乐趣区

关于机器学习:机器学习吴恩达笔记1

机器学习、人工智能和神经网络的关系

  • 机器学习推动了人工智能的倒退,神经网络则是机器学习的支流算法

何为机器学习

  • Samuel 最早定义了机器学习:在进行特定编程的状况下,给予计算机学习能力。例如,Samuel 编写了一个西洋棋程序,计算机在和本人下了上万盘之后,学习到了好的布局和不好的布局,从而在实战中获得了很高的胜率
  • Tom Mitchell 给出了机器学习的精确定义:一个程序能从教训 E 中学习,解决工作 T,并达到性能要求 P;而且教训 E 通过性能要求 P 评估后,程序处理工作 T 的性能有所晋升。例如在西洋棋中,教训 E 即计算机和本人对弈上万局取得布局的教训,工作 T 就是实战下棋,性能要求 P 就是实战时的胜率

机器学习算法的分类

  • 目前存在许多机器学习的算法,其中次要的是监督学习和无监督学习,其余的强化学习、举荐零碎尽管也都是算法,然而支流还是前两种。
  • 监督学习能够了解为教计算机如何实现工作;无监督学习可了解为让计算机本人学习。
  • 这里要留神的是,算法尽管重要,但更重要的是算法能利用到哪里。这就像教木匠,教算法就像教工具,通知木匠这是锤子、这是锯子;教怎么用工具才是更重要的
监督学习
  • 监督学习,即数据集提供的数据曾经有正确答案,算法基于此进行预测更多的数据。监督学习包含回归问题、分类问题等类型
  • 回归问题就是间断值的预测。咱们通过预测房价例子引入,咱们依据数据集作图,横坐标示意面积,纵坐标示意房价;咱们须要用一条直线或者曲线拟合这些点。

在预测房价的例子中,数据集提供的数据曾经有正确答案,算法基于此预测更多房子的正确价格,输入间断值,属于回归问题

  • 分类问题是离散值的预测。咱们通过预测肿瘤良性恶性引入,咱们依据数据集作图,横坐标示意肿瘤大小,纵坐标 0 示意良性,1 示意恶性,陈我给二分类。若纵坐标有 0、1、2、3 多种分类(不同类型恶性),称为多分类。

当然,咱们也能够用另一种作图形式,用不同符号示意良性恶性。

当有多种特色,如病人年龄、肿瘤大小、细胞形态等,能够画一条直线,离开两类肿瘤

无监督学习
  • 无监督学习,即只给咱们数据,不通知咱们数据属于哪一类,或者有哪几种类型,须要咱们本人总结类型并给数据分类。无监督学习包含聚类问题、拆散问题等
  • 聚类算法,把数据分成几类。

(1)例如谷歌新闻会收集新闻,并分成新闻专题。当咱们点击 BP 油井泄露时,同一主题的就会汇集在一起

(2)在基因组剖析中,给予一组个体,监测他们是否含有某个基因。后果如图,色彩示意他们领有基因的水平,而后运行分类算法,将不同个体分为不同的类

(3)组织大型计算机集群时,剖析哪些机器协同工作时效率更高,将其分类
(4)社交网络分析,自动识别哪些人要好,那些人是泛泛之交

  • 鸡尾酒宴算法:加入鸡尾酒会时,许多人同时谈话,多种声音混淆,如何将每个人的声音分离出来。咱们当时不晓得有多少人谈话(有哪几类),须要将叠加的音频拆散。

机器学习举荐的编程环境

  • 上边的鸡尾酒问题,看似简单,实现却只须要一行代码

如果咱们应用 Octace 编程环境,许多算法几行代码就能实现。咱们在工作时,写算法也举荐先用 Octave 写原型程序,确定可能无误工作后,再应用 java、C++ 等编译环境实现,这样能大大提高效率

如 SVD:解线性方程,用 C ++、java 代码量多,而且要援用许多库;而 Octave 曾经写好了,间接援用一行代码就实现了

退出移动版