共计 1928 个字符,预计需要花费 5 分钟才能阅读完成。
人工智能、机器学习和深度学习的关系在智能科学畛域,有一个初学者很爱问的问题:人工智能、机器学习和深度学习三者有什么分割和区别?这个是既简略又简单的问题。这个问题是有标准答案的。答:三者是蕴含关系,即人工智能蕴含机器学习,机器学习蕴含深度学习。可是,如果你一旦细究,就会发现这个问题远比标准答案要简单得多。先说一个很容易产生的误区。咱们在新闻上常常能看到:某某产品应用了人工智能技术,就具备了怎么“叹为观止”的能力,让人很容易产生一种错觉,认为人工智能和涡轮增压一样,就是一种技术,所有的“人工智能”产品,用到的都是同一种叫“人工智能”的技术。但实际上,人工智能是一片森林,森林里的每一棵树,都是一条技术原理齐全不同的路线。为什么会有这么多不同的路线呢?起因很简略,别看一说人工智能,许多大 V 都能娓娓而谈,其实大家都在盲人摸象,直到现在也还不晓得到底哪一条才是通往真正智能的坎坷不平。可能都是,也可能都不是,怎么办呢?那就多路并举。有多少路呢?总的来说能够分为三路,或者叫三种支流学派:符号主义、连贯主义和行为主义。你轻易去翻一本人工智能的教材,你就能看到这三种主义都是什么。
不过,这并非惟一的分法。一些文献会将次要路线分为两条:基于规定和基于统计。我更喜爱这种分法——清晰、易懂、好落地。基于规定的想法很奢侈,譬如说语法分析:如果我把所有的语法规定都穷尽了,做进去的语法分析器不就“智能”了吗?现实很饱满,事实很骨感,最大的问题就在于“大”——工作量大。基于规定的路线很多人试了,论断就是:哪怕只是语法,不同的状况也十分多,要穷尽所有规定只能是挂一漏万,人力不可能为之。目前的赢家是基于统计,劣势是成本低,不须要人肉写规定,而且成果还好。机器学习就是基于统计的智能算法。初学者常常爱问的另一个问题是“机器学习的实质是什么”。我认为很简略,就是用模型拟合数据的散布。对于机器学习来说,数据很重要,十分重要,学过机器学习的同学可能听过一句话,叫“数据决定了性能的天花板”,而抉择哪款模型,则决定你与天花板的间隔。可是,为什么呢?就是因为:机器学习的实质是拟合数据的散布。如果你失去的数据品质并不好,样本分布和实在散布存在偏差,模型的性能就肯定好不了。这就相当于,你考试前背答案,然而答案自身就错了,你背得越熟,后果只能错得越离谱。机器学习也不是某一种技术,而是一筐技术。譬如有反对向量机、决策树、最近邻等等,单拎进去都能够算是一条技术路线,其中有一路叫神经网络,有的人感觉应该和生物学的神经网络有所区别,应该叫人工神经网络(ANN)——以生物学的神经网络为底本设计的机器学习算法。光听名字,就让人感觉这个算法十分有前途,实际上也的确很有前途,当初赫赫有名的深度学习,就是神经网络的 Plus 版。从神经网络到深度学习神经网络和深度学习的关系是个热门话题,甚至罗唆就叫这个名字的书我都翻过好几本。相干的内容我也写过几次分享,最近在看一本书,是 Charu C.Aggarwal 写的《神经网络与深度学习》,对这个话题又有更深的理解。咱们晓得,近几年人工智能又成了热议的话题和投资的风口,而推高这一波热潮的技术叫深度学习。后面介绍了人工智能、机器学习和深度学习三者是蕴含关系,不过还是有不少不谨严的媒体,俨然把深度学习当作了人工智能的代名词,那接下来就专门聊聊,这个深度学习到底是怎么一回事。下面咱们提到了神经网络,从技术脉络来说,深度学习就是神经网络这一支系下的一条分叉。所谓深度,其实就是神经网络层数很多的意思。神经网络的倒退历程十分波折,经验了两次大低谷,每次都被打上“此路不通”的标签。第一次是在 1960 年代,过后出了一本书叫《感知机》,这是一本在神经网络上具备里程碑意义的著述,在数学上证实了(单层)神经网络无奈学习异或,也就是咱们熟知的 XOR 操作。我看过有些教材上间接就写是“神经网络无奈学习异或”,这是误导,咱们当初应用的多层神经网络是能够学习异或的,谨严的示意应该是单层神经网络无奈学习异或。不过,过后的神经网络都是单层神经网络,所以这个证实论断在很多人看来是间接宣判神经网络的死刑,连很多神经网络畛域的领军人物都纷纷另寻他路。大家看到这里理当产生一个问题:当初深度学习大行其道,所有人都晓得多层神经网络是齐全可行的,单层神经网络的前途就是把层数加深,这么简略的破局之道,为什么连过后的大牛都看不到?因为多层神经网络会导致误差难以传导。依附误差调整权重是神经网络,乃至很多机器学习算法的所谓“学习”过程。简略减少神经网络的层数会导致什么问题呢?梯度隐没。简略来说就是传回去的误差为 0 了,权重也就没法通过学习来调整了。这个问题至今依然是困扰深度学习的一大难题。