关于机器学习:深度学习AI芯片上游产业率先爆发

深度学习要求极高的并行计算能力，大数据、算力、训练方法等畛域的冲破使AI芯片作为上游产业率先暴发。

人工神经网络通过训练与预测的过程实现利用，对并行计算能力要求高，训练偏好高性能，预测对简略指令反复计算和及时性要求高。随着大数据存取、算力以及深度学习训练方法等方面的瓶颈被冲破，芯片作为AI畛域的上游成为了率先暴发的产业。

CPU 难以满足并行计算要求，AI芯片站上舞台。

CPU的串行构造难以应答AI计算在简略指令下的并行算力要求，AI芯片应运而生。其中，GPU因其易编程性和良好的并行计算能力最早最宽泛被利用于AI计算。

AI芯片各有千秋，非冯架构下的非类脑芯片占据下风，GPU仍是支流，FPGA和ASIC增速较快。

依照是否为冯诺依曼架构及是否为类脑芯片可对市场中用于AI计算的芯片进行分类：冯诺依曼架构下均是非类脑芯片，次要包含传统的CPU和GPU；

非冯架构下包含类脑与非类脑芯片，其中非类脑芯片蕴含ASIC（寒武纪、谷歌TPU等）、FPGA和局部新GPU（Nvidia的Tesla系列等）。类脑芯片包含IBM的TrueNorth等。在次要的AI芯片中：

GPU峰值性能高、通用性好，但功耗大，实用于数据中心和训练过程；
FPGA效率高、灵活性好，但峰值性能弱、老本高，实用虚拟化云平台和预测过程；
ASIC效率高、功耗比佳，但量产前老本高，实用智能终端和AI平台；类脑芯片能耗低、感知力强，但不足训练、精度低。

英伟达新推Volta架构，GPU无望放弃领导位置，Intel加码CPU+FPGA，而以寒武纪为代表的ASIC厂商在终端的落地前景更为广大。

英伟达Volta架构晋升了GPU预测效率，Intel一直推动CPU+FPGA架构，将来或出现GPU倒退高端简单算法、高性能计算和数据中心；ASIC倒退智能终端、AI平台与算法IP化；FPGA利用于变动较快的行业利用和虚拟化云平台这样的格局，其中重视终端寒武纪等ASIC的落地前景更为广大。

发达国家的ICT产业建设在强势的芯片根底之上。芯片产业是一国工业的支柱之一，其上游的ICT产业在美、日、韩等发达国家中的位置尤为重要。咱们耳熟能详的诸多公司，如美国的谷歌、IBM、Intel、微软、Apple、AT&T、英伟达，韩国的三星，日本的Sony、东芝等都属于ICT畛域，每年能奉献超百亿美元的利润。这些公司或是本身的产品或是上游均是芯片行业，外国芯片产业的强势不仅让这些公司站稳了脚跟，对其国内人工智能、信息安全、网络建设等诸多畛域的推动作用更是显而易见。

海思等企业逐步崛起，中国“芯”也在一直追赶。近几年，只管寰球芯片产业仍由Intel、高通、英伟达等巨头把持，我国芯片产业仍呈现出蓬勃的倒退力，近三年行业销售额复合增长率超20%。2009年寰球纯芯片设计公司50强中，中国第一家闯入世界50强的是华为旗下的海思公司，而2014年这个数目达到了9家，2016年增长到了11家，别离是海思、紫光展讯，紫光锐迪科、中兴、大唐、南瑞、华大、ISSI、瑞芯微、全志和澜起科技。

此外，尽管2016年寰球前20大半导体公司中没有中国企业的身影，然而其门槛44.55亿美元与海思2016年的支出根本相当，而表中的不少公司营收增速十分迟缓，尤其是排名居后的4家增速根本在0%左近，明年海思无望进入寰球前20强。

ASIC解脱传统包袱冲破枷锁。2016年6月，中星微公布国内首款嵌入式NPU(神经网络处理器)芯片，并利用于寰球首款嵌入式视频解决芯片“星光智能一号”。同样在2016年，往年成为寰球人工智能芯片畛域惟一独角兽公司的“寒武纪”公布了“DIANNAO”系列的首个型号，至今已有三代，其背地的机理和指令集更是被同行宽泛援用。

公司也成为寰球第一个胜利流片并领有成熟产品的AI芯片公司，而随着华为麒麟970拆卸上了其1A型号的芯片，寒武纪芯片在智能终端的商用已在迅速推动。这样的冲破在国内传统的集成电路行业是难以想象的。

ASIC芯片存在竞争空间，国内利用市场较大，无望以点及面助力AI芯片弯道超车。如果说在芯片产业上ARM对X86架构的出击制衡成就于挪动终端的衰亡，那么AI浪潮之下，AI芯片尤其是专用于深度学弟的ASIC，用以点及面的形式实现跨越式倒退，未尝不是一个弯道超车的好机会。

咱们能够看到，竞争空间上，传统的CPU畛域有Intel、高通，GPU畛域有英伟达，FPGA中有Xilinx和Altera，唯有与人工智能计算最为定制化联合的ASIC畛域尚未有相对的垄断性龙头；利用场景上，ASIC实用于终端设备，而中国国内安防空间微小，国产智能手机出货量也占据了寰球近半壁江山，新批发产业的倒退也位居寰球前列，潜在的市场非常微小。

豪强纷纷出手，智能手机、可穿戴设施、安防前端等均可能成为ASIC芯片落地放量的后行地。AI芯片尤其是ASIC芯片因为其低功耗高效率的特点特地实用于功耗较低，空间较小的智能手机、智能安防摄像头、智能家居、无人机等智能终端，这些畛域可能成为ASIC芯片率先放量之处。

手机端对于及时性的高要求让挪动端AI芯片成为必需品，近期华为公布了搭载寒武纪芯片的麒麟970，苹果公布内置神经网络引擎的A11 Bionic，对挪动端AI芯片产业起到火上浇油的作用。智能技术在安防行业的利用也十分宽泛，目前安防行业偏向于应用前端智能摄像头与后端解决平台联合的形式进步剖析效率，如海康的摄像机就装备了Movidius开发的视觉处理器和英伟达Jetson芯片。

国产化趋势或带来倒退良机。国产化趋势下，安防、智慧城市等由政府推动的敏感性行业的洽购清单偏向于国产商品，智能芯片作为底层外围硬件将会受到特地关注。国内芯片产业已有多个企业跻身寰球前50强，寒武纪、地平线机器人等企业的AI芯片研发能力寰球当先，华为、紫光等企业在芯片行业的体量也非常微小。随着国内劣势企业的倒退，以及国家对芯片自给率政策要求的推动下，芯片逐渐国产化将为国内企业带来倒退良机。AI芯片作为实现人工智能畛域的重中之重，其国内的市场前景非常广大。

在此AI芯片站上风口之际，咱们试图从算法和需要层面，由浅入深为各位梳理神经网络与深度学习的算法和利用倒退对芯片的各方位要求，并从AI芯片的优缺点比照、利用场景和将来路线角度，与各位一起探寻行业的业态和将来的倒退。

大数据获取能力、算力和对多层次神经网络的训练方法的有余，使得深度学习利用的凋敝提早至今。其实人工智能以及深度学习的很多根底算法在20世纪60年代就曾经比拟成熟了，包含当初被广泛应用的反向流传算法（BP）在80年代就曾经达到了算法的繁荣期，之所以在当初没有像当初这样站上风口，一方面源于过后算力有余、用于训练的数据量不够以及训练方法的缺失，另一方面也因为AI在过后有肯定的利用，但迫切性和当初还无法比拟。

算力方面，即便是2000年Intel推出的第一款Pentium 4 CPU芯片，也只是主频1.3-1.4GHZ的单核处理器，集成了4200万个晶体管，而当初很多CPU主频曾经超过了4GHz，广泛为四核、八核，晶体管数量达到几十亿的程度，更不用说Nvidia最新公布的GPU系列，集成的晶体管数量曾经超过200亿个。

训练方法方面，2006年，机器学习畛域泰斗Geoffrey Hinton在《迷信》上发表了一篇文章，开启了深度学习在学术界和工业界的浪潮。这篇文章提出，通过无监督学习实现“逐层初始化”来训练多层次的神经网络，能够克服深度神经网络在训练上的艰难。

数据方面，深度学习往往一项训练任务就须要数亿级别的样本，以往数据收集终端和场景缺失，短少易于解决的结构化数据，使得数据样本十分稀缺，达不到无效的训练目标，而当初智能手机、可穿戴设施、智能汽车等智能终端的疾速倒退使得数据易于存储和提取。

场景方面，人工智能晚期利用和生存场景的联合比拟少，比拟胜利的利用包含搜寻广告零碎（比方Google的AdWords）、网页搜寻排序（例如Yahoo!和微软的搜索引擎）、垃圾邮件过滤零碎、局部语音机器人等。而在现在，智能无处不在，场景的纵深相比之前有了很大裁减，一方面源于产品和场景的丰盛、人类需要的降级提供了智能利用的场景，另一方面也源于生产效率曾经走向一个瓶颈，依附人力老本投入等形式减少产出的形式越来越不效率，倒逼生产力向智能化革新。

从场景引发需要，智能终端的遍及构建了大数据的环境，技术的提高提供了算力的可能，而算法难点的攻克买通了实践到利用的通道，四者互相加强，疏导AI产业的上游——芯片产业疾速倒退。

关于机器学习:深度学习AI芯片上游产业率先爆发

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于机器学习:深度学习AI芯片上游产业率先爆发

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复