吴翰清​道哥眼中的机器智能计算机的再发展

51次阅读

共计 8295 个字符,预计需要花费 21 分钟才能阅读完成。

简介: 人类社会的发展离不开技术的革新。一项新技术的成熟需要经历哪些考验?为什么说对于计算机、AI 的发展而言,算力和数据都是重要的生产资料?如何实现数据的智能化?通过本文,吴翰清(道哥)将从人类社会的发展讲起,梳理总结技术革新的规律和脉络,分享他对当前技术发展及机器智能的看法。(文末福利:AI 直播合集,探讨人工智能的现在与未来)

一 从历史和社会的角度看技术的发展

想要理清技术发展脉络,就需要回顾人类历史,因为人类历史本身就是技术的发展史。马克思对于人的定义中有一项是:劳动使人变得和动物不一样。而具体是什么不一样呢?我认为是技术赋予了人类独有的特性。

农业革命之前,人类大多是以社群的形式生活。当时,人类获取食物的主要手段是狩猎和采集,因此效率非常低。大概在八千到一万年以前,人类历史上发生了农业革命,出现了种植以及畜牧。在此之后,人类在单位面积土地上获取食物的效率就大大提升了。因为不需要所有人都去从事农业生产,所以多出的劳动力形成了最早的社会分工,比如有的人开始进入手工业制造工具,进一步形成了人群的聚集和交换,由此出现了最早的城邦,也就是说世界上第一个城市的诞生是由农业革命所产生的技术驱动的。这之后人类历史发展得非常平缓,农业社会经历了漫长的几千年的时间。一直到了近代,大概两百多年前,在英国首先诞生了工业革命。自此之后,人类社会的经济开始呈现指数级增长。

我们这一代出生在二战之后的人特别幸运,因为没有经历过大规模战争,并且享受着中国高速发展带来的红利。建国伊始,中国一穷二白,就直接开始工业化建设,并完成了国家和社会工业化建设。到 70 后、80 后、90 后出生的时候,中国已经进入了消费型社会,并经历着不断的变革,出现了计算机、互联网。如今,我们即将进入下一个时代,姑且把它定义为智能时代。

定义一个时代并不简单,当一项新技术出现,能够对经济产生巨大影响,并拉动整个社会的全面改造时,才能称之为一个时代。从两百多年前的工业革命开始到现在为止,是一次巨大的社会变革,而这次社会变革对人类思想的改变也是非常巨大的。可以设想,三四百年前生活在明朝的人,可能一生的生活、工作都不会变化,所从事的工作可能和一千多年前的汉唐时期没有太大改变。而我们这一代人却不同,我们直接从工业社会进入到了消费社会,再到现在的互联网时代。因此,即便是幼年的光景现在看来也非常遥远。如果在今天想要预测几十年后会发生什么也非常困难,这就是技术对社会带来的巨大改变。

从工业革命开始的两百多年里,人类科技不断爆发。回到工业革命的本质,其实资本的本质实际就是技术,是技术创造了新的财富。回顾两百多年来发生的所有技术变革,从蒸汽机、铁路、火车,到蒸汽轮船、电报、电话、电器照明以及汽车、石油、飞机,然后再到计算机、互联网、人工智能,这些变化互相影响,相互刺激,承前启后,共同改造了这个多元化的社会,也促成了现代城市的诞生。相比于古代城市,现代城市已经发生了根本性的变化,而这些变化正是由工业革命带来的。

工业革命的另一项资源——煤炭,在中国古代很早就有了,但中国古代的富人只是拿煤炭来取暖,并没有把煤炭作为重要的生产资源来使用。正是因为这些客观因素导致工业革命首先发生在英国。工业革命的最直接原因是消费需求的刺激,当时的英国消费者对从印度进口的色彩鲜艳、价格便宜的印花棉布产生了非常高的兴趣,因此,英国会花大量金钱去买印度进口的棉布品。当时英国最早采用的是贸易保护措施,就像现在产业对新技术的遏制一样。但即便英国制定了法律来禁止印花棉布的进口,也遏制不住人民的旺盛需求,这就使得英国生产者不断思考如何实现技术创新。之所以选择技术创新,是因为英国的人力成本非常高,导致纺织业资本需要寻求技术的帮助来拉动产业升级,用机器取代人力可能是当时英国的唯一出路。因此,棉纺织工业出现了大量的技术进步,比如 1733 年,约翰凯伊发明了“飞梭”,提高了织布速度;1779 年,克朗普罗顿发明了“罗机”,后来为了适应蒸汽机变成了一个普遍的纺纱机器,使得产能巨幅提升;后来还有一个传教士发明了水利制机,开创了机械织布的新时代。到了 19 世纪 20 年代,一个初级学徒通过操作机器织的布要比熟练的手织工多 15 倍。

站在今天看工业革命,可以明显地感受到需求对技术诞生的刺激作用。瓦特改良蒸汽机是一项非常重要的工作,而棉纺织业对新技术的需求才是关键所在。之所以工业技术革命发生在英国,是因为想要通过技术创新降低人力成本,这也是创新的重要特点。

回到当下,在看待人工智能时,比如在一个仓储中的细分场景中,想要通过仓储物流机器人实现自动分拣和配送,而仓储管理员往往觉得只需要雇几个人力成本非常低的员工即可,从当下的投入产出比来看,不值得去构建人工智能系统。因此,在新技术诞生的初期,最需要找到合适的产业,才能更好地孵化创新。

总体来看,技术实际上就是生产力。在工业革命时代,通过蒸汽机、纺纱机,释放大量的人力成本,提高了产能。可以说,需求刺激了新技术的诞生,而新技术要解决的第一件事情就是提高产能。

二 新技术的成熟要经历通用化、成本、安全的考验

当谈到计算机时,要先谈计算,它也是对产能的巨大提升。即便是人工智能也依然是计算机的发展,无论是计算还是人工智能都没有脱离诞生于 1946 年的冯诺依曼架构。

在计算机的发展历史中,图灵提出了图灵机,而冯诺依曼架构是对图灵机的一次典型实现,后续计算产业所有发展都是在冯诺依曼架构下实现的。而冯诺依曼架构依然是在实现 200 多年前莱布尼茨对于通过符号逻辑模拟世界万物的愿景。正如莱布尼茨的愿景一样,计算之所以重要,是因为它可以模拟、运算我们能观察到的万事万物。计算不仅仅是加减乘除这些基本运算,人类对世界的所有观察都可以符号化。因此,今天所有能够符号化的信息,都可以通过符号进行实现,这也正是当年布尔所做出的重大贡献。

今天,计算机是各个产业中重要的生产力。计算机解决的是计算的产能问题,也就是生产效率问题。而计算之所以如此重要,是因为其能够模拟万事万物。因此,今天的很多产业都离不开计算,比如设计桥梁需要非常精密的计算,也因为计算使得现代桥梁设计的效率比古代高出了千万倍,这些改变都是由计算机带来的,所以说计算创造了一个新的世界。

技术是有完整生命周期的。正如工业革命时期,棉纺织业对于蒸汽机技术的拉动一样,任何技术的发展,在一开始都要找到对应的需求市场。先找到对应需求,再考虑新技术到底解决什么问题。我认为新技术的根本是要去提升领域内的生产效率,解决产能问题。解决了根本问题之后,接下来要解决通用化问题。就像蒸汽机发明时用的是直线传动,最早用于在水井里抽水的,而瓦特对蒸汽机的重要改良就是使用曲柄传动,进而将其适用到各个行业,成为了通用的蒸汽机。瓦特对蒸汽机作出的两项重要改变,分别是通用化和降低成本。

首先,技术的通用化非常重要,冯诺依曼最大的贡献是通过改造计算机的架构实现了通用化,后来又根据这一架构,造出了真正好用的计算机。通过产业的需求孵化新的技术,再通过技术的通用化,去服务于各行各业。

其次,技术成本的降低也非常重要。蒸汽机改良之前的能耗集中在散热上,瓦特在对蒸汽机进行改良时,设计了冷凝器和气缸分离的架构,基本上解决了一半的能耗问题,大大降低了成本。回顾技术的历史,成本也是创新的根本动力,它决定了技术能否走向市场,完成规模化。

在计算机的发展历史中,冯诺依曼提出了两项技术的关键性改进,第一,由二进制代替了十进制;第二,将程序和数据放到了存储器。当时世界上第一台计算机是由电子管制成的,需要通过大量的外部电路进行控制。冯诺依曼是第一个提出电路设计和逻辑设计是应该分离的,这是思想上的巨大进步。

回顾技术的发展历史,能够发现一项技术的背后可能有很多人共同做出了贡献,但瓦特、爱迪生、冯诺依曼等这些做出关键性改变的人被称为技术革命的英雄。他们之所以能够做出改变,其实是因为解放了思想,使得他们能够换一种角度去思考。冯诺依曼原本是数学家,并不懂计算机。但当他接触计算机之后认为应该把逻辑设计和电路设计分开,于是提出了冯诺依曼架构。他还提出直接把数据和程序放入存储器,大大降低了计算机的成本并且提高了效率。同样的,从晶体管走向集成电路,也是工程上重要的改进,也大大降低了成本。

在计算机的发展史上有几次关键性改良,第一次是冯诺依曼架构的提出;第二次是从电子管到晶体管;第三次是从晶体管到集成电路,然后才有了今天的半导体产业。可以明显地看到,在几次技术迭代的过程中,推动技术改良的最主要原因是对成本降低的思考,这也是典型的从工程角度出发的架构改良思路。

回到互联网、AI 时代,能够发现有几个关键结论。如果想要改良技术成本,原材料的成本就变得非常关键。对于计算机而言,有两个关键成本,即算力成本和数据成本。如果将智能技术看成计算机技术的一种,那么所需要解决的依旧是几个典型问题。第一,通用化问题,如何实现智能技术的通用化;第二,成本问题,包括算力和数据的成本问题,这也严重制约着新技术的发展。

计算机实现了计算效率的巨大提升,而软件就是帮助计算机提升效率最直接的工具。软件所消耗的生产资料就是算力和数据。算力本质上就是晶体管,还会涉及存储、网络等。集成电路实现了晶体管在产能和成本上的优化,而云计算实现了算力的规模化。云计算依然没有脱离冯诺依曼对计算机的定义,实际上就是解决了算力的规模化问题,这样才会显现出经济的规模效应。边际成本递减也是云计算商业模式成立的最重要原因,使得算力成本得到了降低。除了计算之外,数据的成本也需要优化,如何有效降低数据成本是 AI 时代需要考虑的关键问题。

回顾技术发展的历程,首先是需求的产生,进而有效刺激了新技术的诞生,然后技术开始通用化,并且有效地降低成本。但是到此为止,技术依然没有走完它的生命周期,还需要解决技术本身的安全问题和生产稳定问题。在技术的发展史上,早期的许多工程师需要冒着巨大的风险对技术进行改进,而如今我们只需要写写软件。总之,技术的安全问题也是需要解决的。当技术的通用化问题、成本问题、安全问题全部解决之后,才能真正地说这个技术成熟了。与此同时,新技术出现之后,也会不断迭代,进而催生新的需求,比如在工业革命中,蒸汽机只是一个标志,由蒸汽机拉动了铁路的需求,然后出现了火车、轮船,形成了铁路网和船运网,进而带动了时代的变化。在那个时期还出现了电报,这样就形成了运输物质的铁路网、轮船网和运输信息的通信网。而如今的电话、互联网也是通信网。这两张网使得全球经济得到了巨大的推动,也使得全球的联系也变得更加紧密。

在 1850 年到 1910 年之间,全球贸易量增长了 10 倍,这能够体现出工业革命对世界贸易的推动作用。网络的重要性在于一次建设,重复使用,而且网中的结点越多,结点间的互动性越高,成本就越低,而带来的经济效应就越大。此外,一张网络将所有可以触达的客户拉入了统一的市场中,从而有效地扩大了产业规模。互联网相对于铁路网而言,没有本质上的变化,只有规模上的变化。但也可以说量变引起质变,互联网打破了物理空间的限制,使得今天在互联网上触达客户的效率非常高。因此,在看技术之间的关系时,铁路网和蒸汽机的关系,就非常像互联网和计算机之间的关系。互联网的出现对于经济起到了非常大的放大作用,其主要具备四个经济效应,即规模经济效应、协同经济效应、双边市场效应和梅特卡夫效应。正是因为同时具备这四个效应,使得互联网成为了一个超级强大的经济放大器。

三 算力和数据如何实现规模化突破

回到今天看互联网、计算机与智能技术的发展,我认为第一个真正被验证过的就是搜索,互联网的发展拉动了搜索技术的发展。搜索是第一个实现算力、数据规模化的软件,它依然满足冯诺依曼架构的设想。其实,搜索最开始被提出来的时候就是为了解决海量数据的计算效率问题,最早由雅虎发明,后来 Google 通过 PageRank 算法做了改良,以更好的体验创造了巨大的市场。正是因为在互联网广告领域发现了巨大的市场需求,才使得源源不断技术投入到搜索领域。正是因为对于搜索技术的沉淀,使得算力和数据的规模化问题得以更好地解决,也就形成了云计算和大数据。

传统思路无法思考新技术的估值问题,对于创新的技术,很难对它形成正确的估值,因为技术迭代速度非常快。比如当蒸汽机出现之后,很快又出现了铁路、轮船,因此对蒸汽机进行估值时,很难想象后面会出现多大的市场,对世界和社会形成多大的改变,这就是创新的力量。所以说只有技术创新才是在创造新的财富,因为它增加了产能,再通过资本的投入不断扩大规模。因此,在研究技术的变化、迭代时,很难想象一个新技术出来之后会创造怎样的新需求,所以难以通过一套成熟的方法评估一项新技术未来的潜力空间。

今天,如果想要在企业的竞争中具有更好的竞争力,需要从资源角度去思考对每项新技术的看法。比如在工业时代,其实出现了一次自然资源的大发现,英国最早使用木材作为生产生活的主要燃料,后来因为木材减少才开始使用煤炭,但直到蒸汽机发明之后,煤炭才被大量开采出来。工业革命诞生在英国还有一个很重要的原因是英国的煤炭比较多并且方便开采,离海岸线近,比较容易运输。在古代中国,煤矿主要在内陆,而经济最发达的地方在长三角,在没有铁路、轮船的情况下,将煤炭运输到沿海地区的成本很高,所以煤炭没有成为古代中国经济发展的重要材料。当蒸汽机出现之后,煤炭成为了重要的战略资源。同样的事情也发生在石油出现之后,美国克利夫兰因为附近的油田从小城镇发展成为一个工业化城市,也正是在这里洛克菲勒拿到了第一桶金。电力发展上也一样,1886 年,美国决定在尼亚加拉瀑布上建设一个水电站,输送十万马力的电能到距离 26 英里外的布法罗市。瀑布在电力发明之前,只能被当做壮观的自然景观,而当电力系统发明之后,就会发现瀑布的水落差是非常重要的自然资源,而谁占有了这样的资源,谁就拥有了巨大的财富。对于自然资源的垄断或攫取,能够让企业或者国家在竞争上处于优势位置,因此有必要从自然资源的角度重新看待新技术的发展。当一项新技术出现之后,创新实际上是需要讲究市场规模的。而对于时代的改变来说,创新的规模才是最关键、最本质的事情。

回到计算机的发展,最开始的电子管还会发光发热,存在巨大的能耗问题。后来发明了晶体管,硅就成为了一种新的自然资源,而这种材料在地球上到处都是,使得新造晶体管比维修电子管更加便宜,这就导致了商业模式的重构。由此可见,自然资源会决定很多事情。

对于计算机、AI 的发展而言,算力和数据都是重要的生产资料。算力涉及到晶体管、存储网络等,而数据则需要当做一个新的自然资源重新思考。在信息时代,计算机的发展就是出现了各种各样的数据库,通过计算机取代了许多需要人工的填表工作。而在智能时代,一些低门槛、低复杂度的事情都可以被计算机自动完成。回过头来看,计算机在信息时代对算力和数据利用的规模都比较小,PC 时代所使用的算力和数据可能仅仅来源于自身,但在智能时代的软件操作,利用的可能是云计算海量的数据和算力。因此,今天新的软件才能解决不一样的问题,它对效率的提升会是信息时代的无数倍。云计算有效地完成了算力的规模化,数据的规模化曾经期望通过大数据来完成,但目前大数据并没有得到充分应用,各行各业依然在处理小数据。今天我们谈论机器智能到底应该设计成什么样的软件,其实应该看这个智能软件到底消耗多少算力和数据,从规模上来判断。如果一个智能软件没有消耗非常多的算力与数据,很难想象它能够提升非常高的产能。

要实现数据的规模化,其实最重要的就是 IoT。今天,通过大量的 IoT 设备,会源源不断地采集海量的数据,数据规模远远大于人工填表时代所产生的数据规模。人工填表采集的数据依然认为是信息时代采集的数据,而 IoT 设备采集的数据则是满足智能时代所需数据规模的基础。数据要想成为自然资源,规模很重要。

对于数据的成本而言,AI 的成本高是因为数据成本非常高。算力成本通过晶体管、集成电路、云计算已经有效地实现了规模经济,可以在实现路径中逐渐收敛,并且符合摩尔定律。而数据成本依旧非常高,这主要有几点原因:第一,对很多 AI 算法而言,数据打标的成本非常高,往往需要人工参与,因此整个学界和产业界都在思考如何让机器自动打标签,进而有效降低数据成本。第二,IoT 设备以及全链路数据采集的成本过高。IoT 设备不生产数据,而是采集数据,通过 3G/4G/5G 的发展降低了设备数据采集链路的成本。数据采集之后,还需要考虑如何存储和加工,需要综合考量成本,也需要和上层的应用软件形成互动,所以人工数据治理也浪费了大量时间。只要需要人工参与,效率一定不高,成本也会上升。因此,学术界和产业界也在思考如何让机器自动进行数据治理,解决数据的质量问题。当这些全部完成之后,才能让数据成为在智能时代能够被有效使用的自然资源。

四 数据的智能化

当有了大规模的算力和数据,如何提高各个产业的生产力呢?机器智能技术其实有点像工业革命出现的蒸汽机,各个产业的应用就类似于英国棉纺织业的纺织机。因此,没有办法简单地说智能技术如何去改变世界,而是要通过制造各行各业的“纺织机”,提升产能,降低成本,进而拉动产业的进步,服务整个社会。因此,需要观察到底哪个产业能拉动自己技术的发展,实现数字化和智能化。

数据的智能化就是通过精细化的管理或者治理来解决资源的合理分配,这是计算能够为各行各业作出的最通用的贡献。当这个问题解决之后,各个行业的产能会巨幅提升,成本也会巨幅下降。

再回到经济和社会层面上,蒸汽机、铁路、轮船出现之后,又发生了农业机械化革命,大量的农民开始失业,大量人口涌向城市,出现了工人阶级。又因为工厂投资大规模的机器设备,所以需要大量工人聚集进行劳动,所以出现了产业分工,进一步形成了工业化城市。所以最早的工业化城市是英国的曼彻斯特,当时有 50 万工人用机器从事棉纺织业的制造。随着电力、石油革命的发展,在 20 世纪早期的二、三十年间,人口过百万的城市从六个上升到了二、三十个,这就是工业革命所带来的城市人口的大规模聚集。

进入消费时代,产业聚集进一步发生,导致最早开始产业分工的一批企业积累了大量财富,于是开始出现阶级分化,出现了劳工、白领以及中产阶级。因为很多重要的生产活动不是在一线完成的,而是在办公室里完成的,而中产阶级的知识与经验的沉淀变得非常的重要,这批人变得非常富有,也因此拉动了社会的需求,特别是第三产业的需求。在 1990 年前后,社会的产业结构发生了巨大的变化,大量人口从工业转移到了服务业,城市结构也从工业型转向消费型。

今天,互联网企业是以技术驱动的,很多企业不会严格地执行打卡,是因为我们又让人重新回归到了人,而不是机器,这其实也是人工智能要解决的问题。因为让人聚集打卡上班的制度是工业革命之后,在工厂里基于流水线发明的一套管理制度。而在今天,如果说技术就是资本本身,技术创造新财富,创新是驱动财富发展的最重要的动力,那么就应该为技术创新提供一个更加宽松的环境。

随着机器智能的进步,社会分工会进一步细化,城市会聚集更多的人口。预计到 2050 年,全球 70% 的人口会生活在城市。而城市的发展需要解决住房、就业、环境、卫生等问题,因此当智能技术出现之后,我们希望可以重新思考和解决工业革命带来的弊病,让整个社会和人类实现可持续发展。

无论是算力还是数据,通过精细化计算,都可以有效地降低损耗,实现对资源的合理分配与利用。机器智能会对未来的经济和社会产生巨大影响,让更多人回归到更具有创造力的工作上,让人更像人,让工作更加开放和自由,进而改变生活的面貌。而技术的发展依然符合前面提到的规律,需要强烈的需求刺激新技术的诞生,需要解决技术的通用性、成本和安全问题,最后技术再创造新的需求,建立技术与需求之间的正反馈,进而形成新的社会分工,以此来改变社会、城市与生活的面貌,催生新的文化与价值观。

如今,无论是 AI、IoT 还是 5G 技术,依然应从需求、成本和经济影响的角度来思考,并作出有效的战略决策,也应从自然资源的角度去思考,为企业找到新的竞争优势。

本文由 DataFunTalk 吴雪松、阿里云开发者社区志愿者贾子甲整理。

福利来了 | AI 直播合集

五位阿里技术大咖
共话人工智能的现在与未来

AI 持续大热并进入爆发期,本合集聚集阿里 AI 技术专家、产品专家,从整个 AI 领域发展趋势、相关技术到 AI 的实际应用,分享对 AI 发展的相关看法,展示阿里 AI 最新技术成果,干货满满!

原文链接:点击这里

正文完
 0