关于数据库:专访|拓数派冯雷的回归

41次阅读

共计 6006 个字符,预计需要花费 16 分钟才能阅读完成。

作者:数字商业时代 丁海骜
工夫:工夫:2022-08-09

“我始终认为:尽管咱们是以公司的模式存在,然而叫机构更适合些。”从 2020 年 1 月 VMware 实现对 Pivotal 的收买算起,两年多不见的冯雷再次回归到公众视线,身份曾经不再是 Pivotal 中国公司常务董事、研发核心总经理,而是一家中国外乡科创公司 —— 拓数派「又称“OpenPie”」—— 的创始人和首席执行官。

2022 年 6 月,拓数派对外发表实现新一轮数亿元策略融资,而在此之前,2021 年 7 月正式成立之初,拓数派就曾经取得了头部产业基金超过两千万美元的天使投资。“当初拓数派储备了足够多的现金,足够咱们能够真正安安静静坐下来,把产品做好,做一个能够对标美国同时代产品的产品。”对于一家初创公司而言,冯雷的话多少有些“凡尔赛”,但拓数派刚刚成立即可实现人均年研发费用 15 万美元的融资规模,在很大水平上,与冯雷选定的技术赛道、拓数派本身技术团队的实力,以及以后中国科创畛域的空前沉闷,都有十分大的关系。

抉择赛道:对于数学利用倒退的一种传承

之所以冯雷认为应该把拓数派称为机构而非公司,很大的一个起因,是其创建拓数派,并抉择“云原生、剖析型分布式数据库”赛道,并非齐全处于单纯的商业考量,更像是一次基于数学迷信的学术验证和利用实际。

拓数派创始人兼首席执行官 冯雷

冯雷最广为业界所知的,是其已经提出的“数字化三部曲”—— 他甚至因而出版了三本图书。在他看来,明天所有企业的数字化转型过程,都将沿着从软件公司到数据公司,再到数学公司的过程演进,其中,当然会波及到包含云计算、大数据和 AI 在内的新兴 IT 技术的退出,然而真正影响数字化过程、决定数字化方向和后果的,永远都是数学原理。

“我大学本科是北大物理系的,所以我思考问题经常是往起源的方向看,就是说我始终关怀:人类智能的起源,咱们智慧是怎么来的?”冯雷当年是以浙江省队物理奥赛银牌进入北京大学并取得了物理学和经济学的双学士学位。而那段经验对于他来说,更重要的影响,是让他意识到数学的美好,也让他曾经开始思考如何让数学这样一个基础学科可能真正影响和扭转人类社会。“你晓得,到明天为止,咱们在 IT 畛域的所有停顿,都还是基于历史上一些平凡的数学发现和实践。”几年前,还在负责 Pivotal 中国常务董事兼总经理的冯雷就已经这样对笔者说。

在冯雷看来,联合数学发展史和 IT 进阶史,有几个历史事件至关重要。

首先是公元前 600 年到公元前 500 年,由古希腊哲学家毕达哥拉斯及其信徒组成的毕达哥拉斯学派,他们提出万物根源是“数”,认为“万物皆数”,而钻研数学的目标并不在于应用,而是为了摸索天然的神秘 —— 这与明天咱们全人类社会正在进行的“数字化”转型仿佛有些外在的关联。

其次,人类真正用数学方法钻研世界从牛顿年代开始。“牛顿力学的平凡之处,不仅仅因为三定律和万有引力定律,更在于牛顿用数学的办法来定义自然哲学,并写了一篇论文《自然哲学的数学原理》来通知咱们:自然科学是能够数学化的。”冯雷说:“进而,又有人用数学的办法来钻研经济学,并获得了不小的停顿。那么社会科学呢?”

将数学方法引入到社会科学 —— 即让数学方法和数字化工程成为人类扭转本身的工具,进而全面实际数字化时代,冯雷认为有两件具备划时代意义的事件。

第一件,是 20 世纪上半叶,德国哥廷根大学在希尔伯特(David Hilbert)的提倡下提出了形式化数学,从而启发了图灵结构计算机的概念模型和冯诺依曼结构存储计算机。“这实际上是奠定了咱们明天数字化根底:如果说古典物理时代的模型办法,次要建设自然科学法则的数学定理;那么,近代咱们数学化人类社会和智能,则次要采纳计算模型的办法,来仿真人类社会和个体智能 —— 这个时代的数学化也同时引入了数字化。”冯雷已经在本人的文章中如是说。

另外一件事,则是产生在冯雷的母校:20 世纪下半叶,卡内基梅隆大学的司马贺(Herbert Simon)利用符号计算来模仿人类智能,创立了世界闻名的 CMU 计算机学院并将之建设成为人工智能的先驱。“CMU 作为人工智能两大诞生地之一,把数字输出看作符号,用计算模型作为智能仿真大脑操作符号的过程,奠基了符号学派人工智能的第一个 AI 程序逻辑学家。”冯雷说。

“用大量符号和计算模型来建模人类社会和个体智能,奠定了晚期的 AI,获得了微小的问题。然而更多的红利却依赖于更多的数据量和更高计算能力。一般说来,任何一个模型,只有解决切当,应用更多的数据和计算,就能产生更好的预测准确率。这样一个简略却无效的洞察把人类社会带入了大数据时代…… 当咱们不能结构相似神经网络等开天辟地的新模型的时候,咱们能够寻找更多的数据集、使用更弱小算力来进步模型的准确率,以数据计算能力来换模型能力 —— 既然数据计算,可能让咱们找到新发现,那么咱们就应该不遗余力地去驱动数据计算平台的翻新。”冯雷在本人起初发表的文章中写到,他和拓数派要做的事件,就是在所有前人的根底上,将人类用数学定义和钻研人类社会的能力,向更深刻的中央推动。

“云计算的呈现,实际上让咱们利用数学的空间失去了极大的延展:并不是前人不够聪慧,而是因为他们过后没有那么多算力,他们基于 PC 机构的计算机曾经找到了最好的数学逻辑和办法,接下来,就是咱们须要基于云计算提供的有有限增长的计算和有限增长的存储,不再基于简略的符号,而是采纳大量的数据 —— 把符号系统升级到数据系统,用数据来训练程序,让程序本人给本人编程。”

探讨至此,冯雷十分兴奋,他反复强调,“数据计算、只为新发现(Data Computing for New Discoveries)”就是他和拓数派团队要做的事:“人类这么多年来,智商并没有太多变动。然而我感觉因为云计算提供的机会,可能让咱们能够把符号学派的人工智能,推广到数据计算学派,这是咱们成立拓数派的起因。”

实际:云原生、剖析型分布式数据库

抉择将人工智能从符号学派深刻到数据计算学派,并不是冯雷从天而降的一个“神来之笔”。事实上,从 10 年前,冯雷完结在甲骨文从事云计算产品研发的工作,承受 Pivotal 邀请,从硅谷回到上海,作为是 Pivotal 中国公司常务董事(Managing Director)和研发体系总经理(GM)),就曾经开始。

“承受 Greenplum 中国和后续 Pivotal 中国的使命,除了因为 Greenplum 创始人和 Pivotal 董事长在业内的影响力之外,很大一部分起因,是 Greenplum 的大数据使命和 Pivotal 的云原生使命,都处于一个令人兴奋的数字将来的十字路口。此刻在我眼里,数字化的外围也是数学化。”冯雷在起初本人撰写的文章中这样写道。

彼时,在建设中国北京和上海两个研发团队的过程中,在 Pivotal 公司的两个产品体系中,冯雷抉择了 Greenplum 作为中国研发核心的关注重点。“在 PC 机时代,因为摩尔定律,计算资源开始丰盛,PC 机通过组群能够取代大型机,而极大地升高了计算的门槛。Oracle,TeraData 和 Greenplum 等产品就诞生在这一时期。Greenplum 作为一个剖析型数据库,整顿和存储了大量结构化数据,帮忙数据计算在各行各业产生智能:银行通过风控计算升高贷款坏账率,批发行业通过计算进步用户的复购率,医药公司通过计算能够晋升新药的有效性。”在冯雷看来,Greenplum 作为一款剖析型数据库,实际上就是在将“数据计算”—— 这样一个起初拓数派所保持的技术利用理念,进行初步实际的终点,并且在在 2015 年,通过冯雷的保持,Greenplum 最终以开源的形式,从一个数据仓库软件变成了一个云时代的大数据和机器学习平台。

应该说,2020 年初 Pivotal 整体发售给 VMware,是拓数派成立的一个主观理由。

“通过多年对 Greenplum 的技术研发和用户服务,实际上咱们曾经看到了剖析型数据库对于用户的价值,并且在中国建设了一个十分业余的研发团队。过后咱们都感觉:这确实是一个将来数据利用的趋势,只是咱们还没有来得及把它真的部署到云端。于是,咱们最终决定要把这个技术持续往前走上来。”在冯雷的意识中,计算技术目前经验的三代平台别离是大型机、PC 机和云计算平台,而其与其研发团队最大的遗憾,是没有将部署在 PC 机的 Greenplum 迁徙到云计算平台,因而他们决定基于云计算平台的云原生、剖析型分布式数据库。

冯雷认为:数据计算以 PC 机为单位的切割办法,是数字将来的最大掣肘。“如果说云上有有限舒展的计算资源和存储资源,并且这两个资源的舒展,意味着数据计算能产生更好的后果,那么咱们应该冲破 PC 时代计算平台的限度,大胆地设想在云上计算平台的新可能。”冯雷撰文强调:拓数派的第一款产品 πCloudDB,就是建设在数据计算这样的一个底层根底计算技术上,利用云计算的计算技术的改革,从新打造的一个云原生的、以剖析型分布式数据库为内核的全新数据计算平台,从而实际本人“真正交付在 PC 机时代未能交付的大数据承诺”。

“原理可能比代码更重要,所以这次咱们继承以往的产品技术逻辑,然而因为部署的环境齐全是基于云计算环境,所以咱们从新了软件代码 —— 这就如同您写了一个文章的 word 文档,然而忽然断电了,没保留。不过如果重写一次,你就会发现,其实能够写得更快,遣词造句会更精准,逻辑也会更清晰。”冯雷介绍说。

在拓数派公布的相干产品介绍不难发现,πCloudDB 在以往 PC 版剖析型数据库所采纳的 MPP(Massive Parellel Processing,大规模并行计算)根底上,提出了 eMPP (elasticMassive Parallel Processing,弹性大规模并行计算)的概念。“基于云计算架构的 πCloudDB 的弹性并行计算,完满地解决基于 PC 传统 MPP 的缺点:在 πCloudDB,存储和计算各自作为两个独立变量,各自在云端弹性伸缩,用户能够在云端传输海量数据量,云中的存储也会随之主动减少,这个舒展过程对于用户来说是齐全通明不可见的;如果用户须要更大的算力,只需开启更多的虚拟机或者容器,πCloudDB 会霎时扩容。在用户实现脉冲计算当前,能够敞开和放大计算的集群,从而节约在云中的计算费用。”冯雷撰文称。

而在冯雷看来,πCloudDB 这样一款云原生、剖析型分布式数据库,在很大水平上,将成为更多行业用户的商业场景数据分析引擎:“企业将来势必会从软件公司到数字公司,最终到数学公司,那是因为企业会越来越以数据的智能剖析和驱动,实现业务的持续增长,在此过程中,数据库产品须要可能帮忙用户针对不同场景,做更无效的数据分析,例如金融行业的征信反欺诈、互联网行业继续的流量获取、批发行业的用户举荐、制造业的事变回溯……”冯雷强调,作为一个剖析型数据,πCloudDB 的指标,是通过数据计算,帮忙企业用户将业务场景剖析做到极致。

科创:中国须要一个大国标记

“在整个现代科技发展史上,一些海内的机构、大学、科学家甚至投资人都施展着很大的作用。我经常想:作为一个强调科创的大国,当初中国也须要一个具备标志性的、彰显中国大国标志性意义的科研机构。这在以前可能挺难,然而当初中国的经济位置,以及科创倒退到现阶段,建设这样一个机构是大势所趋 —— 这曾经失去了一批有识之士和投资机构十分大的认同感。”冯雷说。

这一点,实际上从拓数派的合伙人平台取名就能够充沛领会:拓数派的合伙人平台叫“毕达哥拉斯派”和“哥廷根”(取哥廷根大学之意),“咱们心愿能在中国创建一个立足于中国,但又在世界范畴内当先的一个机构,从而在研发产品的同时,平行降级本人的组织,使其成为立身中国并跻身世界前沿的数据计算机构。”

这也是冯雷更违心将拓数派称为机构,而非单纯公司的另外一个重要起因。

绝对于在技术和学术上堪称虔诚得近乎浪漫主义的做法,冯雷和拓数派在商业上的思考,能够用佛系来形容。这一点,Pivotal 公司创始人 Paul Maritz 给冯雷极大的影响。

“To give more than what you take,贡献大于索取,这是 Paul Maritz 过后说的一句话,也是咱们的一个行为准则。”冯雷提到过后 Pivotal 在开辟中国市场时,采取的形式是将 Cloud Foundry 云操作系统和 Greenplum 进行开源解决。这一方面当然是为了更疾速地建设起本人的用户群,让更多的用户意识 Pivotal 的产品;然而另一方面,冯雷认为,技术最终肯定要以某种形式反馈给社会,商业只是其中的一种。

冯雷强调,成立拓数派并不是“要把市场上所有的钱全副拿回来”。“从成立的第一天起,这就不是我和拓数派的指标。”冯雷说:“当然,咱们肯定会给投资人一个正当的回报。然而就像过后 Pivotal 一样,咱们开源了那么多年,有些客户用了然而并没给钱,我也 ok:因为咱们思考到小企业没多少估算在这下面。所以我说:人家有钱,天然会付;估算不够了,就算了。”

为了让拓数派用技术回馈社会的主旨失去确认,在 2021 年 2 月成立杭州拓数派科技倒退有限公司一年前,冯雷成立了一个“1024 数字产业基金会”——1024 是 2 的十次方,是二进制计数的根本计量单位之一,也是一个所有程序员都能心领神会、会心一笑的梗。“咱们成立 1024 数字产业基金会的目标,是使其与拓数派并行运行,指标是以一种非盈利的形式,让技术可能惠及更多的用户。”

“成立基金会有两个目标:首先是结构一个生态,咱们的技术推广进去当前会托管给基金会,这样的话,就能够用更公正的形式容许更多的人参加进来;第二个目标,是通过基金会的形式,承当更多 ESG(环境、社会和品质)责任,例如人才培训、与学校单干等。”冯雷对待这个问题的视角十分独到:他认为企业在用数字化技术颠覆传统行业的过程中,也要担当释放出来的劳动力在数字行业的再待业和高质量待业的社会公益责任,而基金会在这方面将有更多的工作空间。

写在最初

你能够说冯雷是一个“万物皆数”实践的狂热拥趸,也能够说冯雷是一个对技术利用具备判断能力的 IT 工程师,甚至能够说是对技术商业化实际的理想主义者,然而不能否定的是:尽管冯雷和他的拓数派看起来没有那么具备侵略性,然而这种暗藏在浪漫主义和理想主义背地的,是基于迷信倒退法则对事物发展趋势的一种判断,以及基于这种判断所体现进去的自信。

在已经经验了“快鱼吃慢鱼”、996 高频迭代的科创畛域,这种自信和淡定,以及带有某种理想主义的信念,让人看到了中国科创畛域可能真正继续后退的可能性。

兴许,一个属于中国外乡科创企业的时代真的就要来了,一个属于中国外乡的标志性企业,就要呈现了。

“咱们为什么叫拓数派,OpenPie?是因为咱们更心愿本人是科创畛域里一支非凡的、具备数学属性的凋谢的流派,还因为作为一个神奇的数学符号,π 是一个能够始终算下去的,而且中国人已经准确计算了小数点前面的最多位数。”冯雷说。


相干报道链接:
拓数派:冯雷的回归

正文完
 0