从旷视赴港上市看懂-CV-四小龙的生意经

4次阅读

共计 7050 个字符,预计需要花费 18 分钟才能阅读完成。

# 思否编辑部出品#

三天前,被誉为中国「CV 四小龙」之一的 AI 独角兽旷视科技(Megvii)在港交所递交 IPO 招股书,正式公开了其在香港联交所主板上市的计划。

这意味着旷视最快将于 2019 会计期年内完成港交所主板上市(早前消息显示其募资最多为 10 亿美元),同时也预示中国人工智能市场将迈向更为成熟的一级市场 —— 更加开放和透明。

如果说过去五年是中国人工智能的上半场,那么从 2019 年开始,CV(Computer Vision 计算机视觉)行业正式进入了下半场。

随着整体经济下行影响,市场更推崇技术可落地的实用商业化价值。作为一个 2B 或者 2G 的领域,CV 企业的商业落地能力已然成为它们综合实力判定的重要标准,同时也是赢得较高估值和融资的必要条件。

借着旷视上市的这波儿热度,我们来一起分析一下「CV 四小龙」—— 商汤、旷视、依图、云从的生意经。

融资机器 —— 商汤

商汤有一个别名 ——“融资机器”。

以去年为例:4 月获得了阿里领投的 6 亿美元 C 轮融资;5 月融到了包括厚朴投资、高通创投等多家投资机构的 C+ 轮 6.2 亿美元;9 月又拿到了软银愿景基金 10 亿美元的 D 轮融资,估值直逼 60 亿美元。

有钱就有梦想。商汤科技于大多竞品不同,不满足精耕于一个细分领域,而是想当 AI 行业的平台型公司,做城市级视觉中枢。

这也是这两年商汤的运营策略:“1+1+x”,第一个 1 指技术,第二个 1 指产业,最后的 x 指与各行业伙伴合作,打造共赢的生态。

商汤之所以有这么大的野心,除了有钱之外,有两个核心原因:

第一是企业的基因。商汤的基因就是「平台化」,他成立之初的定位就是做一家 AI 平台公司,公司的创始人也明确提到过,要让 AI 成为一个可以长期饱有价值的技术,而不是转瞬即逝的风口。

第二在于他业内绝对领先的人才优势。真正让各家投资机构愿意拿钱“砸”的原因之一,也是因为商汤的人才。

商汤科技 CEO 徐立曾在接受媒体采访时直言,“当前可称上「精通深度学习」的,至少要读过 PHD(研究型博士学位),但中国在这方面人才最多 200 人,商汤包揽了其中的 120 人。”

对于任何一个发展中的行业或技术来说,人才的重要性是毋庸置疑的。有了人才,钱永远不用发愁。

除了人才质量高、储备多,商汤的团队还有另一个特点 —— 来自同一个师门。

这要从商汤科技的创始人之一徐立去香港中文大学读博说起。

2010 年,徐立赴香港中文大学攻读博士学位,与深度学习视觉领域应用的先驱汤晓鸥教授以及其带领的香港中文大学多媒体实验室的师兄弟关系密切。

一年之后,该实验室的几十个博士、教师开始研究深度学习,这也是学术界最早涉猎深度学习的一支华人团队。此后 3 年时间内,该团队的研究论文在 CVPR 和 ICCV 两大全球计算机视觉世界顶级学术会议上发表的 29 篇相关文章中,占比近一半。

2014 年 11 月,商汤科技正式成立。

在商汤的对外发声中,曾坦言“公司在 2017 年已实现全面盈利,并在智慧城市、智能手机、互联网娱乐、汽车、金融、零售等行业实现快速落地,业务营收连续三年保持 400% 同比增长。”而商汤 CEO 也在对外采访中称,“预计 2018 年营收增长 300%。”在汤教授看来,以他的江湖地位将是一场不用打战斗,据传他曾在一个酒局上放出豪言,这个领域我还做不出来还能有谁。

凭借着这股气势,加之 CV 行业越发强盛的发展前景,获得资本的青睐也是意料之中的事。

直到 2019 年,情况似乎发生了一些变化。

今年 2 月份,华尔街日报曝出商汤科技由于估值虚高导致其潜在投资人退出的消息,一时间业界哗然。5 月份的一场发布会上,汤晓鸥也自嘲到:““今天我换了一套双排扣西装,希望对融资有帮助。过去商汤没有那么多产品时,上半场是徐立讲笑话,下半场是我讲笑话。现在上半场徐立没时间讲笑话了,我们的产品已经丰富起来。”

不管是出于无奈还是真的有更多的产品落地,“还有谁”的汤博士和商汤,开始有点儿加快脚步了。一场没空讲笑话的发布会,可能就是行业打响的发令枪。

AI 第一股 —— 旷视

旷视,被行业戏称为商汤的「死对头」。

旷视能够成为港交所第一家「准」上市的 AI 公司,已经是市场对其公司估值、盈利能力、发展前景等多方面的综合肯定。

和商汤的平台化路线不同,旷视的 CV 下半场,押注的都是「硬生意」。这个「硬」体现于用算法去匹配各种前端硬件产品和工程项目。可以说,旷视正在试图用软硬一体的方式打造涵盖“算法、技术、硬件产品、解决方案、数据”在内的全价值链。

和商汤一样,旷视的发展路线,也和他的创始团队基因,有着必然的联系。

旷视科技创始人印奇 2006 年毕业于安徽省芜湖市第一中学,高中还没毕业便被清华大学钦定,通过自主招生考入清华。之后直接入选姚期智实验班。

进入“姚班”之后,印奇师从图灵奖得主兼中国计算机科学家和理论家姚期智,和后来旷视的首席技术官唐文斌同为姚班 2006 级学生,高级副总裁杨沐是他们的师弟。

在前不久公布的招股书中,有一个很关键的信息 —— 旷视作为一家 AI 创业公司,科研经费占据了财务开支的重要部分。

这可能就是技术导向的公司最大的优势,技术精尖程度与崛起速度成正比。

这也是为什么,年轻的旷视当年凭借着成熟的人脸识别技术,以“Face++”在 2012 年国内智能安防市场刚刚兴起、人脸识别成为市场刚需之时,一举成名。

2012 年拿到联想之星的天使轮融资后,旷视的资本之路走得很顺畅,几乎每年拿下一轮新融资。目前已经跻身全球最有发展前景的 100 家 AI 公司。

对比商汤的 1+1+X,旷视科技此前所实施的一直是“1(原创技术基础研究)+3(个人 IOT、公共 IOT、商业 IOT)”的产业布局。

今年,旷视的 logo 从「Face++ 旷视」升级成了「Megvii 旷视」,摒弃过去视觉感知软件服务商的定位,从基础科学的人脸识别算法供应商晋升为智能物联方案专家。也从一家主要 To C 的企业,转向了 To B 的业务;从基础的仓储物流,正式切入了 AIoT 领域。

近年来,人工智能算法出身的技术公司越来越意识到一个「真理」:相比大同小异的算法软件,摄像头和服务器才是更为硬核的资产,是创收的主力军。

在城市物联网领域,旷视已经深入摄像头、边缘服务器、云端服务器三大硬件领域,相继推出 30 余款摄像头,用于城市道路、商业网点等不同场景。此外,旷视还提供第三方设计及制造服务器以支撑云端任务。

旷视科技创始人兼 CEO 印奇在致投资者的信中,也直言不讳的阐述了企业的发展方向:“我们希望成为各行各业的「大脑」创建者,为物联网行业上下游企业提供核心技术。对旷视来说,强化核心技术优势比扩大业务规模更重要。”

但是,要成为行业「大脑」显然不是单纯依靠深度学习技术就能够实现,哪怕在人工智能领域也不应该只有深度学习技术的分支在起作用。

但这样的发展方向不免让人产生疑问:是否之后会让旷视出现发展路线过窄的问题?要想成为行业大脑,显然不知单纯依靠技术就能实现的,至少不应该只局限于深度学习技术之一分支。

无论是科创板,还是港交所,亦或是其他市场,可以肯定的是,随着旷视打响的上市第一枪,人工智能的创业草莽期将暂告一个段落,敲锣打鼓上市的接力赛,即将开始。

医芯「求索」—— 依图

今年 5 月,依图在上海发布了一款「发布即商用」的云端 AI 芯片「求索」(questcore™),主要针对计算机视觉分析任务。

「求索」的发布,在外界看来是依图面向智能计算时代的重要里程碑事件。这是依图实现人工智能应用大规模普及落地的一个重要基础,也让依图成为 CV 四小龙中第一个尝试自研芯片的公司。

事实上,依图科技自创立以来就保持着高速发展,算法一直是其核心能力之一,但是目前来看依图并不打算被算法所局限。

依图想的思路很清晰,单纯依靠算法很难支撑一家技术公司的长期发展。加之近年来技术的逐渐成熟,依图做芯片已经是顺势而为的选择。这样的选择无论是资本端,还是产品端都是最好的尝试。

而回顾依图的造芯之路,很早之前其实就有了些线索。

2008 年,在马云挖来王坚的同时,也同时邀请了一起在微软亚洲研究院从事机器学习、计算机视觉工作的林晨曦,也就是依图的联合创始人之一。


林晨曦

如果说,王坚是阿里云的制片人,那么曾是阿里云第一技术负责人、一手组建了阿里云“创始团队”,搭建了国内最大的分布式云计算操作系统的林晨曦就是总导演。

众所周知,阿里云创立早期走的极为艰难,就连阿里内部都不信任这个突然出现的团队。彼时的林晨曦除了负责技术开发外,还要肩负着谈业务的重担。阿里云和淘宝网的第一次合作就是他靠着几行代码“骗”下来的,而为阿里金融解决 BUG 也都是他的工作内容。

然而,即便是在阿里云最危急的时刻,林晨曦也没有发起这个项目的打算。据王坚透露,林晨曦在阿里云最艰难的阶段,每天都能收到大量的辞职信,同期阿里云的离职率达到了 80% 以上。

后来在采访中,林晨曦说出了他选择了留下来的原因 —— 他认为只有阿里云稳定下来他才能安心的离开创业。2012 年,阿里云取得了突破性的成功,而林晨曦也才选择了辞职创业,和他的好友朱珑创立了现在的依图。


朱珑

正因为林晨曦对阿里云的不离不弃,阿里也对依图毫不吝啬。在依图的 B 轮和 C 轮融资中,都得到了云锋基金(阿里旗下)的大力支持。

有了阿里的支持,依图烧钱做芯片的信心又加了一成。

朱珑曾公开透露过其自研芯片的主要原因,并非为了芯片的商业化,而是从场景出发,更好地发挥依图算法和软件的性能,为客户提供针对特定场景优化的性能、功耗和成本最优的一体化解决方案。而这个服务的场景,就是依图目前最大的招牌 —— 医疗领域。

在 CV 四小龙中,依图是第一个跳出人脸识别,把医学影像分析作为等同于人脸识别战略地位的独角兽,鲜有人入局的医疗领域也成为了依图的招牌。

2016 年,依图医疗成立。本科医学出身又转型从事计算机工作的倪浩担任总裁,凭借着前 4 年积累的数据和核心技术,依图很快落地了临床诊疗辅助诊断和智能管理产品。

仅肺癌影像智能辅助诊断系统一项,就已在全国近百家三甲医院进入临床工作实际使用中,诊断报告被医生直接采纳率超 92%。

医学影像分析的的技术路径,有别于 CV 行业普遍应用的人脸识别、物体识别乃至语音识别等,不仅需要资深影像科医生进行数据标注,同时数据获取与数据处理也非常困难,专业性要求极高。这也是直到现在为止,很多明星人脸识别公司迟迟不轻易入内的主要原因之一。

其他三小龙虽稍有涉足医学影像 AI,但多在 Kaggle、Luna 等公开域的肺部、眼底数据集上做测试;商汤医学影像因为有 Dimitris 教授和张少霆的加入,稍稍领先,但产品也处于打磨原型的早期阶段,与依图的产品进度不在一个梯队。

但医疗行业绝对是 CV 最有前景的应用场景之一。据相关数据统计显示,在医疗健康领域,国内 AI 医疗市场规模在 2017 年就已超 130 亿元,2019 年则有望突破 200 亿元大关,后续还会持续膨胀。

当然,依图现在的绝对领先地位,并不代表产品和技术已经完全成熟。鉴于该领域的复杂性和监管的金标准门槛,整个行业仍有很高的提升空间。

这可能也是依图发力造「芯」的原因之一。

低调的国家队 —— 云从

在商汤、旷视以及依图三家公司的投资人名单中,都有一个共同的名字,阿里巴巴。

云从,作为「四小龙」中唯一一家没有阿里巴巴成分的平台,另有背书,这又是和他的创始人背景有关。

从美国伊利利诺伊大学回国前两年,周曦和他科大的同学姚志强就已经在上海注册了一家名叫“飞寻”的公司,尝试利用人脸识别技术做商业上的探索。

2010 年,中国科学院重庆研究院院长袁家虎为了邀请周曦回国一起参与科研工作,三次亲自前往 UIUC 与周曦面谈。一年后,周曦终于以“百人计划”专家身份回到重庆,并与大学好友李继伟和温浩一同组建了当时中科院最大的人脸识别研究团队。

到了 2014 年,周曦团队的研究经费已经超过了 2000 万,技术得到了一定的认可,但因为在体制内的原因,周曦认为这对于产品的束缚超过了体制带来的资源优势,在 2015 年放弃了中科院的编制,带领团队的部分核心成员,正式成立了云从科技。

这里面还有一个故事,当时的周曦其实可以选择停薪留职,给自己留一条非常稳妥的后路,但他和他的团队成员全部婉言谢绝了。如果不是破釜沉舟,如今的云从可能是另一个故事了。

相较于其他三家,2015 年才正式成立的云从算得上入局很晚了。尽管作为唯一一家同时受邀制定人脸识别国家标准、公安部标准、行业标准的企业,手持「尚方宝剑」的国家队,云从的发展一开始并不顺利。

云从科技联合创始人孙庆凯曾直言,“做学术和做项目完全是两码事儿,特别是刚涉足金融和安防领域的时候,什么叫低柜、高柜,什么叫手机银行、直销银行,我们都不懂。我们公司离中国银行总行只有短短 1 公里的路,但我们走了整整两年。”

在公司成立早期,云从科技曾参与某大型国有银行项目招标。由于对行业不了解,经历四五个月的准备后,云从科技拿出准备好的 10 多页的标书,而其他竞标者制作的标书,平均都有 300 多页。

吃亏是福。这次尴尬的碰壁经历使得团队很快意识到,攻克某个行业需要拿出决心和敬畏之心,仅仅只掌握技术是行不通的。

2015 年到 2018 年,是云从蜕变的第一个阶段。在这三年间,云从科技搭建起核心团队,在真正将核心技术在场景中验证后,证明技术是对行业有价值的。

2018 年到 2020 年是云从科技的第二个阶段。度过了初创期的云从科技,逐渐熟悉了游戏规则,并且通过核心技术在行业和场景的考验,树立了在行业中的地位。

现在的云从拿下了“中国银行业第一大 AI 供应商”的称号,包括农行、建行、中行、招行总行等在内的全国 400 余家银行均已与其展开合作,日服务量达 2.16 亿次。

目前,云从科技最大的调整为聚焦与搭建技术中台,建立和完善组织体系,让它成为前台源源不断提供支持的核心。中台不再闷着头搞研发,而是与前台相结合,在研发时就考虑到应用性以及用户和市场需求。

这一举动,使其业务从金融交互层渗透到金融决策层,其技术从感知层跨入认知层。

除金融领域外,云从在安防、民航、智能硬件等领域也有布局。横纵联合的平台可能也是云从的目标所在,这一点和商汤不谋而合。唯一的区别是,云从开始做 AI 芯片了。

总体而言,云从在金融行业的领先地位,一方面是技术的趋向性,另一方面就是对于行业资源的关系绑定,这可能才是云从真正的「护城河」。

但就目前金融领域对于 IT、CV 技术的应用,与其他行业相比门槛确实不够高。随着行业的发展,在这场效率与需求的竞赛里,面对大小公司、行业内外的冲击,云从是否还能遥遥领先,依然是一个值得探讨的问题。

CV 市场,蛇头攒动

整个 CV 行业,「四小龙」占据了媒体超过 90% 的话题与版面。但在媒体的镜头背后,盯着 CV 这一市场的,元不止这四家公司。

格灵深瞳是最初的「CV 四小龙」之一,是一家在 2013 年便成立了的较早布局人工智能的技术公司,主要业务为智慧城市相关的项目。前期市场反馈极好,但后来因为核心团队的变动、战略转型等问题,再到 2017 年 CEO 何博飞宣布离职,正式被挤出了「四小龙」的队伍。

直到去年的 6 月,格林深瞳宣布成功获得中国农业银行安防设备 4 标。行业由此猜测,这家浮沉了几年的公司要开始重新发力了。

另一家蠢蠢欲动的,是主攻 CV 搜索引擎市场的衣 +,它也曾获阿里投资,和阿里云有着多项深度合作,也是帮助广电总局制定 TVOS 行业标准的唯一 CV 公司。

当然,还有很多 CV 行业的公司,随着这两年市场风向的变动,也都在迅速的发展蓄力。据不完全数据统计显示,目前我国至少有 40 余家专攻 CV 领域的创业公司,加上跨行打击的巨头,「四小龙」的竞争对手都不容小觑。

其中,以海康威视、BAT 等行业巨头,对于 CV 产业的布局最为明显。

海康这两年不仅成立了 AI 研究院,还基于深度学习技术推出了两款后端产品“猎鹰”“刀锋”智能服务器,联手英伟达和 Movidius 发布“深眸”系列智能摄像机、“超脑”系列智能 NVR、“脸谱”系列人脸分析服务器等多款产品;

阿里达摩院 14 大研究实验室中,智能视觉实验室赫然在列;百度收购美国 CV 初创公司 xPerception,全线开放视觉技术;腾讯直接将优图实验室升级为腾讯计算机视觉研发中心,并与《Science》签署了战略合作协议。

行业利好,前景可期

国际调研机构 Gen Market Insights 发布的《2018 年全球人脸识别设备市场研究报告》指出,中国将成为面部识别技术领域最大的消费者和提供商。

到 2023 年,中国将占全球面部识别市场份额的 44.59%,远高于 2017 年的 29.39%。

有市场就意味着有需求,有需求就意味着有商机。

对于文中上述公司来说,大家的红海之争才刚刚开始。不管是过去的互联网市场,还是未来的人工智能领域,百家争鸣是亘古不变的驱动力。

但对于整个行业,还有一个问题需要大家一起在行业发展中不断思考:

CV 有没有脱离自身技术框架、脱离辅助工具的定义,成为一个社会需求的潜力么?

  • END –

参考内容来源:
themtank.com:《A Year in Computer Vision》
WIKIPEDIA:Computer vision
MLMastery:《A Gentle Introduction to Computer Vision》
CPS 中安网、商汤科技:《2018 中国安防行业调查报告》
镁客网:《CV 无战事》
创业邦:《AI 落地决胜,云从快跑应战》
DeepTech 深科技:《商汤的一场发布会, 创始人汤晓鸥抱怨“没空讲笑话”》
钛媒体:《旷视科技赴港 IPO 背后: 历经 9 轮融资, 上半年亏损 52 亿》
雷锋网:《依图造芯,定名“求索”》
* 部分素材与图片来源于企业官网与网络,如侵删

正文完
 0