乐趣区

关于开源软件:百家客户300-增速上千开发者PingCAP-想要拓展更赚钱的国际市场

以下文章来源于 36 氪 Pro,作者王与桐 小希

2016 年 3 月 5 日,北京天气晴。上午 10 点,在一间长十米,宽三米的屋子里,几个身穿格子衫的程序员,开始对着一面白板交换。

这是 PingCAP 第一次 Infra Meetup。这几个人中,有近 10 个来自 PingCAP 的开创团队,唯二的客人,别离是来自华为和京东的开源爱好者。客人比客人多,倒也能够了解,毕竟周六上午的正确打开方式应该是“补觉”。

现在,以交换国内外基础架构技术为主题的 Infra Meetup,曾经举办了一百三十多期。PingCAP 也成为明天成为中国最大的开源社区之一。作为底层软件的公司,PingCAP 独立研发的数据库产品 TiDB,在 GitHub(世界上风行的开源代码托管平台)共计取得超过 25000 的标星,汇合了近 1200 位贡献者(Contributors);在世界范畴内,TiDB 也是基础架构畛域的出名开源我的项目。

但开创团队的野心却远不止于此,CEO 刘奇说:“ 咱们还是要专一 TiDB 这一款产品,心愿能够做到 500 亿美元的市值,而这背地须要 10 亿美元量级的营收反对。

01 商业化:上百付费客户,300% 营收增速

500 亿美元市值是什么概念?Oracle 市值 1700 亿美元,Snowflake 市值 700 亿美元。如果要要做到 500 亿市值,须要 10 亿美元量级的营收反对。如何去做营收呢?

对于开源软件,所有人都关怀的首要问题就是: 收费的开源产品,能赚到钱吗?

先说答案:能。

目前,PingCAP 曾经是中国开源软件畛域营收最高的公司,公司曾经有超过 1500 家用户将 TiDB 用于线上生产环境,国内的客单价在百万元量级,国外更是数倍之高。

中国的开源仍在倒退的晚期阶段,大部分开源厂商尚未开始进行商业化尝试。PingCAP 的商业化跑通让更多的国内的开源公司取得了更疾速的倒退。在开源畛域,头部美元基金也在踊跃布局,比方经纬在近几年也投资了 PingCAP、Nebula 等很多开源公司。

PingCAP 在产品研发前两年也没有营收,然而在开启商业化后,PingCAP 曾经有过百家付费客户,营收增速均匀放弃在 300%。PingCAP 通知 36 氪,低获客老本、高留存、高增购、比传统软件公司弱小的销售效率以及产品化迭代的加速度,是 PingCAP 保持高速增长的重要起因。

大多数商业开源软件的商业化路径是:首先提供收费版本软件,前期再对高级性能或服务免费。源代码可供所有人查看和应用,因而许多潜在客户的开发人员也会基于开源产品做我的项目,使外围产品更有用、更有价值。这也是开源模式最大的劣势,也因而在被采纳时遇到的阻力很小。

但其难点也很显著:开源软件可能须要数年工夫能力开发胜利;开源软件口碑比传统的市场营销伎俩重要,因而,收集对于迭代产品的反馈须要破费肯定工夫;开源用户和付费用户之间的鸿沟十分大,毕竟从“向所有人凋谢的收费合作我的项目”到“只向付费用户凋谢的商业产品”并不容易。

因而, 开源软件获取商业客户信赖的最佳形式是齐全通明,提前布局性能,并在社区探讨。总结而言,就是借力“开源社区”,做到开源我的项目和社区的高度匹配。

那么开源商业化,在付费志愿更低、数字化意识单薄的中国是如何实现的?

与国外模式比照,PingCAP 也具备基于开源社区进行流传,和明确付费、收费性能的两大劣势。

首先,PingCAP 基于开源社区,能够实现一传十、十传百的获客。

开源人造有着与 toC 一样的的病毒式流传能力,在工程师社区里,用的不爽的工程师会反馈并提供解决形式;产品质量越好,推广人越多,问题解决越快,正向循环就越快。这比传统软件通过销售挨家挨户的敲门形式相比,效率高出太多。

再来看 PingCAP 是如何明确收费性能和付费性能的。

与红帽等第一代开源软件以反对服务为主的商业模式不同,PingCAP 属于三代产品,除了服务、Hybrid-Licensing 的同时,也能够依照 SaaS 模式付费。

软件获客形式流程分为几步:据说 - 钻研 - 测试 - 上线 - 保护,开源就是漏斗的源头。

而在这一漏斗中,又人造蕴含了开源相比传统 SaaS 的劣势: 获客效率高、成本低

第一,在“据说”阶段,开源就因为可能看到源代码,能更容易取得信赖。

第二,在“钻研”阶段,客户在采纳传统 SaaS 服务时,须要比照和选型,但开源产品的品质能够钻研源代码,也有很多社区用户现成的测试报告作参考,节俭客户和厂商单方的工夫。

第三,客户“测试”、“上线”过程中遇到问题时,开源有很多开发人员能够提供帮忙,然而在闭源的状态下,只能由厂商去解决。

第四,开源社区的模式,人造对“运维”阶段十分敌对。

第一次付费在上线阶段产生,即购买 TiDB 的服务。在国内市场,抉择在这一阶段就付费的公司往往是金融机构;少部分互联网公司也会在这一阶段付费,比方盖娅互娱、饿了么等。

另外,TiDB 是规范的 OLTP(联机事务处理)型数据库,承载的都是诸如银行外围零碎等要害生产业务,这类要害业务须要极高的业务连续性要求(SLA),因而对原厂商业反对简直是刚需,这也是 PingCAP 开源用户转化率和客单价双高的重要起因。

最初,PingCAP 在中国土壤上的差别点是,找准了客户群:互联网企业和金融企业。

互联网企业是 PingCAP 的晚期指标客户,一是因为晚期开源爱好者往往都就任于互联网公司,二是因为 TiDB 存储、计算拆散的架构设计,可能让用户按需扩容缩容,符合业务快速增长的互联网公司的业务需要。

PingCAP 第一单付费客户也是互联网公司。2016 年 8 月,游戏公司盖娅互娱向还没有商业化想法的 PingCAP 提出测试邀请。过后盖娅互娱有一个在线数据库系统,次要用于广告投放的剖析,须要实时看到广告投放后果,随着业务的高速增长,零碎曾经达到瓶颈,迫切需要革新。

TiDB 的定位恰好能比拟完满的解决这个痛点,只须要扩容,不用革新现有业务。但过后的 TiDB 还不够稳固,处在“能看”到“能用”的转化阶段,因而外部对于盖娅互娱的测试邀请比拟慌乱。“咱们过后太不接地气了,连个中文说明书都没有。”刘奇回顾道。

真正上线也充斥了挫折。第一次上线工夫是凌晨五点,然而并没有胜利。盖娅互娱还一直激励 PingCAP,让他们找到起因。隔了一天,TiDB 又一次上线,趔趔趄趄终于胜利了。

之后,互联网企业成为 PingCAP 的客户起源之一。2020 年 6 月,PingCAP 公布了 TiDB Cloud 产品,依靠于私有云提供开箱即用的 TiDB 云数据库托管服务。借助于云,TiDB Cloud 能够通过程度扩大,领有近乎有限的存储容量和计算能力,使用户能够专一在本身业务的快速增长。

比起支出,PingCAP 抉择互联网行业切入的更重要的理由是:中国很多互联网公司的利用场景实际上十分有价值和挑战,很多场景都做到了寰球第一,这是中国独有劣势,在服务这些顶级的场景的过程中一直的打磨产品和业务独特成长。

抉择金融行业的起因并不简单,金融行业正处于数字化转型的要害窗口期,既有外围业务零碎迁徙革新等稳态场景的工夫窗口,又有大量互联网业务等 TiDB 非常善于的敏态场景,另外金融行业付费志愿较高。金融行业净利润占国内上市公司的 70%,这也差不多是金融行业占 PingCAP 国内营收的比重。

当然,金融行业对于安全性、可用性的要求也更高。服务金融行业时难免会和阿里、华为等大厂短兵相接,但在刘奇看来,他们尽管综合能力强、业务线广,但在单点下面的投入或者并不大,此外,思考到零碎的中立性,大多数的 CIO、CTO 都不愿被繁多大厂锁定。

因而,在拿下行业头部的标杆客户后,PingCAP 的金融之路就会顺畅很多,目前曾经服务了包含中国银行、光大银行、浦发银行、浙商银行、北京银行、微众银行、中国人寿、安全人寿、国泰君安、华泰证券、陆金所等数十家金融机构。

** 总结而言,PingCAP 的开源商业化在中国得以实现,一是基于开源社区高效流传的劣势,二是绝对传统软件,效率高、成本低,更适应当下的场景需要,三是选对行业,通过互联网行业切入,高速打磨和迭代产品,找对机会而后辐射到其它行业。
**

02 国际化:海内营收已超国内

晓得了如何赚钱,下一步就是要明确能赚多少钱,即答复“最好的市场”的问题。

市场规模决定了公司的天花板,决定了公司能讲一个多大的故事,咱们以数据库行业内市占率最高的 Oracle 为例。在 PingCAP 刚成立的 2015 年,Oracle 在中国数据库市场的占有率高达 56%,一骑绝尘。

Oracle 最大的市场在美国。这也合乎寰球任何软件现状,Oracle 也好,Salesforce 也好,Snowflake 也好,美国市场营收根本能占到寰球营收的一半。

据理解,中国市场占 Oracle 寰球总营收不到 5%。这背地的逻辑是,中国市场对于数据库有着大量的需要,但同时,中国客户因为人力老本、付费习惯及付费能力方面的客观原因,并不能很好的撑持一个全球化数据库公司在商业上的的高速成长诉求。

另一方面,海内市场也在进一步增大。 作为 PingCAP 最早及最大的机构投资人,经纬中国的合伙人熊飞认为,对于海内市场,云的遍及也让给开源根底软件的商业化带来的新的思路,比起传统的软件售卖模式,在云上提供服务无疑是更高效的,因为云基础设施的高度的标准化和自动化,同时加上 Pay-as-you-go 这样对用户来说更敌对的付费和租用模式,对于数据库这类高度标准化的软件产品,依靠于云的基础设施是获取规模化支出的重要途径。

在摩根士丹利的一份报告中,关系型数据库的市场将在 2024 年达到 250 亿美元,而 PingCAP 这种依靠于私有云的新型关系型数据库,到 2024 年的份额将占到 46%,比 2019 年回升 19%。

也就是说,中国市场适合晚期积攒产品场景和计划需要,一直打磨技术和服务能力,海内市场适宜在解决方案成熟后,用来盈利。

这也是 PingCAP 的策略。

经验了挪动互联网和金融、物流各行各业的数字化转型的中国,曾经造就了根底软件畛域最丰盛且具备挑战性的泛滥场景:美团是寰球最大的外卖交易平台;四通一达是寰球顶尖的物流公司;贝壳是寰球最大的房屋交易平台……服务好他们,就代表着具备了服务同类海内公司的能力。

于是,从 2019 年服务 Shopee 开始,PingCAP 走向了海内市场。 目前海内市场的营收曾经超过 PingCAP 国内营收,在不同的国家都有头部的客户,比方日本最大的在线领取公司 PayPay,美国的 Square,越南的独角兽 VNG, 印度的 Zomato,东南亚最大的电商 Shopee,法国最大的在线视频公司 Dailymotion 等等。

中国市场不够大诚然是全球化的起因之一。另一方面,从最好的产品角度登程,好的产品就应该通行寰球。所以 PingCAP 成立第一天,就把国际化当标配去做。

目前,PingCAP 有来自 Google、Twitter、Square 等公司,超过 300 的海内社区贡献者。公司通过加入 CNCF 组织的流动,以及公布前沿技术爆款文章在 Hacker News、Dzone 等媒体,吸引对 TiDB 感兴趣的技术大咖。最终,很多人会积淀在一些职业社交平台,比方 Slack 或者社区外面的兴趣小组,孵化出一系列潜在的商机线索。

03 产品:拆散架构,为企业升高 75% 的人力老本

开源商业化行得通的根底,还是产品。

在 2015 年,征询公司 Gartner 预测,商业数据库市场容量到 2021 年将会衰减到 220 亿美元左右。疾速倒退的云技术和硬件技术,以及疾速遍及的开源数据库技术,将独特决裂商业数据库畛域。

与此同时,学术界在分布式技术上也呈现了一些突破性停顿。这给在 2015 年开始守业的刘奇、黄东旭、崔秋三人提供了实践根底。

一款新型的数据库产品的研发周期注定很长,有急躁的资本能够帮 PingCAP 度过青黄不接的研发期。经纬中国合伙人熊飞在看了几年企业服务后,意识到基于底层架构的守业将是下一波浪潮。在经纬北京的 4 号会议室,甚至连 BP 是什么都不晓得的刘奇带着东旭、崔秋,和熊飞聊了快三个小时。熊飞很快做了投资的决定。

让用户繁难地操作和应用数据库,是 TiDB 产品设计的核心理念。 用户需要明确,想要一款主动弹性伸缩,能解决分库分表(为了解决因为数据量过大而导致性能升高的问题,将原来独立的数据库拆分成若干数据库)问题的数据库。

为了控制规模和复杂度,TiDB 将计算、存储分层,一层是计算层 SQL,它的特点是语言简洁,非计算机专业人的可用。另一层是存储的 key-value 层。

离用户越近越能更快失去用户的反馈,更快验证想法是否可行,因而,团队最终抉择从 SQL 层开始的程序。

如何替换原先的数据库也是一个微小的挑战。用户习惯具备惯性,切换时也有各种因素思考。2016 年,单机版的 MySQL 依然是支流,团队在调研后发现,用户不敢马上切换到新的产品,是放心数据失落等问题产生。

在一直迭代中,TiDB 也明确了本人的切入点:把分布式实践和传统关系数据库相交融,兼容 MySQL 协定和生态,利用无需或者批改大量,即可从 MySQL 迁徙到 TiDB。

不过 PingCAP 并不满足于在小数据量下取代 MySQL,服务数据大规模增长的企业,才是新型分布式数据相比于单机 MySQL 的最大改革。 TiDB 存储、计算拆散的架构的设计,让用户可按需对计算、存储别离进行在线扩容或者缩容,并且让整个过程中对利用运维人员通明。

两年后,TiDB 才推向市场,开始商业化。正如前文所说,TiDB 晚期的两个标杆客户饿了么和摩拜的痛点也都是业务在狂飙,但数据库扩大与运维跟不上,而通过灵便的增减节点,TiDB 帮忙客户实现业务大规模增长下,数据库的性能晋升和安稳降级。

挑战完“大家伙”,TiDB 也积攒了丰盛的场景教训,像伴鱼这样新一代的客户则抉择 All in TiDB,不仅可能解决痛点,也节约了人力。传统企业中,每条业务线底层都须要一组人力去做撑持,目前基于 TiDB 构建的数据底层,伴鱼仅一套撑持服务团队,就撑持了全公四条司产品、业务线,进步了业务研发和 DBA 的工作效率,升高了将近 75% 的人力开销老本。

随着产品、商业模式、市场的答案逐渐清晰,资本对于 PingCAP 也越来越看好: PingCAP 于 2015 年取得经纬中国领投的天使轮融资;之后每年都会有新的资本重注;2020 年 11 月 17 日,PingCAP 实现 2.7 亿美元的 D 轮融资,由 GGV Capital、Access Technology Ventures、晨光投资、时代资本、五源资本(原晨兴资本)独特领投,老股东经纬中国、云启资本持续加持。

这点陪伴 PingCAP 成长的投资人看在眼里,经纬中国的开创治理合伙人张颖也常常揭示公司:要留神现金流、要变现、要保持摸索商业化;刘奇自己则感觉 PingCAP 不够接地气,所以在商业化方面,他肯定要补齐相干的销售人才来补救本人的短板。

04 开源社区:理论参加的贡献者曾经近 1200 人

站在此刻看 PingCAP 的五年,产品、商业模式、市场、资本的补齐,都离不开一个关键词——开源。

能够说,“开源”是 PingCAP 走到当初的源能源。

与开源精力相似的事物并不少见。在特定范畴内,开源软件的源代码任何人都能够审查、批改和加强,相似于全人类都能够编辑的百科全书 Wikipedia。一个开源我的项目,无论是阿里、美团,寰球任何一家企业的工程师,都能够去参加研发,提交代码,并且应用独特研发的产品。

另一个对开源的驰名类比就是集市的模式。在开源著述《大教堂和集市》中,IT 界传奇人物 Eric Raymond 示意,世界上的修建能够分两种:开源软件是集市,天天凋谢在那里,从无到有,从小到大;传统软件则是大教堂,须要几代人醉生梦死能力建成并投入使用。

这样类比起因是,集市模式让更多的工程师参加到软件的开发过程,进步软件品质,欠缺本身产品并反对本人的服务。

放弃开源社区的生机是 TiDB 变得更好用的要害,也是实现正向产品循环、商业循环的要害。 目前,TiDB 理论参加的贡献者曾经近 1200 人,通过社区杠杆去撬动优秀人才是开源力量的弱小之处。

而如何经营开源社区?PingCAP 有一套本人的方法论,刘奇认为就像经营抖音、知乎等内容社区一样。

第一,先要找到最有能力的贡献者造成产品原型,逐步的细化分工,最终造成减速的循环。

在最开始两年,TiDB 并不是一个拿来即用的状态,PingCAP 本身团队会对某一模块有一些构思,而后通过周六早上的 Infra Meetup 把 TiDB 社区里对开源最虔诚、最狂热的几个专家集合起来打磨产品,造成一个产品“毛坯”。

随着贡献者越来越多,分工也会更粗疏,也会让模块的搭建速度也越来越快。当产品开始进入企业应用,就能够从企业收集到更多反馈,从而迭代改良产品,这就进入了一个大循环。在 2018 年到 2019 年,大循环齐全启动后,迭代速度也越来越快。“咱们真正高速跑起来不过两年。”刘奇认为,这就是开源社区厚积薄发的体现。

第二,设置反馈和激励机制,让每一位贡献者感触到尊重和认同的同时,流传社区的能量。

TiDB 社区将贡献者分为几个等级:Contributor—Committer—Maitainer,就像降级打怪一样取得成就认证勋章。很多社区贡献者的代码大多是基于侠义精神的分享,不是每个人都能失去金钱上的回报。举个例子:有些开发者,他们谋求的是极客精力和完美主义,在应用开源产品时,会被动的去改良 BUG 或者减少新的性能;有些是心愿通过分享、帮忙他人,从而取得成就感。

PingCAP 还会设计一些十分乏味的周边来证实身份,比方标志性的红色马克杯就必须是贡献者能力有。发放规范十分严格,PingCAP 的 A 轮领投方云启资本董事总经理陈昱,也在 TiDB 上奉献过一些代码,拿到了红色马克杯。

第三,定期举办有技术影响力和深刻用户的流动。

疫情前,线下 Hackathon 是 PingCAP 会定期举办的流动。在 Hackathon 期间,工程师会进入到疯狂 Hack- 吃饭 - 疯狂 Hack- 吃饭的模式中写代码到凌晨。

另一件触动技术圈的小事,就是 48 小时写一本对于 TiDB 的技术书籍,一本涵盖 TiDB 架构原理、最佳实际案例、生态倒退的作品诞生,两天内总计产生 421 次 Commit,199 个 PR。

这些听起来疯狂的行动,其实并不难理解。回到本文结尾的场景,PingCAP 通过筛选到了一批开源狂热爱好者,在回馈社区的同时,也造成了 PingCAP 的人才护城河。

而最基本的基本,是要答复一个问题:开源为什么会被追捧?

企业软件行业的发家根底,是平台与开发者。而开源软件人造对开发者敌对:寰球有数千万开发者应用开源平台拜访代码、修补应用程序、促成我的项目、参加社区。

就像硅谷风投 A16Z 说得那样,开源吞噬所有。上图所统计的是 1988~2018 年开源畛域的融资数量及融资规模:200 家把开源作为核心技术的公司,总体融资规模超过 100 亿美元,且近十年来融资数额越来越大。

将来,开源我的项目将只增不减。开源不再只是 RedHat、Elastic、Databricks 与 Cloudera,它还将是 Facebook、Airbnb、Google 以及其余任何以开源为核心技术栈的商业公司。开源软件的市场及其可能性,要远远超过目前的设想。

心愿纵然存在,但问题也很事实:开源社区的商业化在不同畛域可不可复制?市场的天花板在哪里?这个市场能够包容几家类似的公司?Snowflake 至今还在亏损,那这类公司到底何时能力盈利?尽管基于私有云的关系型数据库倒退极快(2024 将占到 46% 的份额),然而中国企业云化过程滞后,这是否会影响相干企业的增速?

工夫将给出答案。

退出移动版