李大海 知乎合伙人兼 CTO
2006 年,毕业于北京大学数学迷信学院数学系,先后供职于谷歌、云云网和豌豆荚。加盟知乎后,李大海先后负责过广告技术团队、数据、算法和整体社区业务,目前兼顾负责知乎大数据团队、内容流通和 AI 新业务的拓展。
—
文 | babayage
编辑 | 笑 笑
2006-2010 辞别数学加盟谷歌
成长之初技术视线 > 技术细节
2006 年,行将毕业的北大数学系硕士李大海,陷入了一场决定人生方向的长考:坚守在数学界做一名数学工作者,亦或脱离数学畛域彻底转做其余的职业。
李大海对数学的情感堪称酷爱,但学习是一回事,以其为事业就要面临很多事实问题:在数学界,解决一个课题短则七八年、长则数十年甚至穷尽毕生,他深知本人并不能稳坐研究室、深度钻研繁多课题的性情;性情之外,“我对本人的能力也没那么大信念,在数学畛域我可能只能成为一名平庸的数学工作者”。
“可如果不是数学,我还有什么其余抉择?”
从初中开始,计算机始终是李大海的趣味,也作为晚期发起人成立了北大 linux 俱乐部。凑巧,2006 年,Google 迈出了进入中国市场的第一步,李开复开始在中国边疆进行人才本地化的我的项目,宣讲于全国各大名校,打算招收 50 个关门弟子。
机缘巧合之下,李大海加盟谷歌。
科创人:在谷歌的四年工夫里,您最大的播种是什么?
李大海:方方面面都学到了太多货色,谷歌团队个个都是牛人。当年有一本书我的印象很深,王咏刚老师写的《道法天然》,王老师用特地活跃的语言将模式设计思路介绍得清清楚楚,没想到从实习期开始我就在王老师的团队里;还有一次我负责接待客人去长城玩耍,接待的对象竟然是 Python 发明者 Guido van Rossum。在这样的环境下,须要做的就是齐全关上本人,尽可能排汇所有。
在谷歌的四年里,与其说本人的技术实力增长了多少,更大的播种是关上了技术视线、强化了技术思维。
2010-2014 云云网,首次守业
不均衡的团队
李大海有一位同学,听闻李大海在谷歌任职,便多次以美食利诱,一边吃饭一边灌输对于守业的理念与愿景。三来五往,本没有守业想法的李大海,倒也心理活络了起来。
压垮骆驼的不是稻草,而是一整栋坍塌的摩天大楼——2010 年,谷歌退出中国,李大海三思而行后决定来到,“还是心愿能做服务中国用户的事件”。
论学习环境,谷歌自是最佳抉择;一旦决定来到,就只有守业能让李大海燃起“值得一做”的心底热烈。只不过,他并没有与 N 顾茅庐的同窗好友单干——不知此君是否疼爱饭钱——而是退出了前谷歌中国工程研究院副院长刘骏创立的云云网。
云云网甫一创立,便因其谷歌全明星技术团队而备受瞩目,在圈内掀起了不少的波澜。云云网的业务方向在当年并无先例,没有“新浪—雅虎”“百度—谷歌”“人人网—facebook”这类直观参照,连创始人刘骏本人也婉言“云云网是个全新的货色,跟目前人们已知的货色齐全不同,没方法类比”——直到多年之后,它才被形象形容为“一个社交化的搜索引擎”。
在云云网,李大海负责实时搜索引擎、根底库以及一部分代码框架的开发工作。
科创人:从学习状态到守业状态,在两种差异微小的模式中进行硬切换,是怎么一种体验?
李大海:压力陡增,但影响力也大了,公司的方方面面都与你无关,感觉很有挑战。我可能还是挺适宜守业的,有一种天高任鸟飞的自在感。
有个有意思的事,可能是因为团队里很多谷歌进去的人,很多在谷歌的工作习惯被连续下来了,所以适应起来也没那么难。谷歌进去的人会有一些“臭故障”,在谷歌见过很多好用的工具,进去之后发现没有趁手的工具特地顺当,就会说“咱们先做工具吧”。我也做了一些这样事,比方相似于 Google Blaze 的 C++ Build System 等等。
科创人:最近有首歌《孤勇者》特地火,外面有句歌词叫“和我那么像,缺口都一样”,一个以工程师为相对配角的团队,是否大家的短板、缺点也比拟相似?
李大海:相对如此。复盘第一次守业失败,团队不均衡是一个重要起因,咱们也有产品经理、很业余的经营人员,但在团队内这些岗位的话语权不够强,作为一个技术为主的公司,在做产品的时候没有太抓住用户的痛点,导致一个看上去不错的逻辑却很难跑通。咱们当年要做的社会化搜寻,以买车为例,就是“我和你是敌人——你搜寻到的内容会显示我的评估——间接促成购买决策甚至购买行为”。最终咱们发现,这个逻辑须要肯定的信息密度作为撑持,也就是它可能要依赖一套减少信息密度的产品,略微一想就晓得这肯定是款大规模的产品,咱们没方法间接去做一款进去。
也是因为这次经验,我对于信息密度、信息内容的丰盛水平有了很深的了解。
2014 加盟豌豆荚
正确的逻辑,谬误的机会
“当初是挪动搜寻的年代,这事儿有工夫窗口,如果你还想做搜寻的话,来咱们这吧。”豌豆荚创始人“崔阿姨”崔瑾的一番话感动了李大海,他抱着未酬的搜寻壮志加盟豌豆荚。
将时针扳回 2014 年,豌豆荚这一头部利用商店与搜寻技术的联合有着近乎有限的设想空间:用户只需在利用商店内输出本人想查问的饭店,商店就能间接调出点评类 APP 并跳转到该饭店的页面;用户只有搜寻订票,商店就能调出订票 APP 间接出现订票页面……
但真正上了手,问题接踵而来:首先技术难度门槛颇高,“PC 时代互联网基于 HTML,爬虫能够高效地解决所有页面,但挪动时代 APP 端都是结构化的信息,想用高效买通并调用老本十分高,进而影响搜索引擎构建的效率”;如果说技术问题尚属方法论层,真正的毁灭性打击,来自挪动互联网生态的整体改革,手机厂商迅速崛起、造成头部效应,各品牌手机自制利用商店并事后内置利用的做法,不仅令 APP 生态同样造成了头部效应,更是近乎碾压的捣毁了第三方利用商店的生存土壤。
直到若干年后,微信小程序以另一种方法论跑通了豌豆荚们当年料想的商业模式,而此时的李大海,也曾经寻找到了值得倾泻全副心力的幻想。
2014- 至今 知乎
价值观符合的内容宝矿
写到这,根本能够演绎总结出李大海的职场迁徙模式:从技术到产品,或者说,从醉心技术细节到更全盘的产业洞察。2015 年,李大海受周源的邀请退出知乎,之所以加盟知乎,有两个重要的起因:第一,在李大海看来,知乎领有他之前几次创业项目稀缺的外围资源——兼具价值与数量的无效信息,也就是优质的问题与答复,“通过前两次教训,我意识到内容的价值,而这些内容与技术结合能引爆出更大的能量,而过后知乎在技术层面上还没有开始由机器学习去举荐,后劲很大”;第二,知乎的理念十分符合他的价值观:高价值的常识,该当以活泼的故事为载体,而非干燥的说教,“学数学的时候我感到很苦楚,那是一套公理体系,公理肯定理二、三推出猜测四,这些实践背地的故事、如何产生、过后为了解决什么问题,全都没在课本上体现,恰好这些局部能够让学习者可能更高效的消化常识。”
“帮忙更多人用更简略的形式更全面地理解这个世界,这件事值得始终做上来。”如果说之前的守业指标只是做一款牛 X 的产品、一份名利双收的事业,在知乎,李大海真正体验到了一种理想主义特有的铿锵,那是每一步前行都在扭转世界的烙印余响。
最后,李大海只负责算法与大数据,但不久之后他便接管了首页,首页举荐零碎是知乎最重要的一个产品,但过后现状不现实,不仅一个申请得等上两秒,甚至首页的推送逻辑是每个用户有一个 mailbox,知乎放 200 条信息进去,“刷完就刷完了,一天就这 200 条”。
李大海迅速摒弃了这种“古老的算法”,将知乎首页切成举荐零碎,应用机器学习技术,迅速改善了用户体验,用户时长、次留、DAU 等要害指标均大幅晋升。
放弃内部视角
防止信息茧房
科创人:您可能是最理解知乎底层的人,从逻辑原理到技术细节都很分明,在外部信息如此庞杂的影响下,您如何放弃“用户视角”“内部视角”?
李大海:好问题。首先,技术团队每个人都必须是社区的玩家,我要求大家每天有肯定的沉闷时长,本人的产品本人首先要体验,本人玩起来能力晓得用户的痛点是什么,为什么痛,否则就无奈共情;其次,咱们成立了用户体验核心,用多种办法、多种渠道一直聆听用户的反馈声音,办法包含线下访谈、采集无效的用户反馈、对用户行为痕迹进行数据分析等等——知乎非常重视数据迷信,十分强调试验的科学性。
科创人:举荐算法导致的信息茧房,以及以人为信息节点而导致头部效应,是内容型社区势必面临的挑战,知乎如何防止这一景象的产生?
李大海:知乎始终致力于欠缺、优化内容分层,对每一个畛域的内容进行评估,除了举荐给用户他感兴趣的畛域内的优质内容,也会想跨畛域的优质内容举荐给他。除了关注举荐零碎的精准度,咱们也会关注它的惊喜度,让用户看到的内容可能一直开辟他的视线,防止信息茧房。
而对于创作者的头部效应,就要提到知乎的愿景:让每个人都能分享本人的常识、见解,并找到本人须要的解答。在这个场景下显然有一个客观事实:你须要的答复很可能在一个你齐全设想不到的人身上,他可能来自一位 KOL,也可能来自一位新注册用户,因而知乎的产品逻辑必须聚焦于优质内容。
当然,知乎也肯定可能让继续输入优质内容的 KOL 取得应得的影响力,包含商业回报。说到底,内容是外围价值。
优质内容是商业化的土壤
最大挑战:内容社区的语义辨认
科创人:优质内容与商业内容对于知乎而言各有其价值,作为知乎重度用户,感觉知乎可能把商业信息管制在一个让人舒服的区间内,知乎对商业性内容与优质内容的平衡感,基于哪些准则和理念?
李大海:商业化变现,并不一定影响内容的优质、业余和中立,这两者并没有天生矛盾的关系,而是要看是以怎么的形式做商业化。过来几年,知乎在商业化层面进行了很多尝试和摸索,从问题上看,知乎曾经造成了绝对稳固的商业模式和多元化的支出起源。然而这些商业化摸索的大前提,仍然是放弃社区和内容的高质量生产和运行。知乎始终都保持不以低质内容换流量,不以就义社区气氛换支出,不以蹭热点、博眼球而毁坏网络生态。直到现在还仍然是这样。当赚取支出与咱们的根本价值观相冲撞的时候,咱们抉择放弃支出,保卫价值观。正当收益推动内容创作,是商业化激励了业余、中立的优质内容的生产,放弃了知乎业余的个性,而不是扭转、波动。
科创人:在知乎,您遇到的最大难题、最大挑战是哪一次?是否绝对具体的形容一下具体事件、解题思路及解决办法?
李大海:知乎是一个内容社区,如何通过技术手段更好的驱动内容的生产和流通,对咱们意义重大。咱们始终在尝试拓宽 AI 算法在内容社区的利用边界。到目前为止,也有了不少利用成绩。知乎 AI 算法利用也曾经贯通了从内容生产、生产以及社区治理的多个场景。
这其中技术挑战有很多,最大的挑战,我认为是对语义的准确辨认,比如说“瓦力”对阴阳怪气内容的辨认,外围难点在于网络语言的复杂性。例如经典的“呵呵”,因为单方不同关系、谈话的不同场景和工夫都会带来大同小异的表意。即使是人工断定都存在标准化难度,算法模型的训练挑战就更为艰苦。知乎基于对于用户切实体验的累积察看,与算法团队一起,从情感倾向性、亲密关系、文本特色三方面动手,建设了内容情感模型、用户亲密度模型和文本辨认模型等,并通过训练一直迭代欠缺。三大模型的联合,不仅解脱繁多算法模型的局限性,也让“瓦力”的阴阳怪气辨认准确率超过了大多数人工判断。
技术团队治理心得
绩效,选材
科创人:作为知乎 800 多人技术团队的管理者,是否分享下您的治理心得,比方如何放弃与策略同频,如何提拔人才?
李大海:我的治理框架是点线面,点是要害岗位,须要什么技能、满足什么要求必须精确、得力;线,是指要将大团队里最重要的事提炼进去,这件事可能须要很多团队配合能力做好,这些团队如何合成指标、如何单干分工、如何设置流程,须要深度思考;面,就是制度、标准、文化,尽可能在方方面面影响团队的工程师,晋升凝聚力。
知乎的研发团队十分重视对齐业务,所有以实现业务指标、撑持业务价值为目标,因而咱们将业务研发团队的绩效考核权交给了业务团队,确保研发团队给予业务最大的反对力度。
至于选材,其实没有完满的人,人一旦过了 30 岁,心田造成了理念,想扭转 Ta 十分难。但另一方面,人都有十分大的灵活性和弹性,所以肯定要用人以长,把他的短处激发进去,让他心田真的违心去做这件事。
科创人:您的个人爱好,将来集体的人生愿景?
李大海:我平时喜爱跟敌人一起踢踢足球,打打德扑。将来的人生愿景和知乎的业务有较高水平的符合,久远心愿通过内容服务、常识服务、趣味教育等帮忙到更多的人,能和共事们率领知乎发明更多价值,不论是企业治理还是技术创新,能解决更多问题,进入一个更簇新的场面。
— End–