关于字节跳动:火山引擎-DataLeap-构建Data-Catalog系统的实践二技术与产品概览

技术与产品概览架构设计元数据的接入 元数据接入反对T+1和近实时两种形式上游零碎:包含各类存储系统(比方Hive、 Clickhouse等)和业务零碎(比方数据开发平台、数据品质平台等)中间层: ETL Bridge:T+1形式运行,通常是从内部零碎拉取最新元数据,与以后Catalog零碎的元数据做比照,并更新差别的局部MQ:用于暂存各类元数据增量音讯,供Catalog零碎近实时生产与上游零碎打交道的各类Clients,封装了操作底层资源的能力外围服务层零碎的外围服务,依据职责的不同,细拆为以下子服务:Catalog Service:反对元数据的搜寻、详情、批改等外围服务Ingestion Service:承受内部零碎调用,写入元数据,或被动从MQ中生产增量元数据Resource Control Plane:通过各类Clients,与底层的存储或业务零碎交互,操作底层资源,比方建库建表,能力可插拔Q&A Service:问答零碎相干能力,反对对元数据的字段含意、应用场景等发问和答复,能力可插拔ML Service:负责封装与机器学习相干的能力,能力可插拔API Layer:以RESTful API的模式整合系统中的各类能力存储层针对不同场景,选用的不同的存储:Meta Store:寄存全量元数据和血缘关系,以后应用的是HBaseIndex Store:寄存用于减速查问,反对全文索引等场景的索引,以后应用的是ElasticSearchModel Store:寄存举荐、打标等的算法模型信息,应用HDFS,当ML Service启用时应用元数据的生产数据的生产者和消费者,通过Data Catalog的前端与零碎交互上游在线服务可通过OpenAPI拜访元数据,与零碎交互Metadata Outputs Layer:提供除了API之外的另外一种上游生产形式 MQ:用于暂存各类元数据变更音讯,格局由Catalog零碎官网定义Data warehouse:以数仓表的模式出现的全量元数据产品性能降级产品能力上的降级迭代,大抵分为以下几个阶段:根底能力建设(2017-2019):数据源次要是离线数仓Hive,反对了Hive相干库表创立、元数据搜寻与详情展现、表之间血统,以及将相干表组织成业务视角的数据专题等中阶能力建设(2019-2020年中):数据源扩大了Clickhouse与Kafka,反对了Hive列血统,Q&A问答零碎等架构降级(2020年中-2021年初):产品能力迭代放缓,基于新设计降级架构能力晋升与疾速迭代(2021年至今):数据源扩大为蕴含离线、近实时、业务等端到端系统,搜寻和血统能力有明显增强,摸索机器学习能力,产品状态更成熟稳固。另外咱们还具备了ToB售卖的能力。点击跳转https://www.volcengine.com/product/dataleap/?utm_source=sifou... 理解更多

July 11, 2023 · 1 min · jiezi

关于字节跳动:从Google创业再到字节跳动我在开源领域的实践与思考

点击以下链接收听本期“大咖访谈”播客,与大咖面对面: https://www.xiaoyuzhoufm.com/episodes/64780ea016726282409baf70 开源雨林:请您先向观众介绍本人大家好,我是张鑫。以往在不同场合我会有很多不同的介绍形式,明天我想多聊聊与开源的缘分。我从事过科研、尝试过守业、在互联网公司工作,但这其中有一条主线——开源。 从清华大学毕业后,我去了美国的卡内基·梅隆大学(CMU)持续攻读计算机博士学位,从事分布式系统和网络安全相干的钻研工作。最早感触到开源的力量就是在读博期间。咱们在进行学术研究时,常常要以论文的模式将科研成果在社区共享,通过社区合作、常识共享,独特推动技术与畛域的提高。另外,在做科研、发表论文的过程中,对于一些新的见解,也常常须要做仿真。这个过程中,往往会用到很多开源软件和工具去做技术的落地和验证,相当地高效。这样一些开源工具的存在,有助于大家进行更好地翻新。 从 CMU 毕业后,我去了美国的 Google 从事 Google 外部的集群治理平台。2014 年初,Google 外部探讨是否发力私有云,作为 ToB 畛域的后发者,如何在私有云畛域青出于蓝,通过开源推动 Google 的现有劣势,把开源作为拉动谷歌私有云商业化的重要措施。在这样的大潮里,我参加到了 Kubernetes 的研发工作中,奉献排名在前十位,起初我的项目的胜利也是超出最开始的预期。不过两三年的工夫,其余公司的贡献者比例曾经超过了 Google,这是咱们没想到的。由此可见,过后开源热度之高。 2015 年,我从 Google 辞职回国守业,开办了一家科技公司(杭州才云科技有限公司)。一方面,基于云原生技术踊跃构建企业级产品;另一方面,联合在做 ToB 时发现的新场景,被动开源翻新我的项目,例如 2017 年与 Google、Red Hat 等公司独特推出的容器化深度学习平台凋谢技术标准 Kubeflow,咱们通过参加制订技术标准,播种了很多企业客户,带来了很大的收益的同时,也帮忙咱们更好吸引了人才,以此更好地服务更多的用户,让更多的企业理解到咱们。 2020 年,咱们的团队及业务通过收买的形式退出字节跳动火山引擎,目前是火山引擎副总裁,以及字节跳动开源委员会治理经营负责人。 开源雨林:从顶级国内企业到守业(准独角兽公司),再到退出国内顶级互联网公司的心路历程是什么?最次要的起因还是心田始终想做一些能够填补行业空白的事件。 2015 年,谷歌开始大力发展私有云业务,而过后国内的私有云还比拟空白,另外很多的开源的技术在美国发展地热火朝天,但却始终短少具备中国原创或是中国作为主力军的开源技术贡献者。就感觉,如果回国开办一家不光是用开源技术,同时还本人作为次要贡献者,且能推出一些有独创性的残缺我的项目的企业,我感觉对于整个国内的科技进步和行业提高是十分有价值和意义的。当然,也掂量了守业的一些关键因素。在守业正式回国前,我利用集体假期回国接触了第一家潜在企业用户——锦江团体,聊得特地顺利,顺利到让我感觉所有的企业听到这种开源技术都会十分兴奋。 在字节跳动收买之前,咱们先后实现了四轮融资。和本人守业相比,字节跳动可能带给咱们更大的施展空间,以及更多对外输入的技术和解决方案。咱们心愿能在一个绝对空白的畛域施展更大的影响力,感觉退出字节跳动是一个很好的抉择,字节跳动也提供给咱们一些很好的计划,所以就一拍即合,带着团队和业务来到了字节跳动。事实证明,这段旅程是很好的,在字节跳动做开源能让咱们影响更多人,推动更多的事件。 开源雨林:为何对开源治理感兴趣?最开始,大家不了解开源的价值,企业会感觉开源会侵害外围商业秘密、减弱技术壁垒,认为开源=收费,甚至有的会说开源是扼杀翻新。另外,开源须要最佳实际的积淀。比方开源技术如何做更好的推广、布道?如何更加标准、更加开放式合作的打造强壮的开发者群体?如何通过经营,让好的技术更好地流传进来?国际化环境下,如何突破所谓的 Cultural Barrier 或 Language Barrier,让中国的开源走向国内,和海内开发者以及顶级基金会接轨?这些都是咱们在治理方面须要做的事件,且与国外差距十分大,这是我违心花工夫和精力投入其中的起因。 开源雨林:Google 激励员工奉献开源,当初还是这样吗?2011-2015 年我退职 Google 期间,Google 有一个 70/20/10 准则,激励员工拿出 20% 的工夫来钻研本人喜爱的我的项目,以此激发员工的创造力和翻新精力。如果你在开源方面获得了肯定的问题和影响力,会在公司外部甚至绩效上有肯定的体现。越往上走,就越须要你是某个行业/畛域的专家。通过开源,能够帮忙咱们成为行业专家,产生行业影响力,甚至通过开源合作建设更多行业洞察力,对员工是有具体的事实价值在的。 另一方面,我退职 Google 期间,Google 很多工具是闭源的,导致很多人来到 Google 第一件事是学习外部各种工具及技术栈,耗时且低效,影响了谷歌肯定水平上对于人才的留存或招募。我置信 Google 看到了这些问题,所以在近年来更加拥抱开源,外部一些好货色会对外开放,还是持续保持很凋谢的态度。 开源雨林:最近有几位开源界的 KOL 纷纷退出字节跳动,例如 ASF 董事姜宁,王蕴博等,字节跳动是否在策划什么新的动作呢?非常感谢行业里一些资深的同学信赖咱们,可能跟咱们一起去做奉献。开源是一个长期的根底工作,不像做销售卖产品,有十分短期的一些 KPI。开源不是银弹,没有欲速不达的大招,与其说有什么新的动作,我感觉更多是字节跳动体现出了本人在开源畛域投入的信心和急躁。 做开源的人会更看重平台可能给到的资源、反对以及自由度,也会看哪边有更大的倒退空间。2022 年年初,咱们发现如果企业是分布式自下而上地做开源我的项目,会遇到较多挑战,所以心愿可能有一个中台去服务大家,公司为了这个中台也投入了十分多的资源,给予了很大的反对。 ...

June 1, 2023 · 1 min · jiezi

关于字节跳动:字节跳动和TikTok内推

前言对于字节跳动网上有很多不同的声音,比方字节和心脏只有一个能跳动。随同着字节跳动改名抖音团体,公司也在一直拥抱变动调整工作节奏,比方作息时间,OKR周期,福利继续改良等。每个人都领有自由选择的权力,咱们无法控制共事和领导都是凶恶的,能够逃离互联网抉择外企、公务员、国企央企、读书出国甚至更换行业从新开始,也能够像围城一样抉择在互联网行业深耕,实现本人的小指标。兴许有人会放心35岁后的中年危机,也有人自信笃定,你能够孑然一身纵享人生丝滑,也可能面临上有老下有小的进退维谷,无论是被动还是被动的抉择生存总是须要持续,每迈出一步做出扭转都须要勇气。 本文是基于发自内心的被迫为前提,和共事沟通不波及敏感信息,与大家分享下字节跳动和TikTok招聘流程和内推的机会,以及我所在团队的气氛,如果各位对其中的职位感兴趣欢送投递简历成为共事。 更新历史2023年03月12日 - 初稿 浏览原文 - https://wsgzao.github.io/post/tiktok-referral/ 字节跳动和TikTok招聘的区别字节跳动和TikTok官网招聘网站的区别次要体现在Location和前端入口细分字节跳动校园招聘,次要是应届生和实习生 https://jobs.bytedance.com/campus 字节跳动中国区的社招职位,职位形容大部分显示中文 https://jobs.bytedance.com/experienced/position 字节跳动海内招聘,Job Type能够筛选Experienced/Campus/Intern,显示英文 https://jobs.bytedance.com/en/position TikTok海内招聘,Job Type能够筛选Experienced/Campus/Intern,Location根本都是寰球各地的海内国家,显示英文 https://careers.tiktok.com/position 内推/间接投递/猎头举荐/简历池捞人无论上述哪种形式最终候选人的简历都会进入到公司外部的简历池中,HR会定期从简历池捞人发动面试邀请,个别会安顿3-5轮面试 大部分公司会激励员工内推,除了家喻户晓的内推奖金作为正向激励,更重要的是成年人之间的信赖和效率 基础架构职位外部举荐SGROLES / POSITIONSJOB IDJob DetailSOFTWARE ENGINEER, CLOUD NATIVED2909https://careers.tiktok.com/position/7200631875395045669/detailSOFTWARE ENGINEER, MIDDLEWAREU6798https://careers.tiktok.com/position/7200633018326665531/detailSOFTWARE ENGINEER, DEVOPSJ4745https://careers.tiktok.com/position/7200636052595231034/detailSOFTWARE ENGINEER, R&D SYSTEMSQAVhttps://careers.tiktok.com/position/7059250273450313992/detailSOFTWARE ENGINEER, CLOUD PLATFORMU4269https://careers.tiktok.com/position/7202142775449241893/detailSOFTWARE ENGINEER, DBAB6333https://careers.tiktok.com/position/7203271607413066042/detailSOFTWARE ENGINEER, SREE5747https://careers.tiktok.com/position/7203603759233304889/detailTECH LEAD, DBAFB1Vhttps://careers.tiktok.com/position/7064400706110900494/detailTECH LEAD, SREJRCMPhttps://careers.tiktok.com/position/7064408255376820511/detailCN角色 / 职位职位ID职位详情云基架平台研发高级工程师U1953https://jobs.bytedance.com/experienced/position/7121618800360...云基架平台云原生高级研发工程师/架构师M3509https://jobs.bytedance.com/experienced/position/7197317575860...存储中间件研发高级工程师C5736https://jobs.bytedance.com/experienced/position/7121619956118...业务架构高级研发工程师/架构师M0063https://jobs.bytedance.com/experienced/position/7197317521489...存储研发工程师-广告架构2XK2https://jobs.bytedance.com/experienced/position/7013558889002...团队气氛Linus Torvalds Quote: "Talk is cheap. Show me the code."团队我的项目有阶段成绩产出,受过公司级嘉奖,中长期指标清晰且重要,次要面向寰球混合云+云原生的技术栈团队负责人懂技术也懂治理,亲自参加具体架构布局,违心聆听不同的声音灵便调整策略,充沛受权团队成员次要散布在新加坡和北京,没有PUA和向上治理,团队气氛谐和大家以德服人尊重团队成员的作息习惯,一起做有挑战能取得成就感的事件 Always Day 1如何内推如果对上述职位或者寰球其余职位感兴趣,感觉我分享的文章信息有价值,能够点击以下链接或者扫描二维码,搜寻Job ID后上传简历即可实现内推,爱护简历隐衷,没有中间商赚差价 https://job.toutiao.com/s/SbyavxV 如果你心愿与我在线沟通或者想理解新加坡的生存,能够拜访以下链接 https://www.linkedin.com/in/aowang https://wsgzao.github.io/index/

March 15, 2023 · 1 min · jiezi

关于字节跳动:字节最爱问的智力题你会几道

在面试过程中,智力题的考查也经常出现,这种题的特点是如果你看过,那么很容易就能做进去,如果没加过那可能在面试过程中不太容易做进去,所以在面试过程中恰好问到看过的题也不要马上答出来,还是要伪装思考一下,因为你脱口而出会让面试官发现你做过,给你换一道题的。1. 只有两个无刻度的水桶,一个能够装6L水,一个能够装5L水,如何在桶里装入3L的水提醒:这个问题的实质就是利用两个水桶的已知容量倒来倒去,问题的解法并不惟一。先将5L的桶装满,将5L的桶的水倒入6L的桶中。这时5L的桶是空的,6L的桶中有5L的水再将5L的桶装满,倒入6L的桶中。这时5L的桶有4L的水,6L的桶是满的将6L的桶中的水倒掉,5L的桶的水倒入6L的桶中。这时5L的桶是空的,6L的桶中有4L的水将5L的桶装满,倒入6L的桶中。这时5L的桶还有3L的水,6L的桶是满的。2. 25匹马,5个赛道,每次只能同时有5匹马跑,起码较量几次选出最快的马?这个题目字节常常问,大略思维就是先分5组跑,跑出每组第一名,将每组第一名放到一起跑,找出25匹马的第一名,而后找出2、3名,一共须要7次前五次:将25匹马放到5个赛道较量,找出每个赛道的第一名。假如A1、B1、C1、D1、E1别离为每组的第一名,如下图。 第六次:将A1、B1、C1、D1、E1放到一个赛道上找出第一名,假如为A1,其余四名别离为B1、C1、D1、E1。这时第一名曾经找到了,还需找到二、三名。因为C1的速度比D1和E1的速度快,所以赛道D和赛道E的所有马都被淘汰了。有机会成为二、三名的马为A2、A3、B1、B2、C1这五匹马,即前五名在这个区域,并且第一名为A1。如下图 第七次:将A2、A3、B1、B2、C1放到一个赛道找出前两名,再加上A1,这就找到前三名了。 延申:如果要找到前五名呢?3.1000瓶药水外面只有1瓶是有毒的,毒发工夫为24个小时,问须要多少只老鼠能力在24小时后试出那瓶有毒。这个问题不太容易想到能够先记住答案,须要老鼠的数量为为了简化问题,能够先假如有只有8瓶药水,其中有一瓶有毒,依据公式须要 个老鼠 先将瓶子进行编号为0-7号,用位数示意老鼠,如下图, 将4、5、6、7号药水混合到一起喂给老鼠1,将2,3,6,7号药水混合喂给老鼠2,将1、3、5、7药水混合喂给老鼠3,察看老鼠是否中毒。 中毒的老鼠标号为1,未中毒的老鼠标号为0,将三只老鼠标号组合到一起即为有毒药水的标号。 例如,老鼠1中毒,老鼠2未中毒,老鼠3中毒。那么三只老鼠的二进制示意为101,即5号药水有毒。因为老鼠1中毒,阐明4、5、6、7号药水中含有毒的药水。老鼠2未中毒,阐明2、3、6、7无毒。老鼠3中毒,阐明1、3、5、7中有一瓶有毒。所以有毒的为5号药水,其实和间接将二进制转化为十进制的后果是一样的。 回到正题,如果有1000瓶药水,则须要10只老鼠,因为10位二进制足以示意0-999。 4.家里有两个孩子,一个是女孩,另一个也是女孩的概率是多少?这是一个概率问题,答案是二分之一,看到这里脑瓜子嗡嗡的吧这个问题我也是看了B站的视频剖析才搞明确咋回事,题目多少有些歧义,面试时说分明就行了。 已知家里有两个孩子A和B,其中一个是女孩,关键问题就在其中一个是女陔这句话上。 如果你了解为这个是指定了一个孩子为女孩,例如A为女孩,那么B也是女孩的概率显然为二分之一。 如果你了解为A或B有一个孩子是女孩,问另一个孩子也是女陔的概率,这就是三分之一了。因为两个孩子的性别只有男男、男女、女男、女女四种组合,男男被排除了,剩下三种组合均合乎题意,所以是三分之一。 其实,题目自身应该是第二种了解的意思,通知你了有一个是女孩并未明确说哪个是。但很多人看到题目就会先入为主,先指定了一个孩子为女孩,那另一个孩子为女孩的概率必定是二分之一了,这是不正确的。 5.烧一根不平均的绳,从头烧到尾总共须要1个小时。当初有若干条材质雷同的绳子,问如何用烧绳的办法来计时一个小时十五分钟呢?这个问题的要害就是要晓得绳子能够从中间烧将绳子1从一段开始烧,同时将绳子2从两端烧,绳子2在半小时后烧完。这时开始计时,将绳子1的另一端点燃,从计时开始绳子1烧完后是15分钟,而后点燃绳子3的一端,绳子3烧完须要一个小时。加上方才的15分钟正好是1小时15分钟6.一共12个一样的小球, 其中只有一个分量与其它不一样(未知轻重),给你一个天平,找出那个不同分量的球?这个问题的思维是采纳分治的思维。将12个小球分为三组(因为分成两组不能找到分量不一样的球在哪组),为A组、B组、C组将三组球别离两两称重,找到分量和另外两组不同的那一组(只有有两组能够使天平均衡,分量不统一的球必然在第三组)。假如坏的球在C组将C组的球分成两组C1和C2,每组两个球,这时从A组和B组里找到两个失常的球,别离和C1和C2去称,天平不能均衡阐明分量不统一的球就在哪组。假如在C1将C1组的球别离和失常的球去称,天平不均衡时就能找到分量与其余不统一的球。7.有10瓶药,每瓶有10粒药,其中有一瓶是变质的。好药每颗重1克,变质的药每颗比好药重0.1克。问怎么用天秤称一次找出变质的那瓶药?将这10瓶药标好号1-10。而后依照瓶子的标号取药,1号药瓶取1粒药,2号药瓶取2粒药,3号药瓶取3粒药,以此类推,取完10瓶药一起放到天平下来称。如果没有变质的药,分量应该是55克,这时多出几克,几号药瓶就是变质的。例如55.3克,那么变质的药就是3号药瓶的。8.你有两个罐子,50个红色弹球,50个蓝色弹球,如何将这100个球放入到两个罐子,随机选出一个罐子取出的球为红球的概率最大?这个问题应该是这几道题中最简略的了,将一个红球放到一个罐子中,另一个罐子放49个红球和50个蓝球,这样轻易选出一个罐子取出红球的概率是1/2 1 + 1/2 49 /(49+50),靠近0.75。

August 3, 2022 · 1 min · jiezi

关于字节跳动:当字节跳动在美国输出中国式-996

在荣克到职时公布的一份外部备忘录中,他说,“TikTok看待员工的形式与TikTok平台代表的货色截然相同。” TikTok上仿佛有无穷无尽的消遣打趣、纵情舞动以及善意的恶作剧,它也因而自称是互联网上最高兴的中央。 但据TikTok美国办公室的员工说,推动TikTok胜利的,是严苛的治理格调和高要求的外部文化,齐全背离平台愉悦鼓励的公众形象。 这些员工中有许多都曾供职于其余大型科技公司,他们说,TikTok一味强调效率和窃密,其水平之甚,在业内并不多见。 随着TikTok持续放弃高增长,上述情况日益助推着TikTok美国办公室的缓和氛围。TikTok是总部位于北京的字节跳动科技有限公司(ByteDance Ltd.)的子公司。 据市场钻研公司Sensor Tower,截至2022年第一季度,六年前创建的TikTok已在所有类型应用程序中创下了下载量最高的纪录。 截至2020年年中,TikTok美国业务部约有1500名员工,该公司去年示意,心愿将这一数字减少至10,000人。他们的工作内容次要围绕将在中国开发的产品转化为面向美国受众的产品,同时开辟商机可观的美国广告市场。 01 从工作文化交融的角度来看,TikTok正在进行最大胆的尝试,它须要连贯寰球两大科技强国。 TikTok美国业务的总部设在洛杉矶,这里的一些员工埋怨称,他们经常睡眠不足,而且周末频繁加班,必须与地球另一端的共事散会,就导致这种状况更加重大了。 有几个该公司的美国前员工说,他们在TikTok工作期间,均匀每周要开85个小时的会,而且还要挤出额定的工夫来实现本人的工作。 另一人说,他在提供了医学实验室查看后果、证实本人的身体状况危及生命后,才压服老板不再让他间断熬夜工作。 一些前员工提到,他们经验了重大的体重稳定、压力或是情绪低谷,以至于到了得寻求医治的境地。 一名前员工说,微小的压力让她不敢缺席TikTok一场紧接着一场的会议,她甚至不敢中途走开去换卫生棉条,以至于血漫湿了裤子。 TikTok的一些做法是借鉴于亚马逊(Amazon.com Inc.),后者同样因高要求的工作文化著称。TikTok的高管时常通知员工要“永远守业”,这来自亚马逊创始人贝佐斯(Jeff Bezos)激励翻新、防止自满的名言“每天都是第一天”(Always Day 1)。 除此之外,TikTok办公室的墙上还醒目地贴着其余标语,例如“坦诚清晰”,而员工对这些理念的执行状况如何,会成为公司对他们的评判规范之一。 TikTok示意,公司致力于“建设并造就一个弱小的团队,使其可能反对公司一直成长的寰球社群”,为实现这一指标,它已对本身做法及工作文化进行了一些调整。 TikTok在一份书面声明中补充说,“咱们激励通明和反馈的文化,并致力于打造一个偏心的平台和企业,让咱们的社群和员工都能茁壮成长。” TikTok的美国办公室次要位于洛杉矶 对TikTok这样疾速倒退的科技企业来说,长时间的工作和紧迫的截止日期不算什么新鲜事,而外企员工睡眠周期被打乱的状况也并不少见。但一些在TikTok和其余科技企业都干过的人说,TikTok美国员工体现出的压力之大到了常见的水平。 一些前员工曾在YouTube、Medium等社交媒体网站上讲述他们在TikTok美国办公室的经验。 有些人说,身处缓和气氛会让他们感到兴奋。其余许多人则提到了种种挑战,包含了解外部文件的意思,那些文件以中文撰写再用软件翻译成英文,其中的轻微含意难以在译文中出现。 “我曾经数不清TikTok的工作经验让我在多少方面失去了锤炼,无论是产品策略、执行还是不同文化间的细微差别,我从TikTok学到的货色之多,超过了我最后的设想。” TikTok前高级产品经理Melody Chu在Medium的一篇贴文里说,其工作职责是帮忙创作者将内容变现。尽管如此,自称曾在Facebook、Roblox和Nextdoor都工作过的Chu还是在去年11月来到了TikTok。 她说,很屡次晚饭时间她得跟中国共事通电话,没法陪丈夫,这种状况之频繁,以致于夫妻俩去找过婚姻咨询师。 她写道,她的体重急剧下降,睡眠也呈现了问题。所有她想做的事,包含陪伴父母以及关注本身心理健康,通通让位给了TikTok。 她写道,“早知去TikTok会让我失去这么多,(2020年6月时)我必定不会承受这份工作。”但她也说,当初回想起来,她也不悔恨去TikTok,因为通过这段经验,她向本人证实了她已具备胜利所需的品质。Chu没有回复记者的采访申请。 前TikTok员工帕贝尔·马丁内斯说,他被告知不要将某些数据同较低级别的员工分享。“我失去的信号是:‘咱们不信赖你们。’”他说。 02 许多TikTok员工之所以能忍耐长时间的工作以及工作和生存间不足界线的状况,是因为如果其母公司上市,他们有可能拿到一笔数量可观的钱。“你想登上那艘火箭船。”往年2月之前负责TikTok广告销售寰球客户总监的帕贝尔·马丁内斯(Pabel Martinez)说。 马丁内斯说,只管本人的我的项目按进度推动,他仍被要求整个周末加班,他回绝这样,对此,一名主管回应说:“咱们这里不是这样做事的。”他随后来到了TikTok。 大概一年前,因为中国监管机构催促字节跳动关注数据安全问题,该公司临时搁置了上市打算。 据一位相熟TikTok经营状况的人士说,该公司2021年的支出约为40亿美元,往年的营收无望达到120亿美元。 相比之下,现更名为Meta Platforms Inc.的Facebook在成立十年后,营收才达到120亿美元。 据前员工说,TikTok经常会安顿多个团队实现同一个我的项目,让它们相互竞争,看谁最先实现。 这一策略本意是为了推动员工尽快实现工作,但一些前员工指出,这让人们唯恐落后于其余共事,而当有的团队始终无奈看到曙光时,员工心里容易产生挫败感。 去年,常驻新加坡的周受资接替长期首席执行官瓦妮莎·帕帕斯(Vanessa Pappas),出任TikTok首席执行官,后者目前负责TikTok首席运营官,工作地点位于洛杉矶。 美国员工说,这一行动进一步坚固了TikTok在西方的势力根底。美国人凯文·梅耶尔(Kevin Mayer)曾于2020年初负责TikTok首席执行官,但大概三个月后到职,过后特朗普政府正试图迫使将TikTok发售给一家美国公司。 TikTok既没有向员工提供组织结构图,也不容许员工本人制作和分享组织结构图。 对于那些想阻止竞争对手挖人的中国企业来说,这是他们的常见做法。一些前员工说,他们曾被告知组织结构图没有必要,因为在TikTok的扁平式架构中,任何人之间都能够互相分割。 如此一来,员工可能感到困惑,他们不晓得该分割其余团队中的哪些人,或者给他们发信息的又是哪些人。据一些前员工说,纽约办公室人力资源和财务团队的成员几个月来始终不晓得在加州,还有另一群人也从事同样的职能。 TikTok新加坡前员工Jamie Lim Yin Yin说,当她收到共事的电子邮件时,她只有去领英(LinkedIn)上查找一番,才晓得他们属于哪个团队。 “这样说好了,在我的浏览器上,领英的标签页总是开着的。”她在一段YouTube视频中说,视频讲述了她为何会在去年12月、入职仅四个月后就来到了TikTok。 一位TikTok发言人说,员工有路径查看彼此的档案。 曾任TikTok广告销售客户总监的马丁内斯说,TikTok的展现文件里时常会呈现数字被含糊解决或是被略掉的状况,他的主管曾批示他不要将某些数据同较低级别的员工分享。 “我失去的信号是:‘咱们不信赖你们。’”他说,TikTok的窃密水平与他供职过的其余科技公司有着很大不同。 TikTok前员工Chloe Shih在一段视频中说,“当我该去睡觉的时候却发现公司大部分人都没睡,这让我早晨非常焦虑。” 03 只管TikTok吸引了少量一心想来此工作的求职者,但与此同时,它也在致力解决到职率较高的问题。 曾在加州山景城(Mountain View)工作的TikTok前工程团队主管Lucas Ou-Yang在一系列Twitter主题贴中写道,因为要跟上中国共事的节奏,还要依据他们的日程表来安顿工作,在这种压力下,曾与他共事的所有10位产品经理全都在入职大概一年后辞职了。 ...

June 7, 2022 · 1 min · jiezi

关于字节跳动:字节跳动DanceCC工具链系列之Swift调试性能的优化方案

前言DanceCC (Dance Compiler Collection) 是字节跳动的终端技术团队(Client Infrastructure) 下的编译工具链品牌,编译工具链团队成员由国内和硅谷两地的编译器专家及构建零碎专家组成,提供基于开源的 LLVM/Swift 我的项目深度定制的 clang/swift 编译器、链接器、lldb 调试器和语言根底库等工具及优化计划,笼罩构建性能优化及利用性能稳定性优化等场景,本系列将会围绕这些场景中的优化案例,介绍编译工具链技术在字节的优化计划和落地状况。 背景通常来说,大型Swift我的项目常含有大量混编(Objc/C/C++甚至是Rust)代码,含有超过100个以上的Swift Module,并可能同时蕴含二进制局部和源码局部。而这种大型项目在目前的Xcode 13体验下十分不好,常常存在相似“断点陷入后变量面板卡顿转菊花”、“显示变量生效”等问题。而且始终存在于多个历史Xcode版本。 图1:Xcode变量区显示卡顿转菊花,测试应用Xcode 13.3和下文提到的复现Demo 这部分Apple Team迟迟不优化的起因在于,Apple公司的外部我的项目和内部我的项目开发模式的微小差别。Apple外部产品,如零碎利用,零碎库,会间接内嵌到iOS固件中,并间接受害于dyld shared cache(参考WWDC 2017-App Startup Time: Past, Present, and Future[1])来晋升加载速度。这意味着他们通常会将一个App,拆分为一个薄的主二进制,搭载以相当多的动态链接库(Dynamic Framework),以及插件(PlugIn)的模式来进行开发。 举个例子,咱们以iOS的音讯App(MobileSMS.app)为例子,应用iOS 15.4模拟器测试。能够看到其主二进制大小仅有844KB(x86_64架构)。通过otool -L查问链接,能够看到总计动静链接了22个动态链接库,其中有9个是非公开的,大都是撑持音讯App的性能库,这些库占据了大量存储。 图2:音讯App的动态链接库列表 而iOS平台的第三方开发者的工程,为了谋求更快的冷启动时长,因为没有了dyld shared cache的优化(dyld 3提出的启动闭包只能优化非冷启动),很多我的项目会应用尽量少的动态链接库。加之开源社区的CocoaPods,Carthage,SwiftPM等包管理器的流行导致的Swift Module爆炸增长,预二进制的Framework/XCFramework包装格局的滥用,加之闭源三方公司的SDK的集成,最终造成了一个无论是体积还是符号量都十分微小的主二进制,以及相当长的Search Paths。 以公司内飞书利用的内测版为例子,在应用Debug,Onone模式编译,不剥离(Strip)任何符号状况下,能够看到其主二进制大小为1.1GB,动态链接库数量为105,然而仅蕴含Apple的零碎库和Swift规范库。业务代码以动态链接库集成。 图3:公司飞书利用的动态链接库列表 上述这两种不同的工程构造,带来了十分显著的调试体验的差别,并且Apple公司近年来的Xcode Team和Debugger Team优化,并没有齐全思考局部第三方开发者常应用的,厚主二进制下的工程构造。 PS:实践上能够通过业务的工程构造的革新,在本地开发模式下,应用一个动态链接库包裹根底动态链接库的形式,缩小主二进制大小(也会缩小后续提到的DWARF搜寻的耗时),然而大型项目推动工程构造的革新会是一个十分漫长的过程。 图4:一种缩小主二进制大小的工程结构设计 解决方案:自定义LLDB工具链通过调研,咱们发现业界常见做法,无外乎这几种思路: 工程革新:缩减Swift Module/Search Path数量:可行,然而收益较低,且不可能无限度缩减通过LLDB一些开关:可行,然而内部测试下仍旧达不到现实的调试状态咱们致力于在字节跳动的挪动端提供根底能力反对,因而提出了一套解决方案,不依赖业务工程构造的革新,而是从LLDB工具链上动手,提供定向的调试性能优化。 调研期间也确认到,借助自定义LLDB工具链,集成到Xcode IDE是齐全可行的,包含iPhone模拟器、真机以及Mac利用。 图5:自定义LLDB工具链的文件构造,系列后续文章会独自解说,这里不开展 而LLVM/LLDB自身的工具链代码,在Apple的开源领域之内(仓库地址:https://github.com/apple/llvm...) 通过严格追踪跟进上游的公布历史,分支模型,可能尽可能地保障工具链的代码和性能的一致性。 理论收益通过后文提到的一系列优化伎俩,以公司内大型项目飞书测试,编译器采取Swift 5.6,Xcode抉择13.3为例,比照调试性能: 我的项目Xcode 13.3自定义LLDBv耗时2分钟40秒po耗时1分钟5秒p耗时20秒5秒图6:切换自定义LLDB工具链 图7:调试优化演示,应用Xcode 13.3自定义LLDB,运行文中提到的耗时Demo(原po耗时约1分钟): 简述po/p/v的工作流程在介绍咱们自定义LLDB工具链的优化之前,首先来简述一下LLDB的外围调试场景的工作流程,不便后续了解优化的技术点。 ...

May 10, 2022 · 2 min · jiezi

关于字节跳动:Python3-cpython优化-实现解释器并行

本文介绍了对cpython解释器的并行优化,使其反对真正的多解释器并行执行的解决方案。作者:字节跳动终端技术——谢俊逸 背景在业务场景中,咱们通过cpython执行算法包,因为cpython的实现,在一个过程内,无奈利用CPU的多个外围去同时执行算法包。对此,咱们决定优化cpython,指标是让cpython高完成度的反对并行,大幅度的进步单个过程内Python算法包的执行效率。 在2020年,咱们实现了对cpython的并行执行革新,是目前业界首个cpython3的高完成度同时兼容Python C API的并行实现。 性能 单线程性能劣化7.7%多线程根本无锁抢占,多开一个线程缩小44%的执行工夫。并行执行对总执行工夫有大幅度的优化通过了cpython的单元测试在线上曾经全量应用cpython痛, GILcpython是python官网的解释器实现。在cpython中,GIL,用于爱护对Python对象的拜访,从而避免多个线程同时执行Python字节码。GIL防止出现竞争状况并确保线程平安。 因为GIL的存在,cpython 是无奈真正的并行执行python字节码的. GIL尽管限度了python的并行,然而因为cpython的代码没有思考到并行执行的场景,充斥着各种各样的共享变量,改变复杂度太高,官网始终没有移除GIL。 挑战在Python开源的20年里,Python 因为GIL(全局锁)不能并行。目前支流实现Python并行的两种技术路线,然而始终没有高完成度的解决方案(高性能,兼容所有开源feature, API稳固)。次要是因为: 间接去除GIL 解释器须要加许多细粒度的锁,影响单线程的执行性能,慢两倍。Back in the days of Python 1.5, Greg Stein actually implemented a comprehensive patch set (the “free threading” patches) that removed the GIL and replaced it with fine-grained locking. Unfortunately, even on Windows (where locks are very efficient) this ran ordinary Python code about twice as slow as the interpreter using the GIL. On Linux the performance loss was even worse because pthread locks aren’t as efficient.解释器状态隔离 解释器外部的实现充斥了各种全局状态,革新繁琐,工作量大。It has been suggested that the GIL should be a per-interpreter-state lock rather than truly global; interpreters then wouldn’t be able to share objects. Unfortunately, this isn’t likely to happen either. It would be a tremendous amount of work, because many object implementations currently have global state. For example, small integers and short strings are cached; these caches would have to be moved to the interpreter state. Other object types have their own free list; these free lists would have to be moved to the interpreter state. And so on.这个思路开源有一个我的项目在做 multi-core-python,然而目前曾经搁置了。目前只能运行非常简单的算术运算的demo。对Type和许多模块的并行执行问题并没有解决,无奈在理论场景中应用。 ...

March 3, 2022 · 5 min · jiezi

关于字节跳动:Hudi-Bucket-Index-在字节跳动的设计与实践

由字节跳动数据湖团队奉献的 RFC-29 Bucket Index 在近期合入 Hudi 主分支,本文具体介绍 Hudi Bucket Index 产生的背景与实践经验。文 | 字节跳动数据平台数据湖团队 Hudi 是一个流式数据湖平台,提供 ACID 性能,反对实时生产增量数据、离线批量更新数据,并且能够通过 Spark、Flink、Presto 等计算引擎进行写入和查问。Hudi 官网对于文件治理和索引概念的介绍如下: Hudi提供相似 Hive 的分区组织形式,与 Hive 不同的是,Hudi 分区由多个 File Group 形成,每个 File Group 由 File ID进行标识。File Group 内的文件分为 Base File ( parquet 格局) 和 Delta File( log 文件),Delta File 记录对 Base File 的批改。Hudi 应用了 MVCC 的设计,能够通过 Compaction 工作把 Delta File 和 Base File 合并成新的 Base File,并通过 Clean 操作删除不须要的旧文件。Hudi 通过索引机制将给定的 Hudi 记录统一地映射到 File ID,从而提供高效的 Upsert。Record Key和 File Group/File ID 之间的这种映射关系,一旦在 Record 的第一个版本确定后,就永远不会扭转。简而言之,蕴含一组记录的所有版本必然在同一个 File Group 中。在本文中,咱们将重点介绍 Hudi 索引机制相干的作用和原理,以及优化实际。Hudi索引的作用与类型索引的作用在传统 Hive 数仓的场景下,如果须要对一个分区数据做更新,整个更新过程会波及三个很重的操作。举一个更直观的例子。假如一个 Hive 分区存在 100,000 条记录,散布在 400 个文件中,咱们须要更新其中的 100 条数据。这三个很重的操作别离是: ...

February 28, 2022 · 3 min · jiezi

关于字节跳动:APK修改神器插桩工具-DexInjector

本文介绍了一个针对Dex进行插桩的工具,解说了一下间接批改Dalvik字节码和Dex文件时遇到的问题和解决办法作者:字节跳动终端技术—— 李言 背景线下场景中,咱们常常须要在APK中插入一些检测代码,来实现一些记录办法调用耗时,或者减少一些打印日志的性能。目前的惯例做法都是在编译期批改class字节码达到,例如byteX提供了不便的批改class框架。 然而,编译期批改灵活性有余,对于曾经编译好的apk则无能为力,无奈插桩或批改。导致很多业务方都要配置独立的jenkins打包后,能力触发提高一步的测试。一次自动化测试工作有将近一半的工夫都耗费在打包过程中。 为了解决这个痛点,咱们开发了一套间接针对APK(dex)插桩的工具,DexInjector。次要用来做一些日志、性能方面的数据采集和注入一些第三方工具,防止业务方二次打包,节俭测试工夫。 该计划曾经用在日志旁路、网络数据抓取、第三方库注入,用户信息注入、日常调试等。 工具目前能够实现: 办法前插桩办法后插桩初始化插桩技术计划调研调研了一下市面上现有的字节码批改计划。 smali能够通过smali 和baksmali 工具将dex文件转换成可不便浏览的smali语法文件,然而smali的工具对smali字节码的解析是通过语法解析,如果要插入一个新的代码进去对寄存器等操作没有方法实现结构化操作。 redexredex 反对通过配置在办法前进行插桩,能够通过实现pass来实现本人的插桩性能。然而性能实现无限,应用起来比较复杂,而且在执行之后插入了一些fb自定义的代码,但Redex 提供了一套弱小的字节码批改能力,后续的版本会基于redex的字节码批改能力进行欠缺。 https://github.com/facebook/redex/blob/master/opt/instrument/Instrument.cpp dexterhttps://android.googlesource.com/platform/tools/dexter/+/refs/heads/master dexter 工具是google开发的一个相似dexdump的工具,但其外部实现了对dex文件构造和字节码指令的一套残缺的操作api,轻量简洁,对字节码的操作能够达到ASM的体验。 综合,选用dexter对dex进行操作。 方案设计需要依据性能防劣化和流量统计的需要,都是在一个办法的办法体外部前后插入对其余办法的调用。以网络流量统计为例,须要在 okhttp3.RealCall.getResponseWithInterceptorChain 的办法外部结尾插入一个办法来获取request申请的具体数据。 Response getResponseWithInterceptorChain() throws IOException { com.netflow.inject.hookRealCall(this);//插入的办法 List<Interceptor> interceptors = new ArrayList<>(); interceptors.addAll(client.interceptors()); //.....省略局部代码 return chain.proceed(originalRequest); }Dex 插桩根本流程Dex文件剖析先要剖析Dex文件格式,将其序列化成各种数据结构,Dex文件的构造能够参照官网文档 Dalvik 可执行文件格局 字节码解析在code 段将二进制的字节码解析成可解决的数据结构 字节码结构依照字节码标准结构字节码指令,并插入到现有字节码的序列中即可实现字节码的插入。 字节码序列化将批改后的Dex构造从新计算Index,而后将各个数据Section序列化为Dex的文件格式。 性能需要插桩反对两种能力,在一个办法的办法体后面和前面插入一个静态方法调用。 办法体后面插桩如果被插入的办法为实例办法,则办法的第一参数为 this,随后的参数和被插入的办法统一 ,如果办法是静态方法则插入的办法定义须要和被插入的办法参数类型和个数统一,举例: public class Tracer{ //被插入的办法,为实例办法 private void MethodA(int a,int b){ } //被插入的办法,为静态方法 private static void MethodB(int a,int b){ }}public class Hooker{ //插入的办法 private static void TestHookA(Tracer this_,int a,int b){ } private static void TestHookB(int a,int b){ }}////////插入后/////////public class Tracer{ private void MethodA(int a,int b){ Hooker.TestHookA(this,a,b); //...... } private static void MethodB(int a,int b){ Hooker.TestHookB(a,b); //....... }}办法体前面插桩须要留神的是返回值的解决,插入的办法的返回值须要和被插入方法的返回值类型统一。 ...

February 23, 2022 · 3 min · jiezi

关于字节跳动:字节跳动-28-岁员工猝死官方回应仍在抢救中

近日,一条“字节跳动一28岁员工心梗猝死”的音讯在网上迅速流传。2月 23 日凌晨,字节跳动官网回应称:仍在抢救中。 据悉,该网传" 字节跳动一 28 岁员工猝死 " 的音讯,来自一名疑似字节跳动吴姓员工的妻子所发的聊天截图:" 丈夫在字节大厦的健身房核心梗猝死,生前加班很多,压力很大。"据她介绍,其丈夫是字节跳动视频架构部门的图像算法工程师,入职公司已 4 年。 该男子示意,丈夫是 " 心梗猝死,用了一天一夜的 Ecomo,但很惋惜丈夫曾经脑死亡,无自主呼吸和心跳,医生称无力回天。" 此音讯一出,引发多方关注。 2 月 23 日早上,有不少媒体专门对此致电字节跳动客服,对方示意以官网通报为准。 据媒体报道,字节跳动于 23 日早间提供内网发文截图,称该员工在健身房静止时举止异样,由教练拨打 120 叫来急救人员到场救治后送上救护车,还在医院抢救中。 以下为该通告全文: “感激大家对吴同学的关怀,目前吴同学仍在抢救中。因为事发忽然,外界信息存在很多误会,这里也和大家说一下具体情况 : 2 月 21 日 18 时,吴同学返回中卫通健身房静止。18 时 56 分,吴同学在静止约 1 小时后呈现头晕景象,进入茶水间劳动。健身房教练发现举止异样,上前询问。吴同学自述可能是低血糖,教练随即为他倒了一杯糖水,并告诉行政前台启动 SOS 值班号。 19 时 09 分,保安经理获得血压计到场反对,为吴同学测量血压后,倡议分割共事陪同就医。在此期间,吴同学呈现呕吐景象。 19 时 18 分,教练拨打了 120 电话。同期,保安经理与在场另一位安保对吴同学施行 CPR 急救 ( 两人均持有急救证书 ) 。 19 时 30 分许,120 急救人员到场救治,后将吴同学送上救护车。 截至 2 月 23 日 0 时 30 分,来自医院的反馈,吴同学状况危重,目前仍在抢救中。咱们会全程陪同。并踊跃帮助家属解决相干事宜,帮忙家属渡过难关。” ...

February 23, 2022 · 1 min · jiezi

关于字节跳动:让工程师拥有一台超级计算机字节跳动客户端编译加速方案

咱们有一个幻想,让每一名研发工程师领有一台“超级”计算机。 作者:字节跳动终端技术——孙雄 大型工程的效率瓶颈近年来,基于Devops流水线的研发流程,逐步成为软件研发的行业标准。流水线的运行效率,决定了团队的研发效力。对大型项目来说,编译构建往往是流水线中耗时占比的大头。有些工程的编译时长超过30分钟,甚至达到几个小时。这样的性能,是十分蹩脚的。 字节iOS大型项目的构建时长,大多管制在5分钟以内。这次要得益于外部的编译减速解决方案,它集分布式编译和分布式缓存为一体,本文将具体介绍它的工作原理。不过在这之前,咱们先来剖析一下大型项目的编译瓶颈和解决思路。 先说论断,机器性能有余和反复作业,是影响工程编译效率的两个最大因素,对此,能够采取分布式编译+编译缓存的形式,晋升整体的性能。 分布式编译工程的编译,往往能够拆解为可并行的编译子工作。以C系列语言(C, C++, ObjC)为例,我的项目中往往存在上千甚至上万的源代码文件(以 .c , .cc 或 .m 作为扩展名的文件),每个编译子工作将源代码文件编译为指标文件(以 .o 作为扩展名的文件),再整体链接成最终的可执行文件。 这些编译子工作能够并行执行,如下图所示: CPU的数量,决定了编译的并行度下限。个人电脑(PC)的CPU外围数通常在4~12之间,专用服务器能够达到24~96,但对于动辄上万文件的大型工程,CPU的数量还是显得有余。这时候,利用分布式编译的技术,能够失去一台“超级计算机”。 编译缓存大型工程全量编译,须要解决几千甚至几万个编译子工作。但大多数子工作,之前曾经编译过,如果咱们能通过某种形式,间接获取编译产物,就能够大大节省时间。 建设一个地方仓库,存储编译子工作的产物,这些产物能够通过“工作摘要”来索引。这样每次遇到一个新工作,咱们首先向地方仓库查问摘要,如果查问胜利,间接下载编译产物,就省去了反复编译的动作。 下面提到的分布式编译和编译缓存,是晋升大型项目编译效率的两大法宝,本文次要介绍字节跳动的分布式编译解决方案。 “超级”计算机借助云计算,咱们能够以组装的形式,失去一台“超级”计算机,如下图所示: 这台“超级”计算机,由一台核心节点和若干台工作节点组成。核心节点负责生成和调度编译子工作,按照它们的执行程序,将工作发送给闲暇的工作节点来执行。这样整个零碎的并行处理能力,取决于所有工作节点的CPU之和,性能比单机高出数倍,甚至数十倍。 像这样把工作分发给工作节点的计划,又称为分布式编译。分布式编译并不是陈腐的概念,2008年开源的distcc工具就提供了分布式编译的解决方案。Google在2017年提出的Remote Execution API,又从协定的角度标准了分布式编译和编译缓存的实现形式。 咱们先看一下分布式编译的外围思路。 外围思路外围思路很简略,本地计算出编译命令须要读的文件,把文件列表和编译命令,发给远端机器,执行编译命令。编译完结后,再申请拉取编译产物。 其中,如何找到所需文件是要害。 背景常识——预处理在介绍咱们的做法之前,须要先补充一些编译原理相干的背景常识。 待编译的源文件,能够通过#include xx.h和 #import xx.h的形式,申明对某头文件的依赖。 编译器解决编译命令的第一阶段叫做“预处理”,该阶段的一个重要工作是头文件开展。假如入口文件main.m 中有一行为#import Car.h,编译器会遍历所有搜寻门路,找到Car.h文件,并读取该文件内容,替换掉main.m中的#import Car.h行。其中搜寻门路由编译命令中的 -I, -isystem 等参数给出 接下来,如果 Car.h 文件中有 #import 语句,编译器会反复上述动作,找到依赖的文件,读取内容,进行替换,直到把所有的 #import 语句全副开展。 因而,假如咱们模仿预处理的过程,找到所有依赖的头文件,就能够将该工作发送到远端执行。 重要引擎由上述编译原理可知,依赖剖析是实现分布式的前提。不仅如此,依赖剖析也是性能的决定因素。 因为依赖剖析只能在本地进行,计算资源是无限的。依赖剖析的性能,决定了工作散发是否晦涩,如果依赖剖析过慢,会导致大量工作节点限度,工作散发呈现瓶颈。 能够把依赖剖析,了解为分布式编译的重要引擎。 依赖剖析的实现并不简单,编译器自身就提供了相干参数,以clang为例。-M 能够获取残缺的编译依赖,而 -MM 则能够失去用户定义的依赖,相干参数解析如下: -M,--dependencies Like -MD, but also implies -E and writes to stdout by default ...

February 17, 2022 · 2 min · jiezi

关于字节跳动:火山引擎-MARSAPMPlus-X-美篇-形成应用性能全面监控大幅提升APP稳定性

本文次要介绍了美篇 App 通过应用火山引擎 APMPlus ,使利用性能的稳定性大幅晋升的技术实际。 2月24日晚 MARS TALK 直播间,咱们邀请了火山引擎 APMPlus 和美篇的研发工程师,为大家分享相干技术计划及实现细节。当初报名退出流动群 还有机会取得VR一体机——Pico Neo3哦!一、「美篇」业务场景美篇是南京蓝鲸人网络科技有限公司的次要产品,主打朋友圈的图文创作分享,定位为“不惑后”表白自我、结交同好、学习晋升的互联网内容社区。 「美篇」业务规模:自2015年7月正式上线以来,累计注册用户2亿,累计创作用户4000万 ,APP月沉闷用户1200万, 日新增作品18万。 成立至今取得腾讯双百打算、经纬创投、真格基金、芒果文创基金等一线投资机构多轮累计1.8亿元融资,估值10亿元。2021年10月,美篇APP 7.0公布。 二、「美篇」业务痛点及问题「美篇」业务现状造成的痛点用户量快速增长:用户规模快速增长,创作用户冲破4000万海量内容积淀:美篇作为一个弱小的趣味内容社区,领有海量UGC图文&视频内容积淀多产品性能上线:话题热榜、线上课堂、笔友书信等内容这些起因使利用平台承载信息量大幅回升,导致利用程序运行难度加大,稳定性受到威逼。 「美篇」遇到的问题及挑战对于挪动 App 的开发者来说,最根底也是最关注的问题就是应用程序的稳定性及用户体验。而解体问题和卡顿是影响利用稳定性及用户体验的关键因素。包含Java 解体、Native解体、 ANR ,卡顿等问题类型。 随着美篇产品性能的丰盛及用户量的快速增长,OOM 及卡顿问题的优化和解决也日益重要。 三、MARS-APMPlus 的解决方案产品劣势APMPlus是火山引擎利用开发套件MARS下的性能监控产品,通过先进的数据采集与监控技术,为企业提供全链路的利用性能监控服务,助力企业晋升异样问题排查与解决的效率 基于海量数据的聚合剖析,平台可帮忙客户发现多类异样问题,并及时报警,做调配解决,同时平台提供了丰盛的归因能力,包含且不限于异样剖析、多维分析、自定义上报、单点日志查问等,联合灵便的报表能力可理解各类指标的趋势变动。APM Plus 利用性能监控已服务了抖音、今日头条等多个超大规模用户量级挪动 App。 「美篇」解决方案简介针对美篇 App的稳定性问题咱们提供了Java 解体、Native解体、 ANR 等不同的异样类别监控,抓取成功率高,归因异样丰盛。针对性能,咱们提供了启动监控,页面监控,卡顿监控等流畅性类的监控,还有内存,CPU,电量等资源耗费问题的监控。同时提供网络耗时和异样监控,以及弱小的单点剖析和日志回捞能力剖析单点问题。领有事件自定义上报进行共性的打点监控,弱小的看板进行多维度展现。数据采集提供采样和开关配置满足用户对数据量和老本的诉求,同时提供根底的报警能力对异样问题实时报警。针对跨平台计划提供WebView页面和Flutter监控。丰盛的能力满足客户对App 全面性能监控 的诉求。 计划亮点Java OOM监控提供全流程主动剖析能力,精确定位Java内存问题。透露链、透露大小高深莫测ANR应用基于信号的捕捉计划,更节俭系统资源,准确度高,惟一做到提供现场音讯调度图,高度还原现场主线程阻塞状况做到真正解决Native(C/C++)解体的现场还原能力,提供了最有价值的Tombstone,精密还原现场。残缺展现解体线程的过程信息,信号信息,寄存器信息,还原解体现场汇编指令,具体的maps,fd和内存信息提供了高性能日志库,做到数据稳定性强、性能好,保障了现场业务信息的高度还原 四、施行成果通过应用MARS-APMPlus 利用性能监控产品,并采纳上述解决方案施行后,成果非常明显,应用程序的性能稳固失去了显著晋升 卡顿降落: OOM降落: Android Java OOM升高了80%以上,从8月份的1.5%升高到12月底的0.1%Android用户卡顿率升高了80%以上,Android用户卡顿率从8月份的11%升高到12月底的2%iOS OOM 升高了 80%+,从 8 月份的 1.3% 升高到 12 月份的 0.2%iOS 卡顿率升高了 90%+,从 8 月份的 1.1% 升高到 12 月份的 0.1%更多技术实际细节 欢送锁定 MARS TALK 04期直播间! 届时咱们邀请了火山引擎 APMPlus 研发工程师王涛讲师和美篇研发工程师叶弯弯讲师,在线为大家分享「APMPlus 基于 Hprof 文件的 Java OOM 归因计划」及「美篇基于MARS-APMPlus 性能监控工具的优化实际」等技术干货。 ...

February 11, 2022 · 1 min · jiezi

关于字节跳动:火山引擎违反-Apache-20-许可证的情况下非法地重新发布了Apache-SkyWalking

近日咱们关注到出名开源我的项目 Apache SkyWalking 在其官网博客公布了文章称:字节跳动子公司火山引擎在应用 Apache SkyWalking 构建其商业化产品期间扭转了所有的包名,删除了 Apache 软件基金会的 header,并且在他们的再散发中没有保留 Apache 软件基金会和 Apache SkyWalking 的 LICENSE 和 NOTICE 文件,火山引擎没有恪守 Apache 2.0 许可证的状况下非法地从新公布了Apache SkyWalking。 咱们将继续追踪该事件的最新动静,截止文章公布时字节跳动与火山引擎公司并未对此做出解释与申明。 以下为 Apache SkyWalking 博客原文翻译: Apache SkyWalking 是一个分布式系统的开源 APM,是 Apache 软件基金会的顶级我的项目。 1月28日,咱们收到了一个提交者(匿名)的许可证违规报告。他们有一个云服务,叫做利用性能监控全链路版(Application Performance Monitoring - Distributed Tracing)。在 Java 服务监控局部,匿名提交者提供了这个代理下载链接: https://datarangers.com.cn/apminsight/repo/v2/download/java-agent/apminsight-java-agent_latest.tar.gz咱们在 1 月 28 日 23:15 UTC+8 工夫下载了它,并在这里将其存档。 咱们曾经确认这是一个 SkyWalking Java agent 的二次散发。 咱们在这里列出了几个证据来证实这一点,每个读者都能够与 SkyWalking 的官网源代码进行比拟。 1,第一个也是最简略的一个是 agent.config 文件,它应用雷同的配置键和雷同的配置格局。这是 Volcengine 的版本,能够同时对比查看 SkyWalking agent.config。 2, 在 apmplus-agent.jar,Volcengine 的代理外围 jar 中,你能够很容易地找到几个与 SkyWalking 齐全一样的外围类。ComponentsDefine 类没有变动,甚至连组件的ID和名称都没有变动。这是 Volcengine 的版本,看看 SkyWalking 的版本。 ...

January 29, 2022 · 1 min · jiezi

关于字节跳动:组件发布效率提升15倍是怎么做到的基于Gradle调度机制深度研究与优化

作者:字节跳动终端技术——兰军健 孙雄 一、背景很多大型 Android 我的项目为了进步编译速度均采纳了aar源码切换容器化框架,该计划通过定期公布aar产物来承当缓存的角色从而实现编译减速。在字节有些我的项目在接入框架的过程中遇到了奇怪的问题,比方飞书我的项目大略有200+的模块,首次接入时尝试全副公布,发现在Mac(12核,32G)上最快也要1h+,有时甚至会呈现相似“卡死”的景象,最差状况呈现过4h。抛开这个问题,置信负责研发流程建设的同学在高并发公布大量组件时应该也遇到过耗时重大的问题。 耗时的根本原因是什么呢?本文会借助该问题的排查过程,揭秘 Gradle 的外围调度机制! 二、初步剖析对于组件公布慢的若干疑难遇到这个问题咱们应该怎么去剖析呢?针对编译构建速度异样迟缓的问题,通常会从以下几个维度进行思考: 是否存在异样 task 或者异样自定义代码内存问题并发度问题这里排查过程就不开展介绍了,用尽所有伎俩排查后,得出了一些初步论断。 内存不是第一影响因素通过更换高配置机器验证,将运行内存从 9g 调整到 40g,后果并没有明显改善 数据显示,一旦产生“卡死”景象,排名靠前的耗时Task简直全副指向 VerifyLibraryResources这个Task 查看了该Task的源码,并没有发现显著的逻辑问题,此外,还有个景象是不卡死的时候,这个Task也不肯定全副排名靠前。潜意识里感觉可能和这个Task无关,但即便无关也应该是某些调度机制出了问题。 并发度排查通过控制台察看到绝大部分状况 Gradle 的并行线程数是打满的,也就是“外表”上并发度还能够,又通过了一系列的猜想与排查,最终决定升高并发度试试。 这里简略的提一下,max-workers 能够指定 Gradle 在并发执行 task 时真正工作的线程个数。如果不指定,其大小与cpu核数统一,如上图所示配置代表咱们将并行度由原来的16个线程(16核CPU)调整为2个线程。惊喜呈现!出其不意地在30min内实现了打包。这景象就十分有意思了,咱们升高了并发度,编译速度却显著放慢了,是不是有点毁三观?那岂不是说用高配机器反而会更慢?来验证一下。 在高配机(92核,300G内存)上开了20个线程,用的JDK11,G1垃圾回收器,Xmx设置为40G,速度仍旧让人大跌眼镜,一共花了50分钟的工夫,甚至还不如笔记本的体现。 进一步用jstack打印线程堆栈,发现尽管编译时控制台显示有大量Task在执行,但其中大多数执行线程处于WAIT或者BLOCK状态,真正工作的线程只有一两个。 下面两张图别离是 Gradle 显示的并行执行情况和应用 jvm 剖析工具抓到的线程理论执行状况。尽管 Gradle 显示有10个线程正在干活,然而只有一个线程的状态为RUNNABLE状态,其余都为BLOCKED状态。其余的线程为什么BLOCK住了呢? 这里就呈现了很多疑难: 为什么线程数设置少了,效率反而进步了为什么高配机毫无作用为什么大量线程处于BLOCKED状态带着这些疑难,咱们决定针对 Gradle 的调度机制做一次彻底的剖析。剖析之前咱们先插播一段对于Task的执行工夫的统计准确性问题。 你真的能精确收集到Task的执行工夫吗?如何去度量编译过程中某些task的耗时呢?咱们个别是通过在 gradle-scan或者 hummer(外部自研)上查看Timeline,如下图所示。而后针对耗时排名靠前的task进行优化,之前也有不少的同学来征询,比方 mergeDebugNativeLibs 等Task比拟耗时,然而查看逻辑也不简单,而后可能就没思路了。 以抖音我的项目为例,会发现上图显示的这两个 Task 在某些编译过程中十分耗时,耗时 6min+,这里通过批改源码及一些 hook 形式进行了测量,实在的逻辑执行工夫其实只须要 20s。是咱们收集形式有问题吗?咱们个别是通过监听器,例如TaskExecutionListener类提供的beforeExecute和afterExecute办法进行测量,结果显示的确是6min+。那问题到底出在了哪里呢? 为了彻底弄清楚咱们公布组件的耗时问题与Gradle task耗时度量不精确的问题,咱们正式进入Gradle 调 度机制的摸索章节。 三、Gradle的调度机制先放一张整体的调度机制架构图,这外面有些名词可能会让大家纳闷,前面会具体给大家解释。 Gradle我的项目,由一个或者多个Project形成,每个Project蕴含多个Task,如下图所示: 两个重要准则Gradle调度要解决的外围问题演绎成一句话就是:以最正当的程序执行完所有的Task,并且充分发挥多核计算机的并行处理能力。 最正当的程序用户定义Task之间的依赖关系,这些Task的依赖关系形成 DAG 图(有向无环图),而 Gradle 依据DAG 图的程序进行调度,下图给出了一个 DAG 图的示例,其中绿色的为叶子节点,没有其余依赖,应该优先执行: ...

January 10, 2022 · 2 min · jiezi

关于字节跳动:看看别人家的待遇字节跳动薪酬体系我真的酸了

已经的互联网是PC的时代,随着智能手机的遍及,挪动互联网开始飞速崛起。而字节跳动抓住了这波时机,2015年,字节跳动全面加码短视频,从那以后,抖音成为了字节跳动用户、支出和估值的最大增长引擎。 自从字节逐渐壮大之后,也成了IT行业人才除了BAT之外的第一抉择。在字节跳动越优良越值钱,而且远比个别公司挣得多得多。这也是为什么字节跳动员工工作这么拼。 01岗位职级字节跳动的职级研发序列一共10级: 字节跳动创始人张一鸣是 5-1 级,应届生个别是 1-1 级,中级工程师是 1-2 级,2-2 属于资深研发人才,3-1 属于高级领导, 3-2 属于高级领导层,4-1、4-2、5-1、5-2 都属于不同阶段的高层。 为了弱化爬格子带来的攀比,字节要求员工职级严格窃密,外部不讲 title 层级。 一种是淡化头衔概念,只有当他们须要对外发声时,能力见到个别意义上的治理 Title;另一种齐全打乱工号,防止排资论排辈气氛滋生。 02岗位薪酬不同序列间月薪 base 差别较大,技术 base 整体偏高。 比方 2-1 月薪会在 20k+,2-2 的 package会在 60w-100w 左右(算上期权,大略会占 30%左右)。 T2-2 级别的薪资约 40k,500 股票/每年。 就同学们反馈:目前 20 届校招给的是 14、15 薪,19 届校招很多能拿到 18 薪。 前端开发 20k左右,产品是 14-18,经营 10 左右。字节跳动的现金薪酬要比 BAT 们高出 25%-40%。 年终奖个别 0-6 个月,会在每年 3 月发放,例如 9 月入职会发 18.9-19.3 这段的年终奖。 个别中等大多数是 15 薪,如果年中绩效超预期多 2 个月年中奖,年末再超出预期差不多至多7-8 个月,比例较少, ...

December 7, 2021 · 1 min · jiezi

关于字节跳动:字节跳动如何用7年成为腾讯最可怕的对手张一鸣一语道破

说到互联网巨头,很多人都曾经将其纳入其中,可是要晓得其余大佬,通过了20余年的工夫,才有现在的位置,而字节跳动成立至今仅仅7年。 现在,字节跳动时常被拿来与腾讯比拟,因为他们的侧面竞争简直是注定的。腾讯从连贯“人”登程,再连贯“内容”,到连贯所有;而字节跳动则从“内容”登程,触达用户情感,再连贯“人”。 当下,字节跳动曾经进入了腾讯的策略腹地,发动了一轮又一轮守势。从飞聊上线挑战微信\QQ社交帝国、今日头条对垒腾讯新闻单方各擅胜场、作为游戏新兵不敌腾讯游戏霸业,到抖音系短视频甩开腾讯几个身位、多元化布局突围腾讯全牌照金融帝国,字节跳动来势汹汹。 业界对于字节跳动的呼声很高,有人预测其将来很可能,是排在腾讯和阿里巴巴之后国内第三大互联网企业,前途不可限量。 张一鸣认为,一家互联网公司要倒退,次要是要会用人,他说“用工夫、产品量级去筛选候选人,是很容易的。但招聘,最重要的是找到最合适的人,特质是不是真正符合,关注人的基本面。学校、相干经验、title 反而没那么重要。” 换句话说,还是能力问题,目前字节程序员薪资基本上和BAT这些大厂是平齐的,并且门槛绝对低一些,只有你能力足够,基本上都能够进的去。 所以,提前深刻理解面试知识点很有必要,而我也特意整顿到了一份难得的“JAVA进阶宝典”,这份PDF面经知识点包含了五个大部分,26个知识点(以下为文档内容截图,如需此文档,点击此处码即可收费获取):Java局部:Java根底,汇合,并发,多线程,JVM,设计模式数据结构算法:Java算法,数据结构开源框架局部:Spring,MyBatis,MVC,netty,tomcat分布式局部:架构设计,Redis缓存,Zookeeper,kafka,RabbitMQ,负载平衡等微服务局部:SpringBoot,SpringCloud,Dubbo,Docker 一、java常识局部当初面试对很多原理根底都特地重视,然而有很多人对一些外围原理了解的不够透彻,特地是对 Java 的一些外围根底知识点把握的不够,例如 JVM、罕用的算法和数据结构等。正所谓万丈高楼平地起,只有把根底把握的牢固,能力走的更远,面对不断更新的技术能力疾速把握,同时在面试、工作中也更能怀才不遇!上面展现下这些必须把握的Java常识局部,内容很多,都是一些重点常识!!! 1.Java根底: 2.Java汇合: 3.多线程并发: 4.java虚拟机(JVM): JVM 是高级Java 程序员成长路上的一道必经之路,学习JVM之前,只须要晓得代码编译成 Class,虚拟机加载 Class 运行就能够了,学习 JVM 之后,能够深刻了解代码从编译到加载的过程、内存中对象的创立与垃圾回收、日常开发中疾速定位性能问题等,当然也是面试不可短少的加分项。 5、数据结构与算法篇 哪些数据结构(线,链,堆,栈,队列)及其在 Java 外面哪里有用到。8 大算法(工夫复杂度,空间复杂度,内存,CPU 的影响)及其利用的中央。KMP 查找算法,二分查找,递归算法(写法,内存的影响)。数、图及其利用的中央。hash 表,及其理论工作中哪里利用。 二、数据库局部举荐浏览:《高性能MySQL》 《MySQL技术底细:InnoDB存储引擎(第2版)》 三、开源框架局部Spring 作为一个轻量级的 Java 开发框架,将面向接口的编程思维贯通整个 Java 零碎利用,因而在 Java 面试中常被提。 四、分布式高并发架构局部这部分是对于分布式架构常识局部,包含Redis,Zookeeper,数据库性能优化,负载平衡等! 五、微服务常识 最近面试的小伙伴比拟多,心愿能够帮忙更多人顺利通过大厂面试,有须要点击这里就能收费支付,无套路!!!

December 6, 2021 · 1 min · jiezi

关于字节跳动:字节跳动Web-Infra发起-Modernjs-开源项目打造现代-Web-工程体系

10 月 27 日举办的稀土开发者大会上,字节跳动 Web Infra 正式发动 Modern.js 开源我的项目,心愿推动古代 Web 开发范式的遍及,倒退残缺的古代 Web 工程体系,冲破利用开发效率的瓶颈。 传统的 Web 开发是“服务器端为核心”的开发范式,近年来,曾经越来越多的转移到“客户端为核心”的古代 Web 开发范式,开发门槛一直升高,效率一直晋升。产品研发能够更少的关注底层技术细节,更专一在用户需要和市场价值上。而传统的前端技术栈难以解决“开发者体验”和“用户体验”的矛盾,越来越成为提效的瓶颈。 字节跳动 Web Infra 始终在字节外部反对“古代 Web 开发”的实际,倒退了残缺的字节前端研发体系,Modern.js 我的项目就是来自其中的古代 Web 工程体系。 Modern.js 将以往海量的前端工程模板,收敛成三大工程类型:利用、模块、Monorepo,每种类型都只须要同一套模板、同一套工程计划。其中“利用”工程计划又被称作“MWA”(古代 Web 利用),基于一套客户端为核心、前后端一体化的利用开发框架,实现了弱小的“Universal App”模式。即一套利用源代码,能同时在客户端、服务器端、编译时里运行,能以动态 Web(SPA、MPA、SSG)、动静 Web(SSR、SPR)、微前端、桌面利用、小程序等不同模式运行,同时反对低门槛、全功能、一体化的 BFF (针对特定界面的服务器端 API)开发。 “MWA” 是 Serverless 优先的,内置产品级 Web Server。它能在开发、调试、部署、运行等所有环节做到尽可能“无服务器化”,同时确保“开发者体验”和“用户体验”,让更多“前端开发者”成为独立、全面的“利用开发者”和“产品开发者”。Modern.js 也原生反对微前端、Electron 桌面利用、Monorepo 等研发场景。 Modern.js 从最后就设计为 ESM 优先,在“编译时”环节能更好的反对 Unbundled 开发、非 JS 语言的编译器等第三代 JS 工具的倒退。在“运行时”环节,Modern.js 提供开箱即用的利用架构,提供在“利用”工程计划、“模块”工程计划里都能无缝应用的 Runtime API 规范库。在“编写时”环节,Modern.js 激励尽可能让机器来生成源码的智能编程。 字节跳动 Web Infra 负责人示意:“心愿 Modern.js 我的项目能帮忙业界更快更好的倒退基于前端技术的成熟 GUI 应用软件研发体系,让前端技术栈的开发者们可能‘责任越大,能力越强’。” ...

October 27, 2021 · 1 min · jiezi

关于字节跳动:火山引擎MARSAPM-Plus-x-飞书-|降低线上OOM提高App性能稳定性

通过应用火山引擎MARS-APM Plus的memory graph性能,飞书研发团队无效剖析定位问题线上case多达30例,线上OOM率升高到了0.8‰,降幅达到60%。大幅晋升了用户体验,为飞书的性能品质保驾护航。应用程序稳定性是影响用户体验及留存的关键因素对于挪动App的开发者来说,最根底也是最关注的问题就是应用程序的稳定性。而解体问题是影响稳定性的重要因素, 包含NSException、Signal、卡死、OOM(Out Of Memory)等问题类型。其中,OOM问题是随着业务的迭代,缓缓进入了开发者视线。 OOM问题往往埋伏在简单的业务背景下,复现艰难且短少无效的问题排查伎俩。目前在 iOS 端排查内存问题的工具次要包含 Xcode 提供的 Memory Graph 和 Instruments 相干的工具集,它们可能提供绝对齐备的内存信息,然而利用场景仅限于开发环境,无奈在生产环境应用。因为内存问题往往产生在一些极其的应用场景,线下开发测试个别无奈笼罩对应的问题,Xcode 提供的工具无奈剖析解决大多数偶现的疑难问题。 飞书是字节跳动旗下先进企业合作与治理平台,不仅蕴含一站式整合及时沟通、智能日历、音视频会议、飞书文档、云盘等办公合作套件,更提供飞书OKR、飞书招聘、飞书绩效等组织治理产品。作为一款企业合作与治理平台,业务复杂度十分高,稍有不留神就会触发OOM,导致程序解体。 那么飞书的业务有多简单呢?举例来说: 飞书音讯列表页的音讯类型多达十余种,包含文档预览,视频、简单的富文本等;飞书会议在千人视频中能够对视频做各种特效渲染,视频过程能共享文档,千人在线编辑文档;飞书文档自身反对插入各种类型信息,比方简单计算公式、脑图、UML图、同时也反对内部扩大;......飞书把内存的应用使用到了极限,稍不注意就会导致OOM。试想一下,千人视频会议的时候,忽然间因为内存问题导致解体,会议方是什么感触?给客户发送一条简单的音讯,因为内存问题,客户的手机解体了,客户是什么感触?基于此,解决内存问题、剖析定位线上 OOM 起因,是飞书的首要指标。 火山引擎MARS-APM Plus为飞书性能保驾护航APM Plus是字节跳动利用开发套件MARS下的性能监控产品,通过先进的数据采集与监控技术,为企业提供全链路的利用性能监控服务,解决企业对各端监控的需要。具备非侵入式监控、丰盛的异样现场还原能力,助力企业晋升异样问题排查与解决的效率、优化利用品质,以降低成本进步支出。 MARS-APM Plus-性能介绍 飞书通过火山引擎MARS-APM Plus memory graph 提供的类聚合列表,能清晰的发现内存占用排名靠前的类,每一个类还能够向下钻取到内存节点单元,通过内存节点单元能够查问到节点的援用关系,顺藤摸瓜,找到最开始的父节点,同时还能够逆向去看其余内存节点单元是否也是同样的援用关系,以此来佐证该内存问题。通过这种剖析思路,咱们发现了超大图问题、超多帧gif问题、资源预加载问题等等。 火山引擎MARS-APM Plus的内存优化分「OOM趋势」、「泄露剖析」、「大对象」和「单设施查问」。 OOM 趋势:提供了内存泄露的指标剖析。 除了4个外围指标(OOM次数、OOM率、影响用户数、影响用户比例)外,还提供进一步剖析OOM的扩大指标,如:App占用内存大小、App占用内存比例。泄露剖析:提供了导致透露的对象类型列表和详情剖析。 在这里能够逐个剖析那些重大导致内存泄露的对象。对象列表中:提供了占用内存过大的大对象以及数量泛滥聚合而成的小对象。 以帮忙研发更精确地理解内存被哪些对象占用。单设施查问中:可间接剖析单台设施的内存问题。 iOS提供了间接精准剖析单台设施的内存援用树、摆布树、实例等,Android可下载查问其原始数据。在应用memory graph前,飞书线上剖析伎俩繁多,也不能给出明确的理论依据,一度线上OOM用户影响率达到2‰,通过应用memory graph,咱们无效剖析定位问题线上case多达30例,线上 OOM 率升高到了0.8‰,降幅达到60% 。大幅晋升了用户体验,为飞书的性能品质保驾护航。 助力企业晋升IT异样问题排查与解决的效率、优化利用品质APM Plus为企业提供针对应用服务的品质、性能以及自定义 埋点 的 APM 服务。基于海量数据的聚合剖析,平台可帮忙客户发现多类异样问题,并及时报警,做调配解决,同时平台提供了丰盛的归因能力,包含且不限于异样剖析、多维分析、自定义上报、单点日志查问等,联合灵便的报表能力可理解各类指标的趋势变动。除飞书外,APM Plus已服务了抖音、今日头条、Tik Tok等多个超大规模用户量级挪动App。 火山引擎MARS-APM Plus的内存监控可定位到到因内存占用导致的异样,并提供多种排查内存异样的指标、维度与伎俩: 无死角地发现已呈现的内存异样问题,有齐备的归因链路。 不仅提供了丰盛的指标可剖析内存问题并确定影响范畴,并可能给出导致内存异样的对象列表,还可能剖析单台设施上具体异样节点。提供从大盘到代码的层层递进的归因剖析能力,极大进步研发的排查效率提供预防内存异样的能力。 可给出有导致内存异样危险的对象列表,可提前针对性地优化,升高事变发生率,在影响用户前就解决掉潜在危险。目前,火山引擎MARS-APM Plus面向新用户提供试用30 天的限时收费服务。其中蕴含 App 监控、Web 监控、Server 监控、小程序监控,App 监控和 Web 监控各500 万条事件量, Server 与小程序监控限时不限量。 ...

October 12, 2021 · 1 min · jiezi

关于字节跳动:一起来找茬记一起-clang-开启-Oz-选项引发的血案

作者:字节跳动终端技术 —— 刘夏前言笔者来自字节跳动终端技术 AppHealth (Client Infrastructure - AppHealth) 团队,在工作中咱们会对开源 LLVM 及 Swift 工具链进行保护和定制,推动各项编译器优化在业务场景中的落地。编译器作为一个简单的软件也会有 bug,也会有各种兼容性和正确性的问题,这里咱们分享一则开启 clang 的 -Oz 优化选项时发现的编译器缺点。 问题在 Xcode 中咱们能够对 clang 编译器设置不同的优化等级,比方在 Debug 模式下默认会应用 -O0,在 Reelase 模式默认应用 -Os(兼顾执行速度和体积),然而在一些性能要求不大的场景,咱们能够应用 -Oz级别,开启后编译器会针对代码体积采取更加激进的优化伎俩。 公司的一个视频组件为了减包开启 clang 的 -Oz 优化级别进行编译,但在开启后的测试中发现,视频组件在导出视频时呈现内存暴涨而后产生 OOM 闪退,并且能够稳固重现。通过 Instruments 及 Xcode 的 Memory Graph 性能能够看到大量的 GLFramebuffer 被创立,而每个 GLFramebuffer 中会持有一个 2MB 的 CVPixelBuffer ,导致占用大量内存。 预期中这些 GLFramebuffer 应该被复用而不是反复创立,但通过日志发现每次获取时都没有可用的 buffer,于是就一直创立新的 buffewr。在代码逻辑中, buffer 是否能重用依赖于 -[GLFramebuffer unlock] 是否被调用,然而通过观察发现:这些 buffer 会沉积到导出工作完结后才被 unlock,所以咱们须要找到 unlock 被推延的起因。 ...

July 29, 2021 · 4 min · jiezi

关于字节跳动:火山引擎发布火种计划-向小微企业免费开放数据智能产品

字节跳动正在把本人的举荐算法、数据分析、人工智能等核心技术,通过“火山引擎”,凋谢给企业客户。这是继推出企业协同工具飞书后,字节跳动在企业服务畛域的又一次加码。 火山引擎是字节跳动旗下智能科技品牌,也是字节跳动对外提供技术服务的窗口。6月10日,在低调运行一年后,火山引擎在北京首次召开了品牌发布会,残缺阐释了本人的业务理念和产品逻辑。 字节跳动副总裁,算法与数据技术负责人杨震原在会上示意,中国企业正在减速向数字化、智能化转型,字节跳动基于数据驱动理念所积淀的技术工具和架构,有着宽泛的利用前景,可能帮忙企业更好地抓住技术红利。此外,凋谢技术也能晋升科技公司的创新力。 发布会上,火山引擎还发表推出“火种打算”,面向1000家小微企业收费凋谢多款技术产品,并联结金融、批发、汽车、文旅等行业领军企业,摸索简单业务场景下的技术实际,促成中国企业的数字化转型降级。 字节跳动副总裁,算法与数据技术负责人杨震原在发布会现场发表主题演讲 火山引擎首次公开“智能增长技术”产品矩阵火山引擎总经理谭待认为,数字化转型不是目标,企业须要的是以数字化技术晋升产品和服务质量,从而取得继续的增长。 字节跳动在过来九年间的高速增长,积淀了通过大规模实际验证的增长办法、工具和技术能力。谭待介绍说,这些能力在火山引擎上有机组合为对立根底服务、技术中台、智能利用和行业解决方案四层架构,蕴含60多款单品,统称为“智能增长技术”。 在火山引擎“智能增长技术”的产品矩阵中,个性化举荐算法特地受到企业客户的青眼。利用高效的信息匹配机制,不同畛域的客户取得了效果显著的增长。发布会上一组数据显示,应用火山引擎提供的举荐算法后,某电商客户的人均点击率进步48.3%,人均GMV更是进步了100%以上,多家手机厂商客户的利用商店、浏览器、负一屏等场景的点击率也有大幅增长。 抖音同款的特效玩法也通过火山引擎凋谢给了企业。以AR试妆为例,以往消费者买口红要到柜台试色号,才晓得是否适合。现在应用火山引擎提供的AR视觉特效技术,消费者在手机上就能体验商品,这项技术为一家美妆交易类客户晋升了12.6%的购买转化率。 据悉,火山引擎“智能增长技术”已服务了泛滥客户,包含苏宁、京东、vivo、建设银行、银河证券、吉利、B站、华润等知名企业。银河证券副总裁罗拂晓在发布会上示意,火山引擎的A/B测试、增长剖析等数据工具和增长办法,帮忙他们更迷信地剖析数据、明确策略方向。 “联合火山引擎的AI能力,咱们打造出银河证券‘数字人’。通过虚构形象,咱们和客户之间的互动变得更加活泼,无效晋升客户的粘性和留存。”罗拂晓说。 推出“火种打算”,助力千家小微企业数字化转型发布会上,火山引擎还推出了火种打算。 火种打算包含两项核心内容:一方面,向小微企业限时收费凋谢多款智能利用及数据产品,首批名额一千家;另一方面,联结金融、批发、汽车、文旅等行业领军企业,摸索简单场景下智能增长技术的落地实际,共创解决方案,促成行业的数字化转型降级。 火山引擎总经理谭待发表推出“火种打算” 对于小微企业来说,火种打算能够帮忙他们,在人力和资源无限的状况下,用上比拟好的根底服务工具。崔虎是一位做地图APP的创业者,也是火种打算的首批参与者之一。他示意,火种打算最大的价值,就是为小微企业提供了成熟、稳固的通用技术工具,“能够帮忙我的项目疾速迭代,晋升产品的各项数据指标,也节约了大量工夫。”除了帮扶小微企业,火山引擎也心愿找到更多的行业通用解决方案。谭待示意,在一些业务场景比较复杂的行业,互联网的技术无奈生吞活剥,须要针对具体场景做更深刻的优化。火山引擎正在与行业领军企业单干,共创解决方案。“ToB市场行业间差别大,业务链条长,上下游简单,咱们须要学习的还很多。”杨震原说,“对客户有价值的事件,咱们会放弃急躁,做50年甚至更长期的投入布局。”

June 11, 2021 · 1 min · jiezi

关于字节跳动:字节跳动异构场景下的高可用建设实践

本文首发于:火山引擎开发者社区;作者:字节跳动基础架构团队零碎治理方向负责人邵育亮。本文次要为大家介绍字节跳动在高可用建设上的一些思考和落地教训。先给大家简略介绍一下零碎治理团队是做什么的。零碎治理团队在基础架构团队外部,次要负责字节跳动研发的闭环生态:从服务开发,到大规模微服务架构下的联调、开发以及对应的公布,再到上线当前的微服务治理、对应的流量调度、容量剖析,以及到最初通过混沌工程的建设帮忙业务晋升高可用能力。接下来就进入正题。首先介绍一下字节跳动混沌工程建设的背景。大家晓得字节跳动有很多 APP,咱们有十分多的服务,这些服务大抵能够分成三个类型: 在线服务:大家能够了解成反对抖音、西瓜视频等的后端服务。这些服务的特点是它们跑在咱们自建的大规模 K8s 上的 PaaS 集群上,这是一套十分大的微服务架构。离线服务:包含一些举荐模型的 training,大数据的 report 计算等等,都属于离线服务。它们依赖大规模的存储和计算的能力。基础架构:承载了字节中国的所有业务线,向上提供一套 PaaS 化的能力,包含计算和存储等,撑持各种业务不同的应用场景。不同的服务体系对高可用的关注度并不一样。咱们简略做一下剖析: 在线服务:自身是无状态服务,运行在 K8s 容器上,其存储都在内部的 MySQL、Redis。这些无状态服务很不便做扩容,在产生故障时能尽可能容错,当然也可能会做一些降级。离线服务:有状态服务,很关注计算的状态。大数据的计算服务特点是运行工夫很长,Training、model 的工夫都特地长。它能容忍一些谬误(如果某次 job 挂了,能够进行 retry),其更多状态的一致性、数据的完整性是依赖底层存储系统的反对。所以咱们在离线服务的高可用建设,很大规模依赖于整个基础架构提供的高可用能力。基础架构:基础架构自身是有状态的,它是进行大规模存储、计算的平台,可能会遇到一些网络故障、磁盘故障等灰天鹅事件,这其中咱们关注较多的是数据一致性。应答不同的服务类型,零碎治理团队负责高可用的同学提出了不同的解决方案。在这里先给大家介绍咱们应答在线服务(无状态服务)时混沌工程的演进。 在线服务的混沌工程演进混沌工程平台 1.0 架构咱们认为咱们的混沌工程平台 1.0 版本还不是一个混沌工程零碎,更多的是一个故障注入零碎。 上图是咱们这个平台 1.0 版本的架构。这个平台面向用户提供可视化界面,可进行故障注入和一些简略的配置。在底层物理机上咱们装了 Agent。Agent 运行在宿主机上,可实现容器间网络相干的故障注入。对于服务稳态,咱们在做混沌演练的时候,在平台上能够注入一些 metrics,用户能够写一个 bosun 语句去查问 metrics,咱们提供一个阈值,零碎就会轮询这个 metrics 来断定服务是否达到稳固的状态。如果超出边界,咱们就进行故障复原。如果没有超出边界,就持续演练,看是否能达到预期。为什么这个零碎不能称之为一个混沌工程的零碎?Netflix 的 Principle of Chaos 对混沌工程的定义(http://principlesofchaos.org/) 有五大准则: 建设一个围绕稳固状态行为的假说多样化真实世界的事件在生产环境中运行试验继续自动化运行试验最小化爆炸半径管制比照以上五个准则,咱们来看一下为什么说这个平台只是个故障注入零碎。 首先整体的稳态还绝对比拟简陋。理论的微服务架构中会存在各种故障,这个平台中只做到了比较简单的故障注入,如故障提早、断网等。在生产环境进行演练是过后能做到的事件。因为稳态比拟简陋,所以很难真正评估这个零碎是不是稳固,零碎也无奈自动化运行试验。整个零碎申明 scale 的 scope 做的不是特地好。另外过后技术实现的构造是在物理机的宿主机上做故障注入,自身有肯定的隐患,爆炸半径管制做得也不是特地好。混沌工程平台 2.0 架构在 2019 年的时候,咱们开始想把混沌工程平台 1.0 版本演进到下一代,心愿可能做一个真正合乎混沌工程规范的零碎,因而有了平台的 2.0 版本,咱们认为它是字节跳动真正意义上的第一个混沌工程零碎。 混沌工程平台 2.0 版本的一些降级: 架构降级:引入了一个故障核心层,解耦了业务逻辑和底层故障注入。故障注入:随着 Service Mesh 更大规模的利用,网络调用相干的故障更多基于 sidecar 实现。稳定性模型:这个阶段咱们也构建了一个稳态零碎,基于服务的要害指标和机器学习等算法实现稳态计算。咱们十分关注稳态零碎,认为真正的自动化演练是不须要人工干预的,所以须要一个零碎来辨认被演练的零碎是否稳固。如果零碎只看到一堆 metrics,它很难间接去认知零碎的稳定性。咱们心愿通过一些特定算法将这些 metrics 聚合成一个百分位指标,假如这个指标达到 90 分,咱们就认为它是稳固的。后文还会再介绍咱们怎么在这个稳态零碎外面做算法的投入。故障核心架构 ...

May 28, 2021 · 2 min · jiezi

关于字节跳动:美摄科技起诉字节跳动索赔-2274-亿元称抖音等多款软件涉代码抄袭

SegmentFault 思否音讯,4 月 30 日音讯音视频技术提供商美摄科技通过其微信公众号公布申明,称近日已向法院以侵害计算机软件著作权及侵害技术秘密为由,正式起诉北京字节跳动科技有限公司、北京微播视界科技有限公司及多个关联公司,要求上述公司立刻进行侵权行为、在自有媒体平台全量推送公开赔罪,并抵偿经济损失及正当收入共计人民币 22.74 亿元。 以下内容是美摄科技公众号申明全文:对于美摄科技正式起诉字节跳动的申明 美摄科技近日已向法院以侵害计算机软件著作权及侵害技术秘密为由,正式起诉北京字节跳动科技有限公司、北京微播视界科技有限公司及多个关联公司,要求上述公司立刻进行侵权行为、在自有媒体平台全量推送公开赔罪,并抵偿经济损失及正当收入共计人民币22.74亿元。 经泛滥合作伙伴的揭示,咱们比照发现,自2018年11月1日“抖音”3.0版本至今,其实现视音频编辑解决等性能的相干软件代码,大量剽窃自美摄科技享有著作权的相干美摄软件。而更令咱们震惊的是,比照字节跳动旗下的其余6款APP“剪映”、“巨量创意”、“多闪”、“Faceu激萌”、“图虫”、“轻颜相机”,咱们发现全副存在代码剽窃痕迹,其中多处函数名统一,甚至将美摄科技拼写错误的函数都一成不变剽窃照搬。 视音频编辑解决等性能是“抖音”APP最为根底、外围的性能之一,基于该性能,“抖音”等数款APP曾经取得了数亿级的用户,下载量高达数十亿次,取得微小的侵权获利。对于字节跳动这样一家以技术驱动的互联网科技巨头,旗下多款软件却重大进犯美摄科技的知识产权,咱们深感震惊与遗憾。 依据《中华人民共和国著作权法》、《反不正当竞争法》、《计算机软件爱护条例》等相干法律、法规的规定,美摄科技已向法院提起诉讼,恳请法院依法裁决,保护美摄科技的合法权益。 数据显示,北京美摄网络科技有限公司成立于2014年,是一家专一于视音频畛域开发的智能视音频整体解决方案服务商,服务内容包含挪动端视音频图像智能解决、辨认以及深度学习等,服务畛域涵盖挪动APP、智能手机、智能硬件、广电及通信运营商等行业客户。 同时,美摄科技旗下有多条软件著作权,包含“美映(iOS版)”、“美摄云剪辑”、“美摄转码”等,公司经营有短视频拍摄制作工具“美摄”APP。 美摄科技至今共实现5轮融资,投资方包含B站、小米科技、深创投等。美摄科技第一机构大股东新奥特(北京)视频技术有限公司,成立于1990年,始终致力于在数字媒体畛域提供当先的内容生产及经营的技术与服务。

May 1, 2021 · 1 min · jiezi

关于字节跳动:字节跳动飞书部门大量HC来了

字节跳动飞书部门大量HC来了,乡亲们请看过去。多城市:北 上 广 深 武 成。多职位:技术、经营、产品、测试。有动向的同学能够私信我。谢谢大家的捧场,欢送点赞投币转发。

March 21, 2021 · 1 min · jiezi

关于字节跳动:字节跳动在联邦学习领域的探索及实践

数据是人工智能时代的石油,然而因为监管法规和商业秘密等因素限度,"数据孤岛"景象越来越显著。联邦学习(Federated Learning)是一种新的机器学习范式,它让多个参与者能够在不泄露明文数据的前提下,用多方的数据独特训练模型,实现数据可用不可见。 字节跳动联邦学习零碎架构师解浚源近期在火山引擎智能增长技术专场,以《联邦学习原理与实际》为主题,分享了联邦学习在广告投放和金融等场景中的利用模式、算法钻研、软件系统及实践经验。 联邦学习简介首先,咱们简略介绍联邦学习的定义。 大数据是机器学习的石油,但数据孤岛问题普遍存在。因为用户隐衷、商业秘密、法律法规监管等起因,各机构无奈将数据整合在一起,用来训练一个成果更好的大模型。 联邦学习是一种为了解决数据孤岛问题而提出的机器学习算法,指标是实现公有数据、共享模型。例如当初有三个参与方,每个参与方领有一个公有集群和数据,这些参与方想独特训练一个模型,联邦学习就能够解决该问题。 在联邦学习的模式下,能够由一个地方服务器首先将参数发送给每个参与方,而后每个参与方根据本人的公有数据更新模型,模型更新后再将梯度汇总发送至地方服务器,由服务器更新模型,而后开始下一个循环。 通过这样的形式,各参与方能够在不相互走漏原始数据的状况下训练一个共享参数的模型。 常见的联邦学习范式有纵向联邦学习和横向联邦学习两种。纵向联邦学习有两个参与方,各自领有同一条样本的不同特色,比方一个参与方领有用户浏览历史,另一个参与方领有购买历史。 在这种状况下,咱们能够在两个集群各跑一部分模型,通过跨集群的形式替换两头后果,来达到训练一个模型的成果,这与机器学习中模型并行的训练形式相似。 横向联邦学习是两个参与方领有不同样本的雷同特色,比方两个参与方都领有用户的年龄、性别等,然而用户并不相同。在这种模式下,每个参与方都能够领有整个模型,然而各自用不同的数据更新模型,最终汇总模型的梯度来训练模型,这与分布式机器学习中的模型数据并行训练形式相似。 如果探索联邦学习的历史,其经验了大略 3 到 5 年的倒退。起初是 2015 年,Privacy-Preserving Deep Learning 这样的概念被提出,而后谷歌的 McMahan 提出若干深度学习方面的训练和利用模式。2018 年,微众公布联邦学习白皮书。 究其实质,联邦学习最重要的就是爱护数据的可用而不可见,也就是数据的隐衷爱护,其钻研有如下方面:一是基于差分隐衷的数据保护;二是基于机密共享的加密计算方法;三是基于同态加密的加密计算方法。 联邦学习的利用场景如下图,第一个场景是联邦学习在深度转化广告投放畛域的利用。在广告投放场景下,媒体侧的流程是用户发动申请,媒体通过模型预测用户最可能感兴趣的广告,并将它展现给用户,用户一旦点击广告就会跳到一个落地页,这个落地页会导向广告主侧的购物网站。 对广告主而言,在这个过程中产生的深度事件为用户是否转化。以电商场景为例,转化指的是用户购买了产品,而未转化就是指用户没有购买行为,广告主会将转化事件记录到数据库外面,媒体侧也会把这些信息记录到数据库外面。在该畛域的传统做法是广告主将标签返回到媒体这一侧,而后媒体组合数据和标签用以训练模型,应用该模型晓得投放优化成果。 在这个场景下,媒体和广告主别离领有点击样本的不同信息,比方媒体侧领有用户的特色、年龄、性别,上下文特色(用户点击该广告前后看了哪些文章,点击产生的工夫及用户所处地位);单方共有的信息是广告相干的特色,比方广告图片、题目等;广告主领有的是用户历史特色,比方用户以前在该广告主处购买的商品,以及商品更细节的特色(商品价格、商品评论),广告主不会将这些信息同步到媒体侧。最初是深度事件,用户是否的确产生购买行为还是仅将商品增加至购物车。 如果利用联邦学习对该场景进行优化,在线局部放弃不变,然而用户的每个点击须要附加 request_id,这就惟一标识了用户的一次点击,并在媒体侧和广告主侧共用一个 ID,惟一标记这一次申请。广告主和媒体别离将 request_id 存到数据库中。离线训练时,媒体侧能够找到该条数据输出模型,最初将数据的 request_id 和输入的两头后果一起发送给广告主。广告主拿到 request_id 后就能够找到其对应的 label,而后用其计算样本的转化成果,再用该后果反向流传计算出梯度,最初将梯度发回媒体侧,两边别离用该梯度来更新模型。 第二个场景是金融信用场景。在该场景下,不同的金融机构心愿能够综合多方数据进步对用户信用判断的准确度。如果各方领有不同用户的雷同特色,这样就能够采纳横向联邦的形式。例如,不同的银行别离向不同的用户发放了信用卡贷款,要想建设一个更好的用户信用评估模型,多方就能够用各自领有的不同用户特色,采纳横向联邦的形式建设一个模型。 另一种状况是单方领有雷同客户的不同特色,这样就能够采纳加密的纵向联邦形式。例如,一个银行和一个信贷机构别离领有雷同用户的不同特色,比方银行晓得用户的贷款信息,信贷机构晓得用户的贷款信息,这样就能够综合训练出对用户的信用评估。思考到金融场景的习惯和数据特点,个别是采纳树模型进行建模,基于树模型的较驰名的联邦学习算法是 SecureBoost,能够用多方数据在可用不可见的状况下进行加密的树模型训练。 联邦学习的根底算法在纵向联邦学习中,如果数据由线上申请产生,单方在存储该申请时可能呈现失落和程序不统一的状况,这就须要训练前单方对齐数据,比方后面提到的深度转化广告投放场景,用户的点击数据在媒体侧和广告主侧是别离存储、别离落盘的,单方的落盘工夫可能不统一,程序也有可能因为单方的解决形式而打乱,这样就会产生一种对应关系,比方 request_id 0 寄存在广告主的第一个地位,而 request_id 3 在媒体侧处于第一个地位。在这种状况下,咱们须要把数据进行对齐,排除掉其中一方没有的数据。流式数据求交算法能够解决该问题,删掉对方没有的数据,把共有数据依照对立程序排序。 为了实现该性能,咱们实现了分布式的流式数据求交算法。该算法中,一方作为 leader,另外一方作为 follower,leader 将数据依照本人的存储程序将 request_id 程序发送给 follower,follower 用本人的 request_id 和 leader 的 request_id 进行求交,求交完结依照 leader 的 request_id 程序生成 DataBlocks 数据块,最初将生成的数据块发送给 leader,leader 依照数据块进行排序,并删除缺失数据,最初在两边造成雷同对应的数据块。一个数据块在两方各有一半,在这个对应的数据块里,数据严格依照统一的程序排序。须要提到是在流式数据求交的算法外面,只能应用相似于 request_id 这种不泄露用户隐衷的随机数 ID 作为主键求交,如果是相似于用户的手机号这种敏感数据,就不能应用这种形式来求交。 ...

January 14, 2021 · 2 min · jiezi

关于字节跳动:从-20-到-21迈向新增长2021-元旦快乐

January 1, 2021 · 0 min · jiezi

关于字节跳动:字节跳动开源云原生机器学习平台-Klever

SegmentFault 思否音讯,字节跳动技术团队官网微信公众号公布音讯称:「字节跳动基础架构团队基于火山引擎机器学习平台 Clever 及其丰盛的行业落地教训,推出开源我的项目 Klever,以工程化的形式升高智能技术落地门槛,助力企业疾速打造智能业务。」 我的项目地址 : https://github.com/kleveross Klever 是一个反对 OCI(Open Container Initiative)规范存储训练模型、反对在线模型服务部署的云原生机器学习平台。算法科学家能够应用 Klever 进行模型治理、模型解析、模型转换、模型服务,它曾经解决了智能技术落地流程中的如下问题: 模型的治理和散发模型解析和转换在线模型服务部署和治理同时,基于字节跳动在机器学习和云原生开源社区的技术积攒,Klever 提供弱小、通用的开源技术标准,不便企业无缝迁徙线上利用。 换句话说 Klever 的次要性能是解决 ,算法技术选型到模型最终上线过程中波及到的大量工程化工作对接,从而解放算法工程师的「双手」,让他们能够聚焦在算法模型上,不用为大量繁琐的配置工作浪费时间。 当初,在字节跳动外部在基于各类实际欠缺云原生机器学习工程化平台的构建想法,丰盛 Klever 的性能和外延。在内部市场,火山引擎推出的商业化版机器学习平台 Clever 已在金融、制作、批发、能源等行业领有成熟的解决方案。 Klever 的概述零碎架构Klever 有四个自研发的组件,并依赖三个开源组件: ormb:模型打包、解压、上传、下载工具model-registry:模型仓库及模型服务 API 管理层modeljob-operator:ModelJob controller,治理模型解析、模型转换工作klever-web:前端组件Istio:开源服务网格组件,模型服务通过 Istio 对外裸露模型服务地址,实现模型服务按内容分流和按比例分流Harbor:模型底层存储组件,对模型配置和模型文件进行分层存储Seldon Core:开源模型服务治理的 Seldon Deployment CRD 的 controller,通过 SeldonDeployment CR 实现模型服务的治理 CI 规范的模型仓库治理,用户能够像应用 Docker 治理镜像一样治理机器学习模型。 其次,整个零碎可通过容器化的形式部署在 Kubernetes 容器治理平台之上,用户无需治理模型解析、模型转换、模型服务理论运行在哪台物理机之上,零碎会主动调度和运行资源短缺的机器,并在模型服务负载较高时主动弹性伸缩。 最初,因为机器学习在不同训练过程中往往应用不同的数据集,会产生不同的模型,Klever 反对多种模型服务运行时,可将产生的模型用于提供生产环境可用的在线服务。

December 24, 2020 · 1 min · jiezi

关于字节跳动:美国法官再次叫停-TikTok-禁令称特朗普反复无常

又一位联邦法官阻止了特朗普禁止在美国下载 TikTok 的希图,当地美国用户依然能够下载和应用 TikTok。 此前,特朗普曾将 12 月 4 日定为最初期限,要求字节跳动实现 TikTok 在美国业务的剥离。截止日期当天,美国政府曾示意不会缩短该期限,但字节跳动与甲骨文和沃尔玛的会谈仍在持续。 中央法官颁发禁令,反对 TikTok 在美经营当地工夫周一(12 月 7 日)晚间,美国华盛顿地区法官 Carl Nichols 批准了一项阻止美国商务部禁止 TikTok 的禁令。 这是美国第二个阻止 TikTok 的禁令的案例,上个月,宾夕法尼亚州的一位联邦法官曾经颁发了禁令,称不会强制要求 TikTok 进行运行。 这次颁发禁令时,Carl Nichols 法官说,特朗普政府的禁令可能会违反《国内紧急经济势力法》的受权,称此举是任意和出尔反尔的。 Carl Nichols 先前还于 9 月 27 日颁发了初步禁令,该禁令容许人们持续在美国下载 TikTok。过后,他没有对美国商务部的其余限度作出裁定。 TikTok 交易尚未实现,单方会谈仍在持续TikTok 发言人在一份申明中说: “咱们很快乐法院批准咱们的意见,批准了一项拥护行政命令中所有禁令的初步禁制令。咱们致力于持续把 TikTok 建设成为1亿美国人的家园,包含家庭和小型企业,依附它们来表白、分割、经济生存和真正的高兴。” 目前,美国商务部尚未对此事作出回应。 往年 9 月初,在 TikTok 平台上共有 740 万粉丝的三位美国网红独特对该禁令提起来诉讼,称 TikTok 是他们生计的起源,因而特朗普的禁令意味着他们将失去支出起源并限度他们展现才艺的能力。 这三名网红状告美国政府胜诉也成为了这款利用持续在美立足的关键所在。 音乐家 Alec Chambers 于2018年末退出TikTok,并迅速取得微小欢送 特朗普政府为字节跳动设定了 12 月 4 日发售或剥离 TikTok 在美国业务的最初期限,但政府当天示意不会缩短或执行这个最初期限。特朗普总统示意,他“在概念上”批准甲骨文和沃尔玛提出的收买计划,该计划将创立一个总部位于美国的实体—— TikTok Global,但目前尚不分明这将如何解决一些平安危险,该交易尚未取得中方的最终批准。 ...

December 8, 2020 · 1 min · jiezi

关于字节跳动:7天8卡训练32种语言字节跳动推出多语言预训练新范式mRASP

字节跳动发表在 EMNLP 2020 会议上的一项钻研提出多语言翻译新范式——mRASP。1920 年大哲学家罗素学生来中国各地拜访,陪同翻译的是过后清华大学语言学家赵元任。赵元任极富语言蠢才,过后曾经会说保定话、常州话、福州话、南京话等多中央言和英语。他在陪同罗素从上海到长沙的船上跟同船的经济学家杨瑞六学长沙话,船到长沙靠岸,赵元任曾经能把罗素的演讲和俚语翻译成长沙话了。神经网络翻译是否成为「机器翻译界的赵元任」呢?即发明一个对立的具备多种语言能力的模型,在遇到新的语言时,长期大量学习即可达到很流畅的语言程度。 赵元任(后排左二)与罗素(前排右一) 本文将给大家介绍 EMNLP 2020 新鲜出炉的多语言翻译新范式 multilingual Random Aligned Substitution Pre-training (mRASP) [1],其核心思想是打造「机器翻译界的赵元任模型」,通过预训练技术再在具体语种上微调即可达到当先的翻译成果,其在 32 个语种上预训练出的对立模型在 47 个翻译测试集上获得了全面显著地晋升。 mRASP 不同于以往的翻译模式,建立了翻译的预训练和微调的胜利门路。 以 BERT 为代表的预训练范式简直横扫了所有的文本了解工作,成为各种 NLP 工作的基石。然而,在文本生成尤其是机器翻译畛域,尽管预训练模型也涌现出不少新算法,然而获得的成果仍有肯定局限性,在资源丰盛水平各异的场景和多语言扩大上仍然面临着挑战。mRASP 解决的外围问题是:是否预训练出一个对立的翻译模型,在任何语对例如中文到印尼语中都能通过大量微调来达到好的翻译成果? mRASP 次要针对机器翻译工作而设计,它有三个利用劣势: 突破了资源场景的限度,不管平行双语资源高下都能有所晋升。在资源丰盛的语言,比方规范英法翻译工作上曾经有 4000 万平行语句训练状况下,应用 mRASP 仍然能取得显著晋升,达到了 44.3 的 BLEU 值;在低资源语言中,mRASP 的体现令人惊喜,极其状况下,只须要一万句训练数据,通过 10 分钟微调训练,就能失去一个还不错的翻译零碎。突破了语种数量的限度。任何语言的翻译,无论是孟加拉语到古吉拉特语还是印地语到菲利宾语,只有是地球上的语言,mRASP 都能够间接拿来微调,并且成果可期。资源耗费低。相比于上百张卡的「军备竞赛」预训练玩法,mRASP 更平民,仅须要 8 卡训练一周就能够失去。简略来说,咱们能够把 mRASP 了解为机器翻译畛域的轻量级 BERT,只有是机器翻译工作,任何场景或者语言,拿来用用,都有可能呈现小惊喜!论文作者示意曾经在字节跳动研发的火山翻译零碎上应用了这项技术,失去了理论业务的测验。作者还颁布了钻研数据、代码和预训练模型,参见文末 GitHub 地址。 接下来咱们从三个方面介绍剖析 mRASP:1)机器翻译预训练的挑战;2)mRASP 的动机和办法;3)mRASP 的实际效果和剖析。 机器翻译预训练的挑战目前绝大多数 AI 工作都是建设在数据根底之上的统计学习,模型的性能很大水平上依赖于数据的品质和数量。利用大量较易取得的数据来预训练模型,在具体利用场景中再利用大量标注数据微调来实现理论场景可用的模型,曾经成为 NLP 新的胜利范式。例如 BERT [2] 在大规模纯文本上预训练后,在自然语言了解的 11 项工作上进行大量微调就能获得很好的问题。不过,在多语言机器翻译中,通过预训练再微调的范式还未获得广泛的胜利。以前的 NLP 预训练形式例如 BERT、GPT [5] 的训练指标与翻译工作关注的指标之间差距过大,不易间接应用。 ...

November 30, 2020 · 3 min · jiezi

关于字节跳动:字节跳动火山引擎加入-Linux-云原生计算基金会CNCF

2020 年 11 月 18 日,在北美举办的 KubeCon + CloudNativeCon 上,云原生计算基金会(CNCF)发表字节跳动旗下的数字服务与智能科技品牌火山引擎正式成为 CNCF 白金会员。 CNCF,全称 Cloud Native Computing Foundation,是 Linux 基金会旗下的非盈利组织。 自 2015 年 7 月成立以来,该基金会始终致力于通过建设社区、治理开源我的项目等形式推广技术、推动云原生的可继续倒退,并以此汇集了一大批云原生技术专家。倒退至今,CNCF 曾经领有近 50 家会员企业,旗下流动 KubeCon + CloudNativeCon 更是成了云原生畛域的寰球顶级峰会。 在本次峰会上,CNCF 执行总裁 Priyanka Sharma 示意:CNCF 对火山引擎退出基金会示意诚挚欢送,字节跳动以业界当先的超大容器集群规模撑持着今日头条、抖音、西瓜视频等产品线,作为字节跳动旗下的企业服务品牌,火山引擎退出云原生社区能够为企业应用云原生提供丰盛教训。

November 19, 2020 · 1 min · jiezi

关于字节跳动:美国地方法院发布禁止微信禁令的禁令主审法官微信威胁国家安全证据不足

美国地方法院的一名法官  Laurel Beeler 批准了进行微信禁令的禁令。Laurel Beeler 认为,没有证据表明这项禁令无效地解决了国家平安问题。 这一裁决与当地微信用户提起的诉讼无关,微信用户认为,这一禁令侵害了美国公民的言论自由权。 美国地方法院公布禁止微信禁令的禁令特朗普提出了针对微信的禁令后,当地微信用户对提起了诉讼。案件的主审法官 Laurel Beeler 收回了禁止微信禁令的禁令,因为被告对这一禁令是否影响美国宪法第一修正案提出了重大的之一。她还抵赖,这项禁令会给被告带来艰难,因为它会切断华人社区的次要通信伎俩。 Laurel Beeler 补充说,因为“证据不足”,她不置信禁令会解决特朗普提出的国家平安问题。 Laurel Beeler 说:“当然,政府的首要国家平安利益意义重大。但依据记录,简直没有证据表明,针对所有美国用户的微信禁令无效解决了这些担心。” “正如被告指出的那样,除了全面禁止微信之外,显然还有其余方法,比方像澳大利亚那样禁止微信进入政府设施,或者采取其余措施解决数据安全问题。” 美国商务部上周末发表了这项本应于周日失效的禁令。这是特朗普在往年 8 月初签订的两项行政命令,旨在解决中国应用程序形成的“国家平安”威逼。 然而,只有在微信被移除应用程序之前就曾经装置,这项禁令并不会阻止现有用户应用这些应用程序。 当初,特朗普曾经表态批准了 TikTok 与甲骨文和沃尔玛的单干,字节跳动并未发售 TikTok 的算法技术,无关微信的禁令也受到了地方法院的拥护。 但无论是 TikTok 的交易还是微信的禁令,都还没有最终定论,要确定后果如何尚需时日。

September 21, 2020 · 1 min · jiezi

关于字节跳动:特朗普原则上同意交易字节跳动官方回应-TikTok-四大传言

无关 TikTok 一事曾经继续了一个多月,这段时间里对于是否容许收买,该以什么条件收买的争执始终没有间断。就算是上周字节跳动抉择了不发售算法技术与甲骨文单干后,还未表态的特朗普仍是这场交易的“定时炸弹”。 终于,特朗普在北卡罗来纳州集会时对记者公开示意:“我已这笔交易示意了恭喜,我在原则上批准了这笔交易。” 字节跳动也发表了官网声,称“已与甲骨文和沃尔玛达成了原则性共识,三方将依照相干共识推动商议,心愿尽快达成合乎美国和中国法律要求的单干协定”。 特朗普“原则上”批准交易,TikTok 禁令尚未真正解除在特朗普发表“原则上”批准这笔交易的前一天,美国商务部公布了针对 TikTok 和微信的禁令,并称禁止与 TikTok 母公司字节跳动和微信交易的禁令将于 9 月 20 日失效,针对 TikTok 的禁令将于 11 月 12 日失效,到时将全面进行 TikTok 在美国的运行。特朗普发言后,美国商务部长威尔伯·罗斯公布申明示意,“原定于周日失效的 TikTok禁令将推延一周,直到 9 月 27 日晚 11:59。” 目前,尽管特朗普曾经批准了交易,但具体细节仍在变动中。据理解,字节跳动将在美国设立名为 TikTok Global 的新公司,并接管所有美国用户的解决和存储信息。 特朗普称,这家新公司总部将设在得克萨斯州,雇佣 25000 名员工,并向美国捐款 50 亿美元的教育资金。他说:“这就是我始终要求他们做出的奉献,他们将设立一个十分大的基金。” 甲骨文、沃尔玛官宣与 TikTok 单干依据 TikTok 与甲骨文和沃尔玛的单干协定,这两家公司都将参加到 TikTok Global IPO 前的融资中,他们最多能够持股 20%。 沃尔玛的发言人示意,最终协定仍有工作要做,初步批准购买 TikTok Global 7.5% 的股份。沃尔玛首席执行官 Doug McMillon 还将负责新公司的五名董事会成员之一。 甲骨文 CEO Safra Catz 示意,甲骨文将成为 TikTok Global 的多数投资者,并成为该交易中 TikTok 的“平安云技术提供商”。 Safra Catz 说:“甲骨文将放慢部署 Oracle Cloud,疾速扩大和运行 TikTok 零碎。咱们有能力为 TikTok 提供高度平安的环境,并确保 TikTok 的美国用户以及全世界用户的数据隐衷,咱们百分百地充满信心。” ...

September 21, 2020 · 1 min · jiezi

关于字节跳动:字节跳动官方回应有关TikTok若干不实传言

近日网络流传着泛滥无关字节跳动旗下公司TikTok的风闻,其中蕴含TikTok控制权、源代码、税收和教育基金等等,为此字节跳动进行了官网回应,回应的内容中有四个要害信息: 字节跳动将持续领有Tiktok的理论控制权目前的计划中不波及任何算法和技术的转让所谓向美国财政部交税50亿美元,只是对TikTok将来几年业务倒退所需缴纳的企业所得税和其余经营税的一个预测。字节跳动始终在对教育领域进行投入以下为原文: 为确保1亿美国用户可能持续应用TikTok,满足美国政府监管要求,增强TikTok美国业务,字节跳动、甲骨文、沃尔玛对TikTok的单干造成原则性共识。三方将依照相干共识推动商议,心愿尽快达成合乎美国和中国法律要求的单干协定。 针对三方单干存在的局部传言,现廓清阐明如下: 传言一、TikTok Global的次要股东为美国投资人,字节跳动会失去TikTok的控制权。 理论状况: TikTok Global是字节跳动持股100%的子公司,总部在美国。 TikTok Global打算启动一轮小比例的Pre-IPO融资,融资后TikTok Global将成为字节跳动持股80%的控股子公司。 TikTok Global的董事会包含字节跳动的创始人和字节跳动的现任董事,以及沃尔玛CEO。 TikTok Global还将启动上市打算,进一步加强公司治理构造和透明度。 传言二、对于甲骨文可能利用并占有TikTok的源代码。 理论状况: 目前的计划中,不波及任何算法和技术的转让。甲骨文对TikTok美国的源代码领有安全检查的权限。 展现源代码是跨国企业遭逢外乡数据安全顾虑的通用解决方案。2016年,微软在北京成立了技术通明核心,中国技术专家能够查看微软产品和服务的源代码,检测其安全性。2019年,思科在德国波恩开设技术验证服务中心,用以向德国联邦信息安全局公开验证其5G源代码是否合规。 传言三、对于TikTok Global将因而计划向美国财政部交税50亿美元。 理论状况: 所谓向美国财政部交税50亿美元,是对TikTok将来几年业务倒退所需缴纳的企业所得税和其余经营税的一个预测。TikTok对将来的倒退充满信心,但理论税额还需依据业务的倒退理论状况和美国的税收构造而定。对于税款的预测与此次单干计划无关。 传言四、对于总额为50亿美元的教育基金。 理论状况:

September 21, 2020 · 1 min · jiezi

关于字节跳动:穿山甲品牌升级全新定位全球开发者成长平台

9月16日,2020穿山甲超级聚星大会在京举办。会上,穿山甲发表全新品牌降级,定位「寰球开发者成长平台」。 穿山甲多位业务负责人系统性论述了穿山甲基于开发者全生命周期的成长解决方案、产品及技术支持能力、智能与人性化的服务体系,以及构建良性衰弱行业生态的致力,旨在帮忙每一个优质开发者纵情成长。 穿山甲降级寰球开发者成长平台过来一年,穿山甲随同泛滥开发者成长,为用户提供更多价值,也让平台播种了更多优质流量。 目前,穿山甲平台日均广告申请量达到630亿,相比于去年同期曾经增长了75%以上;日均广告展现量也曾经冲破了110亿,相较于去年增长了62%以上。穿山甲接入的单干利用数量,曾经超过10万个以上,笼罩独立日活设施超过了7亿。 地倒退速度最快的广告平台之一。 平台规模加上本身能力的积攒,让穿山甲有能力和愿景,去承载更多的使命。 穿山甲负责人徐宇杰示意,“咱们置信每一个认真对待用户和本身产品的开发者,都值得更好的资源和机会。无论体量大小,无论行业品类,无论处于哪一个成长阶段,应用哪一种开发平台,穿山甲都心愿成为他们的搭档和帮手,帮忙他们实现优质的成长。” 新平台定位下,穿山甲给出全速成长,深度无忧,衰弱生态三个关键词。 全速成长——全生命周期产品能力凋谢在产品能力方面,除了商业产品外,穿山甲将为开发者提供利用全生命周期的产品反对。一方面,穿山甲聚合巨量引擎的产品研发、经营、留存等通用化底层能力,为开发者提供全链路的成长反对;另一方面,将通过一系列工具和产品,帮忙开发者在成长过程中开释人力。 深度无忧——深度服务学习体系化反对穿山甲的服务和学习体系也进行了全面、智能化的降级。在服务方面,穿山甲组建了一整套寰球专家式服务体系,7*24小时为寰球开发者提供反对。 在学习体系方面,穿山甲推出了全新官网,上线了反对多语种的寰球开发者成长学习核心。无论是刚开始接触利用开发的老手,还是心愿深度理解平台产品的经营,或者是心愿间接对接开发测试的技术,都能在穿山甲全新官网获取到业余,便捷的内容。 同时穿山甲还在挪动端上线了“开发者成长核心小程序”。在小程序内,开发者能够随时随地学习专家真人解说的视频课程,查看经营团队精心制作的行业白皮书和成长指南。 衰弱生态——全力搀扶优质流量在衰弱生态的塑造上,“择优”和“逐劣”是穿山甲精益求精的两条准则,穿山甲打造了一套基于优质流量的举荐零碎,保障优质流量取得更高的权重,实现收益最大化。同时,穿山甲会通过风控体系和反作弊技术,对违规,守法的开发者及行为进行限度和打压,疏导整改或淘汰。 商业化能力全面降级,聚星打算2.0开发者激励启动穿山甲业务增长负责人鹿锋示意,在品牌降级后为了向开发者提供全新商业模式的进阶,穿山甲从冲破力、业余力、生态力等方面进行降级。 冲破力上,穿山甲会在游戏、资讯、影音三大行业进行商业模式的重点冲破;业余力上,穿山甲商务团队将推出更精细化的垂直行业经营体系与寰球专家式服务体系;生态力上,穿山甲将提供一站式转充服务、严格打击盗版、实现更规范化的规范制订。 会上,穿山甲重磅推出了“聚星打算2.0”,在将来1年之中拿出50亿专项激励,面向寰球优质开发者提供高达150%的分成补贴。针对高后劲开发者以及游戏开发者,穿山甲还推出“穿山甲新星助推打算”,胜利参加流动的开发者可取得最高30%的额定分成处分。这意味着优质开发者月收益补贴额度将达到180%。 商业产品能力仍然是穿山甲的基石,在过来一年,穿山甲投入大量精力,晋升商业化外围能力。 穿山甲产品负责人丁玮谈到,2020年,穿山甲已实现算力云化,与公司共用一套云服务零碎,不仅能让穿山甲领有更强的算力,也不便更疾速的调动各类资源;其次,穿山甲继续晋升通用广告变现数据的稳定性、时效性,并上线系列数据产品,开发者间接通过API接口调用;产品状态上,穿山甲推出个性化模板广告,不便开发者不用独自开发组件款式和布局,还可基于运算后果去实现款式模板的千人千面和更好的收益。 在广告主层面,穿山甲经营负责人郑文雅介绍到,穿山甲沉闷广告主数量已超过了10万,同比增长超过65%,在游戏,电商,教育,工具等重点行业成长速度迅猛。从估算散布来看,穿山甲全年估算的大部分是头部广告主和平台外部优质App发明的。随着穿山甲品牌GD的上线,引入了更多高品质的品牌广告主。 破局游戏市场,洞察时机,精密经营在穿山甲超级聚星大会游戏分会场中,穿山甲海内游戏商务负责人钟乐示意,过来一年,穿山甲是中国移动游戏行业为数不多的亮点,纵观去年8月到往年8月,穿山甲给游戏开发者的分成晋升了230%。 除了高额分成激励,穿山甲在游戏业务上还拿出了游戏全生命周期的精细化经营解决方案,摸索流量价值的最大化,在中重度游戏中增强混合变现,将开屏广告引入到更多休闲游戏当中。 在产品模式上,穿山甲也对视频广告进行了更全面的产品升级,其中互动化是视频广告的降级重点。 针对互动广告的制作老本高、产能和人效较低的行业痛点,穿山甲推出全新的平台:「Rubeex -穿山甲一站式互动广告平台」。Rubeex平台的性能笼罩了互动广告从广告投前、投中、投后的全链路,包含创意制作、创意测试、数据分析、优化诊断、灵感挖掘等。应用Rubeex,可将互动广告的生产周期从1个月缩短到最快1天内就可实现,并取得全方位的创意数据分析、优化诊断。 出海方面,随着穿山甲海内业务Pangle在寰球多地区的迅速倒退,穿山甲也将帮忙游戏开发者摸索寰球增量空间。去年7月,穿山甲正式进入日本市场,作为Pangle海内第一站,一年间在日本的MAU增长翻了两番,笼罩全日本约18%的用户App在线时长,日本地区的eCPM显著晋升了18%。往年更是关上韩国、东南亚、中东等多国家和地区市场。 把握时机风口 开掘垂类行业新增量在过来一年,穿山甲平台在垂直行业的分成整体稳步晋升,曾经成为广告主在广告投放中的必选平台。在“6.18”电商大促的节点,电商广告主在穿山甲加大了投放力度,比照去年“双十一”估算减少了近400%。 在内容行业和非内容行业,穿山甲都已推出了“全生命周期精细化解决方案”。以内容行业为例,往年穿山甲的一大冲破是在影音行业的支出有大幅晋升,广告渗透到了开屏、贴片等各个场景,并积极探索激励视频的入口。 在非内容行业,针对用户停留时间过短,造成人均广告展现数少,广告支出低的痛点,穿山甲整合了大量内容输入给开发者,帮忙开发者晋升用户的停留时长和留存。例如,穿山甲帮忙开发者打造本人的小游戏核心和积分体系,作为用户经营和晋升留存的抓手,还通过输入资讯、小视频的内容,帮忙非内容行业开发者,丰盛利用性能,晋升用户粘性、在线时长和广告收益。 针对不同行业,穿山甲公布了资讯、社交、影音、工具四大行业的白皮书,当中具体介绍了为开发者推出了行业定制化的解决方案,从行业洞察到商业模式,从流量痛点到解决方案,从变现策略到变现场景,帮忙行业开发者更好实现商业化。 作为迅捷增长的「寰球开发者成长平台」,三年来穿山甲致力于一直晋升和迭代本身劣势能力,从技术、产品、服务、解决方案等层面,帮忙寰球开发者获得成功。降级后的穿山甲,心愿通过最大水平地让利,真正地帮忙每一个须要帮忙的优质开发者,让开发者纵情成长,以泛滥个体的成长驱动整个行业的后退,与大家一起,共建继续、衰弱、凋敝的挪动开发者生态。

September 16, 2020 · 1 min · jiezi

关于字节跳动:定了TikTok-选了甲骨文没卖是技术合作

TikTok 的交易终于定了!甲骨文博得了治理 TikTok在美国的云业务协定,美国财政部长史蒂文·姆努钦确认了这笔交易,也就是说,TikTok 将持续在美国经营。 不过这笔交易并不是收买,而是甲骨文成为了 TikTok“可信赖的技术合作伙伴”,协定的具体细节尚未颁布,这与间接发售不同,仿佛是由甲骨文通过其本身的云技术来反对 TikTok 在美国的经营。但无论细节如何,对 TikTok 在美国的 1400 名员工和数千万美国用户来说,都算是松了一口气。 甲骨文与 TikTok 含糊的单干关系踩在最初期限上达成的交易在许多方面都显得不太寻常,首先,它基本不是收买,甲骨文和 TikTok 达成了一种含糊的合作伙伴关系,目前尚不分明甲骨文“可信赖的技术合作伙伴”身份到底意味着什么。 前甲骨文平安负责人亚历克斯·斯塔莫斯在推特上说:“如果甲骨文在没有源代码和重大操作变更的状况下接管 TikTok,那么这笔交易将不会解决无关 TikTok 的任何正当担心,而白宫承受这笔交易将表明,这纯正是一场骗局。” 甲骨文不会重写 TikTok 的算法或解决审核,它的身份更像是 TikTok 的承包商。在中方的进口管制条例出台后,特朗普提出的以美国为核心的收买变得更加艰难。 算法技术仍把握在 TikTok 手中昨天,微软刚在官网申明中发表 TikTok 的母公司字节跳动回绝了其竞标,还在申明中强调“咱们将进行重大更改,以确保该服务达到安全性、隐私权、在线安全性和打消错误信息的最高规范。”这其中隐含的信息很分明,微软想说的就是“咱们要把 TikTok 改的更加平安,齐全由咱们来管制,但字节跳动回绝了咱们。” 如果 TikTok 抉择了微软,这笔交易原本会把美国的 TikTok 和欧洲、亚洲的业务齐全切断,但从目前的状况来看,甲骨文不太可能从 TikTok 接管任何重要的业务。 美国参议员提议回绝甲骨文与 TikTok 的单干甲骨文和 TikTok 达成协议后,美国参议员乔什·霍利公开呐喊财政部回绝甲骨文与 TikTok 提议的合作伙伴关系,称这种安顿是处于国家平安的思考齐全不能承受的。 目前,甲骨文和 TikTok 的单干曾经失去了美国财政部部长史蒂文·姆努钦的认可,但该交易仍在期待美国对外投资委员会(CFIUS)的决策倡议。 依据乔什·霍利的提议,CFIUS 应该立刻回绝甲骨文和 TikTok 的单干,并要求字节跳动将其代码和算法齐全发售给一家美国公司。 据理解,甲骨文与 TikTok 的单干和特朗普最后的要求有很大不同,白宫的一些官员也对这笔交易并不称心,但没有人公开发表回绝,局部起因是这可能导致该应用程序被齐全禁止。 TikTok 最终命运还未成定局甲骨文和 TikTok 的单干并未实现特朗普政府预期的齐全切断其与中国母公司分割的目标,甲骨文成为“可信赖的技术合作伙伴”只是在名义上解决了美国所谓“国家平安”的担心。 但 TikTok 在美国业务的最终命运决定权还在特朗普手中,预计他将在本周晚些时候收到 CFIUS 的倡议,到时就能得悉他对这笔交易的明确态度。

September 15, 2020 · 1 min · jiezi

关于字节跳动:TikTok-首席执行官-Kevin-Mayar-宣布辞职加入还不到-100天

退出 TikTok 不到 100 天的 Kevin Mayar 发表辞职,他在发给员工的信中说:“来到 TikTok 的决定是因为政治环境急剧变动做出的”。 本月初,特朗普发表将在美国禁用 TikTok,激励美国企业全面收买 TikTok。在特朗普强势的以政治伎俩打压 TikTok及其中国母公司字节跳动的状况下,字节跳动已于日前发表将正式起诉美国政府。 Kevin Mayar:来到与公司无关,仍置信 TikTok 前景光明Kevin Mayar 曾是迪士尼公司高级执行副总裁兼首席策略官,在张一鸣想要全面铺开美国业务之际,以 CEO 身份在往年 6 月 1 日入职了 TikTok。而特朗普发表禁用 TikTok 之时,Kevin Mayar 还发表了视频申明,称 TikTok 不会退出,有在美国长期经营的打算。但这句话说了还不满一个月,Kevin Mayar 就先撤了。 Kevin Mayar 强调,他来到的决定与公司无关,也与他对平台将来的认识无关。他说:“当咱们瞻望这家公司的下一个阶段时,毫无疑问,前景十分光明。对于咱们的用户来说,任何潜在的构造变动都不应该影响他们的体验,我深信咱们的社区将比以往任何时候都更具创造性和多样性。” 对于 TikTok 的将来,Kevin Mayar 仍认为前景光明,他还说,“TikTok 会为国内社会提供一个令人惊叹的综合体验。同样,从员工的角度来看,我置信绝大多数工作都不会扭转。” TikTok:尊重 Kevin Mayar 的决定Kevin Mayar 在发给员工的信中写道:“最近几周,随着政治环境的急剧变动,我对企业构造改革的要求,以及这对我签订的寰球角色意味着什么进行了重要的思考。在这种背景下,因为咱们预计很快就会达成一项决定,我怀着惨重的情绪想让大家晓得,我已决定来到这家公司。” 一位TikTok的发言人示意,Kevin Mayar 的决定是能够了解的,“咱们意识到,过来几个月的政治动静显著扭转了 Kevin Mayar 将来的职责范畴,咱们齐全尊重他的决定。咱们感激他在公司的工夫,并祝他一切顺利。” 美国指控 TikTok 盗取用户数据在本月初特朗普签订的行政命令中,他认为 TikTok 和微信都对美国用户的隐衷形成了威逼,盗取了美国用户的隐衷,并传回了中国。 特朗普说:“此时此刻,必须采取行动来应答这些挪动应用程序带来的威逼,特地是 TikTok。”“TikTok 主动从用户那里取得大量信息,包含互联网和其余网络流动信息,如地位数据、浏览和搜寻历史。这种数据收集可能会让中国政府获取美国人的集体专有信息,用于讹诈和间谍活动。” ...

August 27, 2020 · 1 min · jiezi

关于字节跳动:字节跳动正式起诉特朗普政府

SegmentFault 思否音讯,面对美国特朗普政府违反全球化的关闭政策,字节跳动最终抉择用法律手段来保护公司的权利。今日字节跳动正式发表将向美国政府提起诉讼。 相干内容:《字节跳动张一鸣就TikTok「被迫发售」事件公布外部信》 以下为原文内容:

August 23, 2020 · 1 min · jiezi

关于字节跳动:字节面前准备20200823面试前

1.TCP,UDP介绍差异,UDP保障可靠性 2.红黑树,AVL比照,引申B,B+树 3.网卡收到一条数据到过程解决数据,这之间经验了什么(中断的上半部下半部,网络层协定拆包) 4.大数据量(内存够用)下,快排与堆排序的比照(考查缓存命中率的比照) 5.缓存相干内容,LRU算法思维,手撕LRU的实现 6.实习我的项目介绍,问的很深 引申到一致性hash 7.缓存生效,替换原理 8.32位零碎运行大于4G的程序,如何寻址(考查虚拟内存,虚拟地址空间) 9.手撕齐全二叉树寻找最初一行的最初一个节点(没做过,过后想到的是利用个性算出最初节点的层序序号,而后除二看奇偶,找出终点到最初节点的门路) 10.手撕层序遍历二叉树 11.手撕给二叉树先序,中序序列,求后序序列 12.http https 13.http各种状态码 14.一次http流程 15.SSL加密 16.session cookie 17.数据库索引 innodb 18.b树 b+树 19.聚簇非聚簇 20.写sql语句 课程A分数大于平均分的总人数 21.代码:二维数组找单词 22.http和https有什么区别? https是ssl(安全套接层+http,加密版本) 23.数字证书有哪些? 讲了一下公钥体系。 24.http有哪些版本,区别? 0.9/1.0/1.1/2.0,我说成1.2而且只晓得长久连贯。 0.9是原始版本,只有get操作。 1.0新增了post,head操作,减少了状态码等。个别是一个申请一个连贯。有keepalive。 1.1减少了长久连贯,全二进制,管道,put,delete,options等申请形式。 2.0减少了双工,数据流等。 25.TCP和IP属于什么层?TCP挥手握手? 26.TCP牢靠传输的机制?窗口的含意是什么? 答复窗口协定,可重传,连贯建设。 27.介绍一下linux内存模型 如同分为内核虚构储存器,用户栈,文件映射区,运行时堆,读写段,只读段,保留区 28.介绍一下页表 29.单cpu单核处理器,多线程须要加锁吗? 要 30.一些数据在磁盘上,要发送到网络上,要通过哪些过程? NIO零拷贝 31.介绍一下BIO, NIO, AIO 阻塞, 阻塞同步, 非阻塞同步, 异步 32.中间件那些有理解吗?33.sql数据库引擎有理解吗? 34.数据库锁有理解吗? 35.字节对齐如何实现有什么作用,举个例子。 36.介绍一下泛型擦除 37.map原理,1.8当前呢? 38.介绍一下可重入锁原理 39.讲一下虚拟机如何加载. class文件,双亲委派 40.红黑树规定,插入删除如何操作? 41.广度优先搜寻用到什么数据结构? 42.深度优先遍历,思路比拟容易想到,要害要纯熟

August 23, 2020 · 1 min · jiezi

关于字节跳动:特朗普威胁-9-月-15-日关闭-TikTok除非其完全脱离字节跳动

技术编辑:芒果果丨发自 思否编辑部SegmentFault 思否报道丨公众号:SegmentFault 微软昨日公开抵赖正在探讨收买 TikTok 后,特朗普再次发宣称,“如果 TikTok 的中国母公司字节跳动不发售它,并向美国财政部提供大量资金,TikTok 将在 9 月 15 日在美国开张。” 特朗普明天在白宫发表了这一音讯,并具体阐明了他认为微软或另一家“大型”、“平安”和“十分美国”的公司更应该收买 TikTok。他认为,应该从字节跳动购买整个 TikTok,而不是仅在美国、加拿大、澳大利亚和新西兰的业务。他说:“我认为购买 30% 的股份很简单。” 特朗普还明确示意,与 TikTok 的任何交易都必须将“很大一部分”资金转入美国财政部库房。他没有解释这是什么意思,但他对美国政府与 TikTok 的关系用房东与房客的关系做了比拟。他说:“当初,除非咱们将权力授予他们,否则他们不能进入咱们国家。这有点像房东和租户的关系,没有租约房客将赤贫如洗。” 美国政府信心让 TikTok 脱离中国母公司字节跳动特朗普威逼说,如果微软或其余公司不能收买 TikTok 并实现适当交易,以便美国财政部取得大量资金,TikTok 将在 9 月 15 日敞开。 在此之前,有报道称微软曾经就收买 TikTok 与其进行了为期 45 天的会谈。昨天,微软也在其官网申明中证实了这一点,微软还在申明中提到,将为美国(包含美国财政部)提供适当经济利益。 特朗普对 TikTok 的禁令曾经继续了数周,但始终未走漏太多细节。他下令禁止 TikTok 的理由是潜在的国家平安威逼,并心愿因新冠病毒惩办中国。 如果不卖掉 TikTok,CFIUS(美国政府外国投资委员会)可能会惩办字节跳动,但特朗普的“禁令”与 CFIUS 的“惩办”相比,有更大的威胁性。美国政府实际上没有禁止用户拜访某个应用程序的先例,尤其是指控与该禁令没有任何理论相干违法行为的应用程序。然而,TikTok 剥离出字节跳动,尤其是由微软接手的可能性仿佛越来越大。 如果能胜利收买领有数亿美国用户的 TikTok,将为微软提供难得的机会,使其成为与 Facebook 和 Snap 等社交媒体巨头的次要竞争对手,况且微软还领有业余的社交媒体网络 LinkedIn。 9 月 15 日是美国政府外国投资委员会给字节跳动的最初期限。随着中美两国在贸易、科技、5G,以及新冠病毒传播等方面的矛盾降级,无论是被美国列入实体清单的华为还是被迫发售给微软的 TikTok 都已成为这两个寰球最大经济体之间争端的要害。 目前尚不分明微软将为这笔交易领取多少费用,但据理解,字节跳动对 TikTok 的估值预期超过了 500 亿美元。微软可能会邀请其余美国投资者收买 TikTok 的多数股权。 ...

August 4, 2020 · 1 min · jiezi

关于字节跳动:字节跳动张一鸣就TikTok被迫出售事件发布内部信

微软收买 TikTok 的事又反转了!微软称正在和特朗普就此事进行探讨。 上个月初,特朗普曾公开示意将在美国国内禁止中国企业字节跳动在美国经营的 TikTok,并称此举是为了避免中国企业的间谍活动。 只管字节跳动屡次否定了这一指控,但 TikTok 仍在承受考察。消息人士走漏,在特朗普发表此舆论之前,微软就与字节跳动就收买 TikTok 一事进行过会谈,收买事宜近日就将落下帷幕。但特朗普却在临门一脚时紧急叫停,不容许微软收买 TikTok。 对此,TikTok 美国区总经理瓦妮莎·佩帕斯专门公布的短视频示意,公司正致力为用户提供平安的利用,她说,“咱们不会来到,TikTok 在美国有久远的倒退打算。” 在微软是否能收买 TikTok 一事闹的满城风雨时,微软今日公开并正式抵赖了正在就收买 TikTok 短视频平台的美国业务进行探讨。 《又反转!微软正与特朗普沟通,持续探讨收买 TikTok 事宜》 为此字节跳动创始人公布外部信,以回应外界种种猜想,并稳固军心。 以下为外部信全文: 过来的几个月中,公司遇到了很多挑战。大家这几天应该也看到不少对于公司的传言和猜想。在以后的状况下,TikTok美国业务面临被CFIUS强制要求发售的可能性,或因行政命令让TikTok产品在美国被封禁。 以后的地缘政治和舆论环境越来越简单,咱们在一些市场面对的内部压力较大,过来几周参加应答的团队始终昼夜轮转,加班工作,争取最好的后果。尽管很多细节还不能在大范畴内说,但我还是想尽可能的跟大家做一些同步,也说一下我的想法。 近一年来,咱们始终在踊跃配合CFIUS对咱们2017年底收买musical.ly的我的项目进行的考察。只管咱们一再强调本人是一家私营企业,并且咱们违心采取更多的技术计划来打消顾虑,但CFIUS还是认定字节跳动必须发售TikTok美国业务。咱们不认同这个决定,因为始终以来咱们都保持确保用户数据安全、平台中立性和透明度。思考到以后的大环境,咱们也必须面对CFIUS的决定和美国总统的行政命令,同时不放弃摸索任何可能性。咱们尝试与一家科技公司就单干计划做初步探讨,造成计划以确保TikTok能持续服务美国用户。 在寻找解决方案的时候,咱们思考了三个方面: 1、用户。TikTok不仅是字节跳动的产品,正如Vanessa昨天视频里说的,它更应该是寰球用户的社区,所以咱们不会把它当作一个没有生命的资产。在这个过程中,咱们会竭尽致力来爱护TikTok的独特存在,并且心愿TikTok的用户体验可能不受影响。 2、团队。TikTok吸引了很多人退出,凝聚了很多共事的致力,对大家来说它是工作也是事业。尤其是对于在解决危机的当地共事来说,他们的压力更大。我时常想如果他们是在一个外乡企业工作,这样懊恼应该会少很多。但换个角度想,独特应答挑战也让不同地区的共事更加互相理解了。咱们会把团队的利益和倒退作为重要思考。 3、公司。咱们心愿为inspire creativity & enrich life 的愿景持续致力,像产品演变一样不断改进,成为一家优良的全球化企业。 咱们还没有齐全决定最初的解决方案,外界对TikTok的关注和传言,可能还会继续一段时间。我心愿大家能在清静和挑战中,仍旧放弃好的士气,看长期有定力,信赖公司能在简单场面下做出好的判断,给员工足够的反对。 而咱们通过一直的翻新和动摇的执行,为用户提供最好的服务,本身放弃高速成长,是应答危机最松软的后盾。 TikTok曾经成为了寰球文化的一部分,它是用户的窗户,画布和桥梁。有数亿用户聚在咱们打造的平台上,进行创作,彼此连贯,给用户带来许多的欢畅和信息。也有那么多人在咱们平台上创作、经营、实现他们的价值。想想这些,我对TikTok的将来充满信心。我也置信咱们能博得更多的信赖。 和以往一样,在遇到困难的时候,咱们的团队尤其团结,大家也很乐观和有韧性。感激大家的投入和付出,能和这样优良的团队一起做有挑战的事件,也是我本人重要的能源。最初想再说一下,字节跳动要做一个值得信赖的寰球公司,始终没有变动,在一个巨变的时代,也更值得为之致力。这自身也是一段有挑战有意义的旅程。

August 3, 2020 · 1 min · jiezi

关于字节跳动:又反转微软正与特朗普沟通继续讨论收购-TikTok-事宜

技术编辑:芒果果丨发自 思否编辑部SegmentFault 思否报道丨公众号:SegmentFault 微软收买 TikTok 的事又反转了!微软称正在和特朗普就此事进行探讨。 上个月初,特朗普曾公开示意将在美国国内禁止中国企业字节跳动在美国经营的 TikTok,并称此举是为了避免中国企业的间谍活动。 只管字节跳动屡次否定了这一指控,但 TikTok 仍在承受考察。消息人士走漏,在特朗普发表此舆论之前,微软就与字节跳动就收买 TikTok 一事进行过会谈,收买事宜近日就将落下帷幕。但特朗普却在临门一脚时紧急叫停,不容许微软收买 TikTok。 对此,TikTok 美国区总经理瓦妮莎·佩帕斯专门公布的短视频示意,公司正致力为用户提供平安的利用,她说,“咱们不会来到,TikTok 在美国有久远的倒退打算。” 在微软是否能收买 TikTok 一事闹的满城风雨时,微软今日公开并正式抵赖了正在就收买 TikTok 短视频平台的美国业务进行探讨。 微软 CEO 与特朗普会见,探讨收买 TikTok微软一位官员在一篇博客中示意,微软首席执行官萨蒂亚·纳德拉曾经和美国总统特朗普进行了会见,单方将持续进行探讨,以探讨微软是否能够收买 TikTok 一事。博客文章称,“微软’致力于’收买 TikTok,并承受全面审查,为美国(包含美国财政部)提供适当的经济利益。”该官员示意,微软正在探讨在美国、加拿大、澳大利亚和新西兰领有和经营 TikTok 的问题。 微软方面打算在数周内持续与 TikTok 的母公司字节跳动进行协商,并将在 2020 年 9 月 15 日之前实现探讨。在此期间,微软打算持续与特朗普在内的政府首脑进行切磋。 微软承诺将所有用户数据转移到美国对于 TikTok 有可能收集海内情报的问题,微软称,“将确保减少世界一流的安全性、隐衷和数字平安爱护。”微软还承诺将美国私人用户的所有数据都转移到美国,并保留在美国,如果以后又任何数据在美国境外存储或备份,微软将确保将其从美国以外的服务器中删除。 TikTok 方面称,其数据中心齐全位于中国境外,数据均不受中国法律管辖。在中国境内,字节跳动经营着一个独自的短视频平台抖音,以服务中国市场。 字节跳动方面称,TikTok 目前在美国经营着本人的超大规模数据中心,并在美国存储所有美国用户数据,在新加坡进行备份。 目前,微软官网称收买事宜还在初步探讨阶段,并指出,除非有明确的后果,否则微软不打算对此进行任何新的阐明。

August 3, 2020 · 1 min · jiezi

关于字节跳动:美国总统特朗普将封杀海外版抖音张一鸣表示静观其变

技术编辑:宗恩丨发自 思否编辑部 SegmentFault 思否报道丨公众号:SegmentFault 来自外媒音讯,本月美国总统特朗普示意正在思考在美国禁止抖音的姊妹利用 TikTok,其参谋彼得·纳瓦罗示意,禁止的起因是该应用程序可能波及到对美「信息战」。这项决定大概率会在11月的选举之前施行。如果禁令正式施行苹果和Google 等美国公司将不得不把TikTok从利用商店中删除。 新美国智库的网络安全政策和中国数字经济研究员萨姆·萨克斯对此事评估:「美国正在走技术民族主义的路线」。 音讯还称 Tiktok 掌控者张一鸣为了维持 TikTok 在美国的业务,延聘了一位美国首席执行官,并向监管机构保障不会在国外共享用户数据。他还试图增强在华盛顿特区的游说,内容包含将在美国发明10,000个就业机会,并设立了2亿美元的基金来反对美国明星。 不过这些口头当初看来没有起到任何成果,为了解决美国对 TikTok 平安威逼的担心。包含红杉资本沈南鹏和一些不愿走漏姓名大佬们给字节跳动和张一鸣提出了几种计划。 将 TikTok 卖给美国投资者发售其TikTok的少数股权。这个想法是TikTok能够成为一家美国公司,而字节跳动保留了多数股份。一位参加会谈的人士说,这种状况曾经探讨了数月,进行了屡次迭代,包含一群风险投资公司或策略合作伙伴购买了更多股权。 发售 TikTok 的美国业务知情人士说,正在探讨的更为温和的状况是将TikTok在美国的业务离开,而字节跳动则在世界其余地区领有全副所有权。这将使这笔交易对风险投资公司来说更容易累赘,并使张一鸣保留对大多数业务的控制权。它还可能使美国监管机构安心,因为用户数据将受到本地公司的管制。 美国TikTok的毛病是,该口头将失去一家跨国公司的协同效应。涌向该服务的广告商将不得不解决两个不同的实体。应用TikTok软件的工程师可能还难以应答细分为不同天文区域的用户群。如果美国企业持续应用北京总部的算法和知识产权,美国政客可能仍会对安全性感到担心。 使字节跳动成为美国公司最不可能的抉择是让张一鸣搬到美国并从那里运行字节跳动。针对非凡工作的美国签证打算会笼罩创始人,这意味着他能够在不到一年的工夫内成为美国公民。知情人士还说,具体情况能够参考默多克或伊隆·马斯克。 外界音讯风闻张一鸣目前示意回绝这些倡议,因为 TikTok 正在与 Facebook  和 Google 一起倒退成为少数几个次要的在线广告平台。并且字节跳动曾经是世界上最有价值的守业公司。其上次官网融资时的估值为 750 亿美元,往年早些时候在私人股票交易中飙升至 1400 亿美元。而Tiktok 是字节跳动最为重要的业务之一。 最初的后果张一鸣可能会抉择不采取任何口头,并在特朗普做出决定后处理特朗普的决定 。TikTok的潜在买家示意:「因为工夫紧迫,任何交易都将面临微小危险。不晓得美国政府是否会随后放弃禁令。但从当初的状况看基本上不可能及时实现交易。」 面对以上种种猜想,TikTok 在一份申明中说:「咱们不对流言或猜想发表评论。咱们对TikTok 的长期胜利充满信心,并将在咱们有事件要发表的时候颁布咱们的打算。」

July 24, 2020 · 1 min · jiezi

TikTok-复制用户剪贴板信息字节跳动识别恶意评论功能误触已删除该功能

技术编辑:芒果果丨发自 思否编辑部SegmentFault 思否报道丨公众号:SegmentFault 近日,有外媒报道称安全专家发现,抖音海外版(TikTok)秘密收集其他 App 复制在剪贴板的内容。不少海外用户发现,他们手机中的 TikTok 每隔几秒就会访问一次剪贴板,并复制其中的内容。 对此,TikTok 所属公司字节跳动相关负责人表示,这种情况是被识别重复性或恶意评论功能所触发,目前已向 App Store 提交了应用程序的更新版本,已删除了该功能。 iOS 14 发现 TikTok 复制剪贴板信息6 月 23 日,苹果在 WWDC 2020 上发布了 iOS 14,新的操作系统发布后,只要应用程序读取了复制到剪贴板最新内容,就会向用户发出警告。 比如用户在 Instagram 复制一段文字到剪贴板后,再次打开 TikTok 时候,手机系统就会推送提醒“TikTok  pasted from Instagram”。 如果用户在工作时 TikTok 处于活跃状态,则该应用程序基本可以读取其他设备上复制的所有内容,包括密码、工作文档、敏感电子邮件、财务信息等。也就是说,用户在 Mac 或 iPad 上复制的所有内容都可以由 iPhone 读取,反之亦然。 对于会复制剪贴板内容的问题,字节跳动方面回应道:“剪贴板访问问题是由于第三方 SDK 出现的,在我们的示例中是较旧版本的 Google Ads SDK,因此我们无法通过此访问信息。我们正在更新中,以便第三方SDK将不再具有访问权限。” Android 用户同样需要加强隐私保护苹果新发布的 iOS 14 对安全和隐私功能进行了更改,很多应用程序涉及用户隐私的功能都必须做出更改。 字节跳动相关负责人称,公司致力于保护用户隐私,并透明地公开应用程序工作方式,同时期待外部专家前来参观。 安全研究人员称,苹果的 iOS 14 已经具有应对风险的机制,但并不能有效地保护用户隐私,而且 Android 用户也需要应用程序有更多的限制和透明度。

July 1, 2020 · 1 min · jiezi

字节跳动加码2B业务推出企业技术服务平台火山引擎

技术编辑:徐九丨发自 SegmentFault 思否 6 月 22 日,字节跳动企业技术服务平台“火山引擎”官网上线,字节跳动在企业服务领域的布局开始慢慢地揭开其神秘的面纱。 据介绍,“火山引擎”是字节跳动旗下企业级智能技术服务平台,依托字节跳动的大数据、人工智能等技术能力,以及增长理念与方法论,为客户提供技术产品与解决方案。 经历过去二十年的发展,互联网行业,尤其是互联网头部企业,已经沉淀了成熟稳定的技术产品与解决方案。对于期望进行数字化转型的企业来说,互联网企业的成熟技术无疑是最好的助推器。 字节跳动火山引擎负责人肖默表示:字节跳动作为一家全球化互联网公司,在过去 8 年中迅速成长,在这一过程中,不断积累的技术能力、增长理念和运营工具起着至关重要的作用。推出火山引擎,是希望将服务字节跳动从 0 到 1、从 1 到 N 的能力与工具产品化、服务化,并开放给更多行业与合作伙伴,帮助大家的业务快速发展、提升竞争力。 “现阶段我们希望为中国企业客户提供两类有价值的服务”,字节跳动火山引擎负责人肖默称,“数据智能与体验智能”。 在数据经济时代,企业需要深入挖掘数据价值、用数据驱动业务快速发展,这就是数据智能。在数据智能方面,火山引擎提供了数据发现者、数据优化师、DataWind 等一系列智能工具,帮助企业客户完成从数据的发现、整合、分析、优化到落地验证等一系列工作,形成精准的增长闭环,推动业务实现爆发式增长。 在体验智能上,肖默表示,火山引擎希望帮助企业用更个性化、更创新的方式提升其用户体验,包括智能推荐技术、视觉交互技术的应用等。 火山引擎旗下的智能推荐,是在今日头条、抖音等产品上历经验证的技术能力。在广告行业的一些特定场景下,智能推荐能够助力企业客户实现点击率 150% 的提升,有些合作场景甚至取得了广告营收 180% 的增长。而在电商行业,智能推荐在其中一个场景为客户带来了140%的GMV增长,这都是企业发展中的核心业务指标。 海尔集团旗下的 Leader 冰箱是火山引擎视觉智能产品的首批客户之一,最新款的 Leader 互联网智能大屏冰箱上,应用了火山引擎的 CVSDK,为智能冰箱用户提供拍照自动美颜,以及多款道具贴纸和智能滤镜,帮助用户提升在厨房场景中的潮趣生活体验。 为了帮助不同行业的客户实现体验智能,火山引擎面向不同领域推出了一体化解决方案,包括短视频、视频互动、大屏互动、教学互动以及图片加速等。例如,传统电视在现代家庭中成为摆设,使用率极低,火山引擎的大屏互动解决方案,能够帮助厂商利用计算机视觉技术升级智能电视体验,在生活场景中,为家庭带来大屏互动娱乐的新体验。 字节跳动火山引擎负责人肖默称,火山引擎未来会开放更丰富的产品与成熟的技术服务,将小到初创团体,大到独角兽企业的增长经验和方法论进行提炼,内化到旗下产品之中,帮助企业客户在数字化转型过程中,实现组织智能化升级,推动业务爆发式增长,全面提升企业竞争力。

June 22, 2020 · 1 min · jiezi