关于人工智能:整数有约-深言科技一款应用拯救词不达意理工科也能玩转浪漫

9次阅读

共计 3065 个字符,预计需要花费 8 分钟才能阅读完成。

2019 年,清华大学自然语言解决实验室(THUNLP)研制出一款名为 WantWords 的反向词典,可能依据语义形容查找词语,可用于写作辅助等多个场景;2021 年 11 月,这款利用忽然在微博爆红,成千上万用户涌入 WantWords,屡次挤爆了服务器;2022 年 5 月,基于语义的名言名句检索系统 WantQuotes 上线,短短两三周的工夫,已取得近 30 万用户。截至目前,WantWords 和 WantQuotes 已有近 200 万用户,每天都有几万人应用它们解决词句查找的困扰。

WantWords 和 WantQuotes 手机端界面

当初研发这款利用的几位同学目前已毕业,并和他们的导师孙茂松传授一起开办了守业公司深言科技(DeepLang AI),致力于应用世界领先的人工智能和自然语言解决技术,为数亿脑力劳动者和数千万组织的信息处理全流程赋能。公司成立之初即取得一线 VC 千万元级投资。WantWords 和 WantQuotes 做对了什么?咱们采访了深言科技创始人 &CEO、清华大学计算机系博士岂凡超,一起领会深言的魅力所在。

 深言科技创始人 &CEO 岂凡超

兼具实用与趣味属性的智能工具

在微信端搜寻“深言科技服务号”,关上后就会看到 WantWords 和 WantQuotes。在 WantWords 中,只有用户输出想表白的意思,就会有无数个词语跳进去,帮助用户找到最想要的那个词。比方输出“这风光好美”,除了有意思相近的二字词,还有上百个四字成语,例如“江山如画、山清水秀、风月无边、水秀山明”等,还有不常看到的“风光旖旎、云舒霞卷、千岩竞秀”等词,也都能够用来形容美景。

而 WantQuotes 则更让人惊艳,别名叫做据意查句,顾名思义,输出想表白的意思,就会有大量名言名句来丰盛你的语料库,包含但不限于古今中外的名言名句、古诗文、谚语、俗语、歇后语,甚至还能找到动漫、影视剧、综艺里的台词,通过设定分类,根本都能找到。

例如仍然输出“风光好美”,WantQuotes 进去的便是:

 苏轼的“水光潋滟晴方好,山色空蒙雨亦奇”;席慕蓉的“说天气真好风又轻柔,还能在夕阳下困倦的微笑”;林清玄的“凌晨滚着金边的红云,午后飘过慵懒的白云,傍晚焚烧炽烈的朝霞,还有有时散得洁净的天空”;还有动漫《言叶之庭》里的台词:总感觉她的美不太像人类,更像远处的云,巍峨的山峰,或是雪山里的兔子和鹿之类的,宛如大自然之美的一部分。

深言科技 CEO 岂凡超示意:“WantWords 反向词典和 WantQuotes 据意查句的实用性在于,能够帮忙不同使用者写作文、论文、演讲稿、政府公文、营销文案,甚至还能够用来做朋友圈素材,只有是用户在文字创作方面的需要,咱们都能满足。”深言科技也失去了很多用户的高度评价:

WantWords 将成为公众身边的活字典!感激你们发明了这个援救语弱的神仙网站!这个网站性能成果真的惊艳,使我的翻译工作效率翻了三倍!心愿你们再接再厉,我会把你们的网站举荐给更多的人。

 搜寻深言科技服务号试用 WantWords 和 WantQuotes

自然语言解决技术国内顶尖

谈及深言科技是否有不可代替的劣势,岂凡超从两个方面开展答复。首先是数据方面,深言科技团队成员此前已耗时两年多工夫,通过上百个不同渠道获取零碎所须要的文本数据,这其中的工作量粗疏而繁琐,须要研发团队消耗大量的工夫和精力。例如,WantQuotes 的数据集蕴含近百万句不同类型的名言名句。

另一个劣势就是深言的自然语言解决技术国内顶尖,其产品具备极高的壁垒和门槛。深言科技 CEO 岂凡超解释:WantWords 和 WantQuotes 的背地是国内最当先的语义了解和匹配模型。而且还将义原这样的语言学常识引入神经网络模型中,较好地解决了歧义、语义稠密等问题。

深言科技心愿通过文本摘要、语义检索、信息抽取等技术进步信息获取的效率,同时通过可控文本生成、素材主动举荐、文本校对和格调查看,实现用户文本内容创作的提质增效。

 深言科技 LOGO

守业之路谋求极致

深言科技的 CEO 岂凡超在本科期间就萌发了守业的想法,读博期间,岂凡超目击并亲身经历了近年来自然语言解决技术的革命性倒退,其自己也在人工智能和自然语言解决畛域的国内刊物发表论文近 30 篇,申请专利十余项。而其博士生导师孙茂松传授,始终以来都有将实验室技术进行产业落地的考量,因此与岂凡超一拍即合,决定成立公司,立志将实验室多年积攒的国内顶尖自然语言解决技术落到实地,转化成生产力,为数亿脑力劳动者和数千万组织的信息处理全流程赋能。

目前,深言科技团队的核心成员次要由清华大学的博士、硕士组成,并由欧洲科学院院士孙茂松传授领衔负责首席科学家。往年,作为清华大学 2022 博士应届毕业生,岂凡超将深言科技的倒退正式提上日程。面对不同角色身份的转换,岂凡超示意:求学和守业最大的不同在于,守业不是一场有正确答案、有满分下限的考试,不是做到 90 分就能够居安思危,而是要做到比所有人都强才有价值。

在守业方面,岂凡超认为:认知才是最大的壁垒,而认知来源于粗浅的、长期的、甚至是苦楚的思考。每当想到市场上有有数更怠惰、聪慧、有教训、有资源的人都在专一地做一件事,在快马加鞭地竞争的时候,他就能感触到微小的压力,因而在这件事上,必须要谋求极致。

世上没有随随便便的胜利,岂凡超始终置信,在守业的过程中没有什么是“理所应当”的,外界不会因你出身名校,领有技术加成而认可你,能感动他人的,就是粗浅的行业认知、极致的产品与服务和成熟的商业模式。

将来,深言科技将持续欠缺产品,开发出专属 APP,帮忙用户从浏览到写作再到检索,晋升整个环节的文本信息处理效率,将最新的技术转化为生产力。

此外,深言科技也在大规模招聘中,凋谢了算法工程师、前后端开发、UI/UX、产品等岗位,欢送有趣味的敌人微信分割岂凡超(微信号:fanchao_qi)。

 深言科技公司实景

整数智能好奇心专栏

因为深言科技对构建数据库有较高需要,以及思考到整数智能在智能标注畛域的权威性,深言科技 CEO 岂凡超抉择和整数智能发展单干,岂凡超示意:“整数智能在标注品质、响应速度、性价比等综合评估方面都有较高水准,整个单干流程十分顺利、高效。”

除了便当的数据标注平台,整数智能还自研 AI 辅助工具以进步数据生产效率,包含光流跟踪算法、OCR 预标注零碎、ASR 辅助音频采集等,能节俭大量的人力标注工夫与复核老本。

另外,整数智能标注平台能够通过多终端无缝连贯,全场景满足用户需要,可对品质进行灵便抽查、动静分阶段验收,帮忙 AI 企业随时把控数据标注品质及进度,保障信息的同步性,让数据真正牢靠可控。不仅如此,为进步数据集的交付品质,整数智能对数据生产全过程实现了全方位的品质把控。在人员治理方面,波及到数据生命周期的各级人员都参加到品质治理中,确保经手数据的每一方都能严控品质。

正因为继续的技术能力和行业积淀,让整数智能成为了人工智能产业联盟的产业数据组专家,独特参加制订 AI 行业的数据规范和白皮书工作,失去中国电子技术标准化研究院和信通院的邀请参编 SC42《可信赖人工智能标准化白皮书》与《人工智能研发经营一体化(Model/MLOps)能力成熟度模型》规范体系。参加制订包含过程治理、模型治理、平安与风险管理、组织构造、零碎与工具等 5 个能力规范,致力于帮忙企业进步 AI 研发经营治理能力,晋升 AI 模型治理能力,为 AI 大规模利用提供无效门路。参加制订的 TC260《AI 数据采集及标注平安标准》,聚焦 AI 数据采集及标注过程及过程中可能呈现的安全隐患,提炼、梳理相干平安技术。

正文完
 0