关于算法:AI-收藏夹-Vol001当你的语音助手不再温顺

人工智能是一门交融了计算机科学、图形学、生物学、语言学等学科的前沿科学。随着电子硬件的倒退和算力的晋升,人工智能的技术实践逐步走向落地,各种利用和构想层出不穷,丰盛了其外延和内涵。

「AI 收藏夹」将会与大家分享一些 AI 畛域实用和乏味的文章和工具,与大家一起见证技术的翻新与改革。

文章

0 1

用卷积神经网络(CNNs)鉴定油画

2017 年 11 月 15 日,一幅耶稣的肖像在纽约以 4.503 亿美元的价格成交,这是迄今为止最低廉的易手画作。然而,很多专家对这幅画的真伪提出质疑,指出画作通过修复,或非自己所做。

确定一件艺术品是否是真迹,须要对艺术家的格调和技巧进行精微的判断,这项工作很适宜交给卷积神经网络(CNNs)。上 图就是将神经网络应用于伦勃朗的画中。寒色局部示意,机器学习画师作品后判断该局部画作更有可能是真迹[1]。 

在医学方面,微小的组织学样本全幻灯片图像可能有数十亿像素大小,其中的细节信息同样十分丰盛。科学家们正在尝试应用卷积神经网络自动化剖析病理图像,捕捉肿瘤细胞的表征。

0 2

在将来

还会有「婚礼摄像师」这个职业吗?

这篇文章[2]提出了一个构想:咱们能够用 AI 主动解决视频剪辑。

让咱们设想一下这个场景:婚礼上,亲朋好友们用手机录下现场的精彩霎时,他们在同一个 App 里进行实时合作,AI 会主动依据光线、机位、声音成果检测每一段视频的品质,并主动剪辑其中精彩的段落。当新人接吻时,AI 还会辨认到须要特写的场景,给手机一个反馈,触发手机拉近特写。这种多机位拍摄、多人合作的摄影模式,让摄影成为一种社交体验。你会期待这种「摄影社交」吗?

0 3

李逵变李鬼?

AI 扭转视频制作范式

设想一下,你输出几行文字,一个明星就会在几秒钟内说出这些话。

计算机图形学家 Maneesh Agrawala 创立了一个视频编辑软件,只有有短缺的原始视频,他就能让任何一个人说出他们没有说过的话。这些视频十分真切,被称为「深度伪造」(Deepfake)。有了这项技术,电视和电影能够防止低廉的重拍,声带受损的人能够用这项技术复原他们天然的声音[3]……不过,对于「深度伪造」的伦理边界在哪里?这也是值得咱们思考的问题。

0 4

用 AI 预测事变热点

通过剖析过来四年的路况数据,AI 剖析并预测出多个事变高风险区域(如右侧中部的圆点所示),而实际上这些中央暂未呈现过事变。随后几年,这些中央真的出车祸了。

这篇论文名为《基于卫星图像和 GPS 轨迹的高分辨率交通事故危险地图推断》[4]。作者应用 AI 剖析大量的卫星地图、 GPS 轨迹、路线地图和历史事变,生成了一张高分辨率的事变危险地图。

0 5

Feminist 机器人挑战咱们的性别偏见

你有没有留神到,语音助手的声音默认都是女声?面对羞辱,语音助手能够出击和显得「不温柔」吗?

在这篇文章[5]中,作者做了一个儿童试验:女性语音助手将会出击那些含有性别歧视的语言。人机交互或者有可能纠正性别偏见、影响人的行为,而这个试验自身也正代表了一种立场。

工具

0 1

DeepFaceLive 实时换脸

🌟 性能: 

  • 对输出的摄像头视频流或本地视频文件进行实时换脸

👀 亮点:

  • 五官无违和感
  • 不同性别也能够替换
  • DeepFaceLab 中已有训练好的模型可应用

👉 地址:

https://github.com/iperov/Dee…

0 2

lxi.ai 让你的网页书签领有「神经网络」

🌟 性能:

  • 依据网页内容的不同,为书签页主动打上标签
  • 依据标签,生成「神经网络」,表明关联性

👀 亮点:

  • 通过 Chrome 插件收集和治理网页书签,不便
  • 重合度较高的书签将会主动关联,造成简单的网络

👉 地址: https://lxi.ai/

0 3

用 AI 让老照片焕发新生

🌟 性能:

  • 修复划痕
  • 色调加强
  • 面部加强

👀 亮点:

  • 敌对的图形用户界面

👉 地址: https://github.com/microsoft/…

参考资料:

[1] 卷积神经网络鉴定油画:https://spectrum.ieee.org/thi…

[2] AI 主动剪辑视频:https://spectrum.ieee.org/ai-…

[3] 「深度伪造」视频:https://hai.stanford.edu/news…

[4] AI 预测事变热点:https://openaccess.thecvf.com…\_Inferring\_High-Resolution\_Traffic\_Accident\_Risk\_Maps\_Based\_on\_Satellite\_Imagery\_ICCV\_2021_paper.pdf

[5] 语音机器人挑战性别偏见:https://spectrum.ieee.org/hum…


Zilliz 以从新定义数据迷信为愿景,致力于打造一家寰球当先的开源技术创新公司,并通过开源和云原生解决方案为企业解锁非结构化数据的暗藏价值。

Zilliz 构建了 Milvus 向量数据库,以放慢下一代数据平台的倒退。Milvus 数据库是 LF AI & Data 基金会的毕业我的项目,可能治理大量非结构化数据集,在新药发现、举荐零碎、聊天机器人等方面具备宽泛的利用。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理