共计 1313 个字符,预计需要花费 4 分钟才能阅读完成。
前沿 AI 技术体验:从文字间接产生图片, 后果真的震撼! 十分有意思!
背景
最近这段时间,大火的文本转图片的模型,不论是 Open AI 的 DALL·E 还是 Goggle 的 Imagen. 单从颁布的成果来看,能够说是非常惊艳,让我大受震撼。
https://mp.weixin.qq.com/s/1e…
想要理解其中原理和细节,短时间对我来说能够很艰难。
有没有什么方法能亲自体验一把这离奇技术呢?不知有多少敌人是和我一样的想法的。
好在有大佬曾经开发出了网站。
网站体验
https://www.craiyon.com/
该网站背地基于 DALL·E mini, 由 Hugging Face 公司的码农 2022 年 6 月公开。能够轻易玩,输出英文形容,约 1 分钟就能够产出图片。
初体验
例如输出:a bird in the blue sky 网站便可返回如下图片.
后果还不错!
试试中国新诗
坊间风闻,老外很难能了解中国新诗中意境的美,那我来试试看 DALL·E 能不能“了解”。
以:无际落木萧萧下,不尽长江滚滚来. 为例。拿新诗的前半句来试试。这里先将它翻译成上面的英文,输出到网址中:
The boundless forest sheds its leaves shower by shower in autumn
的确,局部图片的确有一种秋风萧瑟的苍凉的感觉
此外还多了几分阴森..
创意设计
既然,模型这么厉害,那么我让她为我的公众号设计一个 logo 看看:
同样,将 知行并重 翻译成英文:
输出:logo of Knowledge and action should go hand in hand.
失去了如下后果:
说实话,十分的 amazing!!!后果超出了我的预期的:
不知大家感觉哪张 更好?欢送评论区投票,得票最高的我将其设定为 微信公众号的 头像。
其余想法
目前,在官网上,生成的图片清晰度非常无限,前面将会借助开源的模型,在本地部署,生成高清的图片。到时我也会再出文章,给大家介绍具体方法,敬请期待。
ps:兴许当前文章的封面,就不必愁了,也不必思考版权问题。封面自在不可企及~
本篇文章的封面,就是通过 “cover: interesting and breaking news“生成的。
更多玩法
大家,能够去感触下国外敌人的玩法
https://baijiahao.baidu.com/s…。
总结
明天,通过体验了一把最新的深度学习技术,的确很有意思。上面谈谈几点我对这个技术的认识:
首先,有余方面:
- 网站生成的图片少数的时候并不会太完满,有时给出的后果甚至有些诡异
- 生成图片的清晰度很无限。
尽管作者倡议:在形容时,加上 “illustration”, “photorealistic”, “high definition” 这些关键词,但理论试验,并没有多少改善。
其次,价值方面:
- 在学术上 DALL·E 意义无疑是重大的。对于咱们普通人来说,DALL·E 给出的后果,时常能够给咱们带来惊喜。它能够宽阔咱们的思路,拓展咱们的想象力,尤其是对从事设计、创意的敌人而言。因而,在 DALL·E 的后果根底上进行二次创作兴许是个不错的抉择。
欢送在评论区写下你的认识,一起交换。
参考文章
https://zhuanlan.zhihu.com/p/…
本文由 mdnice 多平台公布