关于开源项目介绍:已开源-马赛克最强去除附微软最强转语音教程

5次阅读

共计 2721 个字符,预计需要花费 7 分钟才能阅读完成。

有人说,马赛克的创造,就是人类文明史上一次重大的“开倒车”。

也有人说,马赛克就是妨碍人类提高的绊脚石。

从性能上讲,马赛克是一种用来遮蔽原画面的伎俩,无利也有弊。

从技术上讲,马赛克的原理是将某一个像素的色彩涂抹到整个范畴而造成原画信息失落。

所以,这个过程是不可逆的。

在个人隐私极为容易泄露的互联网时代,每个人都可能应用马赛克来覆盖图片中的敏感信息。

例如,用马赛克覆盖的 ID 号,名称,地址能够无效地达到爱护信息安全的目标。

然而,以同样的形式,在电影和电视漫画中,每当有不适宜儿童观看的局面或血腥暴力时,最有可能随同着惨重的马赛克。

即便是庄重的图画,只有带上马赛克,绘画格调也会变得怪异。

只管长期以来,老司机的车门始终被实际到“我心中没有代码的天然高清”的最高程度。然而,观看大小的电影时,总像是从靴子上刮擦一样,就像是喉咙里的指节一样。

俗话说,XX 是第一项技术生产力。自从马赛克在人类世界中呈现以来,自然而然地有些人开始关注如何编码。

长期以来,宣称可能去除马赛克的软件层出不穷,但其中大多数是发售狗肉的歹意病毒软件。

然而,最近在 Github 上,另一个宣称可能擦除马赛克并从新显示原始图像的人工制品引起了国内外的热烈探讨。

这款工具名为 Depix,公布后的短短几天内,GitHub 上已标记了 10,000 多颗星,到目前为止,分支的累计数量已超过 1.3k。

使其转出圆圈的是以下渲染:

如图所示,第一行是一层微小的马赛克齐全像素化后的文本内容,没有原始痕迹。。

第二行是 AI 复原的内容。您能够看到内容已根本复原,并且准确性很高。

第三行是在第二行的根底上稍加推理就取得的原始明码。

是的,最难被还原、甚至实践上说根本无法还原的文字,也在重重厚码之后被 Depix 还原了!

这意味着,就算大家当前把姓名 / 身份证号 / 电话等集体敏感信息都打上了马赛克公布到网上,也有可能被他人扒得一尘不染。

那么,如何实现这种令人难以置信的 AI 缩小技术呢?

依据我的项目作者的说法,应用 Depix 将镶嵌文本还原为原始图像仅须要四个简略步骤:

从屏幕快照中抉择一个像素块作为抉择。

在具备雷同字体设置(包含文本大小,字体,色彩,hsl)的编辑器中,将 De Bruijn 序列粘贴到冀望的字符。

应用雷同的屏幕快照工具制作一系列屏幕截图,以创立像素化图像。

执行以下命令:

python depix.py -p[pixelated rectangle image] -s [search sequence image] -o output.png

咱们晓得编码是图像像素化解决的一种伎俩,即通过升高图像特定区域的色阶细节并毁坏色块来实现含糊图像成果。

线性盒滤波器是较常见的解决算法之一。

如下图所示,对表情符号图像进行编码后,实际上将其分为四个色彩块,每个色彩块均被该色彩块的平均值笼罩,最初造成像素化表达式。

因为原始信息失落,因而无奈间接反转滤波器。

Depix 的算法是应用线性框滤镜别离解决每个色彩块,并对搜寻图像中的每个块进行像素化以找到间接匹配项。

简而言之,Depix 的技术原理是将镶嵌区域的内容分为许多小块,而后应用该算法计算每个小块的内容的平均值并将其笼罩。

目前,Depix 这款工具还属于特定畛域的工具,只实用于应用线性方框滤波器创立的像素化图像,且反对的次要是英文字母、数字以及英文半角下的符号等。

通过测试,Depix 能够正确辨认大多数英文字母,数字和符号。

然而,在钻研过程中,开发人员发现某些间断的字符无奈正确辨认,因而应进行改良。

只管 Depix 算法的输入并不完满,但与其余以前的技术相比,它的体现还是不错的。

对于 Depix 的音讯在 Internet 上公布后立刻引起了热烈的探讨,许多网民对此示意了深切的关注。

开发人员强调,此 AI 我的项目的开发不是窃取信息,而是应用 ECB 和明文攻打来改善信息爱护技术。

他还在博客中倡议大家,基于平安思考,请不要应用马赛克,最佳做法是间接将须要遮挡的区域应用黑条或者白条笼罩,这样是无奈通过算法还原的。

当然,除了 Depix,还有许多尝试还原镶嵌内容的开源我的项目。

以前,扩大迷还向您介绍了一种称为 PULSE 的算法 - 它能够基于含糊的马赛克像素“绘制”新面孔,并且能够在几秒钟内变换图像。原始分辨率进步了 64 倍,任何熔渣图像品质都能够在几秒钟内变成高分辨率和真切的图像。

能够复原眉毛,睫毛,毛孔,皱纹和头发。

至于这类我的项目的受欢迎水平,互联网上存在很多狐疑。某些人不可避免地将这些 AI 技术用于不良或非法目标。

能够预感,缩小 AI 的镶嵌技术将变得越来越成熟,并且去马赛克的道德和法律方面将在将来变得越来越简单。

试过很多收费文字转语音的软件,但最初转进去的语音都很僵硬,无意间发现了 Microsoft Edge 的文字朗诵性能,转进去的语音成果十分不错,不愧是微软!花了一早晨推敲了一下如何可能将声音保留下来,顺便写了一份教程分享给大家,文章底部有试音,能够先试听再看教程。

One

首先用 MicrosoftEdge 找一个文字较多的网页,当然一般网页也是能够的,这里我就以人民网的一则新闻为例,找不到好网页的也能够用这个网页,链接放在这里了 http://society.people.com.cn/n1/2021/0304/c1008-32041948.html。

Two

而后点击鼠标右键抉择“查看”,或者间接摁“F12”也是一样的成果,左边会多进去网页代码的一栏,同时能够看到图中画圈的那里有一个“小箭头”。

Three

点击方才的“小箭头”后,会发现箭头指到网页的哪里,左边代码栏就会显示对应的代码,选中任意一段文字,在右侧代码区会显示文字局部的代码,在右侧代码区双击文字,将想要转成语音的文字粘贴过去,点击回车。

Four

点击回车后会发现左侧的文字也跟着扭转了。

Five

在开始录制之前,须要对系统上的“声音”进行设置,关上“控制面板”,抉择“硬件和声音”,再抉择“治理音频设备”,再抉择“录制”,将“麦克风”右键禁用,立体声混音右键“启用”,这一步能够去除录制中的杂音,记得录制实现之后再复原成原来的设置!

Six

关上电脑自带的录音机,点击屏幕地方大大的“录制”图标,再切回到 Microsoft Edge 软件中。

Seven

选中方才批改过的内容,右键点击“朗诵所选内容”,静静期待录制实现即可,点击右上方的“语音选项”,能够抉择语种,包含简体中文的男声、女声,还有粤语,以及一些其余国家的语言选项。

Eight

录制实现后,点击进行即可,文件为 m4a 文件,能够应用格局工厂转成更加通用的 mp3 文件,同时录制完结后右下角有一个剪裁按钮能够进行简略剪裁。

马赛克获取形式:关注公号“网络杀手”,后盾回复关键词“马赛克”即可获取

正文完
 0