来自:开源最火线(ID:OpenSourceTop)\
链接:https://www.linkedin.com/puls...

如果你认为将明码或其余私密文本数据像素化就能爱护它们不被窥见,那你真是太天真了,你的信息并没有你设想的那么平安。像素化(也称为马赛克)是一种罕用的伎俩,能够大幅升高图像敏感区域的分辨率来暗藏信息。

近年来马赛克这项技术被宽泛应用,但它的好日子曾经不多了,最近一个新型的人工智能工具“Depix”横空出世,短短工夫就在Github上标星15.5K,Github地址:

https://github.com/beurtschip...

Depix的开发人员Sipke Mellema是一个信息安全参谋,他示意:“我见过一些公司把外部文件中的明码像素化,没有工具能够从这些图像中复原明码,于是我创立了一个。”该工具实用于应用线性方框滤波器(linear box filter)创立的像素化图像。

Depix的应用

要筹备一个用于Depix解决的像素化文本序列,首先以单个矩形格局从截图图像中剪切相干的像素化块,而后将带有预期字符的De Bruijn序列粘贴到具备雷同字体(文本大小、字体、色彩等)编辑器中。接下来,对序列进行截图,最好应用之前的序列截图,尽可能应用和像素化图像雷同的截图工具。

最初,简略地运行 python depix.py -p [pixelated rectangle image] -s [search sequence image] -o output.png

复原之后的成果和原图的比照后果:

然而,我的项目作者没有抉择创立潜在字体的查找表,只是简略应用待处理字符的德布鲁因序列,将其粘贴到雷同的编辑器中,而后截图。该截图能够用作类似 block 的查找图像,例如:

德布鲁因序列包含待处理字符的所有双字符组合。在以下测试图像中,Depix算法无奈找到(o)的一部分。这是因为在搜寻图像中,搜寻block还蕴含下一个字母(「d」)的一部分,但在原始图像中这里有个空格。

不过对于大多数像素化的图像,Depix都能够找个单个的匹配后果,它假设这些都是正确的。而后将四周的多个匹配块匹配,而后再与马赛克图像雷同的几何间隔进行比拟。这些匹配也被认为是正确的。

当正确的块没有更多的几何匹配后,它将间接输入所有正确的块。对于多匹配块,它输入所有匹配的平均值。它的输入还远远不够完满,但它的性能相当好。下图显示了一个带有随机字符的测试图像,大多数字符都能够正确破解进去。

Sipke Mellema还示意Depix技术相似于哈希破解,利用ECB的应用和已知明文攻打的应用。他倡议人们对于敏感数据还是尽量不要用Depix。

近期热文举荐:

1.1,000+ 道 Java面试题及答案整顿(2021最新版)

2.别在再满屏的 if/ else 了,试试策略模式,真香!!

3.卧槽!Java 中的 xx ≠ null 是什么新语法?

4.Spring Boot 2.5 重磅公布,光明模式太炸了!

5.《Java开发手册(嵩山版)》最新公布,速速下载!

感觉不错,别忘了顺手点赞+转发哦!