共计 1503 个字符,预计需要花费 4 分钟才能阅读完成。
先上代码 前面有介绍
import cv2
import numpy as np
#均值哈希算法
def aHash(img):
# 缩放为 8 *8
img = cv2.resize(img, (8, 8), interpolation=cv2.INTER_CUBIC)
# 转换为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# s 为像素和初值为 0,hash_str 为 hash 值初值为 ''
s = 0
hash_str = ''
# 遍历累加求像素和
for i in range(8):
for j in range(8):
s = s + gray[i, j]
# 求均匀灰度
avg = s / 64
# 灰度大于平均值为 1 相同为 0 生成图片的 hash 值
for i in range(8):
for j in range(8):
if gray[i, j] > avg:
hash_str = hash_str + '1'
else:
hash_str = hash_str + '0'
return hash_str
#差值感知算法
def dHash(img):
#缩放 8 *8
img=cv2.resize(img,(9,8),interpolation=cv2.INTER_CUBIC)
#转换灰度图
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
hash_str=''
#每行前一个像素大于后一个像素为 1,相同为 0,生成哈希
for i in range(8):
for j in range(8):
if gray[i,j]>gray[i,j+1]:
hash_str=hash_str+'1'
else:
hash_str=hash_str+'0'
return hash_str
#Hash 值比照
def cmpHash(hash1,hash2):
n=0
#hash 长度不同则返回 - 1 代表传参出错
if len(hash1)!=len(hash2):
return -1
#遍历判断
for i in range(len(hash1)):
#不相等则 n 计数 +1,n 最终为类似度
if hash1[i]!=hash2[i]:
n=n+1
return n
# 取各个 mp4 第 2 秒的截图 进行比拟
# 图 1
img1=cv2.imread(r'a.jpg')
# 图 2
img2=cv2.imread(r'b.jpg')
hash1= aHash(img1)
hash2= aHash(img2)
print(hash1)
print(hash2)
n=cmpHash(hash1,hash2)
print ('均值哈希算法类似度:'+ str(n))
hash1= dHash(img1)
hash2= dHash(img2)
print(hash1)
print(hash2)
n=cmpHash(hash1,hash2)
print ('差值哈希算法类似度:'+ str(n))
#差值越小 代表 越相近
均值哈希算法 && 差值哈希算法 区别 (另附感知哈希):
均值哈希(aHash):
图片缩放,个别为 88,或者 3232;
图片灰度化;
求平均值,并依据平均值将每一个像素二值化(大于均值为 1 小于均值为 0);
将 8 *8=64 位 bit,每 8 个比特为一个十六进制值,转换成字符串,生成哈希值(指纹);
感知哈希(pHash):
图片缩放,个别 32*32;
图片灰度化;
对图片进行离散余弦变换(DCT),转换频域;
取频域左上角 8 * 8 大小(图片的能量都集中在低频局部,低频位于左上角);
求平均值,并依据平均值将每一个像素二值化(大于均值为 1 小于均值为 0);
生成哈希值;
差值哈希(dHash):
图片缩放为 9 * 8 大小;
图片灰度化;
差别值计算(每行相邻像素的差值,这样会生成 8 * 8 的差值,前一个像素大于后一个像素则为 1,否则为 0);
生成哈希值;
正文完