关于hash:python-识别图片相似度

37次阅读

共计 1503 个字符,预计需要花费 4 分钟才能阅读完成。

先上代码 前面有介绍

import cv2
import numpy as np
#均值哈希算法
def aHash(img):
    # 缩放为 8 *8
    img = cv2.resize(img, (8, 8), interpolation=cv2.INTER_CUBIC)
    # 转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # s 为像素和初值为 0,hash_str 为 hash 值初值为 ''
    s = 0
    hash_str = ''
    # 遍历累加求像素和
    for i in range(8):
        for j in range(8):
            s = s + gray[i, j]
    # 求均匀灰度
    avg = s / 64
    # 灰度大于平均值为 1 相同为 0 生成图片的 hash 值
    for i in range(8):
        for j in range(8):
            if gray[i, j] > avg:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str
#差值感知算法
def dHash(img):
    #缩放 8 *8
    img=cv2.resize(img,(9,8),interpolation=cv2.INTER_CUBIC)
    #转换灰度图
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    hash_str=''
    #每行前一个像素大于后一个像素为 1,相同为 0,生成哈希
    for i in range(8):
        for j in range(8):
            if   gray[i,j]>gray[i,j+1]:
                hash_str=hash_str+'1'
            else:
                hash_str=hash_str+'0'
    return hash_str

#Hash 值比照
def cmpHash(hash1,hash2):
    n=0
    #hash 长度不同则返回 - 1 代表传参出错
    if len(hash1)!=len(hash2):
        return -1
    #遍历判断
    for i in range(len(hash1)):
        #不相等则 n 计数 +1,n 最终为类似度
        if hash1[i]!=hash2[i]:
            n=n+1
    return n

# 取各个 mp4 第 2 秒的截图 进行比拟
# 图 1
img1=cv2.imread(r'a.jpg')
# 图 2
img2=cv2.imread(r'b.jpg')

hash1= aHash(img1)
hash2= aHash(img2)
print(hash1)
print(hash2)
n=cmpHash(hash1,hash2)
print ('均值哈希算法类似度:'+ str(n))

hash1= dHash(img1)
hash2= dHash(img2)
print(hash1)
print(hash2)
n=cmpHash(hash1,hash2)
print ('差值哈希算法类似度:'+ str(n))

#差值越小  代表 越相近 

均值哈希算法 && 差值哈希算法 区别 (另附感知哈希):

均值哈希(aHash):

图片缩放,个别为 88,或者 3232;
图片灰度化;
求平均值,并依据平均值将每一个像素二值化(大于均值为 1 小于均值为 0);
将 8 *8=64 位 bit,每 8 个比特为一个十六进制值,转换成字符串,生成哈希值(指纹);

感知哈希(pHash):

图片缩放,个别 32*32;
图片灰度化;
对图片进行离散余弦变换(DCT),转换频域;
取频域左上角 8 * 8 大小(图片的能量都集中在低频局部,低频位于左上角);
求平均值,并依据平均值将每一个像素二值化(大于均值为 1 小于均值为 0);
生成哈希值;

差值哈希(dHash):

图片缩放为 9 * 8 大小;
图片灰度化;
差别值计算(每行相邻像素的差值,这样会生成 8 * 8 的差值,前一个像素大于后一个像素则为 1,否则为 0);
生成哈希值;

正文完
 0