关于hash:python-识别图片相似度

先上代码前面有介绍

import cv2
import numpy as np
#均值哈希算法
def aHash(img):
    # 缩放为8*8
    img = cv2.resize(img, (8, 8), interpolation=cv2.INTER_CUBIC)
    # 转换为灰度图
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # s为像素和初值为0，hash_str为hash值初值为''
    s = 0
    hash_str = ''
    # 遍历累加求像素和
    for i in range(8):
        for j in range(8):
            s = s + gray[i, j]
    # 求均匀灰度
    avg = s / 64
    # 灰度大于平均值为1相同为0生成图片的hash值
    for i in range(8):
        for j in range(8):
            if gray[i, j] > avg:
                hash_str = hash_str + '1'
            else:
                hash_str = hash_str + '0'
    return hash_str
#差值感知算法
def dHash(img):
    #缩放8*8
    img=cv2.resize(img,(9,8),interpolation=cv2.INTER_CUBIC)
    #转换灰度图
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    hash_str=''
    #每行前一个像素大于后一个像素为1，相同为0，生成哈希
    for i in range(8):
        for j in range(8):
            if   gray[i,j]>gray[i,j+1]:
                hash_str=hash_str+'1'
            else:
                hash_str=hash_str+'0'
    return hash_str

#Hash值比照
def cmpHash(hash1,hash2):
    n=0
    #hash长度不同则返回-1代表传参出错
    if len(hash1)!=len(hash2):
        return -1
    #遍历判断
    for i in range(len(hash1)):
        #不相等则n计数+1，n最终为类似度
        if hash1[i]!=hash2[i]:
            n=n+1
    return n

# 取各个mp4 第2秒的截图 进行比拟
# 图1
img1=cv2.imread(r'a.jpg')
# 图2
img2=cv2.imread(r'b.jpg')

hash1= aHash(img1)
hash2= aHash(img2)
print(hash1)
print(hash2)
n=cmpHash(hash1,hash2)
print ('均值哈希算法类似度：'+ str(n))

hash1= dHash(img1)
hash2= dHash(img2)
print(hash1)
print(hash2)
n=cmpHash(hash1,hash2)
print ('差值哈希算法类似度：'+ str(n))

#差值越小  代表 越相近

均值哈希算法 && 差值哈希算法区别(另附感知哈希):

均值哈希（aHash）：

图片缩放，个别为88，或者3232；
图片灰度化；
求平均值，并依据平均值将每一个像素二值化（大于均值为1小于均值为0）；
将8*8=64位bit，每8个比特为一个十六进制值，转换成字符串，生成哈希值（指纹）；

感知哈希（pHash）：

图片缩放，个别32*32；
图片灰度化；
对图片进行离散余弦变换（DCT），转换频域；
取频域左上角8*8大小（图片的能量都集中在低频局部，低频位于左上角）；
求平均值，并依据平均值将每一个像素二值化（大于均值为1小于均值为0）；
生成哈希值；

差值哈希（dHash）：

图片缩放为9*8大小；
图片灰度化；
差别值计算（每行相邻像素的差值，这样会生成8*8的差值，前一个像素大于后一个像素则为1，否则为0）；
生成哈希值；

关于hash:python-识别图片相似度

均值哈希算法 && 差值哈希算法区别(另附感知哈希):

均值哈希（aHash）：

感知哈希（pHash）：

差值哈希（dHash）：

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于hash:python-识别图片相似度

均值哈希算法 && 差值哈希算法 区别(另附感知哈希):

均值哈希（aHash）：

感知哈希（pHash）：

差值哈希（dHash）：

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

均值哈希算法 && 差值哈希算法区别(另附感知哈希):

发表回复取消回复