协同过滤推荐中利用SVD提高推荐的效果

15次阅读

共计 880 个字符,预计需要花费 3 分钟才能阅读完成。

1. 什么是 SVD :SVD 指的是奇异值分解 SVD SVD 的物理意义
2. 利用 Python 实现 SVD
from numpy import linalg as la

# Numpy 有一个称为 linalg 的线性代数工具, 其中 svd 计算方法如下
U,Sigma,VT = la.svd(dataMat)
3. 利用 SVD 提高效率生产实际中的数据比较稀疏,在生产中不管是基于用户的相似度计算还是基于物品的相似度计算都需要较多的时间和很多的计算力,通过 SVD 可以将映射到低纬空间中去
4. 基于 SVD 的评估方法 Python 实现(参考自机器学习实战)
def svdEst(dataMat, user, simMeas, item):
n = shape(dataMat)[1]
simTotal = 0.0; ratSimTotal = 0.0
U,Sigma,VT = la.svd(dataMat)# numpy 的 svd 计算
Sig4 = mat(eye(4)*Sigma[:4]) #numpy.eye() 生成对角矩阵
# 机器学习实战的 P264 中代码对应的公式推导 https://blog.csdn.net/appleyuchi/article/details/82913217
xformedItems = dataMat.T * U[:,:4] * Sig4.I

for j in range(n):
userRating = dataMat[user,j]
if userRating == 0 or j==item: continue
similarity = simMeas(xformedItems[item,:].T,\
xformedItems[j,:].T)
print ‘the %d and %d similarity is: %f’ % (item, j, similarity)
simTotal += similarity
ratSimTotal += similarity * userRating
if simTotal == 0: return 0
else: return ratSimTotal/simTotal
其中计算按照奇异值能到达总能量的 90% 计算;dataMat.T U[:,:4] Sig4.I 的推导请参见:推导

正文完
 0