全文链接:http://tecdat.cn/?p=31080
原文出处:拓端数据部落公众号
R中的主成分剖析(PCA)和因子分析是统计分析技术,也称为多元分析技术。
当可用的数据有太多的变量无奈进行剖析时,主成分剖析(PCA)和因子分析在R中最有用,它们在不侵害他们所传播的信息的状况下缩小了须要剖析的变量的数量。
咱们和一位客户探讨过如何在R软件中实现稠密主成分剖析。
稠密主成分剖析会把主成分系数(形成主成分时每个变量后面的系数)变的稠密,也即是把大多数系数都变成零,通过这样一种形式,咱们就能够把主成分的次要的局部凸现进去,这样主成分就会变得较为容易解释。
上市公司财务剖析指标数据
KMO测验和Bartlett球度测验
KMO测验
kmo = function( data ){ library(MASS) X <- cor(as.matrix(data)) iX <- ginv(X) S2 <- diag(diag((iX^-1))) AIS <- S2%*%iX%*%S2
Bartlett球形测验:
bartlett(cor(data[,3:(ncol(data)-1)]
相关性测验
输入相关系数矩阵
cor(data[,3:(ncol(data) )])
绘制变量两两相干散点图
稠密主成分剖析
library(MASS)set.seed(1) #稠密主成分剖析建模 nspc <- nsprc(data[,3:
主成分载荷
绘制前两个主成分的载荷图
plot(load ) # set up plot text(load,labels=names(mydata),ce
因子分析
library(psych)parallel
并行分析表明,因子数=8。
fit <- fa(r=cor
因子载荷
绘制前两个因子载荷
绘制因子载荷矩阵
因子分析或主成分剖析的后果用每个因子上的次要载荷来初步解释。这些构造能够用载荷表示意,也能够用图形示意,其中所有具备绝对值>某个切点的载荷都示意为边(门路)。
最受欢迎的见解
1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)
2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化剖析
3.主成分剖析(PCA)基本原理及剖析实例
4.R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归
5.应用LASSO回归预测股票收益数据分析
6.r语言中对lasso回归,ridge岭回归和elastic-net模型
7.r语言中的偏最小二乘回归pls-da数据分析
8.R语言用主成分PCA、 逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化
9.R语言主成分剖析(PCA)葡萄酒可视化:主成分得分散点图和载荷图