关于数据挖掘:R语言稀疏主成分分析SPARSEPCA因子分析KMO检验和Bartlett球度检验分析上市公司财务指标数据

25次阅读

共计 1085 个字符,预计需要花费 3 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=31080

原文出处:拓端数据部落公众号

R 中的主成分剖析 (PCA) 和因子分析是统计分析技术,也称为多元分析技术。

当可用的数据有太多的变量无奈进行剖析时,主成分剖析 (PCA) 和因子分析在 R 中最有用,它们在不侵害他们所传播的信息的状况下缩小了须要剖析的变量的数量。

咱们和一位客户探讨过如何在 R 软件中实现稠密主成分剖析。

稠密主成分剖析会把主成分系数(形成主成分时每个变量后面的系数)变的稠密,也即是把大多数系数都变成零,通过这样一种形式,咱们就能够把主成分的次要的局部凸现进去,这样主成分就会变得较为容易解释。

上市公司财务剖析指标数据

KMO 测验和 Bartlett 球度测验

KMO 测验

kmo = function(data){library(MASS)
  X <- cor(as.matrix(data))
  iX <- ginv(X)
  S2 <- diag(diag((iX^-1)))
  AIS <- S2%*%iX%*%S2                   

Bartlett 球形测验:

bartlett(cor(data[,3:(ncol(data)-1)]

相关性测验

输入相关系数矩阵

cor(data[,3:(ncol(data) )])

绘制变量两两相干散点图

稠密主成分剖析

 
library(MASS)
set.seed(1)
 #稠密主成分剖析建模
 
nspc <- nsprc(data[,3:

主成分载荷

绘制前两个主成分的载荷图

plot(load) # set up plot 
text(load,labels=names(mydata),ce

因子分析

library(psych)
parallel

并行分析表明,因子数 =8。

fit <- fa(r=cor

因子载荷

绘制前两个因子载荷

绘制因子载荷矩阵

因子分析或主成分剖析的后果用每个因子上的次要载荷来初步解释。这些构造能够用载荷表示意,也能够用图形示意,其中所有具备绝对值 > 某个切点的载荷都示意为边(门路)。


最受欢迎的见解

1.matlab 偏最小二乘回归 (PLSR) 和主成分回归(PCR)

2. R 语言高维数据的主成分 pca、t-SNE 算法降维与可视化剖析

3.主成分剖析 (PCA) 基本原理及剖析实例

4. R 语言实现贝叶斯分位数回归、lasso 和自适应 lasso 贝叶斯分位数回归

5.应用 LASSO 回归预测股票收益数据分析

6. r 语言中对 lasso 回归,ridge 岭回归和 elastic-net 模型

7. r 语言中的偏最小二乘回归 pls-da 数据分析

8. R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化

9. R 语言主成分剖析(PCA)葡萄酒可视化:主成分得分散点图和载荷图

正文完
 0