关于数据挖掘:R语言数量生态学冗余分析RDA分析植物多样性物种数据结果可视化

7次阅读

共计 1514 个字符,预计需要花费 4 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=25564 

冗余剖析(redundancy analysis,RDA)是一种回归剖析联合主成分剖析的排序办法,也是多因变量(multiresponse)回归剖析的拓展。从概念上讲,RDA 是因变量矩阵与解释变量之间多元多重线性回归的拟合值矩阵的 PCA 剖析。

本报告对动物生态多样性做了数据分析。
 

冗余剖析

首先,加载数据。

要加载数据,所有文件都必须在工作目录中。

ste <- read.csv("sr.csv")
ev <- read.csv("ev.csv")
as <- read.csv("as.csv")

我对数据做了一些批改。首先,我将 ev 数据的所有定量变量(即除地貌单元外的所有变量)与 as 数据组合成一个名为 enqut. 而后,我对数据进行了归一化,容许十分不同单位的变量之间进行比拟。最初,我在归一化的定量环境变量中增加了地貌单元列,创立数据框 era,用于冗余剖析。

enqut<- cbind(ev\[,-5\],ap)
enz <- scale
ut <- env\[,5\]
era<- data.frame

构造数据

我应用环境数据era 作为解释变量对植被构造进行了冗余剖析。我将后果调配给对象 str

summary(str)

 

 

 

 

而后我失去了这个剖析的 R 方和调整后 R 方。

RsquareAdj

RsqeAdj$adj.r.sqd

 制作三序图。

par
plot
points
usc <- scores
points
text

成分数据

首先我加载了物种数据。同样,该文件 PAl.csv 必须在工作目录中。为了升高大丰度的重要性,我将 Hellinger 转换利用于物种数据。

sp <- Hellinger(sp)

而后我应用所有环境变量作为解释变量进行了冗余剖析。

head(suda)

 

#  取得 R^2 和调整后的 R^2
(sR2 <- RseAdj

(spdj <- RseAdj$adj.r.sed)

以 2 型标尺 对物种数据制作 RDA 三序图。

# 做好绘图空间
par
plot
# 绘制站点的分数
spc <- scores
points

# 绘制出物种的点数
ssc <- scores
points

# 绘制定量解释变量的箭头和它们的标签
spesc <- scores
arrows
env.names 
text

# 绘制地貌单元中心点和它们的标签的绘图点
spsc <- scores
points
text

论文图形

这是为论文制作图形的代码。

par
ensc <- scores
arrows
points

# 制作绘图空间
par
plot
abline
mtext

# 绘制站点的分数
spsc <- scores
points

# 绘制出物种的点数
sp.sc <- scores
points

# 绘制定量解释变量的箭头和它们的标签
spsc <- scores
arrows
text

# 绘制地貌单元中心点和它们的标签的绘图点
unimes 
spusc <- scores
points
text


最受欢迎的见解

1.matlab 偏最小二乘回归 (PLSR) 和主成分回归 (PCR) 和主成分回归(PCR)”)

2.R 语言高维数据的主成分 pca、t-SNE 算法降维与可视化剖析

3. 主成分剖析 (PCA) 基本原理及剖析实例基本原理及剖析实例 ”)

4. 基于 R 语言实现 LASSO 回归剖析

5. 应用 LASSO 回归预测股票收益数据分析

6.r 语言中对 lasso 回归,ridge 岭回归和 elastic-net 模型

7.r 语言中的偏最小二乘回归 pls-da 数据分析

8.r 语言中的偏最小二乘 pls 回归算法

9. R 语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)

正文完
 0