关于数据挖掘:R语言混合图形模型MGM的网络可预测性分析附代码数据

85次阅读

共计 1764 个字符,预计需要花费 5 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=18279

 最近咱们被客户要求撰写对于混合图形模型 MGM 的钻研报告,包含一些图形和统计输入。

网络模型曾经成为形象简单零碎,是深刻理解 [许多迷信畛域]() 中观测变量之间的关系模式的风行办法。这些应用程序大多数集中于剖析网络的构造。然而,如果不是间接察看网络,而是 依据 数据进行 估算(如:吸烟与癌症之间存在关联),则除了网络结构外,咱们还能够剖析网络中节点的可预测性。也就是说:网络中的所有其余节点如何预测网络中的给定节点?

可预测性乏味,有几个起因:

  1. 它给咱们提供了一个对于边的 实用性 的想法:如果节点 A 连贯到许多其余节点,然而这些仅阐明(假如)其方差的 1%,那么边的连贯会是怎么的?
  2. 它通知咱们网络的不同局部在多大程度上是 网络中 的其余因素决定的

在此博文中,咱们应用 R - 预计网络模型并计算地震灾民 [数据集]() 上的创伤后应激阻碍(PTSD)症状。咱们对网络模型和可预测性进行可视化,并探讨如何将网络模型和节点的可预测 [性相]() 联合来设计症状网络的无效干涉措施。

载入材料

咱们加载提供的数据:


data <- as.matrix(data)
p <- ncol(data)
dim(data)
## [1] 312  17

数据集蕴含对 344 人的 17 种 PTSD 症状的残缺反馈。症状强度的答案类别范畴从 1“没有”到 5“十分强”。

预计网络模型

咱们预计了 [混合图形模型](),其中咱们将所有变量都视为间断高斯变量。因而,咱们将所有变量的类型设置为,type = 'g' 并将每个变量的类别数设置为 1:


fit_obj <- (data = data, 
               type = rep('g', p),
               level = rep(1, p),
               lambdaSel = 'CV',
               ruleReg = 'OR', 
               pbar = FALSE)

计算节点的可预测性

预计网络模型后,咱们筹备计算每个节点的可预测性。因为能够通过顺次获取每个节点并对其上的所有其余节点进行回归来预计该图,因而能够轻松地计算节点的可预测性)。作为可预测性的度量,咱们抉择解释的方差的比例:0 示意以后节点基本没有被节点中的其余节点解释,1 示意完满的预测。咱们在估算之前将所有变量中心化,以打消截距的影响。

无关如何计算预测和抉择可预测性度量的具体阐明,请查看[本文]()。如果网络中还有其余变量类型(例如分类),咱们能够为这些变量抉择适当的度量。

pred_obj <- predict(object = fit_obj, 
                    data = data

pred_obj$error
##     Variable    R2
## 1  intrusion 0.639
## 2     dreams 0.661
## 3      flash 0.601
## 4      upset 0.636
## 5    physior 0.627
## 6    avoidth 0.686
## 7   avoidact 0.681
## 8    amnesia 0.410
## 9    lossint 0.520
## 10   distant 0.498
## 11      numb 0.451
## 12    future 0.540
## 13     sleep 0.565
## 14     anger 0.562
## 15    concen 0.638
## 16     hyper 0.676
## 17   startle 0.626

咱们计算了网络中每个节点的解释方差(R2)的百分比。接下来,咱们将预计的网络可视化,并探讨与解释方差无关的构造。

可视化网络和可预测性

咱们依据预计的加权邻接矩阵和节点的可预测性度量作为参数,进行网络可视化:


graph(fit_obj$pairwise$wadj, # 加权邻接矩阵作为输出
       layout = 'spring', 
       pie = pred_obj$error[,2], # 误差作为饼图的输出
  

 

无关晚期钻研不同心理障碍症状可预测性的[文章](),请参见[本文]()。

 


最受欢迎的见解

1.采纳 spss-modeler 的 web 简单网络对所有腧穴进行剖析

2.用 R 语言和 python 进行社交网络中的社区检测

3. R 语言文本开掘 NASA 数据网络剖析,tf-idf 和主题建模

4.在 R 语言中应用航空公司简单网络对疫情进行建模

5.python 附属关系图模型 基于模型的网络中密集重叠社区检测

6.应用 Python 和 SAS Viya 剖析社交网络

7.关联网络分析:已迁离北京外来人口的数据画像

8.情感语义网络:游记数据感知游览目的地形象

9.用关联规定数据挖掘摸索药物配伍中的法则

正文完
 0