乐趣区

关于算法:R语言用相关网络图可视化分析汽车配置和饮酒习惯

原文链接:http://tecdat.cn/?p=22772 

咱们常常应用的一个关系性指标是相关性。通过能够利用数据框架和绘图来帮忙摸索相干关系。

本文先创立了相干关系的关系数据框,而后绘制了关系构造。


=

咱们将应用以下库。

library(tidyverse)
library(igraph)

根本办法

给定一个由数字变量组成的数据框 d,咱们想在网络中绘制其相关性,这里有一个根本办法。

# 创立相干数据框
d %>% 
  correlate() %>% 

# 将强于某个值的相干关系转换成转换为一个无向图的对象
cors %>% 
  filter(abs(r) 

# 绘制
plot(cors)

例子 1:汽车参数配置关联变量

让咱们依照这个办法来解决 MTCars 数据集。默认状况下,所有的变量都是数字的,所以咱们不须要做任何预处理。

咱们首先创立一个相关性数据框,并将其转换为一个图形对象。

  correlate() %>% 
  stretch()

接下来,咱们将这些值转换为一个无向图对象。该图是不定向的,因为相干关系没有方向。相干关系没有因果关系。

因为,咱们通常不心愿看到所有的相干关系,咱们首先过滤()出绝对值小于某个阈值的任何相干关系。例如,让咱们包含 0.3 或更强的相干关系(正或负)。

cors %>%
  filter(abs(r) > .3) %>%

咱们绘制这个对象。上面是一个根本图。
 

plot(cors)

改良之后的。

plot(cors,width = abs(r), color = r,title="汽车变量之间的相干关系")

例子 2:有相似饮酒习惯的国家

这个例子须要进行一些数据预处理,咱们只看强正相干。

让咱们来看一个对于世界各国的啤酒、葡萄酒饮用量的数据。

drinkdata

我想找出欧洲和美洲的哪些国家有相似的啤酒、葡萄酒和烈酒饮用习惯,以及澳大利亚在其中的位置。绑定地理信息并找到我感兴趣的国家,把这些数据变成相干数据的形态。

# 标准化数据以查看绝对数量。# 而不是相对数量
# 啤酒、葡萄酒和烈酒的绝对数量
d %>% mutate_if(is.numeric, scale)

# 整顿数据
%>% 
  gather(type, litres, -country) %>% 
  drop_na() %>% 


#转换成宽数据以便进行关联剖析
 %>% 
  spread(country, litres) %>%

这个数据包含每个国家喝的啤酒、葡萄酒和烈酒数量的 Z -scores。

咱们当初能够持续应用咱们的规范办法。因为我只对哪些国家真正类似感兴趣,咱们过滤相关系数低的数据。(r>0.9)

plot(cors,alpha = r, color = r,title = "哪些国家有相似的饮酒习惯?")

这些国家的饮酒行为分为三个群组。

例如澳大利亚与许多西欧和北欧国家如英国、法国、荷兰、挪威和瑞典一起呈现在左上方的集群中。


最受欢迎的见解

1.R 语言动态图可视化:如何、创立具备精美动画的图

2.R 语言生存剖析可视化剖析

3.Python 数据可视化 -seaborn Iris 鸢尾花数据

4.r 语言对布丰投针(蒲丰投针)试验进行模仿和动静

5.R 语言生存剖析数据分析可视化案例

6.r 语言数据可视化剖析案例:摸索 brfss 数据数据分析

7.R 语言动静可视化:制作历史寰球平均温度的累积动静折线图动画 gif 视频图

8.R 语言高维数据的主成分 pca、t-SNE 算法降维与可视化剖析案例报告

9.python 主题 LDA 建模和 t -SNE 可视化

退出移动版