共计 1401 个字符,预计需要花费 4 分钟才能阅读完成。
原文链接:http://tecdat.cn/?p=22732
关联规定开掘是一种无监督的学习办法,从交易数据中开掘规定。它有助于找出数据集中的关系和一起呈现的我的项目。在这篇文章中,我将解释如何在 R 中提取关联规定。
关联规定模型实用于交易数据。交易数据的一个例子能够是客户的购物历史。
数据分析的第一件事是理解指标数据结构和内容。出于学习的目标,我认为应用一个简略的数据集更好。一旦咱们晓得了这个模型,就能够很容易地把它利用于更简单的数据集。
在这里,咱们应用杂货店的交易数据。首先,咱们创立一个数据框并将其转换为交易类型。
读取数据
n=500 # 交易数量
trans <- data.frame() # 收集数据的数据框架
创立数据并将其收集到交易数据框中。
for(i in 1:n)
{count <- sample(1:3, 1) # 从 1 到 3 的物品计数
如果 (i %% 2 == 1)
{if(!add_product %in% selected)
{tran <- data.frame(items = add_product, tid = i)
查看交易数据框中的数据。
接下来,咱们须要将生成的数据框转换为交易数据类型。
as(split(\[, "items"\], \[, "tid"\]), "transa")
为了查看交易数据的内容,咱们应用 inspect() 命令。
开掘规定
sort(rules_1, dby = "confidence")
…….
咱们从下面的列表中获取第一个 rhs 项(规定后项)来查看该项的规定。但如果你晓得指标我的项目,能够在参数中只写 rhs=”melon”。
inspect(rules_1@rhs\[1\])
> rhs_item <- gsub("\\\}","", rhs)
咱们为咱们的 rhs_item 建设规定
按 “ 置信度 “ 排序并查看规定
sort(rules_2, "confidence")
后果可视化
最初,咱们从规定集_2 中绘制出前 5 条规定。
> plot(rules_2\[1:5\])
绘制全副规定
交互可视化
绘制出前 5 条规定
precision = 3
igraphLayout = layout_nicely
list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe,
edgesToDataframe = edgesToDataframe,
x$legend <- legend
htmlwidgets::createWidget( x, width = width,
height = height)
绘制全副规定
最受欢迎的见解
1. 采纳 spss-modeler 的 web 简单网络对所有腧穴进行剖析
2. 用 R 语言和 python 进行社交网络中的社区检测
3. R 语言文本开掘 NASA 数据网络剖析,tf-idf 和主题建模
4. 在 R 语言中应用航空公司简单网络对疫情进行建模
5.python 附属关系图模型 基于模型的网络中密集重叠社区检测
6. 应用 Python 和 SAS Viya 剖析社交网络
7. 关联网络分析:已迁离北京外来人口的数据画像
8. 情感语义网络:游记数据感知游览目的地形象
9. 用关联规定数据挖掘摸索药物配伍中的法则