关于算法:R语言关联规则模型Apriori算法挖掘杂货店的交易数据与交互可视化

44次阅读

共计 1401 个字符,预计需要花费 4 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=22732 


关联规定开掘是一种无监督的学习办法,从交易数据中开掘规定。它有助于找出数据集中的关系和一起呈现的我的项目。在这篇文章中,我将解释如何在 R 中提取关联规定。
关联规定模型实用于交易数据。交易数据的一个例子能够是客户的购物历史。

数据分析的第一件事是理解指标数据结构和内容。出于学习的目标,我认为应用一个简略的数据集更好。一旦咱们晓得了这个模型,就能够很容易地把它利用于更简单的数据集。

在这里,咱们应用杂货店的交易数据。首先,咱们创立一个数据框并将其转换为交易类型。

读取数据

n=500 # 交易数量

trans <- data.frame() # 收集数据的数据框架 

创立数据并将其收集到交易数据框中。

for(i in 1:n)
{count <- sample(1:3, 1) # 从 1 到 3 的物品计数
  如果 (i %% 2 == 1)
  {if(!add_product %in% selected)
    {tran <- data.frame(items = add_product, tid = i)

查看交易数据框中的数据。

接下来,咱们须要将生成的数据框转换为交易数据类型。

 as(split(\[, "items"\], \[, "tid"\]), "transa")

为了查看交易数据的内容,咱们应用 inspect() 命令。

开掘规定

sort(rules_1, dby = "confidence")

…….

咱们从下面的列表中获取第一个 rhs 项(规定后项)来查看该项的规定。但如果你晓得指标我的项目,能够在参数中只写 rhs=”melon”。

 inspect(rules_1@rhs\[1\])

> rhs_item <- gsub("\\\}","", rhs)

咱们为咱们的 rhs_item 建设规定

按 “ 置信度 “ 排序并查看规定

sort(rules_2, "confidence")

后果可视化

最初,咱们从规定集_2 中绘制出前 5 条规定。

> plot(rules_2\[1:5\])

绘制全副规定

交互可视化

绘制出前 5 条规定

precision     =  3
igraphLayout     =  layout_nicely
list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe, 
            edgesToDataframe = edgesToDataframe,
x$legend <- legend
    htmlwidgets::createWidget( x, width = width, 
        height = height)

绘制全副规定


最受欢迎的见解

1. 采纳 spss-modeler 的 web 简单网络对所有腧穴进行剖析

2. 用 R 语言和 python 进行社交网络中的社区检测

3. R 语言文本开掘 NASA 数据网络剖析,tf-idf 和主题建模

4. 在 R 语言中应用航空公司简单网络对疫情进行建模

5.python 附属关系图模型 基于模型的网络中密集重叠社区检测

6. 应用 Python 和 SAS Viya 剖析社交网络

7. 关联网络分析:已迁离北京外来人口的数据画像

8. 情感语义网络:游记数据感知游览目的地形象

9. 用关联规定数据挖掘摸索药物配伍中的法则

正文完
 0