关于数据挖掘:R语言关联规则Apriori对抗肿瘤中药数据库知识发现研究

43次阅读

共计 2364 个字符,预计需要花费 6 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=32660

原文出处:拓端数据部落公众号

肿瘤是近年来严重威胁人类的衰弱的疾病, 据统计, 目前大部分品种的肿瘤都出现不同水平的回升趋势, 中国因患肿瘤而死亡的人数约占寰球肿瘤死亡总人数的 1 / 4 左右, 人类正面临着肿瘤防治的新挑战。现代医学医治肿瘤的伎俩和形式曾经日臻完善, 次要为手术配合放、化疗联结医治。

但传统中医医治在进步缓解率的同时易产生较强的毒副作用与耐药性。作为传统医学主体的中医药与中医相结合辨证施治, 在进步疗效、缓解不良反应等方面有其独特的劣势。

本钻研帮忙客户在收集数据建设抗肿瘤中药数据库的根底上, 使用数学模型探寻抗肿瘤中药性效关系及古代药理学钻研, 为抗肿瘤西医及中西医综合医治的临证用药提供理论依据。

读取数据

siqi=read.xlsx("性效开掘一列 0616 2.xlsx",sheet=1)  
wuwei=read.xlsx("性效开掘一列 0616 2.xlsx",sheet=2)  
guijing=read.xlsx("性效开掘一列 0616 2.xlsx",sheet=3)  
duxing=read.xlsx("性效开掘一列 0616 2.xlsx",sheet=4)  
gongneng =read.xlsx("性效开掘一列 0616 2.xlsx",sheet=5)

(一)频数统计

四气、五味、归经、有(无)毒、药理性能根底剖析

(1)抗肿瘤中药四气、五味、归经、有无毒性、性能、药理作用→频数统计( or 数据分布)

(四气、五味、归经、有毒无毒思考数字、直方图、饼图示意)

绘制直方图

barplot(table(unlist(x[,2])))  
  tab1=table(unlist(x[,2]))  
  tab2=table(unlist(x[,2]))/sum(table(unlist(x[,2])))  
   
  res=cbind(tab1,tab2)  
  colnames(res)=c("频数","频率")

a_df3=merge(siqi,wuwei,by="流水号")  
a_df3=merge(a_df3,guijing,by="流水号")

穿插表

药味和四气那两列要和效用别离做两张这种图

tab=table(a_df$ 性能,a_df$ 四气)  
for(i in 1:ncol(tab)){

导出为 excel 文件:

(二)关联规定

对经典的 Apriori 算法进行改良,编程实现双向强关联规定开掘办法,采纳此办法剖析药 药性 效用之间的分割

将数据转换成事务类型

for(i in 2:ncol(a_df3))a_df3[,i]=as.factor(a_df3[,i])



rulesmodel=function(X){rules <- sort(rules, by="support")
  arules::inspect(head(rules, n=20))
  #查看最高置信度样本规定
  rules <- sort(rules, by="confidence")

(1)药性 效用关联性剖析

1)药性关联性剖析

①四气、五味  

rulesmodel(c("四气","五味"))

②四气、归经

2)药性 **-** 效用关联性剖析

①四气、性能

④四气、五味、归经、性能→综合剖析

用网络图示意。用表格?图片相似下图。

rulesmodel(c("四气","五味","归经"))

四个比拟有两个,一个是(性 - 味 - 归经 - 毒性),用频繁项集和圆圈图。

rulesmodel(c("四气","五味","归经","毒性"))

(性 - 味 - 归经 - 性能)的做频繁项集和网络图,做成关系网

rulesmodel(c("四气","五味","归经","性能"))


最受欢迎的见解

1.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%bb%98%e5%88%b6%e7%94%…)Python 中的 Apriori 关联算法 - 市场购物篮剖析

2.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%94%9f%e5%ad%98%e5%88%…)[](http://tecdat.cn/%e9%80%9a%e8%bf%87%e5%85%b3%e8%81%94%e8%a7%8…)R 语言绘制生存曲线预计 | 生存剖析 | 如何 R 作生存曲线图

3.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e5%a6%82%e4%bd%95%e5%9c%…)[](http://tecdat.cn/%e5%9f%ba%e4%ba%8er%e7%9a%84fp%e6%a0%91fp-gr…)用关联规定数据挖掘摸索药物配伍中的法则

4.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e4%b8%ad%e4%bd%bf%e7%94%…)通过 Python 中的 Apriori 算法进行关联规定开掘

5.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80%e7%94%9f%e5%ad%98%e5%88%…)用关联规定数据挖掘摸索药物配伍中的法则

6.[](http://tecdat.cn/r%e8%af%ad%e8%a8%80ggplot2%e8%af%af%e5%b7%ae…)采纳 SPSS Modeler 的 Web 简单网络对所有腧穴进行剖析

7.[](http://tecdat.cn/r-%e8%af%ad%e8%a8%80%e7%bb%98%e5%88%b6%e5%8a…)R 语言如何在生存剖析与 COX 回归中计算 IDI,NRI 指标

8.R 语言如何找到患者数据中具备差别的指标?(PLS—DA 剖析)

9.R 语言中的生存剖析 Survival analysis 早期肺癌患者 4 例

正文完
 0