乐趣区

关于数据挖掘:Matlab决策树对空气质量和天气温度及天气数据做交通出行推荐预测附代码数据

全文链接:http://tecdat.cn/?p=31784

原文出处:拓端数据部落公众号

最近咱们被客户要求撰写对于决策树的钻研报告,包含一些图形和统计输入。

为解决城市交通拥堵问题,本文提出了一种基于 Matlab 决策树的交通预测办法,咱们通过采集上海地区的空气质量数据和温度数据,帮忙客户在 Matlab 中实现决策树建模,利用所提取的天气和温度特色建设决策树,对将来的出行工夫、出行路线等进行预测。结果表明:该办法可实现交通工夫、出行路线的预测,并能在将来三天进行无效预测工夫长度与空气质量、温度相干。

数据

外面一个是天气数据(区县主动站实况数据),只把地区为徐家汇的取出来,其余地点的不必参考。

另一个是空气数据(实时空气质量数据)。

预期后果

依据空气中的空气质量和天气数据中的温度及天气情况做一个交通出行的举荐。

举个例子:
明天温度 0 度 天气晴朗 空气质量优 出行形式能够为 公交车或地铁。

明天温度 15 度 天气晴朗 空气质量优 出行形式为 步行。

明天温度 15 度 天气晴朗 管制品质轻度净化 呈现形式为 公交车或地铁。

读取气温数据


[data, ~, raw] = xlsread('区县主动站实况数据.xlsx','Sheet2');

筛选对应日期数据

data=data(1:9649,:);
raw=raw(1:9649,:);

找出徐家汇地区的数据

index=strcmp(raw(:,3),'徐家汇')

读取空气质量数据


[data2, ~, raw2, dateNums] = xlsread('实时空气质量数据(历史)2.xlsx','Sheet1','','

筛选对应日期数据

data2=data2(4415:end,:);
raw2=raw2(4415:end,:);

失去对应工夫

 index=1:3:2880

失去对应工夫的 空气质量数据

 
 mydata=[raw,raw2];
 

建设决策规定

分类类别号

 label=mydata(:,18);
%label=label(2:end);

将类别号赋值给 outData

outData=label;

取得特色变量矩阵

inData = [data,data2];                    % 输出特色矩阵

依据训练集数据创立决策树

classregtree(inData, o)

查看决策树

view(mytree);

决策树规定

Decision tree for classification

  1  if x5<11.5 then node 2 elseif x5>=11.5 then node 3 else 步行

  2  if x5<3.5 then node 4 elseif x5>=3.5 then node 5 else 步行

  3  if x13<0.45 then node 6 elseif x13>=0.45 then node 7 else 步行

  4  if x1<2.01504e+011 then node 8 elseif x1>=2.01504e+011 then node 9 else 公交车或地铁

  5  if x12<91.5 then node 10 elseif x12>=91.5 then node 11 else 步行

  6  if x11<11.5 then node 12 elseif x11>=11.5 then node 13 else 步行

  7  if x9<27.5 then node 14 elseif x9>=27.5 then node 15 else 公交车或地铁

  8  if x6<1.6 then node 16 elseif x6>=1.6 then node 17 else 公交车或地铁

  9  class = 步行

 10  if x8<86.5 then node 18 elseif x8>=86.5 then node 19 else 步行

 11  class = 公交车或地铁

 12  if x7<1.5 then node 20 elseif x7>=1.5 then node 21 else 步行

 13  if x9<94 then node 22 elseif x9>=94 then node 23 else 公交车或地铁

 14  if x9<8.5 then node 24 elseif x9>=8.5 then node 25 else 步行

 15  if x6<2.75 then node 26 elseif x6>=2.75 then node 27 else 公交车或地铁

 16  class = 公交车或地铁

 17  class = 步行

 18  class = 步行

 19  if x1<2.01502e+011 then node 28 elseif x1>=2.01502e+011 then node 29 else 步行

 20  class = 步行

 21  if x1<2.01504e+011 then node 30 elseif x1>=2.01504e+011 then node 31 else 步行

 22  if x4<6.95 then node 32 elseif x4>=6.95 then node 33 else 公交车或地铁

 23  class = 步行

 24  if x6<0.35 then node 34 elseif x6>=0.35 then node 35 else 公交车或地铁

 25  if x8<49.5 then node 36 elseif x8>=49.5 then node 37 else 步行

 26  if x6<2.25 then node 38 elseif x6>=2.25 then node 39 else 公交车或地铁

 27  if x11<26.5 then node 40 elseif x11>=26.5 then node 41 else 步行

 28  class = 步行

 29  class = 公交车或地铁

 30  class = 步行

 31  class = 公交车或地铁

 32  if x5<142.5 then node 42 elseif x5>=142.5 then node 43 else 步行

 33  class = 公交车或地铁

 34  class = 步行

 35  if x5<311 then node 44 elseif x5>=311 then node 45 else 公交车或地铁

 36  if x9<22 then node 46 elseif x9>=22 then node 47 else 公交车或地铁

 37  if x12<135 then node 48 elseif x12>=135 then node 49 else 步行

 38  if x5<102.5 then node 50 elseif x5>=102.5 then node 51 else 公交车或地铁

 39  if x8<18.5 then node 52 elseif x8>=18.5 then node 53 else 公交车或地铁

 40  if x12<40.5 then node 54 elseif x12>=40.5 then node 55 else 步行

 41  if x6<3 then node 56 elseif x6>=3 then node 57 else 公交车或地铁

 42  class = 步行

 43  if x1<2.01503e+011 then node 58 elseif x1>=2.01503e+011 then node 59 else 公交车或地铁

 44  class = 公交车或地铁

 45  class = 步行

 46  if x4<21.75 then node 60 elseif x4>=21.75 then node 61 else 公交车或地铁

 47  if x14<40.5 then node 62 elseif x14>=40.5 then node 63 else 步行

 48  if x12<78.5 then node 64 elseif x12>=78.5 then node 65 else 步行

 49  if x5<212 then node 66 elseif x5>=212 then node 67 else 公交车或地铁

 50  if x14<35.5 then node 68 elseif x14>=35.5 then node 69 else 公交车或地铁

 51  if x6<1.85 then node 70 elseif x6>=1.85 then node 71 else 步行

 52  class = 公交车或地铁 

查看所有预测的分类标签

y_est

type classregtree

判断准确率

Remp

气温

 hist(inData(:,4))

风向

 hist(inData(:,5))

风速

 hist(inData(:,6))

O3

 hist(inData(:,10))

SO2

 hist(inData(:,11))

NO2

 hist(inData(:,12))

最受欢迎的见解

1.PYTHON 用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯模型和 KMEANS 聚类用户画像

2. R 语言基于树的办法:决策树,随机森林

3.python 中应用 scikit-learn 和 pandas 决策树

4. 机器学习:在 SAS 中运行随机森林数据分析报告

5. R 语言用随机森林和文本开掘进步航空公司客户满意度

6. 机器学习助推快时尚精准销售工夫序列

7. 用机器学习辨认一直变动的股市情况——隐马尔可夫模型的利用

8.python 机器学习:举荐零碎实现(以矩阵合成来协同过滤)

9.python 中用 pytorch 机器学习分类预测银行客户散失

退出移动版