关于数据挖掘:SQL-Server-Analysis-Services数据挖掘聚类分析职业地区餐饮消费水平数据

全文链接:http://tecdat.cn/?p=31887

原文出处:拓端数据部落公众号

本文通过 SQL Server Analysis Services数据挖掘的剖析模块,帮忙客户对一个职业、地区、餐饮消费水平的数据挖掘,并用可视化剖析图表显示数据。该后果可为餐饮业的管理者提供决策依据,进而使餐饮企业取得更多利润。同时,挖掘出与该职业绝对应的地区及消费水平,能够为职业倒退布局、餐饮市场的开辟提供无效根据。

筹备工作:数据.xls 数据导入数据库中。

将表格命名

在相应数据库中找到对应的数据

商业智能我的项目

抉择商业智能我的项目,analysis services我的项目,并抉择指标文件夹

在解决方案资源管理器中,右键单击数据源,抉择新建数据源

在解决方案资源管理器中,右键单击开掘构造,抉择新建开掘构造

设置输出数据与键Id

设置训练集和测试集的百分比

点击部署模型

看到右下角 部署实现

查看后果

从聚类后果能够看到,聚类将所有用户分成了2个聚类后果。

从不同类别的依赖图能够看到,类别10、4、8、6、7、5之间具备较强的相干关系。阐明这几个类别中的变量特色是相似的。上面能够具体看下每个类别中的各个属性的散布的比例。

另外一个聚类中,1、2、9为一个聚类簇,阐明这几类别中的变量特色相似。

同时能够看到每个变量再每个类别中的散布状况

能够看到消费水平很低的样本次要散布在分类10中

从上图能够看到 餐饮消费水平较高的类别是1,2,9类别中。

上面能够看到各个分类的剖面图

能够看到每个分类中各个level所占的比例。中餐次要散布在分类1、2中。拍档次要散布在分类6、10中。

年龄的散布也非常明显。大多数散布在26岁左右,分类10的样本年龄最大。同时能够看到分类1 和9 的支出最高,同时他们常去的餐厅类型为中餐。同时能够看到所在城市在分类3中次要是通辽和根河市。他们次要去的餐厅类型是西餐和排档。在分类9中,能够看到医生职业的样本次要去的也是西餐类型。分类1中能够看到,去中餐的样本次要是少了的医生。

而后能够看到总体的分类特色。最常去的餐厅类型为西餐,其次是中餐。年收入最多的区间是51900到67000之间。餐饮生产在10元到18元之间。样本的次要年龄段在20岁到25岁。所在城市次要为根河市,其次是乌兰浩特。样本的职业中,最多的是客服专员。

从每个类别的偏向水平来看,分类1中,次要的样本区的是中餐餐厅。每次的生产在20到30元之间。年收入在8万到12万之间,阐明这些样本的支出较高。其中,行政主管所占的百分比较高。有大量的创意总监。

从每个类别的偏向水平来看,分类1中,次要的样本区的是中餐餐厅。他们所在的城市次要在鄂尔多斯。

 

从每个类别的偏向水平来看,分类3中,次要的样本支出在3万3到3万6之间。他们的职业次要是文案策动,常去的餐厅为非中餐餐厅。

从每个类别的偏向水平来看,分类4中,次要的样本区的是西餐餐厅。次要的职业为市场总监。

从每个类别的偏向水平来看,分类5中,次要的样本区的是西餐餐厅。 次要的职业为电工和电话销售以及老师。

从每个类别的偏向水平来看,分类6中,次要的样本去的是排挡餐厅。 次要的职业为学生和服务员及会计师。该群体大部分支出较低或者没有支出。因而每次的餐厅生产也较低。


最受欢迎的见解

1.R语言k-Shape算法股票价格工夫序列聚类

2.R语言基于温度对城市档次聚类、kmean聚类、主成分剖析和Voronoi图

3.R语言对用电负荷工夫序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的档次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本开掘聚类

7.R语言KMEANS均值聚类和档次聚类:亚洲国家地区生存幸福品质异同可视化**

8.PYTHON用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯模型和KMEANS聚类用户画像

9.R语言基于Keras的小数据集深度学习图像分类

【腾讯云】轻量 2核2G4M,首年65元

阿里云限时活动-云数据库 RDS MySQL  1核2G配置 1.88/月 速抢

本文由乐趣区整理发布,转载请注明出处,谢谢。

您可能还喜欢...

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据