关于数据挖掘:放弃vlookup吧这3种EXCEL多表关联方法强得很

47次阅读

共计 2025 个字符,预计需要花费 6 分钟才能阅读完成。

置信很多人对 Excel 都是又爱又恨的,这个咱们日常工作中频繁用到的工具,性能尽管弱小,但毛病也很显著。如在性能方面,当数据量较大时 Excel 运行就会变得十分迟缓,重大升高了工作效率。在探讨如何解决这个问题之前,咱们先来看一个实在的案例:

一、案例:

小杨是一家医疗器材公司的销售助理,整顿公司的销售报表并定时将数据发送给领导是他的日常工作之一,但往往小杨要在这个工作上破费很多工夫,导致其余工作没法按时实现,因而每周都要加班,小杨苦不堪言。小杨公司的数据源存储在 ERP 零碎,将数据导入 Excel,再对数据源进行加工、整顿、剖析。但这个数据源不仅数据量微小而且维度十分多,十分复杂。如产品品类就有 400 多个,销售 150 多位、客户更是多达了 1500 多位,每个月的数据量靠近能够达到一百万行。不仅如此,小杨还要按维度整顿数据,如公司的销售部次要有 3 个,但外面又蕴含有 2 个小部,部门里又要按区域划分。分完大区、小区,还要辨别连锁、乡镇等。除了有微小的数据量和简单的维度,小杨还须要把这些报表使用公式进行关联。

二、业务场景

1、痛点 / 需要

为了对上述的案例进行场景模仿,并找到最优的解决方案,我找来了 3 个数据源文件,先看一下在 Excel 里做多表关联会遇到什么问题:

第一个是汽车销售数据源,数据量是 100 万行:

第二个是产品的维度表:

第三个是地区的维度表:

因为报表中光汽车销售的数据源就多达 100 万行,不用说运行,只是关上 Excel 都曾经带不动了,十分迟缓。

咱们再尝试一下对这几个报表进行关联,Excel 的多表关联最罕用的办法是利用 vlookup 把两个表格连接起来,每关联一个字段,就要多写一次公式,特地麻烦,如果数据大的时候,就会变得十分卡,有时候基本就跑不动,让人解体。一波操作后,小编抉择了放弃,还是另寻他法吧!

2、解决过程

依据下面的案例,小编认为如果想要解决上述 Excel 的问题,能够从 2 个方面进行思考。一是数据量,二是多表关联。通过对目前市场上知名度较高的工具进行多番尝试后,终于给小编找到了 3 种比拟适宜的办法,至于哪种办法更适宜本人,这个答案就交给理智的你本人去抉择吧。

1)数据库

使用数据库的语句做多表关联是一种不错的形式,学过数据库的人都晓得,sql 语句中提供了多种连贯的形式,如左连贯、右连贯、外连贯、内连贯。先在咱们来实操一下,关上数据库软件,在数据库中将表结构设计好,而后把这 3 个表格都导进数据库中:

接着建一个查问,将语句写好,而后再将这三个表格进行关联,最初一步——点击“执行”,就可能失去一个新的关联表:

这种办法是有肯定的门槛,要求有肯定的数据库语句根底,如果齐全没有根底的话,能够疏忽此办法。

2)Powerpivot

这是 Excel 中的建模组件,性能十分弱小,利用这个性能也可能帮助你实现报表关联。如何疾速找到这个菜单界面?操作形式如下,查看 Excel 工具栏上:

进入到 powerpivot 的界面后,点击“从其余源”,抉择 Excel 导入,再别离将这 3 个数据源导入:

待数据源导入后, 鼠标点击“关系图视图”,察看可发现这 3 个表格没有任何关联,咱们能够使用连线形式对这几个表格进行关联:

关联实现之后,鼠标点击“透视表”,可见 3 个表格曾经关联起来了,且可能自在关联查问:

然而用 powerpivot 也有一个很大的毛病,那就是数据性能太差劲,如果数据量太大,很容易会被卡死。

3)智剖析

智剖析的数据处理能力十分弱小,数据荡涤、数据可视化等都能完满应答,这个大数据分析工具属于云端 saas。智剖析解决 Excel 文件十分不便,对 Excel 用户十分敌对。综上所述,做多表关联的话小编更倡议大家抉择智剖析,与前 2 种多表关联办法相比,智剖析的解决性能、操作步骤等方面都是更具劣势的。上面给大家介绍一下如何通过智剖析做多表关联:

数据导入

老规矩,先将 3 个报表导入到智剖析零碎,导入实现后,在数据连贯的界面里找到这 3 个文件:

而后关上数据筹备里的自助数据集:

进入到自助数据集的界面后,在数据连贯里找到您的数据源,点击数据源后,便能够刷新出明细数据:

而后用鼠标双击维度表,刚导入的两份报表就会实现主动关联,这时能够对关联关系进行设置,例如左连贯、右连贯等等,这里咱们设置为左连贯:

反复以上操作,鼠标点击剩下的那个维度表,也与数据源进行关联,这样 3 个数据源就曾经关联好了:

当初须要对关联后报表中存在的反复字段进行解决,须要对其进行可见性的设置:

设置实现后,咱们能够对数据进行预览,当初 3 个报表曾经合并为同 1 个报表了,有了这个数据集,咱们就能够去做其余的数据分析了:

三、总结

怎么样?这 3 个办法是不是还是挺实用的,前 2 个办法相对来说对小白不是太敌对,须要肯定的技术根底。所以小编还是比拟举荐第 3 个办法,因为只有你会用 Excel,就能很快上手,轻松实现操作。另外,第 3 个办法的操作步骤齐全不须要打代码,且都在可视化得界面进行操作,能接受的数据量也能大,算得上是目前解决多表关联的最好办法了。

正文完
 0