在做数据分析时,咱们会常常听到同比、环比同比的概念。各个企业和组织在公布统计数据时,通常喜爱用同比、环比来和之前的历史数据进行比拟,用来阐明数据的变动状况。例如,统计局颁布2022年1月份CPI同比增长0.9%,环比增长0.6%。

理论中,在基于数据库的数据分析场景中,环比和同比是典型的简单计算场景之一,特地是在Oracle等商业数据库的剖析函数呈现之前。以MySQL为例,在8.0版本中才引入了Lag和Lead函数,这两个函数联合开窗函数无效的进步了同比、环比等简单运算的实现效率。在5.x系列版本中,MySQL须要依赖屡次嵌套子查问和自关联能力实现此类计算。

咱们以一个简略的例子,来别离看下,MySql 5.x和8.0是具体实现同比、环比计算的。

示例数据见表:

CREATE TABLE sales  (  `产品ID` varchar(20),      `销售数量` int(20) ,  `销售工夫` timestamp(6) NULL DEFAULT NULL)INSERT INTO sales VALUES ('C1001', 15, '2020-06-01 10:10:12');INSERT INTO sales VALUES ('C1002',26, '2020-05-02 0:10:12');INSERT INTO sales VALUES ('C1003', 21, '2020-04-03 0:10:12');INSERT INTO sales VALUES ('C1003', 23, '2020-04-04 0:10:12');INSERT INTO sales VALUES ('C1003', 0, '2020-03-05 0:10:12');INSERT INTO sales VALUES ('C1001', 16, '2020-02-06 3:0:12');INSERT INTO sales VALUES ('C1002', 32, '2020-01-07 0:10:12');INSERT INTO sales VALUES ('C1001', 16, '2019-12-08 0:12:24');INSERT INTO sales VALUES ('C1001', 32, '2019-06-09  0:12:24');INSERT INTO sales VALUES ('C1002', 17, '2019-05-09 0:12:24');

1、MySQL 5.x :通过子查问和关联实现同比和占比计算

以按年月统计不同年份的销售总值,并计算环比(销售总额同比上期)、同比(销售总额同比去年同期)为例。

示例表构造和数据

通过SQL计算环比和同比:

select  year(c.销售工夫) yy,month(c.销售工夫) mm,     concat(ifnull(abs(round((sum(c.销售数量)-ss1)/ss1*100,2)),0),'%') 同比,concat(ifnull(abs(round((sum(c.销售数量)-ss2)/ss2*100,2)),0),'%')  环比from sales cleft join (select month(a.销售工夫) mm1,                    year(a.销售工夫) yy1,                    sum(a.销售数量) ss1          from sales a          GROUP BY mm1,yy1) a          on month(c.销售工夫) = a.mm1           and a.yy1 = year(c.销售工夫)-1      left join  (select month(a.销售工夫) mm2,                    year(a.销售工夫) yy2,                    sum(a.销售数量) ss2             from sales a                         GROUP BY mm2,yy2) bon (b.yy2 = year(c.销售工夫) and b.mm2+1 = month(c.销售工夫) OR (yy2=year(c.销售工夫)-1 AND b.mm2 = 12 AND month(c.销售工夫) = 1)) group by yy, mm order by yy,mm asc

计算结果:

2、 MySQL 8.0 :通过剖析函数实现同比和占比计算**

MySql8.0反对了Lead和Lag剖析函数,尽管能够大幅提高同、环比计算的效率,但依然须要编写SQL语句解决。

2、1 计算同比

select t2.年份,t2.月份,concat(round((t2.数量-t1.数量)/t1.数量,2)*100,'%') as 同比 from (SELECT year(销售工夫) as 年份,month(销售工夫) as 月份,sum(销售数量) as 数量 from sales group by year(销售工夫),month(销售工夫) order by year(销售工夫) desc, month(销售工夫) desc) t1,(SELECT year(销售工夫) as 年份,month(销售工夫) as 月份,sum(销售数量) as 数量 from sales group by year(销售工夫),month(销售工夫) order by year(销售工夫) desc, month(销售工夫) desc) t2 where t1.年份=t2.年份-1 and t1.月份=t2.月份

2、2计算环比

SELECT    mm,    CONCAT(        ROUND(            IFNULL(                (xl - first_xl) / first_xl * 100,                2            ),            0        ),        '%'    ) AS 环比FROM    (        SELECT            mm,            xl,            lead (xl, 1) over (ORDER BY mm DESC) AS first_xl        FROM            (                SELECT                    DATE_FORMAT(销售工夫, '%Y-%m') AS mm,                    sum(销售数量) AS xl                FROM                    sales                GROUP BY                    DATE_FORMAT(销售工夫, '%Y-%m')            ) t    ) a

在SqlServer2008R2和Oracle10g之后,都提供了Lag和Lead剖析函数。具体的计算逻辑和用法与上述MySQL8.0相似。

3、应用 BI工具的计算引擎

针对此类简单的计算场景,商业智能BI数据分析工具提供了更加高效的解决方案。以Wyn Enterprise嵌入式商业智能软件为例,其内置的wax剖析表达式和疾速计算引擎,提供间接实现同比、环比等简单计算的能力,而不再须要写简单简短的SQL。

3、1 应用内置的同比、环比疾速计算性能**

同比、环比等计算个别是BI工具的规范性能,咱们能够间接通过设置实现。

3、2 应用数据分析表达式

如果内置的疾速计算无奈满足要求,还能够通过剖析表达式实现更简单的计算。剖析表达式是一种更加灵便、弱小的数据计算形式,通过丰盛的函数,用户能够像Excel公式一样自由组合,实现更加弱小的剖析能力。剖析表达式基于数据模型进行业务计算,以一些定义好的函数使用正确的语法来实现某个简单的业务逻辑计算。这样能够使用户更灵便的地应用数据,最大限度的利用数据。

各位老板们,通过比照SQL和BI数据分析工具在解决同比、环比等简单计算中的差别,咱们能够发现,还是业余的工具在数据计算和解决能力上要更加便捷。当前在工作中,如果有相似的剖析计算需要,抉择BI剖析工具来解决就是再适合不过的了。