共计 2812 个字符,预计需要花费 8 分钟才能阅读完成。
在做数据分析时,咱们会常常听到同比、环比同比的概念。各个企业和组织在公布统计数据时,通常喜爱用同比、环比来和之前的历史数据进行比拟,用来阐明数据的变动状况。例如,统计局颁布 2022 年 1 月份 CPI 同比增长 0.9%,环比增长 0.6%。
理论中,在基于数据库的数据分析场景中,环比和同比是典型的简单计算场景之一,特地是在 Oracle 等商业数据库的剖析函数呈现之前。以 MySQL 为例,在 8.0 版本中才引入了 Lag 和 Lead 函数,这两个函数联合开窗函数无效的进步了同比、环比等简单运算的实现效率。在 5.x 系列版本中,MySQL 须要依赖屡次嵌套子查问和自关联能力实现此类计算。
咱们以一个简略的例子,来别离看下,MySql 5.x 和 8.0 是具体实现同比、环比计算的。
示例数据见表:
CREATE TABLE sales (` 产品 ID` varchar(20),
` 销售数量 ` int(20) ,
` 销售工夫 ` timestamp(6) NULL DEFAULT NULL
)
INSERT INTO sales VALUES ('C1001', 15, '2020-06-01 10:10:12');
INSERT INTO sales VALUES ('C1002',26, '2020-05-02 0:10:12');
INSERT INTO sales VALUES ('C1003', 21, '2020-04-03 0:10:12');
INSERT INTO sales VALUES ('C1003', 23, '2020-04-04 0:10:12');
INSERT INTO sales VALUES ('C1003', 0, '2020-03-05 0:10:12');
INSERT INTO sales VALUES ('C1001', 16, '2020-02-06 3:0:12');
INSERT INTO sales VALUES ('C1002', 32, '2020-01-07 0:10:12');
INSERT INTO sales VALUES ('C1001', 16, '2019-12-08 0:12:24');
INSERT INTO sales VALUES ('C1001', 32, '2019-06-09 0:12:24');
INSERT INTO sales VALUES ('C1002', 17, '2019-05-09 0:12:24');
1、MySQL 5.x:通过子查问和关联实现同比和占比计算
以按年月统计不同年份的销售总值,并计算环比(销售总额同比上期)、同比(销售总额同比去年同期)为例。
示例表构造和数据
通过 SQL 计算环比和同比:
select year(c. 销售工夫) yy,month(c. 销售工夫) mm,
concat(ifnull(abs(round((sum(c. 销售数量)-ss1)/ss1*100,2)),0),'%') 同比,
concat(ifnull(abs(round((sum(c. 销售数量)-ss2)/ss2*100,2)),0),'%') 环比
from sales c
left join (select month(a. 销售工夫) mm1,
year(a. 销售工夫) yy1,
sum(a. 销售数量) ss1
from sales a
GROUP BY mm1,yy1) a
on month(c. 销售工夫) = a.mm1
and a.yy1 = year(c. 销售工夫)-1
left join (select month(a. 销售工夫) mm2,
year(a. 销售工夫) yy2,
sum(a. 销售数量) ss2
from sales a
GROUP BY mm2,yy2) b
on (b.yy2 = year(c. 销售工夫) and b.mm2+1 = month(c. 销售工夫) OR (yy2=year(c. 销售工夫)-1
AND b.mm2 = 12 AND month(c. 销售工夫) = 1))
group by yy, mm
order by yy,mm asc
计算结果:
2、MySQL 8.0:通过剖析函数实现同比和占比计算 **
MySql8.0 反对了 Lead 和 Lag 剖析函数,尽管能够大幅提高同、环比计算的效率,但依然须要编写 SQL 语句解决。
2、1 计算同比
select t2. 年份,t2. 月份,concat(round((t2. 数量 -t1. 数量)/t1. 数量,2)*100,'%') as 同比 from (SELECT year( 销售工夫) as 年份,month(销售工夫) as 月份,sum(销售数量) as 数量 from sales
group by year(销售工夫),month(销售工夫) order by year(销售工夫) desc, month(销售工夫) desc
) t1
,(SELECT year( 销售工夫) as 年份,month(销售工夫) as 月份,sum(销售数量) as 数量 from sales
group by year(销售工夫),month(销售工夫) order by year(销售工夫) desc, month(销售工夫) desc
) t2 where t1. 年份 =t2. 年份 -1 and t1. 月份 =t2. 月份
2、2 计算环比
SELECT
mm,
CONCAT(
ROUND(
IFNULL((xl - first_xl) / first_xl * 100,
2
),
0
),
'%'
) AS 环比
FROM
(
SELECT
mm,
xl,
lead (xl, 1) over (ORDER BY mm DESC) AS first_xl
FROM
(
SELECT
DATE_FORMAT(销售工夫, '%Y-%m') AS mm,
sum(销售数量) AS xl
FROM
sales
GROUP BY
DATE_FORMAT(销售工夫, '%Y-%m')
) t
) a
在 SqlServer2008R2 和 Oracle10g 之后,都提供了 Lag 和 Lead 剖析函数。具体的计算逻辑和用法与上述 MySQL8.0 相似。
3、应用 BI 工具的计算引擎
针对此类简单的计算场景,商业智能 BI 数据分析工具提供了更加高效的解决方案。以 Wyn Enterprise 嵌入式商业智能软件为例,其内置的 wax 剖析表达式和疾速计算引擎,提供间接实现同比、环比等简单计算的能力,而不再须要写简单简短的 SQL。
3、1 应用内置的同比、环比疾速计算性能 **
同比、环比等计算个别是 BI 工具的规范性能,咱们能够间接通过设置实现。
3、2 应用数据分析表达式
如果内置的疾速计算无奈满足要求,还能够通过剖析表达式实现更简单的计算。剖析表达式是一种更加灵便、弱小的数据计算形式,通过丰盛的函数,用户能够像 Excel 公式一样自由组合,实现更加弱小的剖析能力。剖析表达式基于数据模型进行业务计算,以一些定义好的函数使用正确的语法来实现某个简单的业务逻辑计算。这样能够使用户更灵便的地应用数据,最大限度的利用数据。
各位老板们,通过比照 SQL 和 BI 数据分析工具在解决同比、环比等简单计算中的差别,咱们能够发现,还是业余的工具在数据计算和解决能力上要更加便捷。当前在工作中,如果有相似的剖析计算需要,抉择 BI 剖析工具来解决就是再适合不过的了。