关于算法:统计科学之时间序列预测下

39次阅读

共计 1327 个字符,预计需要花费 4 分钟才能阅读完成。

后面两篇给大家介绍了几种对工夫序列间接的预测办法,这一篇给大家讲讲如何对工夫序列进行合成,并依据合成法对数据进行预测。

要对一个指标进行预测,首先得晓得影响这个指标的因素都有哪些。如果,当初领导让你预估下个月的销量状况,这个时候你会从哪些角度进行思考呢?也就是什么因素会影响下个月的销量呢?

失常状况下,第一个须要思考的因素就是往年比今年整体销量的增长状况是什么样子的,咱们把这个因素称为长期趋势;第二个因素呢就是下个月是一年中的旺季还是淡季,个别业务都是会有淡旺季之分的,咱们把这个因素称为节令因素;与淡旺季相相似还有一个因素是循环因素,淡旺季是针对一年内的数据而言的,而循环因素是针对不同年份之间的,比方股市的熊市和牛市周期;后面这三个都是已知的一些因素,理论中总是会有一些其余咱们所不晓得的因素,然而又的确影响着指标的理论状况的,咱们把这种因素称为不规则因素。

综上,一个工夫序列能够分为:长期趋势 (T)、节令因素(S)、循环因素(C)、不规则因素(I) 四局部。

那么咱们应该如何把这四个因素组合起来呢?有两种组合形式:

加法模型:Y = T + S + C + I
乘法模型:Y = T * S * C * I

如果各个因素之间对 Y 值的影响是互相独立的,那么就用加法模型,反之则须要应用乘法模型。

接下来咱们看一下这几个因素别离如何求取:

1. 首先咱们能够通过挪动均匀的办法求出 TC 值,即长期趋势和循环因素两局部;
2. 对 TC 值利用方程 (线性、二次项、指数、对数、多项式等) 进行拟合,失去的拟合值就是 T;
3. 利用 TC 值除 T 值就可失去循环重量 C 值;
4. 用序列值 Y 除 TC 值,即可失去 SI,即节令因素 + 不规则因素
5. 求取过来几年雷同节令的平均数,再计算全季总平均数,而后用各节令平均数去除全季总平均数,失去的值就是各节令指数,须要保障各节令指数之和等于 4,如果不为 4,则须要调整。最初用 SI 值除 S 值即可失去 I 值。

在理论利用中下面的几个因素不肯定同时存在,须要依据理论状况来进行判断。

以上是对于工夫序列各因素的一个拆解,接下来给大家一个举个例子:

下表为 2015 年 -2019 年各个季度的 GDP 值,这是一个残缺的工夫序列,咱们接下来就看下如何拆解这个工夫序列中的各个因素。

先来画个趋势图,看看整体趋势状况:

先进行第一步,求取挪动平均值,因为咱们的数据有严格的季节性,所以选取 4 期挪动均匀,对于挪动均匀的办法在后面讲过,这里就不反复了。

第二步依据求进去的挪动平均值,拟合回归方程,因为看趋势像线性趋势,所以间接抉择线性方程进行拟合,后果如下:

第三步利用 Y 值除挪动均匀 TC 值即可失去 SI 值。

第四步求取节令因素 S 值,咱们先对节令因素做个图:

能够看到每年的第一季度到第四季度都是稳定上升,接下来求取下具体的节令因素大小,其实就是每个节令的在全年中的一个占比状况。

第五步用 SI 值除 S 值,即可失去 I 值。

最初整体的后果如下:

咱们并对 2020 年各个季度的 GDP 做了一个预测,即下图中红线局部,每个季度的预测值等于该季度对应的 TSC,因为每个值对应的 I 不雷同,所以就没放进来,当然也能够对不同季度的 I 值取均值放进来。

以上就是对于工夫序列预测的下局部。为了了解更加粗浅,大家肯定要本人跟着过程计算一遍。

正文完
 0