乐趣区

关于算法:统计科学之时间序列数据上

01| 工夫序列定义:

工夫序列是依照肯定的工夫距离排列的一组数据,其工夫距离能够是任意的工夫单位,如小时、日、周月等。比方,不同时间段某产品的用户数量,以及某个在网站的用户行为,这些数据造成了以肯定工夫距离的数据。

人们心愿通过对这些工夫序列的剖析,从中发现和揭示景象倒退变动的法则 ,尽可能多地从中提取所须要的信息, 并将这些常识和信息用于预测,以把握和预测将来行为。对于工夫序列的预测,因为很难确定它与其余变量之间的关系,这时咱们就不能用回归去预测,而应应用工夫序列办法进行预测。

采纳工夫序列剖析进行预测时须要一系列的模型,这种模型称为工夫序列模型。在应用这种模型时,总是假设某一种数据变化趋势是会反复产生的

02| 工夫序列剖析的用处:

  1. 零碎形容,依据对系统进行观测失去的工夫序列数据,用曲线进行拟合,失去主观的形容;比方 2017 年 A 产品销量的工夫序列曲线是逐步上涨的一个趋势。
  2. 系统分析,当观测值取自于两个以上的变量时,可用一个工夫序列中的变动去阐明另一个工夫序列中的变动,以此来阐明两个变量随工夫的变动状况;典型的例子就是,随着时间推移,新上市产品 A 的销量逐步上涨,B 产品销量逐步下滑。
  3. 预测将来,通过对过来的工夫序列数据进行拟合,预测将来某一时间段的数据;典型的销量预测。
  4. 决策和管制,依据工夫序列模型可调整输出变量使零碎倒退过程放弃一个持续上升的状态,预测到要偏离目标值时进行及时管制;典型的拿用户生命周期来说,尽可能缩短用户的成长周期,尽可能的提早用户衰退期的到来。

03| 工夫序列的组成因素:

工夫序列的变动受多种因素的影响,咱们将泛滥影响因素依照对景象变动影响的类型,以揭示工夫序列的变动规律性,划分成如下几种因素:

  1. 趋势性,指景象随着工夫的推移朝着肯定方向呈现出持续上升、降落或安稳的变动或挪动。
  2. 周期性,指景象随着工夫序列的变动呈现出周期性的变动,就像正余弦函数那样。
  3. 不规则变动,指景象受偶尔因素的影响而呈现出不规则的稳定。

04| 工夫序列的分类:

  1. 按所钻研对象的多少分,有一元工夫序列和多元工夫序列。如果某种产品一年的销量数据数据就是一元序列;如果钻研的序列不仅仅是一个数列,而是多个变量,即一个工夫点对应多个变量时,这种序列称为多元工夫序列,比方一天中某一时刻的气温、气压和雨量。
  2. 按工夫的连续性分,可将工夫序列分为离散型工夫序列和间断工夫序列。
  3. 按序列的统计个性分,有安稳工夫序列和非安稳工夫序列,所谓安稳就是随着工夫的推移,数据并未产生大的稳定。
  4. 按序列的散布法则分,有高斯型和非高斯型工夫序列两种。

这篇只是对工夫序列做一个简略的介绍,对于工夫序列的分析方法还在钻研阶段,当前再来补上。

退出移动版