关于数据挖掘:R语言基于ARCH模型股价波动率建模分析附代码数据

28次阅读

共计 3245 个字符,预计需要花费 9 分钟才能阅读完成。

原文链接: http://tecdat.cn/?p=3856

原文出处:拓端数据部落公众号

 
最近咱们被客户要求撰写对于 ARCH 的钻研报告,包含一些图形和统计输入。

引言

金融中一个重要度量是与资产相干的危险,而资产稳定率是最罕用的危险度量。然而,资产稳定率的类型有多种。稳定率不能间接观测的性质在稳定率钻研和建模中有十分重要的含意。

数据选取

笔者选取 1973 年 1 月到 2009 年 12 月,英特尔公司(INTC)股票的每月收盘价数据,同时也收集同期的 S\&P 指数数据,前六个数据样本如下所列:

## date intc sp

## 1 19730131 0.010050 -0.017111

## 2 19730228 -0.139303 -0.037490

## 3 19730330 0.069364 -0.001433

## 4 19730430 0.086486 -0.040800

## 5 19730531 -0.104478 -0.018884

## 6 19730629 0.133333 -0.006575

模型剖析

①模型的构造

用 rtrt 示意某项资产在 tt 时刻的对数收益率。稳定率钻研的根本思维是,序列 rtrt 是前后不相干的或低阶前后相干的,然而序列不是独立的。作为阐明,思考 Intel 公司股票从 1973 年 1 月到 2009 年 12 月的月对数收益率,共有 444 个察看值,下图给出了该对数收益率的时序图。

收益率序列看起来是安稳且随机的。接下来,咱们给出其样本自相干函数(ACF), 同时也作出对数收益率的绝对值序列|rt||rt|的样本自相干函数。

对数收益率序列的 ACF 显示除了在滞后为 7 和 14 时有较小相关性之外,没有显著的序列前后相关性,并且序列 rtrt 的 Ljung-Box 统计量表明 18.6760744, 相应的p值为 0.0966514. 而对数收益率的绝对值序列|rt||rt|显示具备序列相关性,并且序列|rt||rt|的 Ljung-Box 统计量表明 124.9064353, 相应的p值靠近于 0。因而,Intel 公司股票月对数收益率序列是前后不相干的,但不是独立的。咱们用 ARCH 模型去刻画收益率序列的这种不独立性。

为了把稳定率模型放在一个适当的框架中,思考给定 Ft−1Ft−1 时 rtrt 的条件均值和条件方差,即:

μt=E(rt|Ft−1),σ2t=Var(rt|Ft−1)=E[(rt−μt)2|Ft−1]μt=E(rt|Ft−1),σt2=Var(rt|Ft−1)=E[(rt−μt)2|Ft−1]

其中,Ft−1Ft−1 是在 t−1t−1 时刻已知的信息集。样本公司的股票收益率序列 rtrt 即便有前后相关性也很弱。咱们假设 rtrt 遵从简略的 ARMA(p,q)模型,Ljung-Box 统计量表明 Intel 股票的月对数收益率序列没有序列相关性。咱们对对数收益率序列进行单样本测验, 确认序列 rtrt 的均值显著不等于0.

## $statistic

## t

## 2.37881

##

## $p.value

## [1] 0.01779151

更具体地说,测验 H0:μ= 0 和 Ha:μ≠0H0:μ= 0 和 Ha:μ≠0 的t比为 2.3788,p 值为 0.01779. 因而,对 Intel 公司股票的对数收益率,有 rt=μt+εtrt=μt+εt,其中 μt=μμt= μ 为常数。

②ARCH 效应的测验

对于 Intel 公司股票的月对数收益率序列,均值方程仅仅由一个常数形成。

记 εt=rt−μtεt=rt−μt 为均值方程的残差。平方序列 ε2tεt2 能够用来测验条件异方差性,即 ARCH 效应,咱们采纳 Mcleod 和 Li(1983)提出的将 Ljung-Box 统计量QQ(m)Q(m)利用于序列 ε2tεt2,该测验统计量的原假如是序列 ε2tεt2 前m个距离的 ACF 值都为0.

ε2t=α0+α1ε2t−1+⋅⋅⋅+αmε2t−m+et,t=m+1,⋅⋅⋅,Tεt2=α0+α1εt−12+···+αmεt−m2+et,t=m+1,···,T

ε2tεt2 的 Ljung-Box 统计量 Q(12)Q(12)=92.938884,其p值靠近于0, 因而表明有很强的 ARCH 效应。也能够用 Engle 的拉格朗日乘子法(m=12),archTest 测验结果显示,F 的值为 4.978, 相应的 p 值靠近于 0,进一步表明 Intel 公司股票对数收益率有很强的 ARCH 效应。

③ARCH 模型的建设

ARCH 模型的根本思维是:1)资产收益率的扰动序列 εtεt 是前后不相干的,但不是独立的;2)εtεt 的不独立性能够用其滞后值的简略二次函数来表述。ARCH(m)模型假设

εt=σtϵt,σ2t=α0+α1ε2t−1+⋅⋅⋅+αmε2t−mεt=σtϵt,σt2=α0+α1εt−12+···+αmεt−m2

,其中 ϵtϵt 是均值为0、方差为1的独立同散布 (iid) 随机变量序列,且 α0>0α0>0, 对 i >0i>0 有 αi≥0αi≥0. 系数 αiαi 必须满足一些正则性条件以保障 εtεt 的无条件方差是无限的。咱们假设 ϵtϵt 遵从规范正态分布。

上图给出了均值调整对数收益率的平方序列的样本 ACF 和 PACF. 从 PACF 图中,咱们能够看出在距离为1、2、3和11上有显著的相关性。为了放弃模型简略,咱们对稳定率建设一个 ARCH(3)模型。相应的,为 Intel 公司股票的月对数收益率建设一个如下模型:

rt=μ+εt,εt=σtϵt,σ2t=α0+α1ε2t−1+α2ε2t−2+α3ε2t−3rt=μ+εt,εt=σtϵt,σt2=α0+α1εt−12+α2εt−22+α3εt−32

假设 ϵtϵt 是独立同散布的规范正态序列。

咱们失去的拟合模型为:rt=0.0126+εt,σ2t=0.0104+0.2329ε2t−1+0.0751ε2t−2+0.0520ε2t−3rt=0.0126+εt,σt2=0.0104+0.2329εt−12+0.0751εt−22+0.0520εt−32 并且,各个参数估计值的标准误差别离是 0.0055、0.0012、0.115、0.0473 和 0.0451, 统计报告见附录。

可见,α2α2 和 α3α3 的估计值在 5% 的程度下不是统计显著的。咱们去掉两个不显著参数,简化模型为 ARCH(1) , 从新得出如下拟合模型 rt=0.0131+εt,σ2t=0.0110+0.3750ε2t−1rt=0.0131+εt,σt2=0.0110+0.3750εt−12 其中,各个参数估计值的标准误差别离是 0.0053、0.0021 和 0.1126, 并且所以预计都是高度显著的,统计报告见附录。

④ARCH 模型的思考

咱们对于 Intel 公司股票稳定率建设的上述模型是不是就能充沛地形容给定数据的条件异方差性了呢?

以下,咱们对残差进行标准化解决,失去序列 {εt^εt^},{εt^εt^} 的样本 ACF 和样本 PACF 图如下所示:

PACF 图表明在标准化残差的平方序列的高阶距离上依然有序列相关性。{εt^εt^}的 Ljung-Box 统计量为 Q(10)=16.58Q(10)=16.58,p=0.08p=0.08;Q(20)=38.81Q(20)=38.81,p=0.007p=0.007. 因而,如果只是关注低阶的模型,那么在5%程度下,以上所求的 ARCH(1)模型就能充沛地形容给定数据的条件异方差。


最受欢迎的见解

1.HAR-RV- J 与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频稳定率

2. R 语言中基于混合数据抽样 (MIDAS) 回归的 HAR-RV 模型预测 GDP 增长

3.稳定率的实现:ARCH 模型与 HAR-RV 模型

4. R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测

5.GARCH(1,1),MA 以及历史模拟法的 VaR 比拟

6. R 语言多元 COPULA GARCH 模型工夫序列预测

7. R 语言基于 ARMA-GARCH 过程的 VAR 拟合和预测

8.matlab 预测 ARMA-GARCH 条件均值和方差模型

9. R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略

 

正文完
 0