原文链接:http://tecdat.cn/?p=23882 

摘要

随机稳定率(SV)模型是罕用于股票价格建模的一系列模型。在所有的SV模型中,稳定率都被看作是一个随机的工夫序列。然而,从基本原理和参数布局的角度来看,SV模型之间仍有很大的不同。因而,为一组给定的股票价格数据抉择最合适的SV模型对于对股票市场的将来预测十分重要。为了实现这一指标,能够应用留一穿插验证(LOOCV)办法。然而,LOOCV办法的计算成本很高,因而它在实践中的利用十分无限。在对SV模型的钻研中,咱们提出了两种新的模型抉择办法,即综合宽泛实用信息准则(iWAIC)和综合重要性抽样信息准则(iIS-IC),作为近似LOOCV后果的替代品。在iWAIC和iIS-IC办法中,咱们首先计算每个观测值的冀望似然,作为绝对于相应的潜变量(以后的对数稳定参数)的积分。因为观测值与相应的潜变量高度相干,每个第 t 个观测值(y obs t)的综合似然值冀望靠近于以 y obs t 为保持数据的模型所计算的 y obs t 的冀望似然值。其次,在计算信息规范时,综合冀望似然被用作冀望似然的代替。因为绝对于潜变量的整合在很大水平上缩小了模型对相应观测值的偏差,因而整合后的信息规范无望靠近LOOCV后果。为了评估iWAIC和iIS-IC的性能,咱们首先应用模仿数据集进行了实证钻研。该钻研结果表明,iIS-IC办法比传统的IS-IC有更好的性能,但iWAIC的性能并不优于非综合WAIC办法。随后,利用股票市场收益数据进行了进一步的实证钻研。依据模型的抉择后果,对于给定的数据,最好的模型是具备两个独立自回归过程的SV模型,或者是具备非零预期收益的SV模型。

绪论

1.1 随机稳定率模型

随机稳定率(SV)模型被宽泛用于股票价格的建模,Taylor(1982)和 Hull 和 White(1987)在期刊上发表的论文中对此进行了形容。在根本的随机稳定率模型中,均值修改后的每日间断复利收益yt能够被建模为具备随机稳定率的正态分布。与指数加权挪动平均数(EWMA)模型和狭义自回归条件异方差(GARCH)模型不同,对数稳定率在 SV 模型中被视为马尔可夫过程。

作为马尔可夫过程的后果,对数稳定率自身成为一个随机过程。因而,SV 模型不须要像其余一些模型(即 Black 和 Scholes (1973)提出的驰名的 Black-Scholes 模型)那样假如恒定稳定率或固定稳定率过程。因为稳定率的确会随着工夫的推移而变动,因而假如稳定率不变是许多非 SV 模型的次要缺点,特地是当时间跨度较长时。因而,在对股票价格和其余一些具备变动的稳定率的衍生品进行建模时,SV 模型往往是一个很好的抉择。

除了根本模型外,许多扩大的SV模型也被用于股票价格建模的目标,如Harvey等人(1994);Shephard(1996);Gallant和Tauchen(1996);Chernov等人(2003)发表的论文中所述。

在这篇论文中,对八个不同的模型进行了测试和比拟,用于股票价格的建模。每个测试的模型都是根本的SV模型或其变体。

为了应用马尔科夫链蒙特卡洛办法从SV模型参数的后验散布中取样,咱们须要晓得一个与后验散布成正比的函数。为了实现这一指标,钻研中应用了贝叶斯推断法。依据贝叶斯规定,给定模型参数()的先验散布和一组观测数据D,模型参数的后验散布与模型参数的后验似然函数f(D|)()和模型参数先验散布的乘积成正比。

随机稳定率模型和模型拟合过程

2.1 随机稳定率模型

公司股票的价格是由实体产生将来现金流的能力决定的,同时也受到股票供求关系的影响。如果咱们对某只股票进行投资,那么在一段时间内对该股票的投资利润就称为该股票的收益率。在实践中,股票的收益率与股票的波动性密切相关。如果yt是间断复利的收益率,那么二者之间的关系能够用以下公式来模仿。

股价稳定率是掂量标的资产价格变动(回升或降落)的预期幅度,这是股票的一个十分重要的特色。某只股票的稳定率对于预测股票自身的价格以及许多其余与股票无关的衍生品是至关重要的。例如,依据驰名的布莱克-斯科尔斯模型,当标的股票的隐含稳定率较高时,某只股票的欧洲看涨期权(具备雷同的执行价格和到期日)须要更多的权利金(更有价值)(Black and Scholes, 1973)。此外,从风险管理的角度来看,股票的稳定率须要用来确定投资组合的危险值(VaR)(Giot 和 Laurent,2004)。

诸如历史模仿的传统办法可能无奈辨认稳定率的变动,狭义自回归条件异方差(GARCH)模型因而常常被用来预测将来的稳定率(Engle, 1982; Bollerslev, 1986)。例如,在 GARCH(1,1)模型中,稳定率 2 t 依照以下公式计算。

随机稳定率(SV)模型是GARCH模型在股票价格稳定率建模中的替代品(Taylor,1982;Hull和White,1987)。在 SV 模型中,稳定率被认为是一个随机过程。通过容许过程中的随机性,SV模型在实践上有更多的益处。在这项钻研中,咱们测试了几个自回归随机稳定率(AR-SV)模型,这是一个风行的SV模型的子类别。在根本的AR-SV模型中,稳定率的对数,ht=log(t),被建模为一个随机的自回归过程。

这也能够写成

鉴于对数稳定率,每日股票收益率yt能够被建模为

模型1

这个模型是咱们之前提到的根本 AR-SV 模型。调整对数稳定率过程的状态方程为:

和日收益率的察看方程方程为

模型2

模型 2 是根本 SV 模型的一个变种。在这个模型中,对数稳定率的状态方程与根本的 AR-SV 模型雷同,然而每日收益率的平均值 

yt是(非零)而不是零:

模型3

在这个模型中,对数稳定率ht遵循一个AR(2)过程

这个方程最适宜用来模仿具备较低自相关性的滞后-1 对数稳定率过程。依据 Yule-Walker 方程(Cheng, 2005),对于这个 AR(2)过程中的任何 ht,滞后-1 本身相干(ht 和 ht-1 之间的相关性)是 ht-1 的系数,也就是 。另一方面,滞后n自相干(ht和ht-n之间的相关性)由 n + n-1给出。因而,该模型表明以后的对数稳定率与它的滞后-1 对数稳定率的相关性较小,但与所有其余的滞后对数稳定率的相关性较大。

模型4

该模型由两个独立的AR(1)过程组成,如Harvey等人所述。

在这个模型中,对数稳定率 ht 由 µ + h (1) t + h (2) t 给出,h (1) t 和 h (2) t 是两个独立的 AR(1) 过程。

模型5

模型5容许ut和vt+1之间存在相关性,这导致yt的不对称效应。这种ut和vt+1之间的相关性早已被Black(1976)以及Engle和Ng(1993)所留神。在 Engle 和 Ng(1993)之前实现的一项钻研中,发现收益冲击对稳定率有肯定的影响。因而,假如二者之间存在关联性是正当的。在模型 5 中,该相关性由以下协方差矩阵形容。

因而,SV模型方程和ht的状态方程能够写成

模型6

在这个模型中,察看方程中蕴含了一个跳跃成分(察看值的额定随机向上或向下静止)。此外,yt也受到其滞后观测值yt-1的影响。

一般来说,这个模型表明以后的收益率yt是由以后的价格稳定率、随机跳跃的产生和之前的察看值yt-1决定的。

模型7

与模型6相似,模型7也包含跳跃成分,但不包含后面的察看。

模型7中所有参数的散布都与模型6中的参数雷同。

• 模型8

为了失去这个模型,察看方程中的高斯察看误差被自由度为的学生t散布所取代。

因为误差是对称的和非正态的,依据Andrews和Mallows(1974)的观点,能够应用正态分布的比例混合进行模型拟合。

2.2 拟合SV模型的贝叶斯推断和马尔科夫链蒙特卡洛抽样法

因为似然函数的非剖析模式,将经典的统计推断,如最大似然预计,利用于SV模型是相当艰难的。为了克服这个问题,人们提出了几种代替办法。例如,在Harvey等人(1994)提出的准最大似然法中,通过将log(yt)的散布视为正态分布,失去了理论似然函数的近似值。而后,这个近似函数(准最大似然函数)被最大化,而不是理论似然函数。

在另一种被称无效矩量法(EMM)的办法中,准似然函数的导数被用作狭义矩法(GMM)的矩条件。而后通过最小化矩条件的准则来计算EMM预计的参数。通过应用这个矩条件,而不是长期抉择一些低阶矩,EMM办法被认为是更无效的(Andersen等人,1999)。

在咱们的钻研中,咱们对SV模型采纳了贝叶斯推断法。依据贝叶斯规定,给定模型参数(,h)的先验散布和观测数据y obs,模型参数的后验散布能够示意为。

为了将模型拟合给定的数据集,咱们应用马尔科夫链蒙特卡洛(MCMC)办法从每个模型的参数的后验散布中取样。在MCMC过程中,模型参数是依据马尔科夫链进行抽样的。马尔科夫链是一个随机过程,在一个给定的状态空间中进行状态转换。给定一个无限的状态空间,当链足够长时,马尔科夫链必然会达到一个稳固状态(不变散布)(Gilks,2005)。

比拟随机模型的统计办法

在钻研股票市场数据和预测将来趋势时,模型的抉择十分重要。通过应用正确的模型,能够更好地了解和解释数据的属性,从而能够做出更好的预测和预计。而在实践中应用谬误的模型,则可能导致本可防止的意外损失。

传统的办法,包含均匀平方误差(MSE)和决定系数(R2),只掂量数据与模型的拟合水平。因为在一个模型中减少额定的参数通常会减少拟合度,这些办法往往有利于简单的模型,可能会适度拟合数据。为了克服适度拟合的问题,引入了穿插验证办法。穿插验证办法包含将数据集划分为两个子集,用一个子集拟合模型,用另一个子集测试模型。只管穿插验证法仿佛可能齐全解决适度拟合的问题,但这些办法耗时且老本高。另外,许多办法对模型的复杂性进行了惩办。

实证后果

4.1 仿真钻研

在咱们的第一个钻研中,通过应用一组模仿数据集来测试模型抉择规范的性能。首先,咱们从模型6生成了一个数据集,数据的实在模型是模型6。这个数据生成过程被反复了100次,生成了100个数据集。其次,每个模仿数据集都被独自拟合到列出的所有候选SV模型中。最初,应用模型抉择规范,包含DIC、nWAIC、nIS、iWAIC和iIS,来为模仿数据集抉择最佳模型。

在第一步,通过将模型6中的参数设置为一些特定的值来模仿数据集。在咱们的特定状况下,用于数据生成的参数是:µ = -10, = 0.96, = 0.345, = 0.1, = 0.08, = 0.03。每个模仿数据集是一个有2000个观测值的工夫序列。

一旦生成了数据集,咱们随后将候选的SV模型与数据进行拟合。为了拟合这些模型,咱们应用了马尔科夫链蒙特卡洛(MCMC)办法,从每个模型的参数后验中取样。许多MCMC算法曾经被提出来对模型参数进行抽样,如Metropolis-Hastings算法和Gibbs采样。基于这些MCMC算法,开发了许多采样软件包,包含WinBUGS、OpenBUGS和JAGS(Lunn等人,2000;Spiegelhalter等人,2007;Plummer,2003)。然而,因为这些软件包次要是基于Metropolis-Hastings算法,它们可能会因为算法中应用的随机游走法提出新的状态而呈现收敛迟缓的问题。为了克服这个问题,开发了stan包(Carpenter等人,2015;Gelman等人,2015)。在stan中,通过利用Hamilton Monte Carlo和no-U-turn采样,收敛速度能够快得多(Carpenter等人,2015)。因而,咱们决定在SV模型的特定钻研中应用stan采样器。

在应用stan采样器对模型参数的后验散布进行采样之前,咱们须要先对参数进行先验散布。对于本钻研中的所有SV模型,的先验散布是正态的,均值为-10,标准差为5。此外, 2的先验散布为反Gamma(2.5, 0.025)(Kim et al., 1998),对于所有的候选模型,的先验散布都是在0和1之间均匀分布。对于模型2,参数∼N(0,10)的先验,所有其余参数的先验与根本SV模型雷同。模型3中的先验散布与根本SV模型中的先验散布雷同(在0和1之间均匀分布)。在模型4中,参数2的先验散布与根本SV模型中的雷同。对于模型5,的先验散布在-1和1之间,均值为0,这给了相干参数一个非信息性的先验散布。模型6中的参数掂量了以后观测对先前观测的影响水平,该参数个别被认为是小的。因而,咱们对这个参数施加了∼N(0,0.2)的信息性先验。同样在模型6中,掂量察看中产生跳跃(yt的额定向上或向下静止,可能产生也可能不产生)的概率的参数被赋予Beta(2, 100)先验(Chib等人,2002)。另一方面,跳跃大小参数st的先验散布为ln(1+st)∼N(- 2/2, 2),咱们假设log()的先验散布为log()∼N(-3.07, 0.149)(Chib et al., 2002)。在模型8中,参数在[2, 128]上有一个均匀分布作为其先验(Chib等人,2002)。

一旦模型参数的先验值被设定,Stan采样器读取模仿观测值(来自模型6),随后对候选模型进行拟合。为了确保马尔科夫链的收敛,每个独自的马尔科夫链的采样迭代次数被设定为20,000次。因为链可能须要一段时间来收敛,所以前10,000个样本被放弃。为了缩小相邻样本之间的自相干,最初的样本只蕴含其余10,000个样本中的每10个样本。此外,为了确保马尔科夫链的收敛性,对每个模仿数据集同时运行两个独立的链。两条链在同一组数据上的比拟证实了马尔科夫链在MCMC抽样的前10,000个样本之前就曾经收敛了。R是对跨链变异与链内变异的绝对测量,靠近1.0的值表明收敛性良好(Gelman等人,2011)。在咱们的钻研中,咱们为每个后验散布(基于给定模型的数据集)运行两个独自的马尔可夫链,如果马尔可夫链的确收敛,那么在收敛点之后,同一数据集的两个链应该体现出相似的模式。R值大于1表明收敛不欠缺,R值越大,收敛就越差。拟合模型(应用模仿数据)的参数R值大多十分靠近1,表明这些模型的马尔科夫链的确收敛了。

不过,一个例外是模型4中的(R=53.8731)、(R=2.8202)、2(R=59.9186)和2(R=2.9484)参数。这些大的R值表明,马尔科夫链在这个模型中收敛得并不好。然而,在这种非凡状况下,这个问题并不是一个大问题。在模型4中,咱们有两个独立的AR(1)过程,它们具备雷同的公式格局。因而,该模型蕴含两个模式。如果一个模式蕴含h (1) t, , , h (2) t, 2, 2和所有其余参数,那么另一个模式是通过放弃所有其余参数不变而用h (2) t, , 的值齐全替换来造成的。因而,模型4的R的高值是由两个链收敛到两个不同的模式引起的(见图4.2的例子)。因为这两个模式彼此相距较远,任何现有的采样器都很难在这个特定的状况下摸索参数空间。因为收敛到不同的模式会放弃h(1)t+h(2)t的散布不变,而yt的散布只取决于h(1)t和h(2)t的总和,所以整个模型对yt的预测是不受影响的。

表4.2中列出了拟合参数的值及其标准偏差。表中的结果显示,模型参数的期望值根本合乎数据生成参数的轮廓,这表明拟合成果良好。

############################################ ##上面的R代码从模型6生成100组模仿数据。## ##数据集生成就会存储在以后文件夹中。############################################ y --- 模仿数据集。for (ifold in 1:100){s <- lss <- y<- h <- qq <- rep (0, T)h\[1\] <- rnorm (1, mu + phi * (h0 - mu), tau)for (t in 1:T) {lss\[t\] <- rnorm(1, -(delta^2)/2,delta^2); s\[t\] <- exp (lss\[t\] ) -1}##模型############################################ 上面的R代码用rstan语言定义了模型1。fit <- stan(model_code = model1, data = list(y = y, T = T), iter = 20000,chains = 2, thin = 10)

每个跟踪图中的两条链来自于基于模型6和同一组数据的两条独自模仿的马尔可夫链。跨链方差与预烧期后的链内方差相比绝对较小,表明马尔科夫链的收敛性良好。

############################################ 上面的R代码用rstan语言定义了模型4。##########################################model4 <-'int<lower=1> T。}real<lower=0,upper=1> phi1。real<lower=0,upper=1> phi2。real<lower=0.0001> tausq;real<lower=0.0001> tau2sq;}real<lower=0> tau。real<lower=0> tau2。tau <- sqrt(tausq);tau2 <- sqrt(tau2sq);}mu ~ normal(-10,5);h1\[t\] ~ normal(phi1*h1\[t-1\], tau);h2\[t\] ~ normal(phi2*h2\[t-1\], tau2)。############################################ 上面的R代码应用HMC对给定的数据集进行模型拟合办法。## ###从每组测试数据中产生两个独立的马尔科夫链。##########################################fit <- stan(model_code = model4, data = list(y = y, T = T), iter = 20000,

当两个马尔科夫链收敛到不同模式时,模型4中和2的跟踪图实例。轨迹图中的和2来自基于模型4和同一组数据的两个独自模仿的马尔科夫链。与链内方差相比,跨链方差很大,这是因为两个链收敛到两个不同的模式。

当stan采样器实现模型参数的采样后,应用DIC、WAIC、IS、iWAIC和iIS规范来进行模型抉择。为了计算iIS和iWAIC的综合似然,咱们在每次迭代中对每个工夫点t抽样100个ht。这个随机抽样过程是依据计算出的ht |,h-t的散布实现的(详见第三章)。当失去f(ht |,h-t)的样本后,能够计算出相应的log f(y obs t |,h-t)。为了计算这个综合似然,咱们将f(ht |,h-t)的样本插入y obs t的概率函数中,一次一个,以计算每个迭代中每个工夫点的y obs t的总共100个对数比例的概率。最初,100个y obs t的对数似然性的平均值将提供一个现实的综合对数似然性log f(y obs t |,h-t)的良好预计。然而,对于模型5来说,f(ht |,h-t)的样本不能轻易地从一个明确的散布中取得,综合对数似然的近似值是通过数字正交的办法计算的。

4.2 标普100指数数据的实证钻研

除了模仿钻研,咱们还应用了一组真实世界的股市数据(2010年9月至2015年8月的标普100股票指数数据)来拟合SV模型。规范普尔100指数包含100只股票,这些股票简直占股票市场市值的45%。这个股票子集在资本市场上施展着重要作用,是掂量金融市场整体实力的一个良好指标。因而,找到一个适合的办法来模仿规范普尔100指数数据是十分重要的。

在这项钻研中,咱们应用了2010年9月至2015年8月(1,258个交易日)标普100指数(从雅虎财经导出)的均值校对、间断复利的每日收益。总的来说,如图4.3所示,这一时期的收益率回升,被认为是2008年股市上涨后的 "复苏期"。然而,因为经济情况和货币政策的频繁变动,股票市场的稳定率在不同期间有很大的不同。因而,将SV模型利用于股票市场数据是有意义的。

实在数据钻研中的模型拟合过程与咱们之前对模仿数据的钻研雷同。rstan软件包被用来用股票市场数据拟合模型参数。马尔科夫链的总迭代次数为20,000次,预烧期为10,000次。也就是说,前10,000个样本被抛弃了。对于剩下的10,000个样本,咱们只保留每10个样本,以缩小自圆其说。对每个模型中的数据集运行了两条平行的马尔科夫链,R后果(详见表4.5)显示,马尔科夫链在预烧期后收敛了。模型参数的R值个别都靠近于1,表明马尔可夫链收敛成果良好。

所有的拟合参数都列在模型参数表中,如表4.6所示。从该表提供的后果能够看出,有些模型参数的绝对值十分小,而方差却很大,阐明这些参数与0没有显著区别。如果是这样,相应的模型可能不是给定数据的好抉择。

当咱们从MCMC抽样过程中失去模型参数样本后,别离利用DIC、nWAIC、iWAIC、nWAIC、nIS和iIS办法对模型进行抉择(详见模仿钻研)。表4.7列出的结果显示,除了iWAIC办法外,其余五种模型抉择规范都抉择了模型4作为给定股市指数数据的最佳模型。此外,DIC、nWAIC、nIS和iIS办法在模型的好坏排序上也提供了十分类似的后果。然而,nWAIC办法抉择了模型8作为最佳模型。同样对于nWAIC办法,其余的排名后果也与其余的模型抉择规范十分不同。

论断和探讨

总之,依据模仿数据钻研,HMC办法在模型参数的后验散布中取样是胜利的。在测试的模型抉择办法中,DIC办法的成果相当好。DIC办法的良好体现可能是因为在大多数拟合的模型中,参数通常遵循多变量正态分布。此外,nIS也相当统一,这表明重要性加权是纠正乐观偏差的无效办法。此外,iIS 的结果显示,与以后对数稳定率 ht 相干的积分是进一步解决偏差问题的好办法。因而,iIS 办法可能比 nIS 办法有所改进。然而,综合办法可能并不总是一个好的抉择,因为它的计算成本很高。最初,在所有测试的办法中,nWAIC和iWAIC的性能都是最差的,这使得它们的实践根底值得狐疑。依据这项钻研,咱们能够晓得这两种WAIC办法可能无奈通过其公式精确地量化模型复杂性。

此外,对实在股市收益数据(2010年9月至2015年8月的标普100指数)的钻研表明,依据模型抉择规范,最佳模型是模型4,这表明数据序列遵循ARMA过程。然而,因为所有的抉择规范都对模型4有强烈的偏好,即便实在的模型不是模型4,抉择这个模型作为最佳模型可能是一个谬误。因而,次好的模型,模型2(非零预期收益模型),也是实在模型的良好候选。

在咱们的钻研中,咱们应用马尔科夫链蒙特卡洛办法来拟合咱们的随机稳定率模型,并随后应用五个不同的模型抉择规范(DIC,nWAIC,nIS,iWAIC,iIS)来评估模型。为了测验模型拟合算法的可靠性和模型抉择办法的一致性,在应用任何实在数据之前,对模仿数据集做了初步钻研。在模仿钻研中,总共有100个数据集是由模型6独自生成的,参数如下:µ = -10, = 0.96, = 0.345, = 0.1, = 0.08, = 0.03。通过数据生成过程,咱们既晓得实在的模型,也晓得模型参数的实在值。因而,咱们可能评估模型拟合办法的优劣,以及模型抉择规范的一致性。

参考文献

Alder, B. J. and Wainwright, T. (1959), “Studies in molecular dynamics. I. General method,” The Journal of Chemical Physics, 31, 459–466.

Andersen, H. C. (1980), “Molecular dynamics simulations at constant pressure and/or temperature,” The Journal of Chemical Physics, 72, 2384–2393.

Andersen, T. G., Chung, H.-J., and Sørensen, B. E. (1999), “Efficient method of moments estimation of a stochastic volatility model: A Monte Carlo study,” Journal of Econometrics, 91, 61–87.

Andrews, D. F. and Mallows, C. L. (1974), “Scale mixtures of normal distributions,” Journal of the Royal Statistical Society. Series B (Methodological), 36, 99–102.


 

最受欢迎的见解

1.HAR-RV-J与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频稳定率

2.WinBUGS对多元随机稳定率模型:贝叶斯预计与模型比拟

3.稳定率的实现:ARCH模型与HAR-RV模型

4.R语言ARMA-EGARCH模型、集成预测算法对SPX理论稳定率进行预测

5.应用R语言随机稳定模型SV解决工夫序列中的随机稳定率

6.R语言多元COPULA GARCH 模型工夫序列预测

7.R语言基于ARMA-GARCH过程的VAR拟合和预测

8.R语言随机搜寻变量抉择SSVS预计贝叶斯向量自回归(BVAR)模型

9.R语言对S&P500股票指数进行ARIMA + GARCH交易策略