原文链接:http://tecdat.cn/?p=22226
两个随机变量之间的相依性问题备受关注,相依性(dependence)是反映两个随机变量之间关联水平的一个概念。它与相关性(correlation)有区别,罕用的相关性度量是Pearson相关系数,它只度量了两个随机变量之间的线性关系,其值不仅依赖于它们的Copula函数,而且还依赖它们的边缘散布函数。
直观地说,Copula函数就是两个(或多个)随机变量的联结散布能够示意为它们的边缘散布函数的函数,这个函数就是Copula函数,它与随机变量的边缘散布没有关系,所反映的是两个(多个)随机变量之间的“构造”,这种构造蕴含了两个随机变量相依性的全副信息。
Joe(1990)尾部相依性指数
Joe(1990)提出了一个(强)尾部相依性指数。例如,对于下尾,能够思考
也就是
高低尾(教训)相依性函数
咱们的想法是绘制下面的函数。定义
下尾
对上尾来说,其中是与 ,相依的生存copula ,即
其中
当初,咱们能够很容易地推导出这些函数的教训对应关系,即:
因而,对于上尾,在左边,咱们有以下图形
而对于下尾,在右边,咱们有
损失赔偿数据
Copula函数在经济、金融、保险等畛域有宽泛的利用.早在1998年Frees和Valdez(1998)钻研了索赔额与管理费之间的关系,采纳了Copula函数对其进行刻画并利用于保费的定价。
对于代码,思考一些实在的数据,比方损失赔偿数据集。
损失赔偿费用数据有1,500个样本和2个变量。这两栏蕴含赔偿金付款(损失)和调配的损失调整费用(alae)。后者是与解决索赔相干的额定费用(如索赔考察费用和法律费用)。
咱们的想法是,在右边绘制下尾函数,在左边绘制上尾函数。
当初,咱们能够将这个图形,与一些具备雷同Kendall's tau参数的copulas图形进行比拟
高斯copulas
如果咱们思考高斯copulas 。
> copgauss=normalCopula(paramgauss)> Lga=function(z) pCopula(c(z,z),copgauss)/z> Rga=function(z) (1-2*z+pCopula(c(z,z),copgauss))/(1-z)> lines(c(u,u+.5-u\[1\]),c(Lgs,Rgs)
Gumbelcopula
或Gumbel的copula。
> copgumbel=gumbelCopula(paramgumbel, dim = 2)> lines(c(u,u+.5-u\[1\])
置信区间
然而因为咱们没有任何置信区间,所以依然很难得出结论(即便看起来Gumbel copula比Gaussian copula更适宜)。一个策略能够是从这些copula曲线中生成样本,并可视化。对于高斯copula曲线
> nsimul=500> for(s in 1:nsimul){+ Xs=rCopula(nrow(X),copgauss)+ Us=rank(Xs\[,1\])/(nrow(Xs)+1)+ Vs=rank(Xs\[,2\])/(nrow(Xs)+1)+ lines(c(u,u+.5-u\[1\]),MGS\[s,\],col="red")
包含–逐点–90%的置信区间
> Q95=function(x) quantile(x,.95)> lines(c(u,u+.5-u\[1\]),V05,col="red",lwd=2)
高斯copula曲线
Gumbel copula曲线
只管统计收敛的速度会很慢,评估底层的copula 曲线是否具备尾部相依性简略。尤其是当copula 曲线体现出尾部独立性的时候。比方思考一个1000大小的高斯copula 样本。这是咱们生成随机计划后失去的后果。
或者咱们看一下右边的尾巴(用对数比例)
当初,思考10000个样本。
在这些图上,如果极限是0,或者是某个严格的正值,是相当难以判定的(同样,当感兴趣的值处于参数的反对边界时,这是一个经典的统计问题)。所以,一个简略的想法是思考一个较弱的尾部相依指数。
===
_Ledford_ 和_Tawn(1996)_尾部相关系数
形容尾部相依性的另一种办法能够在Ledford & Tawn(1996)中找到。假如和具备雷同的散布。当初,如果咱们假如这些变量是(严格)独立的。
但如果咱们假如这些变量是(严格的)同枯燥性的(即这里的变量是相等的,因为它们有雷同的散布),则
所以,有这样一个假如:
那么a=2能够解释为独立性,而a=1则示意强(完满)正相依性。因而,思考进行如下变换,失去[0,1]中的一个参数,其相依性强度随指数的减少而减少,例如
为了推导出尾部相依指数,假如存在一个极限,即
这将被解释为一个(弱)尾部相依指数。因而定义函数
下尾巴(在右边)
上尾(在左边)。计算这些函数的R代码非常简单。
> L2emp=function(z) 2*log(mean(U<=z))/> R2emp=function(z) 2*log(mean(U>=1-z))/+ log(mean((U>=1-z)&(V>=1-z)))-1> plot(c(u,u+.5-u\[1\]),c(L,R),type="l",ylim=0:1,> abline(v=.5,col="grey")
高斯copula函数
同样,也能够将这些教训函数与一些参数函数进行比照,例如,从高斯copula函数中失去的函数(具备雷同的Kendall's tau)。
> copgauss=normalCopula(paramgauss)> Lgs =function(z) 2*log(z)/log(pCopula(c(z,z),+ copgauss))-1> Rgas =function(z) 2\*log(1-z)/log(1-2\*z++ pCopula(c(z,z),copgauss))-1> lines(c(u,u+.5-u\[1\])
Gumbel copula
> copgumbel=gumbelCopula(paramgumbel, dim = 2)> L=function(z) 2*log(z)/log(pCopula(c(z,z),+ copgumbel))-1> R=function(z) 2\*log(1-z)/log(1-2\*z++ pCopula(c(z,z),copgumbel))-1> lines(c(u,u+.5-u\[1\]),c(Lgl,Rgl),col="blue")
同样,咱们察看置信区间,Gumbel copula在这里提供了一个很好的拟合
极值copula
咱们思考copulas族中的极值copulas。在双变量的状况下,极值能够写为
其中为Pickands相依函数,它是一个凸函数,满足于
察看到,在这种状况下:
其中肯德尔系数,可写成
例如
那么,咱们就失去了Gumbel copula。 当初,咱们来看(非参数)推理,更精确地说,是相依函数的预计。最规范的预计器的出发点是察看是否有copula函数
具备散布函数
而反过来,Pickands相依函数能够写成
因而,Pickands函数的天然预计是
其中,是教训累积散布函数
这是Capéràa, Fougères & Genest (1997)中提出的预计办法。在这里,咱们能够用
> Z=log(U\[,1\])/log(U\[,1\]*U\[,2\])> h=function(t) mean(Z<=t)> a=function(t){function(t) (H(t)-t)/(t*(1-t))+ return(exp(integrate(f,lower=0,upper=t,+ subdivisions=10000)$value))> plot(c(0,u,1),c(1,A(u),1),type="l"
整合失去Pickands相依函数的估计值。上图中能够直观地看到上尾的相依指数。
> A(.5)/2\[1\] 0.4055346
最受欢迎的见解
1.R语言基于ARMA-GARCH-VaR模型拟合和预测实证钻研
2.r语言实现copula算法建模依赖性案例
3.R语言COPULAS和金融工夫序列数据VaR剖析
4.R语言多元COPULA GARCH 模型工夫序列预测
5.GARCH(1,1),MA以及历史模拟法的VaR比拟
6.matlab应用Copula仿真优化市场危险数据分析
7.R语言实现向量主动回归VAR模型
8.R语言随机搜寻变量抉择SSVS预计贝叶斯向量自回归(BVAR)模型
9.R语言VAR模型的不同类型的脉冲响应剖析