关于算法:R语言用Copulas模型的尾部相依性分析损失赔偿费用

6次阅读

共计 3525 个字符,预计需要花费 9 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=22226 

两个随机变量之间的相依性问题备受关注, 相依性 (dependence) 是反映两个随机变量之间关联水平的一个概念。它与相关性 (correlation) 有区别,罕用的相关性度量是 Pearson 相关系数, 它只度量了两个随机变量之间的线性关系, 其值不仅依赖于它们的 Copula 函数, 而且还依赖它们的边缘散布函数。

直观地说,Copula 函数就是两个 (或多个) 随机变量的联结散布能够示意为它们的边缘散布函数的函数, 这个函数就是 Copula 函数, 它与随机变量的边缘散布没有关系, 所反映的是两个 (多个) 随机变量之间的“构造”, 这种构造蕴含了两个随机变量相依性的全副信息。

Joe(1990)尾部相依性指数

Joe(1990)提出了一个 (强) 尾部相依性指数。例如,对于下尾,能够思考

也就是

  • 高低尾 (教训) 相依 性函数

咱们的想法是绘制下面的函数。定义

下尾

对上尾来说,其中是 ,相依的生存 copula,即

其中

当初,咱们能够很容易地推导出这些函数的教训对应关系,即:

因而,对于上尾,在左边,咱们有以下图形

而对于下尾,在右边,咱们有

损失赔偿数据 

Copula 函数在经济、金融、保险等畛域有宽泛的利用. 早在 1998 年 Frees 和 Valdez(1998)钻研了索赔额与管理费之间的关系, 采纳了 Copula 函数对其进行刻画并利用于保费的定价。

对于代码,思考一些实在的数据,比方损失赔偿数据集。

损失赔偿费用数据有 1,500 个样本和 2 个变量。这两栏蕴含赔偿金付款 (损失) 和调配的损失调整费用(alae)。后者是与解决索赔相干的额定费用(如索赔考察费用和法律费用)。

咱们的想法是,在右边绘制下尾函数,在左边绘制上尾函数。

当初,咱们能够将这个图形,与一些具备雷同 Kendall’s tau 参数的 copulas 图形进行比拟

高斯 copulas

如果咱们思考高斯 copulas。

> copgauss=normalCopula(paramgauss)
> Lga=function(z) pCopula(c(z,z),copgauss)/z
> Rga=function(z) (1-2*z+pCopula(c(z,z),copgauss))/(1-z)

> lines(c(u,u+.5-u\[1\]),c(Lgs,Rgs)

Gumbelcopula

或 Gumbel 的 copula。

> copgumbel=gumbelCopula(paramgumbel, dim = 2)

> lines(c(u,u+.5-u\[1\])

置信区间

然而因为咱们没有任何置信区间,所以依然很难得出结论(即便看起来 Gumbel copula 比 Gaussian copula 更适宜)。一个策略能够是从这些 copula 曲线中生成样本,并可视化。对于高斯 copula 曲线

> nsimul=500
> for(s in 1:nsimul){+ Xs=rCopula(nrow(X),copgauss)
+ Us=rank(Xs\[,1\])/(nrow(Xs)+1)
+ Vs=rank(Xs\[,2\])/(nrow(Xs)+1)
+ lines(c(u,u+.5-u\[1\]),MGS\[s,\],col="red")

包含–逐点–90% 的置信区间

> Q95=function(x) quantile(x,.95)

> lines(c(u,u+.5-u\[1\]),V05,col="red",lwd=2)

高斯 copula 曲线  

Gumbel copula 曲线 

只管统计收敛的速度会很慢,评估底层的 copula 曲线是否具备尾部相依性简略。尤其是当 copula 曲线体现出尾部独立性的时候。比方思考一个 1000 大小的高斯 copula 样本。这是咱们生成随机计划后失去的后果。

或者咱们看一下右边的尾巴(用对数比例)

当初,思考 10000 个样本。

在这些图上,如果极限是 0,或者是某个严格的正值,是相当难以判定的(同样,当感兴趣的值处于参数的反对边界时,这是一个经典的统计问题)。所以,一个简略的想法是思考一个较弱的尾部相依指数。

===

_Ledford_ 和_Tawn(1996)_尾部相关系数

形容尾部相依性的另一种办法能够在 Ledford & Tawn(1996)中找到。假如和具备雷同的散布。当初,如果咱们假如这些变量是(严格)独立的。

但如果咱们假如这些变量是(严格的)同枯燥性的(即这里的变量是相等的,因为它们有雷同的散布),则

所以,有这样一个假如:


那么 a = 2 能够解释为独立性,而 a = 1 则示意强(完满)正相依性。因而,思考进行如下变换,失去 [0,1] 中的一个参数,其相依性强度随指数的减少而减少,例如

为了推导出尾部相依指数,假如存在一个极限,即

这将被解释为一个(弱)尾部相依指数。因而定义函数

下尾巴(在右边)

上尾(在左边)。计算这些函数的 R 代码非常简单。

> L2emp=function(z) 2*log(mean(U<=z))/

> R2emp=function(z) 2*log(mean(U>=1-z))/
+ log(mean((U>=1-z)&(V>=1-z)))-1
> plot(c(u,u+.5-u\[1\]),c(L,R),type="l",ylim=0:1,

> abline(v=.5,col="grey")

 高斯 copula 函数

同样,也能够将这些教训函数与一些参数函数进行比照,例如,从高斯 copula 函数中失去的函数(具备雷同的 Kendall’s tau)。

> copgauss=normalCopula(paramgauss)
> Lgs =function(z) 2*log(z)/log(pCopula(c(z,z),
+ copgauss))-1
> Rgas =function(z) 2\*log(1-z)/log(1-2\*z+
+ pCopula(c(z,z),copgauss))-1

> lines(c(u,u+.5-u\[1\])

Gumbel copula

> copgumbel=gumbelCopula(paramgumbel, dim = 2)
> L=function(z) 2*log(z)/log(pCopula(c(z,z),
+ copgumbel))-1
> R=function(z) 2\*log(1-z)/log(1-2\*z+
+ pCopula(c(z,z),copgumbel))-1

> lines(c(u,u+.5-u\[1\]),c(Lgl,Rgl),col="blue")

同样,咱们察看置信区间,Gumbel copula 在这里提供了一个很好的拟合

极值 copula

咱们思考 copulas 族中的极值 copulas。在双变量的状况下,极值能够写为 


其中 为 Pickands 相依函数,它是一个凸函数,满足于

察看到,在这种状况下:

其中 肯德尔系数,可写成

例如

那么,咱们就失去了 Gumbel copula。当初,咱们来看(非参数)推理,更精确地说,是相依函数的预计。最规范的预计器的出发点是察看 是否有 copula 函数 

具备散布函数

而反过来,Pickands 相依函数能够写成


因而,Pickands 函数的天然预计是

其中,是教训累积散布函数

这是 Capéràa, Fougères & Genest (1997)中提出的预计办法。在这里,咱们能够用

> Z=log(U\[,1\])/log(U\[,1\]*U\[,2\])
> h=function(t) mean(Z<=t)
> a=function(t){function(t) (H(t)-t)/(t*(1-t))
+ return(exp(integrate(f,lower=0,upper=t,
+ subdivisions=10000)$value))

> plot(c(0,u,1),c(1,A(u),1),type="l"

整合失去 Pickands 相依函数的估计值。上图中能够直观地看到上尾的相依指数。

> A(.5)/2
\[1\] 0.4055346

最受欢迎的见解

1. R 语言基于 ARMA-GARCH-VaR 模型拟合和预测实证钻研

2. r 语言实现 copula 算法建模依赖性案例

3. R 语言 COPULAS 和金融工夫序列数据 VaR 剖析

4. R 语言多元 COPULA GARCH 模型工夫序列预测

5.GARCH(1,1),MA 以及历史模拟法的 VaR 比拟

6.matlab 应用 Copula 仿真优化市场危险数据分析

7. R 语言实现向量主动回归 VAR 模型

8. R 语言随机搜寻变量抉择 SSVS 预计贝叶斯向量自回归(BVAR)模型

9. R 语言 VAR 模型的不同类型的脉冲响应剖析

正文完
 0