关于数据挖掘:R语言用Copulas模型的尾部相依性分析损失赔偿费用

34次阅读

共计 4567 个字符,预计需要花费 12 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=22226

最近咱们被客户要求撰写对于 Copulas 的钻研报告,包含一些图形和统计输入。

两个随机变量之间的相依性问题备受关注, 相依性 (dependence) 是反映两个随机变量之间关联水平的一个概念

它与相关性 (correlation) 有区别,罕用的相关性度量是 Pearson 相关系数, 它只度量了两个随机变量之间的线性关系, 其值不仅依赖于它们的 Copula 函数, 而且还依赖它们的边缘散布函数。

直观地说,Copula 函数就是两个 (或多个) 随机变量的联结散布能够示意为它们的边缘散布函数的函数, 这个函数就是 Copula 函数, 它与随机变量的边缘散布没有关系, 所反映的是两个 (多个) 随机变量之间的“构造”, 这种构造蕴含了两个随机变量相依性的全副信息。

Joe(1990)尾部相依性指数

Joe(1990)提出了一个 (强) 尾部相依性指数。例如,对于下尾,能够思考

也就是

  • 高低尾 (教训) 相依性函数

咱们的想法是绘制下面的函数。定义

下尾

对上尾来说,其中是与,相依的生存 copula,即

其中

当初,咱们能够很容易地推导出这些函数的教训对应关系,即:

因而,对于上尾,在左边,咱们有以下图形

而对于下尾,在右边,咱们有


点击题目查阅往期内容

matlab 应用 Copula 仿真优化市场危险数据 VaR 剖析

左右滑动查看更多

01

02

03

04

损失赔偿数据 

Copula 函数在经济、金融、保险等畛域有宽泛的利用. 早在 1998 年 Frees 和 Valdez(1998)钻研了索赔额与管理费之间的关系, 采纳了 Copula 函数对其进行刻画并利用于保费的定价。

对于代码,思考一些实在的数据,比方损失赔偿数据集。

损失赔偿费用数据有 1,500 个样本和 2 个变量。这两栏蕴含赔偿金付款 (损失) 和调配的损失调整费用(alae)。后者是与解决索赔相干的额定费用(如索赔考察费用和法律费用)。

咱们的想法是,在右边绘制下尾函数,在左边绘制上尾函数。

当初,咱们能够将这个图形,与一些具备雷同 Kendall’s tau 参数的 copulas 图形进行比拟

高斯 copulas

如果咱们思考高斯 copulas。

> copgauss=normalCopula(paramgauss)
> Lga=function(z) pCopula(c(z,z),copgauss)/z
> Rga=function(z) (1-2*z+pCopula(c(z,z),copgauss))/(1-z)

> lines(c(u,u+.5-u[1]),c(Lgs,Rgs)

Gumbelcopula

或 Gumbel 的 copula。

> copgumbel=gumbelCopula(paramgumbel, dim = 2)

> lines(c(u,u+.5-u[1])

置信区间

然而因为咱们没有任何置信区间,所以依然很难得出结论(即便看起来 Gumbel copula 比 Gaussian copula 更适宜)。一个策略能够是从这些 copula 曲线中生成样本,并可视化。对于高斯 copula 曲线

> nsimul=500
> for(s in 1:nsimul){+ Xs=rCopula(nrow(X),copgauss)
+ Us=rank(Xs[,1])/(nrow(Xs)+1)
+ Vs=rank(Xs[,2])/(nrow(Xs)+1)
+ lines(c(u,u+.5-u[1]),MGS[s,],col="red")

包含–逐点–90% 的置信区间

> Q95=function(x) quantile(x,.95)

> lines(c(u,u+.5-u[1]),V05,col="red",lwd=2)

高斯 copula 曲线  

Gumbel copula 曲线 

只管统计收敛的速度会很慢,评估底层的 copula 曲线是否具备尾部相依性简略。尤其是当 copula 曲线体现出尾部独立性的时候。比方思考一个 1000 大小的高斯 copula 样本。这是咱们生成随机计划后失去的后果。

或者咱们看一下右边的尾巴(用对数比例)

当初,思考 10000 个样本。

在这些图上,如果极限是 0,或者是某个严格的正值,是相当难以判定的(同样,当感兴趣的值处于参数的反对边界时,这是一个经典的统计问题)。所以,一个简略的想法是思考一个较弱的尾部相依指数。

===

Ledford 和_Tawn(1996)_尾部相关系数

形容尾部相依性的另一种办法能够在 Ledford & Tawn(1996)中找到。假如和具备雷同的散布。当初,如果咱们假如这些变量是(严格)独立的。

但如果咱们假如这些变量是(严格的)同枯燥性的(即这里的变量是相等的,因为它们有雷同的散布),则

所以,有这样一个假如:

那么 a = 2 能够解释为独立性,而 a = 1 则示意强(完满)正相依性。因而,思考进行如下变换,失去 [0,1] 中的一个参数,其相依性强度随指数的减少而减少,例如

为了推导出尾部相依指数,假如存在一个极限,即

这将被解释为一个(弱)尾部相依指数。因而定义函数

下尾巴(在右边)

上尾(在左边)。计算这些函数的 R 代码非常简单。

> L2emp=function(z) 2*log(mean(U<=z))/

> R2emp=function(z) 2*log(mean(U>=1-z))/
+ log(mean((U>=1-z)&(V>=1-z)))-1
> plot(c(u,u+.5-u[1]),c(L,R),type="l",ylim=0:1,

> abline(v=.5,col="grey")

 高斯 copula 函数

同样,也能够将这些教训函数与一些参数函数进行比照,例如,从高斯 copula 函数中失去的函数(具备雷同的 Kendall’s tau)。

> copgauss=normalCopula(paramgauss)
> Lgs =function(z) 2*log(z)/log(pCopula(c(z,z),
+ copgauss))-1
> Rgas =function(z) 2*log(1-z)/log(1-2*z+
+ pCopula(c(z,z),copgauss))-1

> lines(c(u,u+.5-u[1])

Gumbel copula

> copgumbel=gumbelCopula(paramgumbel, dim = 2)
> L=function(z) 2*log(z)/log(pCopula(c(z,z),
+ copgumbel))-1
> R=function(z) 2*log(1-z)/log(1-2*z+
+ pCopula(c(z,z),copgumbel))-1

> lines(c(u,u+.5-u[1]),c(Lgl,Rgl),col="blue")

同样,咱们察看置信区间,Gumbel copula 在这里提供了一个很好的拟合

极值 copula

咱们思考 copulas 族中的极值 copulas。在双变量的状况下,极值能够写为 

其中为 Pickands 相依函数,它是一个凸函数,满足于

察看到,在这种状况下:

其中肯德尔系数,可写成

例如

那么,咱们就失去了 Gumbel copula。当初,咱们来看(非参数)推理,更精确地说,是相依函数的预计。最规范的预计器的出发点是察看是否有 copula 函数 

具备散布函数

而反过来,Pickands 相依函数能够写成

因而,Pickands 函数的天然预计是

其中,是教训累积散布函数

这是 Capéràa, Fougères & Genest (1997)中提出的预计办法。在这里,咱们能够用

> Z=log(U[,1])/log(U[,1]*U[,2])
> h=function(t) mean(Z<=t)
> a=function(t){function(t) (H(t)-t)/(t*(1-t))
+ return(exp(integrate(f,lower=0,upper=t,
+ subdivisions=10000)$value))

> plot(c(0,u,1),c(1,A(u),1),type="l"

整合失去 Pickands 相依函数的估计值。上图中能够直观地看到上尾的相依指数。

> A(.5)/2
[1] 0.405

点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《R 语言用 Copulas 模型的尾部相依性剖析损失赔偿费用》。

点击题目查阅往期内容

R 语言 ARMA GARCH COPULA 模型拟合股票收益率工夫序列和模仿可视化
ARMA-GARCH-COPULA 模型和金融工夫序列案例
工夫序列剖析:ARIMA GARCH 模型剖析股票价格数据
GJR-GARCH 和 GARCH 稳定率预测普尔指数工夫序列和 Mincer Zarnowitz 回归、DM 测验、JB 测验
【视频】工夫序列剖析:ARIMA-ARCH / GARCH 模型剖析股票价格
工夫序列 GARCH 模型剖析股市稳定率
PYTHON 用 GARCH、离散随机稳定率模型 DSV 模仿预计股票收益工夫序列与蒙特卡洛可视化
极值实践 EVT、POT 超阈值、GARCH 模型剖析股票指数 VaR、条件 CVaR:多元化投资组合预测危险测度剖析
Garch 稳定率预测的区制转移交易策略
金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言危险价值:ARIMA,GARCH,Delta-normal 法滚动预计 VaR(Value at Risk)和回测剖析股票数据
R 语言 GARCH 建模罕用软件包比拟、拟合规范普尔 SP 500 指数稳定率工夫序列和预测可视化
Python 金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
MATLAB 用 GARCH 模型对股票市场收益率工夫序列稳定的拟合与预测 R 语言 GARCH-DCC 模型和 DCC(MVT)建模预计
Python 用 ARIMA、GARCH 模型预测剖析股票市场收益率工夫序列
R 语言中的工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言 ARIMA-GARCH 稳定率模型预测股票市场苹果公司日收益率工夫序列
Python 应用 GARCH,EGARCH,GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
R 语言工夫序列 GARCH 模型剖析股市稳定率
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
Python 应用 GARCH,EGARCH,GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
应用 R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略
R 语言用多元 ARMA,GARCH ,EWMA, ETS, 随机稳定率 SV 模型对金融工夫序列数据建模
R 语言股票市场指数:ARMA-GARCH 模型和对数收益率数据探索性剖析
R 语言多元 Copula GARCH 模型工夫序列预测
R 语言应用多元 AR-GARCH 模型掂量市场危险
R 语言中的工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言用 Garch 模型和回归模型对股票价格剖析
GARCH(1,1),MA 以及历史模拟法的 VaR 比拟
matlab 预计 arma garch 条件均值和方差模型 R 语言 POT 超阈值模型和极值实践 EVT 剖析

正文完
 0