乐趣区

关于算法:R语言极值推断广义帕累托分布GPD使用极大似然估计轮廓似然估计Delta法

原文链接:http://tecdat.cn/?p=22566 

本文是极其值推断的内容。咱们在狭义帕累托散布上应用最大似然办法。

  • 极大似然预计

在参数模型的背景下,规范技术是思考似然的最大值(或对数似然)。思考到一些技术性假如,如 的某个邻域,那么

其中 示意费雪信息矩阵。在此思考一些样本,来自狭义帕累托散布,参数为,因而 

如果咱们解决极大似然的一阶条件,咱们失去一个满足以下条件的预计

这种渐进正态性的概念如下:如果样本的实在散布是一个具备参数 的 GPD,那么,如果 n 足够大,就会有一个联结正态分布。因而,如果咱们产生大量的样本(足够大,例如 200 个观测值),那么预计的散点图应该与高斯分布的散点图雷同。

> for(s in 1:1000){+ param\[s,\]=gpd(x,0)$par.ests


> image(x,y,z)

失去一个 3D 的示意

> persp(x,y,t(z)
+ xlab="xi",ylab="sigma")

有了 200 个观测值,如果真正的根底散布是 GPD,那么,联结散布 是正态的。

  • Delta德尔塔法

另一个重要的属性是德尔塔法。这个想法是,如果是渐进正态,足够平滑,那么也是渐进高斯的。

从这个属性中,咱们能够失去 (这是极值模型中应用的另一个参数化)的正态性,或者在任何四分位数 上。咱们运行一些模仿,再一次查看联结正态性。

> for(s in 1:1000)
+ gpd(x,0)$par.ests
+ q=sha * (.01^(-xih) - 1)/xih
+ tvar=q+(sha + xih * q)/(1 - xih)
dmnorm(cbind(vx,vy),m,S)
> image(x,y,t(z)

正如咱们所看到的,在样本大小为 200 的状况下,咱们不能应用这个渐进式的后果:看起来咱们没有足够的数据。然而,如果咱们在 n =5000 运行同样的代码,

   

``````
> n=5000

咱们失去 的联结正态性。这就是咱们能够从这个后果中失去的 delta- 办法。

  • 轮廓似然(Profile Likelihood)

另一个乏味的办法是 Profile 似然函数的概念。因为尾部指数 在这里是辅助参数。
这能够用来推导出置信区间。在 GPD 的状况下,对于每个,咱们必须找到一个最优的。咱们计算Profile 似然函数,即。而咱们能够计算出这个轮廓似然的最大值。一般来说,这个两阶段的优化与(全局)最大似然是不等价的,计算结果如下

+  profilelikelihood=function(beta){+  -loglik(XI,beta) }
+  L\[i\]=-optim(par=1,fn=profilelik)$value }

如果咱们想计算轮廓似然的最大值(而不是像以前那样只计算网格上的轮廓似然的值),咱们应用

+  profile=function(beta){+  -loglikelihood(XI,beta) }
(OPT=optimize(f=PL,interval=c(0,3)))

咱们失去后果和最大似然预计的 类似。咱们能够用这种办法来计算置信区间,在图表上将其可视化

> line(h=-up-qchisq(p=.95,df=1)
>  I=which(L>=-up-qchisq(p=.95,df=1))
>  lines(XIV\[I\]

竖线是参数95% 置信区间的上限和下限。


最受欢迎的见解

1. R 语言 POT 超阈值模型和极值实践剖析

2. R 语言极值实践 EVT:基于 GPD 模型的火灾损失散布剖析

3. R 语言有极值(EVT)依赖构造的马尔可夫链 (MC) 对洪水极值剖析

4. R 语言回归中的 hosmer-lemeshow 拟合优度测验

5.matlab 实现 MCMC 的马尔可夫切换 ARMA – GARCH 模型预计

6. R 语言区间数据回归剖析

7. R 语言 WALD 测验 VS 似然比测验

8.python 用线性回归预测股票价格

9. R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

退出移动版