关于数据挖掘:极值理论-EVTPOT超阈值GARCH-模型分析股票指数VaR条件CVaR多元化投资组合预测风险测度分析附代码数据

38次阅读

共计 7515 个字符，预计需要花费 19 分钟才能阅读完成。

最近咱们被客户要求撰写对于极值实践的钻研报告，包含一些图形和统计输入。

本文用 R 编程语言极值实践 (EVT) 以确定 10 只股票指数的危险价值（和条件 VaR）

应用 Anderson-Darling 测验对 10 只股票的组合数据进行正态性测验，并应用 Block Maxima 和 Peak-Over-Threshold 的 EVT 办法预计 VaR/CvaR。最初，应用条件异向性 (GARCH) 解决的狭义自回归来预测将来 20 天后指数的将来值。本文将确定计算危险因素的不同办法对模型后果的影响。

极值实践（最后由 Fisher、Tippett 和 Gnedenko 提出）表明，独立同散布（iid）变量样本的分块最大值的散布会收敛到三个极值散布之一。

最近，统计学家对极其值建模的趣味又有了新的变动。极限值剖析已被证实在各种危险因素的案例中很有用。在 1999 年至 2008 年的金融市场动荡之后，极值剖析取得了有效性，与之前的危险价值剖析不同。极限值代表一个零碎的极其稳定。极限值剖析提供了对极其事件的概率、规模和爱护老本的关系进行建模的能力。

https://arxiv.org/pdf/1310.32…
https://www.ma.utexas.edu/mp_…
http://evt2013.weebly.com/upl…
Risk Measurement in Commodities Markets Using Conditional Extreme Value Theory

为了开始剖析，工作目录被设置为蕴含股票行情的文件夹。而后，装置所需的 R 编程语言包并蕴含在包库中。R 包包含极值实践函数、VaR 函数、工夫序列剖析、定量交易剖析、回归剖析、绘图和 html 格局的包。

library(ggplot2)
library(tseries)
library(vars)
library(evd)
library(POT)
library(rugarch)

用于此剖析的第一个文件是“Data_CSV.csv”。该文件蕴含在 DAX 证券交易所上市的 15 家公司的股票代码数据，以及 DAX 交易所的市场投资组合数据。从这个数据文件中选出了 10 家公司，这些公司最近十年的股价信息是从谷歌财经下载的。

股票价格数据下载并读入 R 编程环境。收益率是用“开盘价 / 收盘价”计算的，十家公司的数据合并在一个数据框中，（每家公司一列）。

后果数据帧的每一行代表记录股价的 10 年中的一个工作日。而后计算数据帧中每一行的均值。一列 10 年的日期被附加到数据框。还创立了仅蕴含行均值和日期信息的第二个数据框。

alDat <- cbind(retursDaa, returnDta_A,
                 retrnsata_Ss, reunsataDB,
                 retunsDta_H, reurnsDta_S, rtunsDaaA,
                 retrnsaa_senus,reursDtaAlnz,
                 reurnsData_ailer)

创立一个数据框统计表，其中蕴含每列（或公司）的最小值、中值、平均值、最大值、标准偏差、1% 分位数、5% 分位数、95% 分位数、99% 分位数。分位数百分比实用于极值。还创立了所有收益率均值的工夫序列图表。

  taeSs<- c(min(x), medan(x), man(x),
                    max(x), sd(x), quntile(x, .01),
                    quanile(x, .05), qunile(x, .95),
                    quatile(x, .99), lngth(x))

第 2b 节 – 10 只股票指数的 VaR 预计

all_va.2 <- VAR(lDvarts, p = 2, tpe= "cnst")

# 预测将来 125 天、250 天和 500 天
aDFva100 <- pdc(alDva.c, n.aea = 100, ci = 0.9)

为了开始估算数据所隐含的将来事件，咱们进行了初步的危险值估算。首先，所有行的平均值和日期信息的数据框架被转换为工夫序列格局，而后从这个工夫序列中计算出危险值。依据 VaR 计算对将来 100 天和 500 天的价值进行预测。在随后的预测图中，蓝色圆圈代表将来 100 天的数值，红色圆圈代表 500 天的回报值。

plot（ap0$t$Tme[1:1200],
     alF_ar.d.$fst[1:1200]）

为便于比拟，计算了 10 只股票指数数据的条件危险值（CvaR 或预计亏损）。首先，利用数据的工夫序列，找到最差的 0.95% 的跌幅的最大值。而后，通过 “ 高斯 “ 办法计算出预计亏损，这两种计算的后果都以表格模式出现。

ES(s(lD1:2528, 2, rp=FAE]),p=0.95, mho="gausn")

因为假如 10 股指数数据为重尾散布，数据极少变动，所以采纳 Hill Estimation 对尾指数进行参数估计。目标是验证 10 只股票数据是否为极值散布。Hill Estimation 生成的图证实了。

hil(orvtis, otio="x", trt=15, nd=45)

点击题目查阅往期内容

R 语言 POT 超阈值模型和极值实践 EVT 剖析

左右滑动查看更多

01

02

03

04

Anderson-Darling 测验次要用于散布族，是散布非正态性的决定因素。在样本量较大的状况下（如在 10 股指数中），小于 0.05 的 P 值表明散布与正态性不同。这是极值散布的预期。应用 Anderson-Darling 测验发现的概率值为 3.7^-24，因而证实了非正态性。

最初，给出了 10 个股票指数将来价值的预计后果表。3 个 VaR 估计值（和预计差额）的点估计值和范畴被制成表格以比拟。

VaRES[3,] <- c("ES", etFbl[1], 4)
                        eSFbe[2], estFtbl[3],
                        rond(eSab[4], 4))

极值实践中的 Block Maxima 办法是 EVT 剖析的最根本办法。Block Maxima 包含将观察期划分为雷同大小的不重叠的期间，并将注意力限度在每个期间的最大察看值上。创立的察看遵循吸引条件的域，近似于极值散布。而后将极值散布的参数统计办法利用于这些察看。

极值理论家开发了狭义极值散布。GEV 蕴含一系列间断概率分布，即 Gumbel、Frechet 和 Weibull 散布（也称为 I、II 和 III 型极值散布）。

在以下 EVT Block Maxima 剖析中，10 股指数数据拟合 GEV。绘制失去的散布。创立工夫序列图以定位时间轴上的极其事件，从 2006 年到 2016 年。而后创立四个按 Block Maxima 数据顺序排列的图。最初，依据 gev() 函数创立 Block Maxima 剖析参数表。

gev(ltMeans, x=0.8, m=0)


plt(alVF)

为了从 Block Maxima 数据中创立危险价值 (VaR) 预计，将 10 股指数 GEV 数据转换为工夫序列。VaR 预计是依据 GEV 工夫序列数据进行的。将来值的预测（将来 100 天和 500 天）是从 VaR 数据推断进去的。在后果图中，蓝色圆圈示意将来 100 天的值，红色圆圈示意 500 天的收益率值。

# 预测将来 500 天
aGE500<- preit(aG_va.c, n.ad = 500, ci = 0.9)

plot(aGE500pd.500)

10 只股票指数 GEV 数据的条件危险值（”CvaR “ 或 “ 冀望损失 ”）被计算。首先，利用数据的工夫序列，找到最差的 0.95% 的缩水的最大值。而后，通过极其散布的 “ 修改 “ 办法来计算 “ 预计亏损 ”，这两种计算的后果都以表格模式出现。

# 条件缩减是最差的 0.95% 缩减的平均值
ddGV <- xdrow(aEVts[,2])
# CvaR（预期亏损）估计值
CvaR(ts(alE), p=0.95, meho="miie")

希尔预计（用于尾部指数的参数估计）验证 10 只股票的 GEV 数据是极值散布。

Anderson-Darling 测验是确定大样本数量散布的非正态性的无力决定因素。如果 P 值小于 0.05，则散布与正态性不同。通过该测试发现了一个渺小的概率值 3.7^-24。

最初，给出了对 10 股指数 GEV 将来价值的预计后果表。3 个 GEV VaR 估计值（和 GEV 冀望损失）的点估计值和范畴制成表格比拟。

G_t[3,] <- c("GEV ES",sFale[1],
                     sStble[2], SEble[3],
                     "NA")
GRst

通过将 Block Maxima GEV 散布（10 只股票的指数）拟合到 GARCH(1,1)（狭义自回归条件异型）模型，对 Block Maxima EVT 数据进行预测。显示预测公式参数表。创立一个“自相干函数”(ACF) 图，显示随工夫变动的重要事件。而后，显示拟合模型后果的一组图。创立对将来 20 天（股票指数体现）的预测。最初，20 天的预测显示在 2 个图中。

spec(aanc.ol = list(mel = 'eGARCH',
                                        garer= c(1, 1)),
                  dirion = 'sd')

# 用狭义自回归条件异质性拟合模型
alimol = ugct(pec,allV, sovr = 'ybi')

cofale <- dtafe(cof(litol))
oeBal

plt(l.itodl)

在 EVT 中的峰值超过阈值办法中，抉择超过某个高阈值的初始观测值。这些选定观测值的概率分布近似为狭义帕累托散布。通过拟合狭义帕累托散布来创立最大似然预计 (mle)。MLE 统计数据以表格模式出现。而后通过 MLE 绘图以图形形式诊断所得估计值。

plot(Dseans, u.rg=c(0.3, 0.35))

POT 数据的危险价值 (VaR) 预计是通过将 10 个股票指数 MLE 数据转换为工夫序列来创立的。VaR 预计是依据 MLE 工夫序列数据进行的。将来值的预测（将来 100 天和 500 天）是从 MLE VaR 数据推断进去的。在后果图中，蓝色圆圈示意将来 100 天的值，红色圆圈示意 500 天的收益值。

VAR(merts, p = 2, tp = "cost")

# 预测将来 125 天、250 天和 500 天
mle_r.pd <- prect(e.ar, n.ahad = 100, ci = 0.9)


plot(mea.prd)

而后计算 10 只股票指数 MLE 数据的条件危险值（”CvaR “ 或 “ 冀望损失 ES”）。数据的工夫序列被用来寻找最差的 0.95% 的跌幅的最大值。通过极其散布的 “ 修改 “ 办法，计算出 “ 冀望损失 ES”，两种计算的后果都以表格模式出现。

# 最差的 0.95% 最大回撤的平均值
mdM <- maxdadw(mlvs[,2])

CvaR(ldaa), p=0.95, meto="mdii",
               pimeod = "comnen", weghts)

Hill 预计（用于尾部指数的参数估计）验证 10 只股票的 MLE 数据是一个极值散布。

Anderson-Darling 测验是确定大样本数量散布的非正态性的无力决定因素。如果 P 值小于 0.05，则散布与正态性不同。此测试的后果 P 值为 3.7^-24。

最初，给出了 10 个股票指数 MLE 将来价值的预计后果表。3 个 MLE VaR 估计值（和 MLE 冀望损失 ES）的点估计值和范畴被制成表格来比拟。

通过将 MLE（10 只股票指数的最大似然预计）拟合到 GARCH(1,1)（狭义自回归条件异型性）模型，对峰值超过阈值 EVT 数据进行预测。显示预测公式参数表。创立了一个“自相干函数”（ACF）图，显示了随工夫变动的重要事件。而后，显示拟合模型后果的一组图。而后创立对接下来 20 天（股票指数体现）的预测。最初，20 天的预测（来自峰值超过阈值 EVT extimation）显示在 2 个图中。

fit(ec,ta, slvr = 'hybrid')



plot(pot.fite.ol)

下表汇总了测验极值散布的 10 个股票的四种办法的后果。第一列蕴含四种预计办法的名称。提供了 VaR、ES、mu 统计量和 Anderson-Darling P 值的统计量。

c("VaR",
                     round(mean(cofets),4),
                     "NA", "NA", p.vau)
c("Block Maxm", round(mean(coffies),4),
                     MES, pr.ss[3],.vle)

c("POT", 
                     round(mean(cofies), 4),
                     MES, fitdaes, p.ale)

在对 10 家公司（在证券交易所上市）10 年的股票收益率进行查看后，证实了将收益率变动定性为极值散布的有效性。对四种分析方法的拟合值进行的所有安德森 - 达林测试显示，散布具备正态性或所有非极值的概率不大。这些办法在收益数据的危险值方面是统一的。分块最大值办法产生了一个危险值预计的偏差。传统的 VaR 预计和 POT 预计产生雷同的危险值。绝对于传统的股票收益率数据的 CvaR 预计，两种 EVT 办法预测的冀望损失较低。规范 Q - Q 图表明，在 10 只股票的指数中，Peaks-Over-Threshold 是最牢靠的预计办法。

本文摘选《 R 语言极值实践 EVT、POT 超阈值、GARCH 模型剖析股票指数 VaR、条件 CVaR：多元化投资组合预测危险测度剖析 》，点击“ 浏览原文”获取全文残缺材料。

点击题目查阅往期内容

Garch 稳定率预测的区制转移交易策略
金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言危险价值：ARIMA，GARCH，Delta-normal 法滚动预计 VaR（Value at Risk）和回测剖析股票数据
R 语言 GARCH 建模罕用软件包比拟、拟合规范普尔 SP 500 指数稳定率工夫序列和预测可视化
Python 金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
MATLAB 用 GARCH 模型对股票市场收益率工夫序列稳定的拟合与预测 R 语言 GARCH-DCC 模型和 DCC（MVT）建模预计
Python 用 ARIMA、GARCH 模型预测剖析股票市场收益率工夫序列
R 语言中的工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言 ARIMA-GARCH 稳定率模型预测股票市场苹果公司日收益率工夫序列
Python 应用 GARCH，EGARCH，GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
R 语言工夫序列 GARCH 模型剖析股市稳定率
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
Python 应用 GARCH，EGARCH，GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
应用 R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略
R 语言用多元 ARMA,GARCH ,EWMA, ETS, 随机稳定率 SV 模型对金融工夫序列数据建模
R 语言股票市场指数：ARMA-GARCH 模型和对数收益率数据探索性剖析
R 语言多元 Copula GARCH 模型工夫序列预测
R 语言应用多元 AR-GARCH 模型掂量市场危险
R 语言中的工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言用 Garch 模型和回归模型对股票价格剖析
GARCH（1,1），MA 以及历史模拟法的 VaR 比拟
matlab 预计 arma garch 条件均值和方差模型 R 语言 POT 超阈值模型和极值实践 EVT 剖析
R 语言极值推断：狭义帕累托散布 GPD 应用极大似然预计、轮廓似然预计、Delta 法
R 语言极值实践 EVT：基于 GPD 模型的火灾损失散布剖析
R 语言有极值（EVT）依赖构造的马尔可夫链 (MC) 对洪水极值剖析
R 语言 POT 超阈值模型和极值实践 EVT 剖析
R 语言混合正态分布极大似然预计和 EM 算法
R 语言多项式线性模型：最大似然预计二次曲线
R 语言 Wald 测验 vs 似然比测验
R 语言 GARCH-DCC 模型和 DCC（MVT）建模预计
R 语言非参数办法：应用核回归平滑预计和 K -NN(K 近邻算法)分类预测心脏病数据
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
R 语言基于 Bootstrap 的线性回归预测置信区间预计办法
R 语言随机搜寻变量抉择 SSVS 预计贝叶斯向量自回归（BVAR）模型
Matlab 马尔可夫链蒙特卡罗法（MCMC）预计随机稳定率（SV，Stochastic Volatility）模型
Matlab 马尔可夫区制转换动静回归模型预计 GDP 增长率 R 语言极值推断：狭义帕累托散布 GPD 应用极大似然预计、轮廓似然预计、Delta 法

正文完

数据挖掘

发表至：数据挖掘

2023-01-18

0

关于数据挖掘:专题智能财务背景下财务人才能力框架和培养路径研究报告PDF合集分享附原数据表

关于数据挖掘:专题2022年中国跨境电商行业研究报告PDF合集分享附原数据表

关于数据挖掘:R语言随机波动模型SV马尔可夫蒙特卡罗法MCMC正则化广义矩估计和准最大似然估计上证指数收益时间序列附代码数据

关于数据挖掘:2022年母婴行业内容营销研究报告PDF分享附原数据表

关于数据挖掘:R语言股市可视化相关矩阵最小生成树附代码数据

关于数据挖掘:极值理论-EVTPOT超阈值GARCH-模型分析股票指数VaR条件CVaR多元化投资组合预测风险测度分析附代码数据

全文链接：http://tecdat.cn/?p=24182

参考

第 1a 节 – 工作目录、所需的包和会话信息

第 1b 节 – 格式化专有数据

第 1c 节 – 下载股票代码数据

第 2a 节 – 探索性数据分析

第 2c 节 – 预计冀望_shortfall_(ES), 条件 VAR_(_CvaR_)_ 10 股票指数

第 2d 节 – 10 只股票指数的希尔 Hill 预计

第 2e 节 – 正态分布的 Anderson-Darling 测验

第 2f 节 – 后果表

第 3a 节 – 10 个股票指数的 EVT 分块最大值预计

第 3b 节 – 分块最大值的 VaR 预测

第 3c 节 – 分块最大值的冀望损失 ES (CvaR)

第 3d 节 – 分块极大值的 Hill 预计

第 3e 节 – 正态分布的 Anderson-Darling 测验

第 3f 节 – 后果表

第 3g 节 – 分块极大值的 100 天 GARCH 预测

第 4a 节 – 峰值超过阈值预计 – 10 个股票指数

第 4b 节 – POT 的 VaR 预测

第 4c 节 – POT 的冀望损失 ES (CvaR) 预测

第 4d 节 – 峰值超过阈值的 Hill 预计

第 4e 节 – 正态分布的 Anderson-Darling 测验

第 4f 节 – 后果表

第 4g 节 – 峰值超过阈值的 100 天 GARCH 预测

第 5a 节 – 预计办法影响表

第 5b 节 – 论断

Just My Socks（注册教程内含优惠码）

关于数据挖掘:极值理论-EVTPOT超阈值GARCH-模型分析股票指数VaR条件CVaR多元化投资组合预测风险测度分析附代码数据

全文链接：http://tecdat.cn/?p=24182

参考

第 1a 节 – 工作目录、所需的包和会话信息

第 1b 节 – 格式化专有数据

第 1c 节 – 下载股票代码数据

第 2a 节 – 探索性数据分析

第 2c 节 – 预计冀望_shortfall_(ES), 条件 VAR_(_CvaR_)_ 10 股票指数

第 2d 节 – 10 只股票指数的希尔 Hill 预计

第 2e 节 – 正态分布的 Anderson-Darling 测验

第 2f 节 – 后果表

第 3a 节 – 10 个股票指数的 EVT 分块最大值预计

第 3b 节 – 分块最大值的 VaR 预测

第 3c 节 – 分块最大值的冀望损失 ES (CvaR)

第 3d 节 – 分块极大值的 Hill 预计

第 3e 节 – 正态分布的 Anderson-Darling 测验

第 3f 节 – 后果表

第 3g 节 – 分块极大值的 100 天 GARCH 预测

第 4a 节 – 峰值超过阈值预计 – 10 个股票指数

第 4b 节 – POT 的 VaR 预测

第 4c 节 – POT 的冀望损失 ES (CvaR) 预测

第 4d 节 – 峰值超过阈值的 Hill 预计

第 4e 节 – 正态分布的 Anderson-Darling 测验

第 4f 节 – 后果表

第 4g 节 – 峰值超过阈值的 100 天 GARCH 预测

第 5a 节 – 预计办法影响表

第 5b 节 – 论断

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）