关于数据挖掘:R语言分析股市相关结构用回归估计股票尾部相关性相依性依赖性

43次阅读

共计 3998 个字符,预计需要花费 10 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=25860 

最近咱们被客户要求撰写对于股票尾部相关性的钻研报告,包含一些图形和统计输入。

什么是尾部相关性?

假如市场呈现了属于最差 5% 的日子的回撤(缩减):

有人能够问,鉴于市场处于蓝色区域,特定股票上涨的概率是多少?

咱们都理解股票绝对于市场的贝塔系数、股票绝对于市场的敏感性(例如规范普尔 500 指数)的概念。尾部相关性的概念相似,因为它是股票对市场回撤的敏感性。如果每次市场上涨,股票上涨,那将意味着两件事:

  1. 鉴于市场曾经上涨,股票上涨的概率是 100%。
  2. 股票对市场上涨十分敏感

直观地认为,这样的办法会与高 beta 值相伴而行。但这并不是一对一的。很有可能的是,与另一只低 beta 的股票相比,高 beta 的股票对上涨的敏感度较低。

模式上,股票左尾对市场左尾的相关性定义为:

(1)  \vert market < Q_{market} (p)), \end{equation*}”)

其中 Q 是分位数,这取决于您如何定义尾部,在咱们的示例中为 5%。从概率来看,如果两个事件是独立的,那么看到这两个事件的概率是每个事件概率的乘积:

(2)  = Pr(A) \times Pr(b) \end{方程 *}”)

其中 A 是事件:, B 是事件。依据教训,咱们所做的预计只是简略地计算位于股票 5% 临界值以下的点数,对于位于市场 5% 以下的每个点。这个函数应用这个概念来掂量两个工夫序列之间的尾部相关性:

# cc 参数定义了尾部。默认为 5%。co<- function{

# 如果两个序列不在同一长度上,则进行。if(length!=length(sb)){stop}

TT <- length(



# 计算有多少是低于 5% 的

ind0 <- ifelse
ind <- which

# 鉴于序列 a 低于 5%(意味着有缩减),计算序列 b 中有多少个

ind1 <- sum(ifelse(reb<quantile,1,0))

# 计算概率

p0 <- id1/TT # 两者都放弃的概率

让咱们拉出 10 只 ETF,看看 beta 与尾部相关性度量有何不同。咱们拉动股票代码并转换为每周收益。

sym 
l=length
end
dat0 = (getSymbols
n = NROW

w0 <- NULL

for (i in 1:l){

dat0 = getSymbols
w1 <- weeklyReturn
w0 <- cbind
}

当初咱们计算 beta 和尾部相关性度量,并绘制它。

pr <- bet <- NULL

for(i in 1:(l-1)){bet[i] <- lm
pr[i] <- cortr
}

barplot

蓝线是,这是咱们对两个齐全(尾部)独立序列的冀望。


点击题目查阅往期内容

R 语言实现 Copula 算法建模相依性案例剖析报告

左右滑动查看更多

01

02

03

04

用简略的计量经济学对尾部相关性建模,能够思考应用回归设置。应用无截距回归同样能够达到第二张图表的底部面板:

(3) 

其中,是事件 A 产生时股票呈现回撤的指标函数。看一看:

fiquan <- quantile
indl <- ifelse
betdpe <- NULL

for(i in 1:(l-1)){

fivuan <- quantile
indk <- ifelse
betence[i] <- lm$coef[1]

}

因而,咱们能够应用咱们对回归的理解并将剖析扩大到多变量案例,而不是应用艰难的多维 copula 和收敛问题。在不仅有 B 的缩减,而且有 C 和 D 的缩减的状况下,咱们看到 A 的缩减有多大可能。

有余和瞻望

  • 咱们能够进行推断,但不应用回归系数的通常 STD,因为它是指标回归.
  • 咱们还必须包含交互项,以使推理无效。
  • 咱们用更新的回归办法来改良预计;套索 lasso、bagging 等

最初,我想晓得 XLU(公用事业)ETF 的状况如何,为什么尾部相关性绝对于 beta 而言看起来很弱,以及与 XLY 相比,状况有何不同。

plot
lines(lowess, lwd = 2, col = 4)

咱们的预计对一些极其察看很敏感。兴许持重的回归会提供更稳固的预计,因而这是另一个可能的扩大。


本文摘选 R 语言剖析股市相干构造:用回归估计股票尾部相关性(相依性、依赖性) ,点击“浏览原文”获取全文残缺材料。


点击题目查阅往期内容

样条曲线分段线性回归模型 piecewise regression 预计个股 beta 值剖析收益率数据
【视频】CNN(卷积神经网络)模型以及 R 语言实现回归数据分析
用膨胀预计股票 beta 系数回归剖析 Microsoft 收益率危险
对用电负荷工夫序列数据进行 K -medoids 聚类建模和 GAM 回归
多项式 Logistic 逻辑回归进行多类别分类和穿插验证准确度箱线图可视化
R 语言分段线性回归剖析预测车辆的制动间隔
R 语言分段回归数据数据分析案例报告
R 语言 stan 进行基于贝叶斯推断的回归模型
R 语言时变面板平滑转换回归模型 TV-PSTR 剖析债权程度对投资的影响
R 语言线性回归和工夫序列剖析北京房价影响因素可视化案例
R 语言惩办 logistic 逻辑回归(LASSO, 岭回归)高维变量抉择的分类模型案例
R 语言用规范最小二乘 OLS,狭义相加模型 GAM,样条函数进行逻辑回归 LOGISTIC 分类
R 语言实现 CNN(卷积神经网络)模型进行回归数据分析
R 语言中实现狭义相加模型 GAM 和一般最小二乘 (OLS) 回归
R 语言中应用非凸惩办函数回归 (SCAD、MCP) 剖析前列腺数据
【视频】R 语言实现 CNN(卷积神经网络)模型进行回归数据分析
R 语言 ISLR 工资数据进行多项式回归和样条回归剖析
R 语言中的多项式回归、部分回归、核平滑和平滑样条回归模型
R 语言随机搜寻变量抉择 SSVS 预计贝叶斯向量自回归(BVAR)模型
R 语言如何和何时应用 glmnet 岭回归逻辑回归、随机森林、SVM 反对向量机预测心脏病危险数据和模型诊断可视化
高维数据惩办回归办法:主成分回归 PCR、岭回归、lasso、弹性网络 elastic net 剖析基因数据分类回归决策树交互式修剪和更好看地可视化剖析细胞图像宰割数据集
实现狭义相加模型 GAM 和一般最小二乘 (OLS) 回归
贝叶斯线性回归和多元线性回归构建工资预测模型
Python 反对向量回归 SVR 拟合、预测回归数据和可视化准确性查看实例
逻辑回归 (对数几率回归,Logistic) 剖析研究生录取数据实例
狭义线性模型 glm 泊松回归的 lasso、弹性网络分类预测学生考试成绩数据和穿插验证
非线性回归 nls 摸索剖析河流阶段性流量数据和评级曲线、流量预测可视化
特征选择办法——最佳子集回归、逐步回归
线性回归和工夫序列剖析北京房价影响因素可视化案例
贝叶斯分位数回归、lasso 和自适应 lasso 贝叶斯分位数回归剖析免疫球蛋白、前列腺癌数据
用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化
PYTHON 用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯和 KMEANS 聚类用户画像
PYTHON 集成机器学习:用 ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜寻超参数优化
R 语言集成模型:晋升树 boosting、随机森林、束缚最小二乘法加权均匀模型交融剖析工夫序列数据
Python 对商店数据进行 lstm 和 xgboost 销售量工夫序列建模预测剖析
R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化
R 语言基于树的办法:决策树,随机森林,Bagging,加强树
R 语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
spss modeler 用决策树神经网络预测 ST 的股票
R 语言中应用线性模型、回归决策树主动组合特色因子程度
R 语言中自编基尼系数的 CART 回归决策树的实现
R 语言用 rle,svm 和 rpart 决策树进行工夫序列预测
python 在 Scikit-learn 中用决策树和随机森林预测 NBA 获胜者
python 中应用 scikit-learn 和 pandas 决策树进行 iris 鸢尾花数据分类建模和穿插验证
R 语言里的非线性模型:多项式回归、部分样条、平滑样条、狭义相加模型 GAM 剖析
R 语言用规范最小二乘 OLS,狭义相加模型 GAM,样条函数进行逻辑回归 LOGISTIC 分类
R 语言 ISLR 工资数据进行多项式回归和样条回归剖析
R 语言中的多项式回归、部分回归、核平滑和平滑样条回归模型
R 语言用泊松 Poisson 回归、GAM 样条曲线模型预测骑自行车者的数量
R 语言分位数回归、GAM 样条曲线、指数平滑和 SARIMA 对电力负荷工夫序列预测 R 语言样条曲线、决策树、Adaboost、梯度晋升 (GBM) 算法进行回归、分类和动静可视化
如何用 R 语言在机器学习中建设集成模型?
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测在 python 深度学习 Keras 中计算神经网络集成模型 R 语言 ARIMA 集成模型预测工夫序列剖析 R 语言基于 Bagging 分类的逻辑回归 (Logistic Regression)、决策树、森林剖析心脏病患者
R 语言基于树的办法:决策树,随机森林,Bagging,加强树
R 语言基于 Bootstrap 的线性回归预测置信区间预计办法
R 语言应用 bootstrap 和增量法计算狭义线性模型(GLM)预测置信区间
R 语言样条曲线、决策树、Adaboost、梯度晋升(GBM) 算法进行回归、分类和动静可视化
Python 对商店数据进行 lstm 和 xgboost 销售量工夫序列建模预测剖析
R 语言随机森林 RandomForest、逻辑回归 Logisitc 预测心脏病数据和可视化剖析
R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化
Matlab 建设 SVM,KNN 和奢侈贝叶斯模型分类绘制 ROC 曲线
matlab 应用分位数随机森林(QRF)回归树检测异样值

正文完
 0