关于数据挖掘:R语言用CPV模型的房地产信贷信用风险的度量和预测附代码数据

47次阅读

共计 3432 个字符,预计需要花费 9 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=30401

最近咱们被客户要求撰写对于 CPV 模型的钻研报告,包含一些图形和统计输入。

本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测。咱们被客户要求撰写对于 CPV 模型的钻研报告

结果表明, 该模型在度量和预测房地产信贷守约率方面具备较好的成果。

CPV 模型的基本原理和框架

CPV 模型是一个用于剖析贷款组合危险和收益的多因素模型, 它依据失业率、长期利率、GDP 增长率、汇率、政府收入和总储蓄率等宏观因素, 借助于经济计量工具和蒙特卡罗技术, 将每个国家不同行业中不同等级的守约概率和转移概率相分割, 进而计算出危险价值(迪迪埃、皮罗特, 2005)。

指标及样本数据抉择

当理论使用 CPV 模型时, 宏观经济因素个数必须达到 3 个以上时该模型才具备肯定的有效性 (预计有效性及预测有效性)。因而, 本文别离从国家宏观经济、房地产行业情况、房地产企业情况三个方面抉择出三个宏观经济因素指标, 使用 CPV 模型评估房地产信贷的信用风险。综合当先指标(Composite Leading Indicator)。经济合作与发展组织 (OECD) 的综合当先指标(CompositeLeading Indicator, CLI) 被认为是预测寰球经济变动趋势的良好指标, 它是指一系列疏导经济由增长至消退的循环的相干经济指标和经济变量的加权平均数, 次要用来预测整体经济的转变状况, 预测将来数月的经济发展趋势:

### 守约率再 0 到 1 之间,因而对其进行标准化

cr=(fbzdata$NA.-min(fbzdata$NA.))/(max(fbzdata$NA.)-min(fbzdata$NA.))

## 绘制工夫序列图

plot(diff(cr),type="l")

从上图能够看到数据呈现出稳固的稳定趋势,再均值四周回摆,因而差分后数列稳固。

CPV 模型

# 逻辑回归后果

 

## 滞后期的抉择

#MA(1)

ma1=arma(x=cr,order=c(0,1))
summary(ma4)# 查看相关系数,Std. Error  t value,AIC 值

滞后期的抉择依据 Akaike Information Criterion(AIC)准则确定。

依据回归结果显示 CLI、CRECI 和 ECI 的 P 值显示的数值表明该预计的有效性。从预计出的敏感系数能够看出,CLI、和 ECI 的系数 (Coefficient) 为正, CRECI 的系数 (Coefficient) 为负,并且 ECI 的系数值是 CLI 系数值的 2 倍左右所以, 当 CRECI 的值回升的时候,Y 值也回升 (守约率降落), 它们之间是反向变动。并且, 综合当先指标 ECI 绝对于其余宏观经济指标来说, 影响力度最大。

残差值剖析

plot(CPVmod$residuals,type="l")# 残差值

lines(CPVmod$fitted.values,type="l")# 拟合值

lines(cr,type="l")# 理论值

abline(h=0)# 增加 0 基准线

依据下面的模型预计后果, 能够得出 Y 的残差值、理论值和拟合值的趋势图。如图 1 所示。

依据图 1 的趋势图, 能够分明地看出, Y 的拟合值和理论值的曲线简直齐全重合, 这也阐明该模型很好地拟合了样本数据, 也跟上述结果表明的事实相符合。

另外, 残差的相关系数和偏相关系数如图 2 所示意。从图 2 能够看出, 模型的残差不存在序列自相干。


点击题目查阅往期内容

PYTHON 链家租房数据分析:岭回归、LASSO、随机森林、XGBOOST、KERAS 神经网络、KMEANS 聚类、天文可视化

左右滑动查看更多

01

02

03

04

残差自相干和偏相关剖析

acf(CPVmod$residuals)# 自相关系数

pacf(CPVmod$residuals)# 偏相关系数

BG 高阶自相关系数测验

进一步用布—戈弗雷测验 (Breusch-Godfrey, BG 测验) 来测验残差的序列自相关性的状况, 从下面的测验后果,能够看出, P 值较大, 依据 BG 高阶自相关系数测验原理, 该测验后果承受原假如, 即上述模型的残差不存在自相关性, 也进一步证实了后面的自相关系数和偏自相关系数的测验后果。

综上所述, 此模型测验达到预期要求, 较好地反映了宏观经济理论情况和各宏观经济变量之间的对应关系。

宏观经济变量的趋势


lines(fbzdata$CLI,col="red",type="l")

 

lines(fbzdata$CERCI,col="green",type="l")

守约率拟合值和理论值的比照

plot(CPVmod$fitted.values,type="l")# 拟合值

lines(cr,type="l")# 理论值

预测信贷守约率

pre=predict(ma7, 50)# 预测值

plot(unlist(pre),type="l")

仍抉择综合当先指标 (CLI), 国房景气指数(CRECI) 以及企业景气指数 (ECI) 三个宏观经济变量, 使用 CPV 模型的预计后果对将来 2 年的每个月的房地产信贷守约率进行预测,

为了直观地示意出守约率的变化趋势及其与 CLI、CREIC、ECI 三个变量之间的关系, 别离做出趋势图。从中能够看出: 在 11 月份, 尽管 ECI 回升, 然而因为 CRECI 和 CLI 降落的独特作用, 对于房地产信贷来说经济情况趋势还是降落, 因而守约率略有回升。然而从 3 月份开始, 因为宏观经济、房地产行业和企业三个层面的景气恶化, 房地产信贷守约率逐步降落。这个预测趋势后果仅作为参考, 这里次要是为了阐明模型的预测性能对于商业银行抵制信贷风险的重要意义。

点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《R 语言用 CPV 模型的房地产信贷信用风险的度量和预测》。

点击题目查阅往期内容

R 语言时变面板平滑转换回归模型 TV-PSTR 剖析债权程度对投资的影响
R 语言 Lasso 回归模型变量抉择和糖尿病倒退预测模型
数据分享 | R 语言逻辑回归、Naive Bayes 贝叶斯、决策树、随机森林算法预测心脏病
R 语言逻辑回归 logistic 模型剖析泰坦尼克 titanic 数据集预测生还状况 R 语言是否对二分连续变量执行逻辑回归
R 语言用 lme4 多层次(混合效应)狭义线性模型(GLM),逻辑回归剖析教育留级考察数据
R 语言随机森林 RandomForest、逻辑回归 Logisitc 预测心脏病数据和可视化剖析
R 语言基于 Bagging 分类的逻辑回归 (Logistic Regression)、决策树、森林剖析心脏病患者
R 语言逻辑回归(Logistic 回归)模型分类预测病人冠心病危险
R 语言用部分加权回归(Lowess) 对 logistic 逻辑回归诊断和残差剖析 R 语言用主成分 PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化
R 语言用线性模型进行臭氧预测:加权泊松回归,一般最小二乘,加权负二项式模型,多重插补缺失值 R 语言 Bootstrap 的岭回归和自适应 LASSO 回归可视化
R 语言中回归和分类模型抉择的性能指标
R 语言多元工夫序列滚动预测:ARIMA、回归、ARIMAX 模型剖析
R 语言用 lme4 多层次(混合效应)狭义线性模型(GLM),逻辑回归剖析教育留级考察数据
R 语言计量经济学:虚构变量 (哑变量) 在线性回归模型中的利用
R 语言 线性混合效应模型实战案例
R 语言混合效应逻辑回归(mixed effects logistic)模型剖析肺癌数据
R 语言如何用潜类别混合效应模型(LCMM)剖析抑郁症状
R 语言基于 copula 的贝叶斯分层混合模型的诊断准确性钻研
R 语言建设和可视化混合效应模型 mixed effect model
R 语言 LME4 混合效应模型钻研老师的受欢迎水平
R 语言 线性混合效应模型实战案例
R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)
R 语言基于 copula 的贝叶斯分层混合模型的诊断准确性钻研
R 语言如何解决线性混合模型中畸形拟合 (Singular fit) 的问题
基于 R 语言的 lmer 混合线性回归模型
R 语言用 WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型
R 语言分层线性模型案例
R 语言用 WinBUGS 软件对学术能力测验(SAT)建设分层模型
应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM
R 语言用 WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型
SPSS 中的多层(等级)线性模型 Multilevel linear models 钻研整容手术数据
用 SPSS 预计 HLM 多层(档次)线性模型模型

正文完
 0