关于数据挖掘:R语言LeeCarter模型对年死亡率建模预测预期寿命附代码数据

33次阅读

共计 2469 个字符,预计需要花费 7 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=17347

最近咱们被客户要求撰写对于 Lee-Carter 模型的钻研报告,包含一些图形和统计输入。

昨天上午,咱们取得了分娩产妇的平均年龄两个图表,依据孩子的出世程序排序,区间是 1905-1965 年

而后是 1960-2000 年:


点击题目查阅往期内容

R 语言散布滞后非线性模型(DLNM)钻研发病率,死亡率和空气污染示例

左右滑动查看更多

01

02

03

04

 

这些图形令人兴奋,特地是在过来 30 年中察看到的增长方面,这使我想到了寿命的增长趋势。咱们能够找到其余乏味的数据(在这种状况下为 均匀 出世年龄)。


> age$Age=as.character(age$AGE)
> age$AGE=as.numeric(substr(age$Age,1,2))+
+ as.numeric(substr(age$Age,4,4))/10
> plot(age$ANNEE+.5,age$AGE,
+ type="l",lwd=2,col="blue")

咱们在下面的图中发现深蓝色的曲线,

 

获取祖母的平均年龄,咱们进一步剖析


> tail(age)
      AGE   Age NAIS.MERE NAIS.GRD.MERE age.GRD.MERE
2000  2000 30.3 30,3     1970.2       1942.87        57.63
2001  2001 30.4 30,4     1971.1       1943.80        57.70
2002  2002 30.4 30,4     1972.1       1944.92        57.58
2003  2003 30.5 30,5     1973.0       1945.95        57.55
2004  2004 30.5 30,5     1974.0       1947.05        57.45
2005  2005 30.6 30,6     1974.9       1948.04        57.46
> plot(age$ANNEE+.5,age$age.GRD.MERE,
+ type="l",lwd=2,col="red")

再一次,咱们能够形象地看到外婆的出世年龄

 

咱们能够通过应用 Lee-Carter 模型对年死亡率进行建模,并推断到以后世纪,咱们能够推断出冀望残余寿命。

> Deces <- read.table("Dec.txt",header=TRUE)
> Expo  <- read.table("Expo.txt",header=TRUE,skip=2)
> Deces$Age <- as.nu
> Expo$Age <- as.numeric(as.character(Expo$Age))
> Expo$Age[is.n
Deces$Female/Expo$Female,nL,nC)
>  POPF <- matrix(Expo$Female,nL,nC)
>  BASEF <- demogdata(data=MUF, pop=POPF,ages=AGE,
+ years=YEAR, t
> K1 <- LCF$kt
nction(xentier,T){+ return(ext) }
> EVIE = function(x,T){+ x1 <- trunc(x)
> tail(age)
     AGE   Age NAIS.MERE NAIS.GRD.MERE age.GRD.MERE       EV
2000 30.3 30,3     1970.2       1942.87        57.63 29.13876
2001 30.4 30,4     1971.1       1943.80        57.70 29.17047
2002 30.4 30,4     1972.1       1944.92        57.58 29.39027
2003 30.5 30,5     1973.0       1945.95        57.55 29.52041
2004 30.5 30,5     1974.0       1947.05        57.45 29.72511
2005 30.6 30,6     1974.9       1948.04        57.46 29.80398

换句话说,在最初一行,2005 年,一名 57.46 岁女性的(残余)冀望寿命约为 29.80 岁。而后,咱们不仅能够看到他祖母的平均年龄,还能够看到她的残余冀望寿命,

 

而后咱们就能够确定曾祖母的(均匀)年龄,

 

以及曾祖母的(残余)寿命

 

当初咱们也能够对这项疾速钻研的局限性感到纳闷。特地是,正如有配偶的寿命之间存在很强的相关性,咱们可能会问,孩子和孙子的出世是否具备对一个人的残余生命的影响(或者咱们是否能够像这样假如独立性)。


点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《R 语言 Lee-Carter 模型对年死亡率建模预测预期寿命》。

点击题目查阅往期内容

R 语言散布滞后非线性模型(DLNM)钻研发病率,死亡率和空气污染示例
R 语言散布滞后非线性模型(DLNM)空气污染钻研温度对死亡率影响建模利用
R 语言散布滞后线性和非线性模型(DLM 和 DLNM)建模
散布滞后线性和非线性模型(DLNM)剖析空气污染(臭氧)、温度对死亡率工夫序列数据的影响
R 语言中的散布滞后非线性模型 DLNM 与发病率和空气污染示例
【视频】R 语言中的散布滞后非线性模型(DLNM)与发病率,死亡率和空气污染示例
R 语言散布滞后线性和非线性模型(DLNM)剖析空气污染(臭氧)、温度对死亡率工夫序列数据的影响
R 语言散布滞后线性和非线性模型(DLMs 和 DLNMs)剖析工夫序列数据
R 语言散布滞后非线性模型(DLNM)空气污染钻研温度对死亡率影响建模利用 R 语言散布滞后非线性模型(DLNM)钻研发病率,死亡率和空气污染示例 R 语言 Lee-Carter 模型对年死亡率建模预测预期寿命
R 语言预测人口死亡率:用李·卡特(Lee-Carter)模型、非线性模型进行平滑预计
Tableau 数据可视化:探索性图形剖析新生儿死亡率数据
R 语言模仿人类生存预期寿命动静可视化动画图 gif
r 语言绘制动静统计图:绘制世界各国的人均 GDP,出世时的预期寿命和人口气泡图动画动静 gif 图
R 语言非参数模型厘定保险费率:部分回归、狭义相加模型 GAM、样条回归
R 语言小数定律的保险业利用:泊松散布模仿索赔次数
R 语言对巨灾危险下的再保险合同定价钻研案例:狭义线性模型和帕累托散布 Pareto distributions 剖析
R 语言中的狭义线性模型(GLM)和狭义相加模型(GAM):多元(平滑)回归剖析保险资金投资组合信用风险敞口

正文完
 0