关于数据挖掘:R语言人口期望寿命统计预测方法

57次阅读

共计 926 个字符,预计需要花费 3 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=18079

原文出处:拓端数据部落公众号

本文对人口统计预测办法进行探讨。首先,咱们将看到根本的静态方法。在应用数据集之前,咱们应用“规范”生命表。

download.file(url,"mortal")
tables=readHTMLTable("morta

上面是获取数据集的代码

tables\[\[2\]\]
a1=as.numeric(as.character(TV8\[,1\]))
a2=as.numeric(as.cha
TV0=data.frame(x=c(a1,a2),lx=as.numeric(c(b1,b2))

能够应用生存函数来计算出世时的冀望寿命

sum(TV0$lx)/100000-1
\[1\] 72.01518

可视化的生存概率

或死亡概率,即假如您达到 xx 岁,则在某特定年龄 xx 死亡的概率,也称为 死亡率

n=nrow(TV0)
px=(TV8$lx\[1:(n-1)\]-TV8$lx\[2:n\])/
TV8$lx\[1:

应用对数概率的可视化

plot(x,px,type="l",log="y")

最初,咱们能够计算死亡年龄的概率密度

用来计算冀望寿命

sum(x*pbx)
\[1\] 72.01518

对于初始数据,咱们能够应用人类死亡率数据库中的表格。

download.file(url,"E.txt")

以下代码可用于读取这些文件。

read.table("C.txt",skip = 3,header=TRUE)

      Year  Age Female  Male  Total
22195 2015  101 242.66 25.86 323.82
22196 2015  104 132.95 16.39 213.34
22197 2015  101 101.87 9.50 145.37
22198 2015  103  57.27  4.07  64.34
22199 2015  109  31.93  2.59  32.52
22200 2015 110+  33.03  1.61  33.64

专栏

精算迷信

对于联合数学、统计办法以及程序语言对经济流动来做危险剖析、评估的见解。

摸索专栏  

正文完
 0