关于数据挖掘:R语言使用bootstrap和增量法计算广义线性模型GLM预测置信区间附代码数据

38次阅读

共计 2660 个字符,预计需要花费 7 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=15062

最近咱们被客户要求撰写对于狭义线性模型的钻研报告,包含一些图形和统计输入。

思考简略的泊松回归

。给定的样本,其中,指标是导出用于一个 95%的置信区间给出,其中是预测。

 

因而,咱们要导出 预测 的置信区间,而不是 观测值,即下图的点

> r=glm(dist~speed,data=cars,family=poisson)
> P=predict(r,type="response",
+ newdata=data.frame(speed=seq(-1,35,by=.2)))
> plot(cars,xlim=c(0,31),ylim=c(0,170))
> abline(v=30,lty=2)
> lines(seq(-1,35,by=.2),P,lwd=2,col="red")
> P0=predict(r,type="response",se.fit=TRUE,
+ newdata=data.frame(speed=30))
> points(30,P1$fit,pch=4,lwd=3)

 

 

最大似然预计。

,Fisher 信息来自规范最大似然实践。

这些值的计算基于以下计算

在对数泊松回归的状况下,

让咱们回到最后的问题。

  • 线性组合的置信区间

取得置信区间的第一个想法是取得置信区间(通过取边界的指数值)。渐近地,咱们晓得

因而,方差矩阵的近似将基于通过插入参数的估计量而取得。
而后,因为作为渐近多元散布,参数的任何线性组合也将是正态的,即具备正态分布。所有这些数量都能够轻松计算。首先,咱们能够失去估计量的方差

因而,如果咱们与回归的输入进行比拟,

> summary(reg)$cov.unscaled
(Intercept)         speed
(Intercept)  0.0066870446 -3.474479e-04
speed       -0.0003474479  1.940302e-05
> V
[,1]          [,2]
[1,]  0.0066871228 -3.474515e-04
[2,] -0.0003474515  1.940318e-05

依据这些值,很容易得出线性组合的标准偏差,

一旦咱们有了标准偏差和正态性,就得出了置信区间,而后,取边界的指数,就失去了置信区间

> segments(30,exp(P2$fit-1.96*P2$se.fit),
+ 30,exp(P2$fit+1.96*P2$se.fit),col="blue",lwd=3)

 

基于该技术,置信区间不再以预测为核心。

 


点击题目查阅往期内容

R 语言狭义线性模型 GLM、多项式回归和狭义可加模型 GAM 预测泰坦尼克号幸存者

左右滑动查看更多

01

02

03

04

  • 增量法

实际上,应用表达式作为置信区间不会喜爱非核心区间。因而,一种代替办法是应用增量办法。咱们能够应用一个程序包来计算该办法,而不是在实践上再次写一些货色,





> P1
$fit
1
155.4048

$se.fit
1
8.931232

$residual.scale
[1] 1

 

增量法使咱们具备(渐近)正态性,因而一旦有了标准偏差,便能够失去置信区间。

 

通过两种不同的办法取得的数量在这里十分靠近

> exp(P2$fit-1.96*P2$se.fit)
1
138.8495
> P1$fit-1.96*P1$se.fit
1
137.8996
> exp(P2$fit+1.96*P2$se.fit)
1
173.9341
> P1$fit+1.96*P1$se.fit
1
172.9101
  • bootstrap 技术

第三种办法是应用 bootstrap 技术基于渐近正态性(仅 50 个观测值)得出这些后果。咱们的想法是从数据集中取样,并对这些新样本进行 log-Poisson 回归,并反复很多次数,

 

 



点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《R 语言应用 bootstrap 和增量法计算狭义线性模型(GLM)预测置信区间》。

点击题目查阅往期内容

R 语言狭义线性模型 GLM、多项式回归和狭义可加模型 GAM 预测泰坦尼克号幸存者
R 语言狭义线性模型 (GLM)、全子集回归模型抉择、测验剖析全国风向气象数据
R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)
R 语言用潜类别混合效应模型(Latent Class Mixed Model ,LCMM) 剖析老年痴呆年龄数据
R 语言贝叶斯狭义线性混合(多层次 / 程度 / 嵌套)模型 GLMM、逻辑回归剖析教育留级影响因素数据 R 语言预计多元标记的潜过程混合效应模型(lcmm)剖析心理测试的认知过程
R 语言因子实验设计 nlme 拟合非线性混合模型剖析有机农业施氮程度
R 语言非线性混合效应 NLME 模型 (固定效应 & 随机效应) 反抗哮喘药物茶碱动力学钻研
R 语言用线性混合效应(多程度 / 档次 / 嵌套)模型剖析腔调高下与礼貌态度的关系
R 语言 LME4 混合效应模型钻研老师的受欢迎水平 R 语言 nlme、nlmer、lme4 用(非)线性混合模型 non-linear mixed model 剖析藻类数据实例
R 语言混合线性模型、多层次模型、回归模型剖析学生均匀问题 GPA 和可视化
R 语言线性混合效应模型(固定效应 & 随机效应)和交互可视化 3 案例
R 语言用 lme4 多层次(混合效应)狭义线性模型(GLM),逻辑回归剖析教育留级考察数据 R 语言 线性混合效应模型实战案例
R 语言混合效应逻辑回归(mixed effects logistic)模型剖析肺癌数据
R 语言如何用潜类别混合效应模型(LCMM)剖析抑郁症状
R 语言基于 copula 的贝叶斯分层混合模型的诊断准确性钻研
R 语言建设和可视化混合效应模型 mixed effect model
R 语言 LME4 混合效应模型钻研老师的受欢迎水平
R 语言 线性混合效应模型实战案例
R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)
R 语言基于 copula 的贝叶斯分层混合模型的诊断准确性钻研
R 语言如何解决线性混合模型中畸形拟合 (Singular fit) 的问题
基于 R 语言的 lmer 混合线性回归模型
R 语言用 WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型
R 语言分层线性模型案例
R 语言用 WinBUGS 软件对学术能力测验(SAT)建设分层模型
应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM
R 语言用 WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型
SPSS 中的多层(等级)线性模型 Multilevel linear models 钻研整容手术数据
用 SPSS 预计 HLM 多层(档次)线性模型模型

正文完
 0