原文链接：http://tecdat.cn/?p=23099

在本文对于如何在R中进行贝叶斯剖析。咱们介绍贝叶斯剖析，这个例子是对于职业足球比赛的进球数。

模型

首先，咱们认为职业足球比赛的进球数来自散布，其中θ是均匀进球数。当初假如咱们用一位足球专家的意见来得出足球比赛的均匀进球数，即参数θ，咱们失去：。

curve(dnorm(x, 2.5, 0.2), from = -2, to = 8,...)

咱们想晓得什么？

在这种状况下，咱们想晓得θ的后验散布是什么样子的，这个散布的平均值是什么。为了做到这一点，咱们将在三种状况下剖析：

咱们有1个察看值x=1，来自散布为的总体。
咱们有3个观测值x=c(1,3,5)，来自一个具备散布的总体。
咱们有10个观测值x=c(5,4,3,4,3,2,7,2,4,5)，来自一个具备散布的总体。

实践办法

在这里，我想通知你贝叶斯剖析是如何剖析的。首先，咱们有一个来自具备未知参数θ的泊松散布的人口的似然函数。

咱们晓得参数θ的先验散布p(θ)是由以下公式给出的。

最初，θ的后验散布为。

其中常数C的计算方法如下。

而后验散布E(θ|x)的平均值由以下公式给出。

计算方法

在这里，你将学习如何在R中应用蒙特卡洛模仿来答复下面提出的问题。对于这三种状况，你将遵循以下步骤。

1. 定义数据

首先，你须要依据计划定义数据。

x <- 1 #第一种状况

2. 计算常数C

当初应用蒙特卡洛模仿来计算积分。为此，有必要从先验散布中产生N=10000个值θi，并在似然函数中评估它们。最初，为了失去C，这些值被平均化。R中的代码如下。

N <- 100000  # 模仿值的数量
rnorm(n=N, mean = 2.5, sd = 0.2) #先验散布
prod(dpois(x=x, lambda = theta)) #似然函数

3. 寻找后验散布

计算完C后，你能够失去后验散布，如下所示。

        fvero(theta) * dnorm(x=theta) / C

4. 计算后验散布的平均数

最初你能够应用蒙特卡洛模拟计算积分来取得后验散布的平均值。

integral <- mean(aux)
posterior <- integral/C

后果

如前所述，下面介绍的代码用于所有三种状况，惟一依据状况变动的是x。在这一节中，咱们将为每种状况展现一张图，其中蕴含θ的先验和后验散布、后验散布的平均值（蓝色虚线）和观测值（粉红色的点）。

第一种状况

curve(dnorm(x, 2.5, 0.2), col=4,,x=x, y=rep(0, length(x)),
line,v = mposterior,legend=c("topright", legend=c("后验", "先验"),)

第二种状况

第三种状况

论断

从后果中咱们能够得出这样的论断：当咱们有很少的观测数据时，如图1和图2，因为不足样本证据，后验散布将偏向于相似于先验散布。相同，当咱们有大量的观测数据时，如图3，后验散布将偏离先验散布，因为数据将有更大的影响。

我心愿你喜爱这篇文章并理解贝叶斯统计。我激励你用其余散布运行这个程序。

最受欢迎的见解

1.R语言多元Logistic逻辑回归利用案例

2.面板平滑转移回归(PSTR)剖析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型剖析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度测验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存剖析与Cox回归中计算IDI，NRI指标

关于算法:R语言贝叶斯Poisson泊松正态分布模型分析职业足球比赛进球数

原文链接：http://tecdat.cn/?p=23099

模型

咱们想晓得什么？

实践办法

计算方法

1. 定义数据

2. 计算常数C

4. 计算后验散布的平均数

后果

第一种状况

第三种状况

论断

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于算法:R语言贝叶斯Poisson泊松正态分布模型分析职业足球比赛进球数

原文链接：http://tecdat.cn/?p=23099

模型

咱们想晓得什么？

实践办法

计算方法

1. 定义数据

2. 计算常数C

4. 计算后验散布的平均数

后果

第一种状况

第三种状况

论断

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复