原文链接:http://tecdat.cn/?p=24103
此示例阐明如何应用逻辑回归模型进行贝叶斯推断。
统计推断通常基于最大似然预计 (MLE)。MLE 抉择可能使数据似然最大化的参数,是一种较为天然的办法。在 MLE 中,假设参数是未知但固定的数值,并在肯定的置信度下进行计算。在贝叶斯统计中,应用概率来量化未知参数的不确定性,因此未知参数被视为随机变量。
贝叶斯推断
贝叶斯推断是联合无关模型或模型参数的先验常识来剖析统计模型的过程。这种推断的根基是贝叶斯定理:
例如,假如咱们有正态观测值
其中 sigma 是已知的,theta 的先验散布为
在此公式中,mu 和 tau(有时也称为超参数)也是已知的。如果察看 X
的 n
个样本,咱们能够取得 theta 的后验散布
下图显示 theta 的先验、似然和后验。
y = norpdf(thta, posMan,psSD);
plot(theta'-', theta,'--', theta,'-.')
汽车试验数据
在一些简略的问题中,例如后面的正态均值推断示例,很容易计算出关闭模式的后验散布。然而,在波及非共轭先验的个别问题中,后验散布很难或不可能通过剖析来进行计算。咱们将以逻辑回归作为示例。此示例蕴含一个试验,以帮忙建模不同分量的汽车在里程测试中的未通过比例。数据包含被测汽车的分量、汽车数量以及失败次数等观测值。咱们采纳一组通过变换的分量,以缩小回归参数估值的相关性。
% 一组汽车的分量
% 每个分量下测试的汽车数量
\[48 42 31 34 31 21 23 23 21 16 17 21\]';
% 在每个分量上有不良 mpg 体现的汽车数量
\[1 2 0 3 8 8 14 17 19 15 17 21\]';
逻辑回归模型
逻辑回归(狭义线性模型的一种特例)适宜这些数据,因为因变量呈二项分布。逻辑回归模型能够写作:
其中 X 是设计矩阵,b 是蕴含模型参数的向量。咱们能够将此方程写作:
@(b,x) exp(b(1)+b(2).\*x)./(1+exp(b(1)+b(2).\*x));
如果您有一些先验常识或者曾经具备某些非信息性先验,则能够指定模型参数的先验概率散布。例如,在此示例中,咱们应用正态先验值示意截距 b1
和斜率 b2
,即
@(b1) normpdf(b1,0,20); % 截距的先验。@(b2) normpdf(b2,0,20); % 斜率的先验。
依据贝叶斯定理,模型参数的联结后验散布与似然和先验的乘积成正比。
请留神,此模型中后验的归一化常数很难进行剖析。然而,即便不晓得归一化常数,如果您晓得模型参数的大抵范畴,也能够可视化后验散布。
msh(b2,b1,sipot)
view(-10,30)
尔后验沿参数空间的对角线伸长,表明(在咱们察看数据后)咱们认为参数是相干的。这很有意思,因为在咱们收集任何数据之前,咱们假如它们是独立的。相关性来自咱们的先验散布与似然函数的组合。
_切片_采样
蒙特卡罗办法罕用于在贝叶斯数据分析中汇总后验散布。其想法是,即便您不能通过剖析的形式计算后验散布,也能够从散布中生成随机样本,并应用这些随机值来预计后验散布或推断的统计量,如后验均值、中位数、标准差等。_切片_采样是一种算法,用于从具备任意密度函数的散布中进行抽样,已知项最多只有一个比例常数 – 而这正是从归一化常数未知的简单后验散布中抽样所须要的。此算法不生成独立样本,而是生成马尔可夫序列,其安稳散布就是指标散布。因而,切片抽样器是一种马尔可夫链蒙特卡罗 (MCMC) 算法。然而,它与其余家喻户晓的 MCMC 算法不同,因为只须要指定缩放的后验,不须要倡议散布或边缘散布。
此示例阐明如何应用切片抽样器作为里程测试逻辑回归模型的贝叶斯剖析的一部分,包含从模型参数的后验散布生成随机样本、剖析抽样器的输入,以及对模型参数进行推断。第一步是生成随机样本。
sliesmle(inial,nsapes,'pdf');
采样器输入剖析
从切片采样获取随机样本后,很重要的一点是钻研诸如收敛和混合之类的问题,以确定将样本视为是来自指标后验散布的一组随机实现是否正当。察看边缘轨迹图是查看输入的最简略办法。
plot(trace(:,1))
从这些图中能够显著看出,在处理过程趋于平稳之前,参数起始值的影响会维持一段时间(大概 50 个样本)才会隐没。
查看收敛以应用挪动窗口计算统计量(例如样本的均值、中位数或标准差)也很有帮忙。这样能够产生比原始样本轨迹更平滑的图,并且更容易辨认和了解任何非平稳性。
mvag = fier((1/50)*os(50,1), 1, tace);
plot(moav(:,1))
因为这些是基于蕴含 50 次迭代的窗口计算的挪动平均值,因而前 50 个值无奈与图中的其余值进行比拟。然而,每个图的其余值仿佛证实参数后验均值在 100 次左右迭代后收敛至安稳散布。同样不言而喻的是,这两个参数彼此相干,与之前的后验密度图统一。
因为磨合期代表指标散布中不能正当视为随机实现的样本,因而不倡议应用切片采样器一开始输入的前 50 个左右的值。您能够简略地删除这些输入行,但也能够指定一个“预热”期。在已知适合的预热长度(可能来自先前的运行)时,这种形式很简便。
slcsapl(inial,nsmes,'pf',pot, ..'brin',50);
plot(trace(:,1))
这些跟踪图没有显示出任何不安稳,表明预热期已实现。
然而,还须要理解跟踪图的另一方面。尽管截距的轨迹看起来像高频噪声,但斜率的轨迹如同具备低频重量,表明相邻迭代的值之间存在自相干。尽管也能够从这个自相干样本计算均值,但咱们通常会通过删除样本中的冗余数据这一简便的操作来升高存储要求。如果它同时打消了自相干,咱们还能够将这些数据视为独立值样本。例如,您能够通过只保留第 10 个、第 20 个、第 30 个等值来浓缩样本。
sceampe(...
'brin'50,'tin',10);
要查看这种浓缩的成果,能够依据轨迹预计样本自相干函数,并应用它们来查看样本是否疾速混合。
fftetendtrce,'cnsant');
F .* coj(F);
for i = 1:2
lineles = stem(:20, F(:i) 'filled' , 'o');
第一个滞后的自相干值对于截距参数很显著,对于斜率参数更是如此。咱们能够应用更大的浓缩参数反复抽样,以进一步升高相关性。但为了实现本示例的目标,咱们将持续应用以后样本。
推断模型参数
与预期相符,样本直方图模仿了后验密度图。
hist(rce,\[25,25\]);
view(-10,30)
您能够应用直方图或核平滑密度估计值来总结后验样本的边缘散布属性。
kdeiy(rae(:2))
您还能够计算描述性统计量,例如随机样本的后验均值或百分位数。为了确定样本大小是否足以实现所需的精度,将所需的轨迹统计量作为样本数的函数来进行查看会很有帮忙。
csu= csm(rae);
plot(csm(:,1)'./(1:sals))
在这种状况下,样本大小 1000 仿佛足以为后验均值估计值提供良好的精度。
mean(te)
总结
您可能轻松地指定似然和先验。您也能够将它们联合起来用于推断后验散布。您能够通过马尔可夫链蒙特卡罗仿真在 MATLAB 中执行贝叶斯剖析。
最受欢迎的见解
1.matlab 应用贝叶斯优化的深度学习
2.matlab 贝叶斯隐马尔可夫 hmm 模型实现
3.R 语言 Gibbs 抽样的贝叶斯简略线性回归仿真
4.R 语言中的 block Gibbs 吉布斯采样贝叶斯多元线性回归
5.R 语言中的 Stan 概率编程 MCMC 采样的贝叶斯模型
6.Python 用 PyMC3 实现贝叶斯线性回归模型
7.R 语言应用贝叶斯 层次模型进行空间数据分析
8.R 语言随机搜寻变量抉择 SSVS 预计贝叶斯向量自回归(BVAR)模型
9.matlab 贝叶斯隐马尔可夫 hmm 模型实现