<article class=“article fmt article-content”><h3>全文下载链接:http://tecdat.cn/?p=2857</h3><p>最近咱们被客户要求撰写对于贝叶斯的钻研报告,包含一些图形和统计输入。</p><h3>本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响,并且比照rjags R2jags和内置贝叶斯预测函数的后果</h3><h2>读取数据</h2><pre><code>seed=read.csv(“seeds_dataset.csv”)seed=seed[,1:7]</code></pre><h2> 查看数据的构造</h2><pre><code> str(seed) ‘data.frame’:    209 obs. of  7 variables:  $ area        : num  14.9 14.3 13.8 16.1 14.4 …  $ perimeter   : num  14.6 14.1 13.9 15 14.2 …  $ campactness : num  0.881 0.905 0.895 0.903 0.895 …  $ length      : num  5.55 5.29 5.32 5.66 5.39 …  $ width       : num  3.33 3.34 3.38 3.56 3.31 …  $ asymmetry   : num  1.02 2.7 2.26 1.35 2.46 …  $ groovelength: num  4.96 4.83 4.8 5.17 4.96 …</code></pre><h2>建设回归模型</h2><pre><code>  Residuals:      Min       1Q   Median       3Q      Max  -0.66375 -0.10094  0.00175  0.11081  0.45132   Coefficients:              Estimate Std. Error t value Pr(>|t|)     (Intercept)  19.46173    2.45031   7.943 1.29e-13  area          0.49724    0.08721   5.701 4.10e-08  perimeter    -0.63162    0.18179  -3.474 0.000624  campactness -14.05218    1.34325 -10.461  < 2e-16  — Signif. codes:  0 ’’ 0.001 ’’ 0.01 ’’ 0.05 ’.’ 0.1 ’ ’ 1  Residual standard error: 0.1608 on 205 degrees of freedom Multiple R-squared:  0.895,  Adjusted R-squared:  0.8934  F-statistic: 582.4 on 3 and 205 DF,  p-value: < 2.2e-16</code></pre><p>从回归模型的后果来看,三个自变量对因变量都有显著的意义。其中,area有正向的影响。而其余两个变量是负向的影响。从r方的后果来看,达到了0.895,模型具备较好的解释度。</p><h2>建设贝叶斯回归模型</h2><pre><code>Bayesian analysis With bayesglm  Deviance Residuals:       Min        1Q    Median        3Q       Max   -0.66331  -0.09974  -0.00002   0.11110   0.44841    Coefficients:              Estimate Std. Error t value Pr(>|t|)     (Intercept)  18.90538    2.41549   7.827 2.63e-13  area          0.47826    0.08604   5.559 8.40e-08  perimeter    -0.59252    0.17937  -3.303  0.00113   campactness -13.74353    1.32463 -10.375  < 2e-16  — Signif. codes:  0 ’’ 0.001 ’’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1  (Dispersion parameter for gaussian family taken to be 0.02584982)      Null deviance: 50.4491  on 208  degrees of freedom Residual deviance:  5.2992  on 205  degrees of freedom AIC: -164.91  Number of Fisher Scoring iterations: 6</code></pre><p>从内置贝叶斯模型的后果来看,3个变量同样是十分显著,因而模型的后果和回归模型相似。而后咱们应用BUGS/JAGS软件包来建设贝叶斯模型</p><p>应用 BUGS/JAGS软件包来建设贝叶斯模型</p><p>建设贝叶斯模型</p><pre><code> jags(model.file=‘bayes.bug’,              parameters=c(“area”,“perimeter”,“campactness”,“int”),              data = list(‘a’ = seed$area, ‘b’ = seed$perimete              n.cha</code></pre><p>查看模型后果:</p><pre><code>module glm loaded Compiling model graph    Resolving undeclared variables    Allocating nodes Graph information:    Observed stochastic nodes: 209    Unobserved stochastic nodes: 5    Total graph size: 1608 Initializing modelbb <- jags1$BUGSoutput   提取“ BUGS输入” mm <- as.mcmc.bugs(bb)   将其转换为coda能够解决的“ mcmc”对象plot(jags1)              绘制图像</code></pre><p></p><p>从下面的图中,咱们能够看到自变量的中位数和置信区间。从置信区间来看,各个变量的取值和贝叶斯模型的后果相似。贝叶斯后果的值全副落入在了置信区间内。</p><p>而后绘制每次迭代中各个变量参数的轨迹图</p><pre><code>trace + density #轨迹图</code></pre><p></p><p>能够看到每个变量的参数都在肯定区间内稳定。同时能够看到误差在肯定的迭代次数之后趋于收敛。</p><hr/><p><strong>点击题目查阅往期内容</strong></p><p></p><p>R语言和STAN,JAGS:用RSTAN,RJAG建设贝叶斯多元线性回归预测选举数据</p><p></p><p>左右滑动查看更多</p><p></p><p><strong>01</strong></p><p></p><p><strong>02</strong></p><p></p><p><strong>03</strong></p><p></p><p><strong>04</strong></p><p></p><p>而后绘制每个变量参数的密度图 prettier density plot</p><p></p><p>能够看到每个变量的参数的密度散布近似于正态分布。同时咱们能够看到散布的均值和贝叶斯模型,失去的后果相似。</p><p>而后绘制每个变量参数的置信区间 estimate + credible interval plot</p><p></p><p>从后果来看,能够看到各个变量参数的置信区间,campatness和int的置信区间较大,而其余两个变量的置信区间较小。</p><p>从下面的试验后果比照,咱们能够看到,三个自变量对因变量均有重要的影响。area,perimeter,campactness几个变量他们对groovelength这个变量均有重要的影响。同时咱们能够认为回归模型的后果和贝叶斯模型的后果类似。而后咱们应用rjags&R2jags软件包来对数据进行贝叶斯型的建设,从后果来看,同样和之前失去的模型后果相差不大。并且咱们通过模型的迭代,能够失去每个参数的置信区间。</p><hr/><p></p><p>点击文末 <strong>“浏览原文”</strong></p><p>获取全文残缺材料。</p><p>本文选自《r语言应用rjags R2jags建设贝叶斯模型》。</p><p><strong>点击题目查阅往期内容</strong></p><p>应用贝叶斯层次模型进行空间数据分析 <br/>R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯奢侈贝叶斯、反对向量机SVM剖析营销流动数据|数据分享 <br/>PYTHON用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯和KMEANS聚类用户画像 <br/>MATLAB随机森林优化贝叶斯预测剖析汽车燃油经济性 <br/>R语言中贝叶斯网络(BN)、动静贝叶斯网络、线性模型剖析错颌畸形数据 <br/>应用贝叶斯层次模型进行空间数据分析MCMC的rstan贝叶斯回归模型和规范线性回归模型比拟 <br/>python贝叶斯随机过程:马尔可夫链Markov-Chain,MC和Metropolis-Hastings,MH采样算法可视化 <br/>Python贝叶斯推断Metropolis-Hastings(M-H)MCMC采样算法的实现 <br/>matlab贝叶斯隐马尔可夫hmm模型实现 <br/>贝叶斯线性回归和多元线性回归构建工资预测模型 <br/>Metropolis Hastings采样和贝叶斯泊松回归Poisson模型 <br/>贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归剖析免疫球蛋白、前列腺癌数据 <br/>R语言RSTAN MCMC:NUTS采样算法用LASSO 构建贝叶斯线性回归模型剖析职业声望数据 <br/>R语言STAN贝叶斯线性回归模型剖析气候变化影响北半球海冰范畴和可视化查看模型收敛性 <br/>PYTHON用户散失数据挖掘:建设逻辑回归、XGBOOST、随机森林、决策树、反对向量机、奢侈贝叶斯和KMEANS聚类用户画像 <br/>贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归剖析免疫球蛋白、前列腺癌数据R语言JAGS贝叶斯回归模型剖析博士生延期毕业实现论文工夫 <br/>R语言Metropolis Hastings采样和贝叶斯泊松回归Poisson模型 <br/>Python决策树、随机森林、奢侈贝叶斯、KNN(K-最近街坊)分类剖析银行拉新流动开掘潜在贷款客户 <br/>R语言贝叶斯MCMC:用rstan建设线性回归模型剖析汽车数据和可视化诊断 <br/>R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例 <br/>R语言贝叶斯Poisson泊松-正态分布模型剖析职业足球比赛进球数 <br/>随机森林优化贝叶斯预测剖析汽车燃油经济性 <br/>R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病 <br/>R语言用Rcpp减速Metropolis-Hastings抽样预计贝叶斯逻辑回归模型的参数 <br/>R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归 <br/>Python贝叶斯回归剖析住房累赘能力数据集 <br/>R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归剖析 <br/>Python用PyMC3实现贝叶斯线性回归模型 <br/>R语言用WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型 <br/>R语言Gibbs抽样的贝叶斯简略线性回归仿真剖析 <br/>R语言和STAN,JAGS:用RSTAN,RJAG建设贝叶斯多元线性回归预测选举数据 <br/>R语言基于copula的贝叶斯分层混合模型的诊断准确性钻研 <br/>R语言贝叶斯线性回归和多元线性回归构建工资预测模型 <br/>R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例 <br/>R语言stan进行基于贝叶斯推断的回归模型 <br/>R语言中RStan贝叶斯层次模型剖析示例 <br/>R语言应用Metropolis-Hastings采样算法自适应贝叶斯预计与可视化 <br/>R语言随机搜寻变量抉择SSVS预计贝叶斯向量自回归(BVAR)模型 <br/>WinBUGS对多元随机稳定率模型:贝叶斯预计与模型比拟 <br/>R语言实现MCMC中的Metropolis–Hastings算法与吉布斯采样 <br/>R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例 <br/>R语言应用Metropolis-Hastings采样算法自适应贝叶斯预计与可视化 <br/>视频:R语言中的Stan概率编程MCMC采样的贝叶斯模型 <br/>R语言MCMC:Metropolis-Hastings采样用于回归的贝叶斯预计</p></article>