按关键词阅读:
注意事项· 请注意 , 回归分析是许多现代数据科学问题家族的一个非常容易获得的起点 。在学习完本教程后 , 我希望您开始考虑它的两种风格:ML(基于损失)和经典(基于模型/似然性) 。
· 贝叶斯推理并不难融入您的DS实践中 。 可以采用基于损失的方法作为贝叶斯方法 , 但这是我稍后将要讨论的主题 。
· 只要您知道自己在做什么就很有用! 事先指定是困难的 。但是 , 当您的数据量有限(昂贵的数据收集/标记 , 罕见事件等)或您确切知道要测试或避免的内容时 , 此功能特别有用 。
· 在ML任务(预测 , 分类等)中 , 尤其是随着数据集规模的增长 , 贝叶斯框架很少比其(频繁)ML对手表现更好 。处理大型数据集(大数据)时 , 您的先验数据很容易被淹没 。
· 正确指定的贝叶斯模型是一个生成模型 , 因此您应该能够轻松生成数据 , 以检查模型与相关数据集/数据生成过程的一致性 。
· 在模型构建和检查过程之前 , 整个过程以及之后 , EDA和绘图都是至关重要的 。[5]是一篇关于贝叶斯工作流程中可视化的重要性的出色论文 。
进一步指示我鼓励您不仅从贝叶斯的角度而且从机器学习的角度来批判性地考虑改善此预测的方法 。
数据集是否足够大或足够丰富 , 可以从严格的ML方法中受益? 有什么方法可以改善这种贝叶斯模型? 在哪种情况下 , 该模型肯定会胜过MLE模型? 如果观测值在某种程度上是相关的(聚类 , 自相关 , 空间相关等) , 该怎么办? 当可解释性是建模优先级(监管方面)时该怎么办?
如果您想知道将贝叶斯方法扩展到深度学习的方法 , 还可以研究变分推理[6]方法 , 作为纯贝叶斯方法的可扩展替代方法 。这是一个"简单"的概述 , 并且是技术评论 。
参考文献[1] B. Carpenter等 。Stan:一种概率编程语言(2017) 。统计软件杂志76(1) 。DOI 10.18637 / jss.v076.i01 。
[2] Betancourt 。哈密尔顿蒙特卡洛概念介绍(2017) 。arXiv:1701.02434
【一文看懂如何使用(Py)Stan进行贝叶斯推理】[3] J·韦克菲尔德 。贝叶斯和频率回归方法(2013) 。统计中的Springer系列 。纽约施普林格 。doi:10.1007 / 978–1–4419–0925–1 。
[4] D. Simpson等 。惩罚模型组件的复杂性:构建先验的有原则的实用方法(2017) 。在:统计科学32.1 , 第1至28页 。doi:10.1214 / 16-STS576 。
[5] J. Gabry等 。贝叶斯工作流中的可视化(2019) 。J. R. Stat 。Soc 。A , 182:389-402 。doi:10.1111 / rssa.12378
[6] D.M. Blei等 。变异推理:《统计学家评论》(2016年) 。美国统计协会杂志 , 第一卷 。第112章 518 , 2017 DOI:10.1080 / 01621459.2017.1285773
·
(本文翻译自Sergio E. Betancourt的文章《Painless Introduction to Applied Bayesian Inference using (Py)Stan》 , 参考:)

稿源:(未知)
【傻大方】网址:http://www.shadafang.com/c/111J2V402020.html
标题:一文看懂如何使用(Py)Stan进行贝叶斯推理( 四 )