混合模型适合需求吗?

混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对响应变量的影响。混合模型的输出将给出一个解释值列表,其效应值的估计值和置信区间,每个效应的p值以及模型拟合程度的至少一个度量。如果您有一个变量将您的数据样本描述为您可能收集的数据的子集,则应该使用混合模型而不是简单的线性模型。

什么概率分布最适合数据?

假设你已经决定要运行混合模型。接下来你要做的是找到最适合你的数据的概率分布。

r语言灵敏度分析示例 r语言lmer_机器学习

#lnorm表示对数正态

qqplot (recog $ Aggression.t,“lnorm” )

#qqp要求估计负二项式,泊松#和伽玛分布的参数。可以使用fitdistr #函数生成估计值。

r语言灵敏度分析示例 r语言lmer_开发语言_02

r语言灵敏度分析示例 r语言lmer_r语言_03

查看我使用qqp生成的图。y轴表示观察值,x轴表示由分布模拟的分位数。红色的实线表示完美的分布拟合,虚线的红色线条表示完美的分布拟合的置信区间。

如何将混合模型拟合到数据

数据是正常分布的

如果你的数据是正态分布的, 你可以使用线性混合模型(LMM)。您将需要加载lme4软件包并调用lmer函数。

如果你的数据不正常分布

用于估计模型中效应大小的REML和最大似然方法会对数据不适用正态性假设,因此您必须使用不同的方法进行参数估计。

结束 :了解你的数据

在熟悉数据之前,您无法真正了解哪些分析适合您的数据,熟悉这些数据的最佳方法是绘制它们。通常我的第一步是做我感兴趣的变量的密度图,按照我最感兴趣的解释变量来分解。

r语言灵敏度分析示例 r语言lmer_开发语言_04

绘图对评估模型拟合也很重要。通过以各种方式绘制拟合值,您可以确定哪种模型适合描述数据

该图所做的是创建一条代表零的水平虚线:与最佳拟合线平均偏离零。

r语言灵敏度分析示例 r语言lmer_开发语言_05

结果正如我所希望的那样:与最佳拟合线的偏差趋于零。如果这条实线没有覆盖虚线,那意味着最适合的线条不太适合。

MCMC模型图形比较

r语言灵敏度分析示例 r语言lmer_r语言_06

这些随机效果看起来非常尖锐,不像白色噪音。所以让我们尝试用更多的迭代来重新设计模型。这是计算量更大,但产生更准确的结果。

r语言灵敏度分析示例 r语言lmer_r语言_07

现在更接近线条周围的白色噪音,这意味着更好的模型。