拓端tecdat|R语言混合图形模型MGM的网络可预测性分析

原创

拓端tecdat 2022-11-14 20:37:55 ©著作权

文章标签 网络可预测性混合图形模型 R语言网络模型数据 文章分类 Java 后端开发

©著作权归作者所有：来自51CTO博客作者拓端tecdat的原创作品，请联系作者获取转载授权，否则将追究法律责任

网络模型已经成为抽象复杂系统，是深入了解许多科学领域中观测变量之间的关系模式的流行方法。这些应用程序大多数集中于分析网络的结构。但是，如果不是直接观察网络，而是根据数据进行估算（如：吸烟与癌症之间存在关联），则除了网络结构外，我们还可以分析网络中节点的可预测性。也就是说：网络中的所有其余节点如何预测网络中的给定节点？

可预测性有趣，有几个原因：

它给我们提供了一个关于边的实用性的想法：如果节点A连接到许多其他节点，但是这些仅说明（假设）其方差的1％，那么边的连接会是怎样的？
它告诉我们网络的不同部分在多大程度上是由网络中的其他因素决定的

在此博文中，我们使用R-估计网络模型并计算地震灾民数据集上的创伤后应激障碍（PTSD）症状。我们对网络模型和可预测性进行可视化，并讨论如何将网络模型和节点的可预测性相结合来设计症状网络的有效干预措施。

载入资料

我们加载提供的数据：

data <- as.matrix(data)
p <- ncol(data)
dim(data)

## [1] 312  17

数据集包含对344人的17种PTSD症状的完整反应。症状强度的答案类别范围从1“没有”到5“非常强”。

估计网络模型

我们估计了混合图形模型，其中我们将所有变量都视为连续高斯变量。因此，我们将所有变量的类型设置为，type = 'g'并将每个变量的类别数设置为1：

fit_obj <- (data = data,
type = rep('g', p),
level = rep(1, p),
lambdaSel = 'CV',
ruleReg = 'OR',
pbar = FALSE)

计算节点的可预测性

估计网络模型后，我们准备计算每个节点的可预测性。由于可以通过依次获取每个节点并对其上的所有其他节点进行回归来估计该图，因此可以轻松地计算节点的可预测性）。作为可预测性的度量，我们选择解释的方差的比例：0表示当前节点根本没有被节点中的其他节点解释，1表示完美的预测。我们在估算之前将所有变量中心化，以消除截距的影响。

有关如何计算预测和选择可预测性度量的详细说明，请查看本文。如果网络中还有其他变量类型（例如分类），我们可以为这些变量选择适当的度量。