对于observation or feature 的两种利用方式

原创

mb649b884ce232e 2023-06-29 10:05:44 博主文章分类：Topic Model ©著作权

文章标签 ide 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者mb649b884ce232e的原创作品，请联系作者获取转载授权，否则将追究法律责任

对于text dataset, 每篇doc 一般都有对应的metadata(side information), 还有容易得到的一些feature e.g. pos, np chunking, wordnet

1. word 本身

2. metadata

3. feature

都算是我们的observation, 利用的方式有两种，

第一种就是用generative model，意淫这些observation的生成过程，即model p(word 本身, metadata, feature)

第二种就是用discriminative model，把某些observation看做condition, 其余的observation看做generative的东西，

例如 p(word 本身, metadata | feature) 就是在feature这个条件下意淫word与metadata的生成过程

ref: jun zhu "conditional topic random fields"

mimno "topic models conditioned on arbitrary features with dirichlet-multinomial regression"

下一篇：ML1.6 KNN

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯