了解Gensim LDA模型中的参数_随笔

了解Gensim LDA模型中的参数

我想知道您是否看过此页面？

无论哪种方式，让我为您解释一些事情。该方法使用的文档数量很少（在经过Wikipedia大小的数据源训练后，效果会更好）。因此，结果将是相当粗糙的，您必须意识到这一点。这就是为什么您不应该针对大量主题的原因（您选择了10个，在您的情况下可能明智地增加到20个）。

至于其他参数：

可以设置为显式数组=您选择的优先级。它还支持’asymmetric’和’auto’的特殊值：前者使用固定的归一化不对称1.0 /
topicno先验，后者直接从数据中学习不对称先验。

最佳训练过程参数在M.Hoffman等人的在线潜在狄利克雷分配中特别详细地描述。

有关训练过程或模型的内存优化，请参阅此博客文章。

欢迎分享，转载请注明来源：内存溢出

了解Gensim LDA模型中的参数