搜索内容

有一个问题?

如果您有任何疑问,可以在下面询问或输入您要寻找的!

用sklearn求大文本的tfidf特征?

技术聚客 未结 1 1050
Vieta's_Jumping
Vieta's_Jumping 2021-03-08 10:24

clipboard.png
上面的数据是从reuters数据集中取得7303个训练集,用sklearn对其取tfidf特征,得到的结果都是0,这是怎么回事?
clipboard.png

当我从这些数据中取一部分时,对于这些少部分数据能够得到正确的tfidf结果。
clipboard.png

clipboard.png

1条回答
  • 2021-03-08 10:49

    上代码,可能是你精度太低或者min_count导致的

    比如词频是1,总词数1e9,对应的tf就是1e-9,被忽略了。

    0 讨论(0)
提交回复