看一下文档。它说
CountVectorizer.fit_transform期望字符串可迭代(例如,字符串
列表 )。您正在传递 单个字符串 。
这很有意义,scikit中的fit_transform做两件事:1)学习模型(拟合)2)将模型应用于数据(变换)。您要构建一个矩阵,其中列是词汇表中的所有单词,而行对应于文档。为此,您需要了解语料库中的整个词汇表(所有列)。
欢迎分享,转载请注明来源:内存溢出
看一下文档。它说
CountVectorizer.fit_transform期望字符串可迭代(例如,字符串
这很有意义,scikit中的fit_transform做两件事:1)学习模型(拟合)2)将模型应用于数据(变换)。您要构建一个矩阵,其中列是词汇表中的所有单词,而行对应于文档。为此,您需要了解语料库中的整个词汇表(所有列)。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)