怎么是用python 语言使用结巴分词呢_IT百科

Python代码

#encoding=utf-8

import jieba

seg_list = jieba.cut("我来到北京清华大学",cut_all=True)

print "Full Mode:", "/ ".join(seg_list) #全模式

seg_list = jieba.cut("我来到北京清华大学",cut_all=False)

print "Default Mode:", "/ ".join(seg_list) #默认模式

seg_list = jieba.cut("他来到了网易杭研大厦")

print ", ".join(seg_list)

输出：

Full Mode: 我/ 来/ 来到/ 到/ 北/ 北京/ 京/ 清/ 清华/ 清华大学/ 华/ 华大/ 大/ 大学/ 学

Default Mode: 我/ 来到/ 北京/ 清华大学

他, 来到, 了, 网易, 杭研, 大厦 (此处，“杭研”并没有在词典中，但是也被Viterbi算法识别出来了)

github上面有一个说明文件，里面明确说了“使用 add_word(word, freq=None, tag=None) 和 del_word(word) 可在程序中动态修改词典”。所以这个add_word的修改只是用于当前的程序。你换一个程序的话，需要从新添加。

欢迎分享，转载请注明来源：内存溢出

怎么是用python 语言使用结巴分词呢