2020-07-10

2020-07-10,第1张

2020-07-10 日语分词工具MeCab的安装和使用

可以使用python的pip直接安装使用

pip install mecab-python3

还是比较推荐在Linux系统上安装这个。

这个库的pypi主页是:https://pypi.org/project/mecab-python3/

它的基本使用也很简单:

>>> import MeCab
>>> wakati = MeCab.Tagger("-Owakati")
>>> wakati.parse("pythonが大好きです").split()
['python', 'が', '大好き', 'です']

>>> tagger = MeCab.Tagger()
>>> print(tagger.parse("pythonが大好きです"))
python  python  python  python  名詞-普通名詞-一般
が      ガ      ガ      が      助詞-格助詞
大好き  ダイスキ        ダイスキ        大好き  形状詞-一般
です    デス    デス    です    助動詞  助動詞-デス     終止形-一般
EOS

如果出现了目录找不到的问题,可以尝试安装一个依赖包:

pip install unidic-lite

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5659228.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存