自然语言学习笔记之——hanlp环境配置

自然语言学习笔记之——hanlp环境配置,第1张

自然语言学习笔记之——hanlp环境配置

 hanlp的环境配置还是比较简单的,这里我主要配置了两个环境,一个是java环境和python,具体如下:

目录

anaconda 安装hanLp

idea安装NLP


anaconda 安装hanLp

1 指定清华镜像,加速下载:

>pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyhanlp

 2下载hanlp

 3 测试,如图所示安装成功:

代码测试:

from pyhanlp import *


def main():
    HanLP.Config.enableDebug()
    #  为了避免你等得无聊,开启调试模式说点什么:-)
    print(HanLP.segment("王国维和服务员"))


if __name__ == '__main__':
    main()

结果:

[王国维/nr, 和/cc, 服务员/nnt]
idea安装NLP

首先构建一个maven工程,然后在pom.xml文件中添加依赖如下,即可:

    
      com.hankcs
      hanlp
      portable-1.7.5
    

代码测试:

编写如下代码,测试正确安装

import com.hankcs.hanlp.HanLP;

public class NLPtext {
    public static void main(String[] args) {
        System.out.println(HanLP.segment("你好,欢迎使用HanLP汉语处理包!"));
    }
}

输出结果如下:

[你好/l, ,/w, 欢迎/v, 使用/v, HanLP/nx, 汉语/nz, 处理/v, 包/v, !/w]

为了方便在后续中使用分析中的数据。

需要将在anaconda中下载的数据拷贝到的idea项目中,该数据在

拷贝到:

 

 代码测试:

package NLPLearn.chapter02;
import com.hankcs.hanlp.corpus.io.IOUtil;
import com.hankcs.hanlp.dictionary.CoreDictionary;


import java.util.TreeMap;

public class dictLoad {
    public static void main(String[] args) throws Exception{
        TreeMap dictionary = IOUtil.loadDictionary("data/dictionary/CoreNatureDictionary.mini.txt");

        System.out.println(dictionary.size());

        System.out.println(dictionary.keySet().iterator().next());

    }
}

结果:

85584
±

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/3973090.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-10-21
下一篇 2022-10-21

发表评论

登录后才能评论

评论列表(0条)

保存