使用Postgresql进行中文分词

使用Postgresql进行中文分词,第1张

概述使用Postgresql进行中文分词 安装 postgresql 数据库 解压 tar -zxvf postgresql-9.6.6.tar.gz 配置 ./configure 可能会缺少这个依赖,安装readline开发包 yum install readline-devel 编译 make 安装 make install 添加postgres用户并加入到postgres用户组 groupadd 使用Postgresql进行中文分词 安装 postgresql 数据库 解压

tar -zxvf postgresql-9.6.6.tar.gz

配置

./configure

可能会缺少这个依赖,安装readline开发包

yum install readline-devel

编译

make

安装

make install

添加postgres用户并加入到postgres用户组

groupadd postgres
useradd -g postgres postgres

创建数据目录

mkdir -p /data/pgdata/

添加环境变量 方法一,在root和postgres用户下分别执行(重启机器后失效)

export PATH=/usr/local/pgsql/bin:$PATH

方法二,在root和postgres用户下分别执行(永久生效)

vim ~/.bash_profile
再最后边追加
export PATH=/usr/local/pgsql/bin:$PATH

修改数据目录和pg程序目录的权限

chown postgres:postgres /data/pgdata/
chown postgres:postgres /usr/local/pgsql/

初始化数据库

su - postgres
/usr/local/pgsql/bin/initdb -D /data/pgdata/

添加postgresql到系统服务

vim postgresql-9.6.6/contrib/start-scripts/linux
PGDATA=”/data/pgdata/”
chmod a+x postgresql-9.6.6/contrib/start-scripts/linux
cp postgresql-9.6.6/contrib/start-scripts/linux /etc/init.d/postgresql

用系统服务的方式启动postgresql

service postgresql start

查看postgresql的端口起来了没有

netstat -tlnp | grep 5432

设置开机启动

chkconfig postgresql on

安装分词程序

tar -jxvf scws-1.2.3.tar.bz2
cd scws-1.2.3/

配置

./configure

@H_403_83@编译

make

安装

make install

安装postgresql的分词插件,这个插件依赖scws程序 解压

unzip zhparser-0.1.4.zip
cd zhparser-0.1.4

编译

SCWS_HOME=/usr/local make

安装

make install

测试 进入postgres用户

su - postgres

进入pg数据库

psql

切换到postgres数据库

\c postgres

创建扩展

CREATE EXTENSION zhparser;
CREATE TEXT SEARCH CONfigURATION testzhcfg (PARSER = zhparser);
ALTER TEXT SEARCH CONfigURATION testzhcfg ADD MAPPing FOR n,v,a,i,e,l WITH simple;

查询分词

SELECT to_tsvector(‘testzhcfg’,’南京市长江大桥’);

ps:分词的粒度可以从配置中调整。 总结

以上是内存溢出为你收集整理的使用Postgresql进行中文分词全部内容,希望文章能够帮你解决使用Postgresql进行中文分词所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1171848.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-02
下一篇 2022-06-02

发表评论

登录后才能评论

评论列表(0条)

保存