安装一个php分插件就可以对内容进行分词,得到你要的关键词,取关键词密度最大的放到keyword里就可以了,你可能从百度里搜索一下SCWS - 简易中文分词系统
1.需要分词的字符串,必须,英文,标点,数字,汉字,日语等都可以。编码为UTF-82.是否返回字符串,可选,默认是。如果传入false,那么将返回一个数组。
3.是否base64_encode中文,可选,默认是。Mysql的全文搜索有个配置是 ft_min_word_len 这个值一般是4,而 我们分成的中文词语是两个字,就不会被mysql认为是一个词。而base64_encode过后,词语的长度为8,就不存在最小长度问题 了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)