首页 >> 大全

Centos中文分词SCWS安装和使用 PHP使用SCWS进行中文分词

2023-12-16 大全 21 作者:考证青年

前言

开发的程序需要通过搜索出所需要的信息,因用户搜索的关键字过于模糊,所以采用分词进行搜索。

安装步骤 1.下载源码

cd /usr/local/src
wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2
tar xvjf scws-1.2.3.tar.bz2
cd scws-1.2.3
./configure --prefix=/usr/local/scws
make && make install

2.检查是否安装成功

/usr/local/scws/bin/scws -h

3.下载通用词典

cd /usr/local/scws/etc
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
tar xvjf scws-dict-chs-gbk.tar.bz2
tar xvjf scws-dict-chs-utf8.tar.bz2

4.安装 php 扩展

注意:/www//php/73/bin/ 要看清楚自己PHP安装的目录

cd ./scws-1.2.3 /phpext/
locate phpize
/www/server/php/73/bin/phpize
./configure --with-php-config=/www/server/php/73/bin/php-config --with-scws=/usr/local/scws
make && make install

5.在 php.ini 中加入以下几行

注意:需要重启服务器php.ini才会生效,成功后在中可以查询到scws

extension = scws.so
scws.default.charset = utf8
scws.default.fpath = /usr/local/scws/etc

6.测试代码

$scws = scws_open();scws_set_charset($scws, 'utf-8');scws_set_dict($scws, '/usr/local/scws/etc/dict.utf8.xdb');scws_set_rule($scws, '/usr/local/scws/etc/rules.utf8.ini');$text = "我爱写代码";scws_send_text($scws, $text);$tops = scws_get_tops($scws, 5);print_r($tops);
?>
// 输出结果
//Array
//(
//[0] => Array
//(
//[word] => 代码
//[times] => 1
//[weight] => 4.8200001716614
//[attr] => n
//)
//
//[1] => Array
//(
//[word] => 我爱
//[times] => 1
//[weight] => 4.5900001525879
//[attr] => n
//)
//
//)

注意

本人在测试过程中出现了: in . File(/usr/local/scws/etc/dict.utf8.xdb) is not the path(s) 这个错误提示。由于我是宝塔面板安装的,只需要在相应的网站目录,勾选掉防跨站攻击()即可。

tags: 分词

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了