Day: March 27, 2020

基于PSCWS4词库的PHP中文分词工具

基于PSCWS4的PHP中文分词工具词库官方网址:http://www.xunsearch.com/scws/ 这是用纯 PHP 代码实现的 C 版 Libscws 的全部功能,即第四版的 PSCWSPSCWS4 使用文档:http://www.xunsearch.com/scws/docs.php#pscws4 安装composer require wxkxklmyt/pscws 安装 使用 运行结果 静思 善解 法师 柔和 做到 其它说明 默认返回结果为字符串,返回字符串支持自定义分隔符,默认为空格 支持返回结果为数组 支持返回词数量自定义,默认为5个

blueidea

清除不可见空格

用 $str = preg_replace(‘/^[\pZ\pC]+|[\pZ\pC]+$/u’,”,$str); http://php.net/manual/zh/regexp.reference.unicode.php 在选用 UTF-8模式时用于匹配通用字符类型 pC:所有的unicode“other”pZ:所有的unicode“separator” ,所有空格和不可见字符

blueidea