使用cjieba(结巴分词库)实现php扩展中文分词

编译安装

git clone https://github.com/jonnywang/jz.git
cd jz/cjieba
make
cd ..
phpize
./configure --enable-jieba
make
make install

配置php.ini

extension=jz.so 
jz.enable_jieba=1
jz.dict_path=/Users/xingqiba/data/softs/jz/cjieba/dict    #指向jz库dict目录

使用

<?php

$result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造');
print_r($result);

$result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造', true, 6);
print_r($result);

效果

Array
(
    [0] => 小明
    [1] => 硕士
    [2] => 毕业
    [3] => 于
    [4] => 中国
    [5] => 科学
    [6] => 学院
    [7] => 科学院
    [8] => 中国科学院
    [9] => 计算
    [10] => 计算所
    [11] => ,
    [12] => 后
    [13] => 在
    [14] => 日本
    [15] => 京都
    [16] => 大学
    [17] => 日本京都大学
    [18] => 深造
)

Array
(
    [0] => 计算所
    [1] => 小明
    [2] => 京都大学
    [3] => 深造
    [4] => 硕士
    [5] => 中国科学院
)

欢迎您加入我们的专属QQ讨论群组① 233415606 ② 233415756

相关推荐