Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)
1、环境准备
CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1
2、配置步骤
(1)下载IK Analyzer分词包,解压缩
(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下
cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar
/usr/local/tomcat6/webapps/solr/WEB-INF/lib/
(3)将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下(和schemal.xml同一目录)
(4)修改schema.xml,加入如下配置:
<fieldType
name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
如上表示加入"text_ik"类型的分词器(即:IKAnalyzer)
最后配置field通过name使用text_ik分词
<field name="text_ik" type="text_ik" indexed="true" stored="true" multiValued="false" />
3、中文分词测试
4、OK搞定!
Solr 的详细介绍:请点这里
Solr 的下载地址:请点这里