Solr配置安装(二)--之中文分语器IKAnalyzer
Solr自带的分词器对英文支持较好,但不适合针对中文的分词,我们这里使用IKAnalyzer为例讲解Solr的分词器配置
一、下载
见附件
二、拷贝IKAnalyzer2012FF_u1_custom.jar文件至'运用路径'/WEB-INF/lib下
注:“运用路径”一般有两种,第2种solr-webapp在服务每次重启后,会从example/webapps/solr.war重新解压一份
1、tomcat部署solr:apache-tomcat/webapp/solr/WEB-INF/lib
2、Solr自带jetty:solr/example/solr-webapp/webapp/WEB-INF/lib
三、打开core(如:example/solr/collection1)-->conf-->schema.xml
在最后</scheml>内加入
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
四、自定义分词器使用
在需要使用中文分词器的field标签配置fieldType的引用,type="text_ik"要和fieldType的name一致
<field name="shortName" type="text_ik" indexed="true" required="false" stored="true"/>
附言:
1、schema.xml中的copyField作用:创建文档索引时将指定字段
2、如果Solr启动提示java.lang.UnsupportedClassVersionError:org/wltea/analyzer/lucene/IKAnalyzer
则请下载IKAnalyzer另一个版本,再进行测试。如果问题仍旧,请升级JDK版本
配置完毕,重启Solr即可