Solr 6.6.0 配置IKAnalyzer中文分词

lionelf

2017-12-28

IKAnalyzer是一个开源的，基于Java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始，IKAnalyzer已经推出了3个大版本。最初，它是以开源项目Luence为应用主体的，结合词典分词和文法分析算法的中文分词组件。新版本的 IKAnalyzer3.0则发展为面向Java的公用分词组件，独立于Lucene项目，同时提供了对Lucene的默认优化实现。GitHub的地址是https://github.com/wks/ik-analyzer，Google的地址是https://code.google.com/archive/p/ik-analyzer/。官方好久没更新了。

1. 下载ikanalyzer-solr6.5.zip 和pinyin.zip（，见本文下面，这里这两个文件已经配置好了）；

2. 解压ikanalyzer-solr6.5.zip

把ext.dic、IKAnalyzer.cfg.xml和stopword.dic 复制到Tomcat \webapps\solr\WEB-INF\classes中，把ik-analyzer-solr5-5.x.jar 和 solr-analyzer-ik-5.1.0.jar 复制到Tomcat \webapps\solr\WEB-INF\lib中；
3. 打开webapps\solr\solrhome{{core_name}}\conf下的managed-schema文件，在</schema> 前加入配置：

<!-- IK分词 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="false"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
</analyzer>
</fieldType>

这里说下useSmart，我试过，当设置为true时，分词粒度比较小，支取权重比较高的分词，当设置为false时，分词粒度比较小，能匹配多个词；

到这里，IKAnalyzer就算配置完毕，可以直接在后台调试分词了。

------------------------------------------分割线------------------------------------------

ikanalyzer-solr6.5.zip 和pinyin.zip可以到安科网1号FTP服务器下载

------------------------------------------分割线------------------------------------------

更多Solr相关教程见以下内容：

Solr 的详细介绍：请点这里
Solr 的下载地址：请点这里

solr ikanalyzer 中文分词分词

安科网

Solr 6.6.0 配置IKAnalyzer中文分词

lionelf

lionelf

相关推荐

docker 安装solr8.6.2 配置中文分词器的方法

solr+IKAnalyzer部署

【solr】添加分词器ik-analyzer-solr

Solr文本分析剖析【文本分析、分词器详解、自定义文本分析字段及分词器】

solr索引基本原理

Apache Solr velocity模板注入RCE漏洞

【solr】使用-取反时注意，-是表示排除，不能单独做条件用

solr与.net系列课程(五)solrnet的使用

关于Solr服务搭建

Solr7-4的学习与使用

01 CentOS7中安装和启动solr

solr replication原理探究

ant编译solr源码生成eclipse项目，解决一直resolve，一直[ivy:retrieve]的问题

2020.2.3学习进度总结

Solr请求概念和配置详解

lucene&solr全文检索_7solr后台界面的介绍

lucene&solr全文检索_3查询索引

Lucene、Solr、ElasticSearch、hibernate-search四部曲

lunrjs - A bit like Solr, but much smaller and not as bright.

一、linux系统安装配置solr8

lionelf