solr问题整理

1.导入数据性能问题

①DIH导入数据太慢,应该使用solrj配置多线程

example:性能提升如下:

60w数据设计五张表

使用solrj,手动导入,配合多线程,四十分钟

DIH则需要24小时+

2.接口封装使用

不要重复轮子,使用http方式自己处理解析json,发送请求,利用solrj进行二次封装

3.dismax打分问题

可能会导致schema配置更改,比如某个mutlifield字段,出现什么后权重不一样的,这个就需单独建立字段,在导入数据的时候做处理

4.小问题汇集

①升级solr使用新版本4.3

wiki搜tomcat,对应操作文档,stepbystep发现报错,查看tomcat日志,日志有问题,4.3使用了新的日志方式,需要copy相关jar包到lib下面

②maven方式引入solrj,运行报错:类无法找到

dependency:treesolrj相关版本依赖3.x,可推荐使用httpsever却注释说使用4.x版本,必须引入httpclienthttpmimehttpcore相关4.x版本我使用的是3.6solrj引入为4.1.3

ps:技术这玩意,很多教程,没有谁会stepbystep并且给你

事无巨细讲,参考都是带有默认知识的,所以这本身就是门槛

相关推荐