solr问题整理
1.导入数据性能问题
①DIH导入数据太慢,应该使用solrj配置多线程
example:性能提升如下:
60w数据设计五张表
使用solrj,手动导入,配合多线程,四十分钟
DIH则需要24小时+
2.接口封装使用
不要重复轮子,使用http方式自己处理解析json,发送请求,利用solrj进行二次封装
3.dismax打分问题
可能会导致schema配置更改,比如某个mutlifield字段,出现什么后权重不一样的,这个就需单独建立字段,在导入数据的时候做处理
4.小问题汇集
①升级solr使用新版本4.3
wiki搜tomcat,对应操作文档,stepbystep发现报错,查看tomcat日志,日志有问题,4.3使用了新的日志方式,需要copy相关jar包到lib下面
②maven方式引入solrj,运行报错:类无法找到
dependency:treesolrj相关版本依赖3.x,可推荐使用httpsever却注释说使用4.x版本,必须引入httpclienthttpmimehttpcore相关4.x版本我使用的是3.6solrj引入为4.1.3
ps:技术这玩意,很多教程,没有谁会stepbystep并且给你
事无巨细讲,参考都是带有默认知识的,所以这本身就是门槛