ElasticSearch(ES)和solr的关系和区别
Elasticsearch 与 Solr 的比较总结
单纯的对已有数据分析。solr更快
建立实时查询时,solr会产生io阻塞,查询性能更差。es 更有优势
随着数据量变化,solr的搜索效率会变低,而es没有明显变化
多线程下容易死锁性能降低。
综上所述,Solr的架构不适合实时搜索的应用
- 二者安装都很简单;
- Solr 利用 Zookeeper 进行分布式管理,而 Elasticsearch 自身带有分布式协调管理功能;
- Solr 支持更多格式的数据,而 Elasticsearch 仅支持json文件格式;
- Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供;
- Solr 在传统的搜索应用中表现好于 Elasticsearch,但在处理实时搜索应用时效率明显低于 Elasticsearch。
- Solr 是传统搜索应用的有力解决方案,但 Elasticsearch 更适用于新兴的实时搜索应用。
solr的优点:
1、和Hadoop什么的结合应该比较好,毕竟都是apache基金会下的
官方的管理端页面比较强大。Solr有一个更大、更成熟的用户、开发和贡献者社区。
2、自带的功能已经很全面,对新手来说更容易上手
3、url查询更适合简单的查询语句,通过url发送请求可以方便地调试
4、支持添加多种格式的索引,如:HTML、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式。
5、不考虑建索引的同时进行搜索,速度更快。
solr的缺点:
1、建立索引时,搜索效率下降,实时索引搜索效率不高。solrj效率较低
2、多线程下容易死锁性能降低
ES的优点:
1、Elasticsearch是分布式的。不需要其他组件,分发是实时的,被叫做”Push replication”。
2、Elasticsearch 完全支持 Apache Lucene 的接近实时的搜索。
3、处理多租户(multitenancy)不需要特殊配置,而Solr则需要更多的高级设置。
4、Elasticsearch 采用 Gateway 的概念,使得完备份更加简单。
5、各节点组成对等的网络结构,某些节点出现故障时会自动分配其他节点代替其进行工作。
ES的缺点:对新手不太友好,上来新建一个集群就是yellow的,还以为有什么问题,而且得装很多插件才真正“可用”
<!--[if !supportLineBreakNewLine]-->
<!--[endif]-->
总结:
1、当单纯的对已有数据进行搜索时,Solr更快。
2、当实时建立索引时, Solr会产生io阻塞,查询性能较差, Elasticsearch具有明显的优势。
3、随着数据量的增加,Solr的搜索效率会变得更低,而Elasticsearch却没有明显的变化。
4、Solr的架构不适合实时搜索的应用。
5、Solr 支持更多格式的数据,而 Elasticsearch 仅支持json文件格式
6、Solr 在传统的搜索应用中表现好于 Elasticsearch,但在处理实时搜索应用时效率明显低于 Elasticsearch
7、Solr 是传统搜索应用的有力解决方案,但 Elasticsearch 更适用于新兴的实时搜索应用
相关推荐
另外一部分,则需要先做聚类、分类处理,将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引,同时将每个聚合主题相关的数据存入每个document下面的某个field下。