solr实现简单的增删改查
solr是一款非常强大的搜索项目,虽然基于luncen开发,但是在其基础上做了一定的修改,特别是强大的solr cloud,我是刚开始接触solr,记录下使用solr实现最简单的增删改查。
首先需要搭建solr的开发环境,网上搭建solr开发环境的资料很多,大家可以去找一下,搭建过程也很简单,这里默认大家环境是完好的,没好的话可以参考我的另外一篇博客。
以下操作前提假设:schema.xml中主要的配置为:
<field name="blogId" type="string" required="true" multiValued="false" stored="true" indexed="true"/> <field name="content" type="textik" multiValued="false" stored="true" indexed="true"/> <field name="blogUrl" type="string" multiValued="false" stored="true" indexed="false"/>
一、创建索引
1、获取solr服务的连接,设计了一个单例模式,最小限度的创建连接数量
private static HttpSolrServer httpSolrServer; private static HttpSolrServer getHttpSolrServer() { if (httpSolrServer == null) { // solr服务的url,连接响应时间、连接时间,最大连接数、分路由最大连接数,重试次数,是否支持压缩等参数的设置 httpSolrServer = new HttpSolrServer("127.0.0.1:8983/solr/bolg"); httpSolrServer.setSoTimeout(1000); httpSolrServer.setConnectionTimeout(1000); httpSolrServer.setDefaultMaxConnectionsPerHost(50); httpSolrServer.setMaxRetries(3); httpSolrServer.setMaxTotalConnections(100); httpSolrServer.setAllowCompression(true); httpSolrServer.setFollowRedirects(false); } return httpSolrServer; }
2、创建一个实体类的对象,以便于保存索引,与实体类保存到数据库原理相似
public class BlogDTO implements Serializable{ @Field private String blogId; @Field private String content; @Field private String blogUrl; // 省略get和set方法... }
3、创建索引
public boolean createBlogIndex(List<BlogDTO> blogList) { // blogList中不能包含null对象,需要做一步处理,省略 SolrServer solrServer = getHttpSolrServer(); try { if(blogList == null || blogList.size()==0){ return false; } // 批量创建博客数据索引数据 solrServer.addBeans(blogList); solrServer.commit(); // 优化索引,不建议每次创建好之后都优化,定期优化即可 solrServer.optimize(); return true; } catch (Exception e) { // TODO LOGGER.logException(eventMessage, e); } return false; }
创建好索引后可以选择优化,优化索引所做的操作是将索引文件惊醒合并和归类,在此过程中,会影响索引的读操作,不建议每次创建后优化,可以每隔一定时间进行优化,时间根据需要来设定。索引创建结束成功后,就可以通过solr的客户端查询验证数据了。
二、查询索引
public List<BlogDTO> queryBlogList(String blogId) { List<BlogDTO> queryResult = new ArrayList<BlogDTO>(); QueryResponse response = null; // 主搜索条件 String searchParam = "blodId:" + blogId; // 获取服务连接 SolrServer server = getHttpSolrServer(); SolrQuery query = new SolrQuery(searchParam); // 添加联合查询条件 相当于and query.setFilterQueries("url:www.baidu.com"); // 此处可以设置要返回的字段,比如只返回博客内容 query.setFields("content"); // 搜索排序条件 query.addSortField("blogId", ORDER.desc); query.setRows(2); // 每页文档数,默认为10 try { response = server.query(query); } catch (Exception e) { LOGGER.logException(e); } if (response != null) { SolrDocumentList list = response.getResults(); // 将搜索结果封装为结果类 queryResult = processBlogData(list); } return queryResult; } // 将solr中查询出的文档转换为对象类型 private List<BlogDTO> setReviewData(SolrDocumentList list) { DocumentObjectBinder binder = new DocumentObjectBinder(); List<BlogDTO> blogList = binder.getBeans(BlogDTO.class, list); return blogList; }
索引技术的使用主要是使用到的查询,solr中包含非常强大的查询机制,首先是倒排序方式的查询比db中的正排序快出很多,其次 文档文件中的检索也比关系型数据库检索要来的快,另外,solr中支持的条件查询,非常多,同时还支持评分计算,文档高亮显示,分页检索,自定义返回数据类型(json、xml、csv、php、ruby等等),这里只是实现了最简单的查询,相当于select * from table where id=124
三、更改索引数据
在索引文件中,因为每条数据都是唯一的,在schema.xml中有设置
<uniqueKey>blogId</uniqueKey>
所谓的更改索引数据就是重新创建索引,代码与创建索引有相似之处,此处省略代码
四、删除索引
删除索引就是直接将该索引数据删除,但是我通过solrj删除索引后,发现索引文件依然存在的,不知道是因为没有进行commit操作还是因为没有optimize操作,这个还望了解的同学指点,删除索引的代码如下:
public boolean deleteBlogIndex(List<String> blogIds) { SolrServer solrServer = getHttpSolrServer(); try { solrServer.deleteById(blogIds); solrServer.commit(); return true; } catch (Exception e) { LOGGER.logException( e); } return false; }
以上是通过solrj对索引数据的增删改查操作,有了以上技能啊,就可以简单的将solr技术使用到项目中了,当然,如果真的将solr技术使用到项目中,还需要考虑的是索引文件的定期全量创建机制、索引碎片处理、索引优化机制、查询性能优化,有可能还会用到读写分离、主从同步、服务集群、处理高并发以及与其他一些技术如redis的结合(solr实时性需要慎重使用,可以与redis结合达到业务需求),还需继续研究才行啊,希望喜欢搜索项目的同学一起学习啊