从Lucene 4.10.3到Lucene 7.1.0:带你了解版本之间的些许差异
一.环境说明:
※Windows 10 v1709
※IDEA 2017.2.6
※JDK 1.8.0_144
※Lucene 7.1.0
二.哪里有差异
因本人能力有限,所以也只是放出我在更新版本的时候,项目中用到的需要升级的地方,其他还未研究.
所以,本文主要从
- NumericRangeQuery
- BooleanQuery
- Directory
- IndexWriterConfig
这几个方面来进行说明.
三.NumericRangeQuery
数字范围查询,一般用于价格等域的查询
/** * 测试数字范围查询 * * @throws IOException 读取索引库异常 */ @Test public void testNumericRangerQuery() throws IOException { /* 版本更新说明: 在lucene4.10中,关于数字范围的查询是使用的NumericRangerQuery 使用方式: Query query = NumericRangerQuery.newFloatRange(域名,较小值,较大值,是否包含较小值,是否包含较大值) 在lucene6.6中(不知最早在什么版本,没有细查),NumericRangerQuery被legacyNumericRangerQuery替代 在lucene7中(应该是从7开始的),lucene开始使用PointValue来替代之前的Filed.而数字范围查询方法也进行了修改, Float/Long/IntPoint.newRangeQuery取代了之前的NumericRangeQuery的newFloat/Long/IntRange 使用方法: Query query = Float.newRangeQuery(域名,较小值,较大值); 而这种查询方法默认包含范围的端点值,即查询的是 较小值<=域名<=较大值 如果不想包含端点值: 1.不包含左端点值(即较小值):Query query = Float.newRangeQuery(域名,FloatPoint.nextUp(较小值),较大值); 2.不包含右端点值(即较大值):Query query = Float.newRangeQuery(域名,较小值,Float.nextDown(较大值)); 3.均不包含:结合1和2即可 */ Query query = FloatPoint.newRangeQuery("price", FloatPoint.nextUp(108F), FloatPoint.nextDown(488F)); doQuery(query); } 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
四.BooleanQuery
组合查询,用于多个查询条件组合起来一起参与查询
/** * 测试组合查询 * * @throws IOException 读取索引库异常 */ @Test public void testBooleanQuery() throws IOException { //新建两条查询 Query query1 = new TermQuery(new Term("description", "spring")); Query query2 = FloatPoint.newRangeQuery("price", FloatPoint.nextUp(50F), 110F); /* 1、MUST和MUST表示“与”的关系,即“交集”。 2、MUST和MUST_NOT前者包含后者不包含。 3、MUST_NOT和MUST_NOT没意义 4、SHOULD与MUST表示MUST,SHOULD失去意义; 5、SHOUlD与MUST_NOT相当于MUST与MUST_NOT。 6、SHOULD与SHOULD表示“或”的概念。 版本更新说明: 在lucene 4.10.3中,组合查询还有无参构造方法,可以通过下面这种方式实现组合查询: Query query = new BooleanQuery() //添加查询条件,并指定该条件的判断级别 query.add(query1,Occur.MUST); query.add(query2,Occur.MUST); 在lucene7.1中,组合查询只有一个有参构造方法,并没有无参构造方法.而是多了一个静态内部类Builder public static class Builder { private int minimumNumberShouldMatch; private final List<BooleanClause> clauses = new ArrayList<>(); //大概是4.10.3中的BooleanQuery的无参构造 public Builder() {} //设置最小需要匹配的数 public Builder setMinimumNumberShouldMatch(int min) { this.minimumNumberShouldMatch = min; return this; } public Builder add(BooleanClause clause) { if (clauses.size() >= maxClauseCount) { throw new TooManyClauses(); } clauses.add(clause); return this; } //4.10.3中的BooleanQuery的add方法,支持链式编程(一般使用这个add方法) public Builder add(Query query, Occur occur) { return add(new BooleanClause(query, occur)); } //返回一个BooleanQuery,用于构造Query public BooleanQuery build() { return new BooleanQuery(minimumNumberShouldMatch, clauses.toArray(new BooleanClause[0])); } } 7.1中,Occur.MUST等全都放到了BooleanClause中,所以,Occur.MUST等变成了BooleanClause.Occur.MUST等 所以在lucene中,组合查询的使用方法: Query booleanQuery = new BooleanQuery.Builder().add(query1,BooleanClause.Occur.MUST).add(query2,Boolean.Occur.MUST).build(); */ Query booleanQuery = new BooleanQuery.Builder().add(query1, BooleanClause.Occur.MUST).add(query2, BooleanClause.Occur.MUST).build(); doQuery(booleanQuery); } 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67
五.Directory
/* 版本变更说明: 在4.10.3中,FSDirectory.open的参数是file对象, 可能在6.6以后,开始使用Path类(java.nio.file) File对象转Path的方法: File file = new File(文件路径); Path path = file.toPath(); */ File file = new File("D:\bookIndex\"); Directory directory = FSDirectory.open(file.toPath()); IndexWriter writer = new IndexWriter(directory, config); 1 2 3 4 5 6 7 8 9 10 11
六.
/* 可能从6.6开始,IndexWriterConfig就不在需要制定版本了 而且有了无参构造方法,默认使用的分词器就是StandardAnalyzer. 即表示,如果你不想更改分词器,就使用无参构造 */ IndexWriterConfig config = new IndexWriterConfig(); 1 2 3 4 5 6
好了,大概就是这样了.
我始终认为,IT从业人员应该经常进行自我更新,包括知识的更新,要保证自己能跟上技术的更新,才能更好的适应新时代的工作要求.
努力吧,少年.
相关推荐
renjinlong 2020-09-03
Jacry 2020-07-04
IceStreamLab 2020-06-26
mengyue 2020-06-09
PasserbyX 2020-05-16
mameng 2020-05-12
心丨悦 2020-05-06
编码之路 2020-05-03
mengyue 2020-05-02
qiuzhuoxian 2020-02-23
编码之路 2020-02-20
lionelf 2020-02-03
TyCoding 2020-02-01
heniancheng 2020-01-31
某某某 2020-01-30
PinkBean 2020-01-29
某某某 2020-01-12
编码之路 2020-01-01
itmale 2020-01-01