lucene的排序方式
lucene的查询排序有两种方式,一种是按照相关性排序,一种是按照域值排序
相关性排序api:
public TopDocs search(Query query, int n)
会对每个命中文档进行相关性打分,并返回得分最高的n个文档。
域值排序api:
public TopFieldDocs search(Weight weight,
final int nDocs, Sort sort,
boolean doDocScores, boolean doMaxScore)
sort对象可定义按照哪个或哪几个值域进行排序。
doDocScores这个参数为true,则需要对返回结果进行评分。
doMaxScore这个参数为true,则需要对返回结果进行评分,且需要计算最大的评分。
doMaxScore为true,则会用OneComparatorScoringMaxScoreCollector收集器来收集文档,由于要计算最大得分,因此对每个命中文档都会进行打分。计算得到的最大得分用于查询标准化。
doMaxScore为false,而doDocScores为true,则会用OneComparatorScoringNoMaxScoreCollector收集器来收集文档,由于不用计算最大得分,因此只会对进入优先级队列中的文档(以排序域进行排序的前n个文档)进行打分,没有进入,则不会打分,因此性能会好很多。
doMaxScore和doDocScores都为false,则会用OneComparatorNonScoringCollector收集器来收集文档,由于不需要计算得分,因此性能最好。