lucene的排序方式

lucene的查询排序有两种方式,一种是按照相关性排序,一种是按照域值排序

相关性排序api:

public TopDocs search(Query query, int n)

会对每个命中文档进行相关性打分,并返回得分最高的n个文档。

域值排序api:

public TopFieldDocs search(Weight weight,

                                final int nDocs, Sort sort,

                                boolean doDocScores, boolean doMaxScore)

sort对象可定义按照哪个或哪几个值域进行排序。

doDocScores这个参数为true,则需要对返回结果进行评分。

doMaxScore这个参数为true,则需要对返回结果进行评分,且需要计算最大的评分。

doMaxScore为true,则会用OneComparatorScoringMaxScoreCollector收集器来收集文档,由于要计算最大得分,因此对每个命中文档都会进行打分。计算得到的最大得分用于查询标准化。

doMaxScore为false,而doDocScores为true,则会用OneComparatorScoringNoMaxScoreCollector收集器来收集文档,由于不用计算最大得分,因此只会对进入优先级队列中的文档(以排序域进行排序的前n个文档)进行打分,没有进入,则不会打分,因此性能会好很多。

doMaxScore和doDocScores都为false,则会用OneComparatorNonScoringCollector收集器来收集文档,由于不需要计算得分,因此性能最好。

相关推荐