Hibernate Search常用注解总结

manbucy

2011-06-08

关注关注

1. @Indexed

-> index 指定索引名称

2. @Field

-> name 指定当前属性在Lucene Document中存储的名称，默认为属性名

-> store 指定当前属性是否被存储在Lucene index中，可选值为：

1) Store.YES 占用大量的索引空间，支持"投影(projection)"

2) Store.COMPRESS 压缩方式，消耗大量CPU

3) Store.NO (default)

-> index 指定元素索引方式和信息存储类型，可选值为：

1) Index.NO 不索引，只有通过设置store才可以访问其内容

2) Index.TOKENIZED (default) 使用analyzer

3) Index.UN_TOKENIZED 不使用analyzer

4) Index.NO_NORMS (advanced)

是否采用分词可依据，是要查询数据本身还是它所包含的内容(文字)；

用来排序的域不需要分词。

-> termVector 检索统计信息

1) TermVector.YES

2) TermVector.NO (default)

3) TermVector.WITH_OFFSETS

4) TermVector.WITH_POSITIONS

5) TermVector.WITH_POSITION_OFFSETS

-> indexNullAs

1) Field.DO_NOT_INDEX_NULL

通过hibernate.search.default_null_token指定，默认为_null_

查询时使用相同的分词来查找空值，建议Index.UN_TOKENIZED时使用

2) Field.DEFAULT_NULL_TOKEN (default)

-> boost 用法形如：boost=@Boost(2f)，详见@Boost

-------------------------------------------------------------------------------------------------------------

Stored Indexed Tokenized

Y Y N 适合原始值需要保持原样的字段，如URL、文件系统路径、日期、个人名称、电话号码等；

Y N N 适合需要和搜索结果一起显示的字段，但从不直接搜索它的值，如URL或数据库主键；

N Y Y 适合索引大量的文本而不需要以原始形式重新获得它，如网页主题或各种文本文档；

-------------------------------------------------------------------------------------------------------------

3. @NumericField

@Field的联合注解，用于Integer, Long, Float和Double属性，索引时采用字典树结构(Trie structure).

Lucene将此API标记为experimental，未来版本未必支持。Hibernate Search将尽量掩盖底层的API变化，但也未必能有效保证。

-> forField

-> precisionStep (default值4)

4. @DocumentId

用于保证索引实体的单一性。必须存储而且必须不能被分词(相当于加了@Field(store=Store.YES, index=Index.UN_TOKENIZED))

采用JPA方式时，如果指定了@Id则不再需要标注该注解。

5. @Fields

同一个域采用不同的索引策略。需要为每个Field指定name属性(非强制).

当使用@Fields时，@Field将支持两个有用的属性：

-> analyzer 为每个field定义@Analyzer而非为属性定义

-> bridge 每个field定义@FieldBridge而非为属性定义

6. @IndexedEmbedded

对象有组合关系时使用。

-> depth 关联的深度，存在循环的依赖时使用。

-> prefix 索引fields的前缀，默认为"属性名."，如address.city中的"address."

-> targetElement 被标注的域不是实际对象类型(如声明类型为接口)时使用，用来指定实际对象类型

1) 关联对象会自动被设为@Indexed

2) 相当于在当前实体对应的Document下创建一个或多个名为"前缀+被组合实体中标注了@Field的域"的Field

3) 对集合、Map、对象数组同样生效

4) 成本很高，尽量不要过多的使用该注解

7. @ContainedIn

双相关联的对象中，另一方配合@IndexedEmbedded使用，保证Lucene document的联动更新。

当前类被用JPA方式标注为@Embeddable时不需要使用@ContainedIn

8. @Boost

静态索引加速。与被索引实体的运行时状态无关。

1) 可用在@Field的boost属性中、方法级、类级

2) 不同方式指出的加速系数会累积，不能重复使用。如

@Field(boost=@Boost(1.5f))

@Boost(2f)

public String getSummary() { return summary; }

则summary系数为3，比普通域重要3倍

3) 提升因数的指定并非精确的，可用来标注相对重要的实体或域。

9. @DynamicBoost

动态索引加速。

-> impl 指定具体的加速策略实现类

1) 用于class或field级别

2) 使用该标注时，需要自定义加速策略类并实现BoostStrategy接口：

public interface BoostStrategy {

public float defineBoost(Object value);

}

value是被标注的类型实例或属性值。

3) 可以和@Boost混合使用

10. @Analyzer

-> impl 指定具体的Analyzer实现类

-> definition 指向@AnalyzerDef标注中name属性定义的值

* 类方式：

1) 可以作用于实体、属性甚至每个域

2) 同一实体中使用不同的混合的Analyzer通常是一种坏的做法，尤其是在使用QueryParser查询时

3) 必须保证在同一域上，索引和查询使用的是同一个Analyzer.

11. @AnalyzerDef

Hibernate Search采用Solr framework做分词。

版本3.3.0.Beta2之前需添加Solr依赖，之后被囊入org.hibernate:hibernate-search-analyzers中

-> name (Required) 定义该分词器的唯一字符串

-> charFilters (Optional) 负责对分词前的输入流预处理

-> tokenizer (Required) 负责拆分输入流为单词或单字

-> filters (Optional) 负责对分词后的输入流做一些额外处理

通过@AnalyzerDef声明的Analyzer实例可以在SearchFactory中得到：

Analyzer analyzer = fullTextSession.getSearchFactory().getAnalyzer("customanalyzer");

12. @CharFilterDef

定义CharFilter，一般配合@AnalyzerDef使用。

-> factory

-> params

13. @TokenizerDef

定义Tokenizer，一般配合@AnalyzerDef使用。

-> factory

-> params

14. @TokenFilterDef

定义TokenFilter，一般配合@AnalyzerDef使用。

-> factory

-> params

15. @DateBridge

日期型存储格式为 yyyyMMddHHmmssSSS

-> resolution

1) Resolution.DAY

2) Resolution.HOUR

3) Resolution.MILLISECOND

4) Resolution.MINUTE

5) Resolution.MONTH

6) Resolution.SECOND

7) Resolution.YEAR

16. @FieldBridge

-> impl 所使用Bridge的实现类名，该实现类需实现以下接口之一，且所有实现必须是线程安全的：

1) StringBridge

最简单的Bridge,作用于普通的field/getter/class

需要实现objectToString(Object object)方法，以便自定义对象到String的转换过程

2) TwoWayStringBridge

作用于: 1.标注了@DocumentId的属性(通常为id属性)

2.需要从index中读回的属性

需要提供双向转换，且object = stringToObject(objectToString(object))要成立

3) FieldBridge

可灵活操作Lucene Document.例如需要对日期分年、月、日存储在3个field时.

需要实现set(String name,Object value,Document document,LuceneOptions luceneOptions)方法

可选接口：

ParameterizedBridge 用来获得参数

AppliedOnTypeAwareBridge 用来获得被标注为@FieldBridge的类型

-> params

17. @ClassBridge

用于一个实体对应的多个属性的联合索引，且该索引通常需要采用一种特殊的索引方式

-> impl

-> name

-> store

-> analyzer

-> index

-> termVector

-> boost

-> params

索引

manbucy

0 关注 0 粉丝 0 动态

关注关注

MySQL数据类型优化原则

MySQL支持的数据类型很多，选择正确的数据类型对于高性能至关重要。下面几个简单的原则都有助于做出更好的选择。应该尽量使用可以正确储存数据的最小数据类型。如果无法确定哪个数据类型时最好的，就选择你认为不会超过范围的最小类型。比如用MySQ内建的类型而不是使

ribavnu 2020-11-16

MySql索引使用策略分析

(建立索引会占用磁盘空间的索引文件。2.很少数据的列也不应该建立索引,比如一个性别字段 0或者1,在查询中,结果集的数据占了表中数据行的比例比较大,mysql需要扫描的行数很多,增加索引,并不能提高效率

moyekongling 2020-11-13

python如何获得list或numpy数组中最大元素对应的索引

#表示最大值在第二行第二列

sizhixht 5评论 2020-11-16

Python实现列表索引批量删除的5种方法

开头，如果不仔细看好像没什么问题。但是结果却是错误的。将 listObj.remove() 改为listObj.pop结果也是相同的。Java用同样的编程思想，得到的结果也有相似性。这种错误，主要是初学者对于数据存储原理没有理解清楚，或者，没有意识到内存存

坚持是一种品质 5评论 2020-11-16

MyISAM与InnoDB索引实现对比详解

MyISAM引擎使用B+Tree作为索引结构，叶节点的data域存放的是数据记录的地址。这里设表一共有三列，假设我们以Col1为主键，则上图是一个MyISAM表的主索引示意。虽然InnoDB也使用B+Tree作为索引结构，但具体实现方式却与MyISAM截然

chenjiazhu 2020-09-29

万能Python的秘诀：操纵数据的内置工具

本文转载自公众号“读芯术”。Python可谓是如今最流行的编程语言，甚至孩子们也可以从它开始学习趣味编程。Python类似英语的简单语法使它成为一种通用语言，已在全世界各个领域被广泛使用。Python的万能之处正在于其内置的数据结构，它使编码变得简单，不受

kikaylee 2020-10-31

Uber为什么放弃Postgres选择迁移到MySQL？

Uber 的早期架构包含了一个用 Python 开发的单体后端应用程序，这个应用程序使用 Postgres 作为数据存储。从那个时候开始，Uber 的架构已经发生了巨大变化，变成了微服务，并采用新的数据平台模型。具体地说，之前使用 Postgres 的地方

Ida 5评论 2020-09-16

导致MySQL索引失效的一些常见写法总结

最近一直忙着处理原来老项目遗留的一些SQL优化问题，由于当初表的设计以及字段设计的问题，随着业务的增长，出现了大量的慢SQL，导致MySQL的CPU资源飙升，基于此，给大家简单分享下这些比较使用的易于学习和使用的经验。这次的话简单说下如何防止你的索引失效。

liuweiq 2020-09-09

MySQL索引的各种类型

索引是数据库存储引擎用于快速查找到指定数据的一种数据结构。可以用新华字典做类比：如果新华字典中对每个字的详细解释是数据库中表的记录，那么按部首或拼音等排序的目录就是索引，使用它可以让我们快速查找的某一个字详细解释的位置。在MySQL中，存储引擎也是用了类似

silencehgt 2020-09-07

MySQL 数据库如何解决高并发问题

我们都知道初创公司一开始都是以单体应用为首要架构，一般都是单体单库的形式。但是版本以及版本的迭代，数据库需要承受更多的高并发已经成了架构设计需要考虑的点。高并发的情况下，可以将多个请求的查询合在一次进行，以减少对数据库的访问速度。我们都知道，只要数据库

sunnyxuebuhui 2020-09-07

MySQL 千万级数据量如何快速分页

后端开发中为了防止一次性加载太多数据导致内存、磁盘IO都开销过大，经常需要分页展示，这个时候就需要用到MySQL的LIMIT关键字。但你以为LIMIT分页就万事大吉了么，Too young,too simple啊，LIMIT在数据量大的时候极可能造成的一个

西瓜皮儿的皮儿 2020-09-07

MongoDB通配符索引的用法实例

MongoDB在4.2 版本推出了Wildcard Indexes，究竟什么是Wildcard Indexes以及Wildcard Indexes适合哪些场景本文结合官方文档以及实际测试进行简单概述。因为MongoDB是dynamic schemas，所以

LuckyLXG 5评论 2020-09-08

django 对接elasticsearch实现全文检索

# python manage.py rebuild_index #数据库有多少条数据，全部会被同步到es中。object = BookSerializer # 只读,不可以进行反序列化。fields = # text 由索引类进行返回, object

明瞳 2020-08-19

msyql索引篇

官方介绍索引是帮助MySQL高效获取数据的数据结构。更通俗的说，数据库索引好比是一本书前面的目录，能加快数据库的查询速度。我们通常所说的索引，包括聚集索引、覆盖索引、组合索引、前缀索引、唯一索引等，没有特别说明，默认都是使用B+树结构组织的索引。可以提高数

MissFuTT 2020-08-18

Pandas

可以使用中括号取单个索引，或者中括号里一个列表取多个索引。使得两个Series进行相加。可以使用pd.isnull()，pd.notnull()，或s.isnull(),notnull()函数检测缺失数据。DataFrame由按一定顺序排列的多列数据组成。

jzlixiao 2020-08-18

浅析MongoDB 全文检索

全文检索对每一个词建立一个索引，指明该词在文章中出现的次数和位置，当用户查询时，检索程序就根据事先建立的索引进行查找，并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。MongoDB 从 2.4 版本开始支持全文检索，目前支

zhushenghan 2020-08-16

oracle数据库关于索引建立及使用的详细介绍

罗罗 2020-08-16

MySQL索引的基本语法

索引是排好序的数据结构！可以用在 where 条件查找的字段，和order by 排序的字段，有了索引，便可以快速地定位数据所在的物理地址并找出来。ALTER TABLE 表名 ADD INDEX 索引名 ;ALTER TABLE 表名 DROP INDE

mrandy 2020-08-15

MySQL数据库查询性能优化策略

Explain 用来分析 SELECT 查询语句，开发人员可以通过分析 Explain 结果来优化查询语句。MySQL可以为多个字段创建索引,一个索引可以包括16个字段,只有查询条件中使用这些字段中的第一个字段时,索引才会被使用.子查询虽然可以使查询语句更

houdaxiami 2020-08-15

关于mysql自增id，你需要知道的

本篇文章将以问答的形式讲述关于自增id的一切。这就要求同一个叶子节点内的各条数据记录按主键顺序存放，因此每当有一条新的记录插入时，MySQL会根据其主键将其插入适当的节点和位置，如果页面达到装载因子，则开辟一个新的页（节点）。自增id是增长的不一定连续。

抱抱熊 2020-08-15

安科网

Hibernate Search常用注解总结

manbucy

manbucy

相关推荐

MySQL数据类型优化原则

MySql索引使用策略分析

python如何获得list或numpy数组中最大元素对应的索引

Python实现列表索引批量删除的5种方法

MyISAM与InnoDB索引实现对比详解

万能Python的秘诀：操纵数据的内置工具

Uber为什么放弃Postgres选择迁移到MySQL？

导致MySQL索引失效的一些常见写法总结

MySQL索引的各种类型

MySQL 数据库如何解决高并发问题

MySQL 千万级数据量如何快速分页

MongoDB通配符索引的用法实例

django 对接elasticsearch实现全文检索

msyql索引篇

Pandas

浅析MongoDB 全文检索

oracle数据库关于索引建立及使用的详细介绍

MySQL索引的基本语法

MySQL数据库查询性能优化策略

关于mysql自增id，你需要知道的

manbucy