Spring Boot 2.x(十七):快速入门Elastic Search
What —— Elasticsearch是什么?
Elasticsearch是一个基于Lucene的搜索服务器,Elasticsearch也是使用Java编写的,它的内部使用Lucene做索引与搜索,但是它的目的是使用全文检索变得简单,通过隐藏Lucene的复杂性,取而代之的提供一套简单一致的RESTful API。
Elasticsearch 不仅仅是 Lucene,并且也不仅仅只是一个全文搜索引擎。 它可以被下面这样准确的形容:
- 一个分布式的实时文档存储,每个字段 可以被索引与搜索
- 一个分布式实时分析搜索引擎
- 能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据
面向文档
Elasticsearch是面向文档,即文档是可以被索引的信息的基本单位,而文档的格式是在NoSQL中常用的JSON,关于关系型数据库和Elasticsearch之间一些名词的关系的对应可以用以下的表格来表示,方便我们后面的应用:
关系型数据库 | Elasticsearch |
---|---|
Database | Index |
Table | Type |
Row | Document |
Column | Field |
Schema | Mapping |
这里需要注意的是文档的格式不是固定的,同一个Type下的不同文档可以拥有不同的格式
Why —— 为什么选择Elasticsearch?
- 丰富的查询方式——Elasticsearch能够执行及合并多种类型的搜索(结构化数据、非结构化数据、地理位置、指标),搜索方式随心而变。
- 极速的查询速度——Elasticsearch通过有限状态转换器实现了用于全文检索的倒排索引,实现了用于存储数值数据和地理位置数据的 BKD 树,以及用于分析的列存储。每个数据都被编入了索引。
- 可观的可扩展性——Elasticsearch能够水平扩展,每秒钟可处理海量事件,同时能够自动管理索引和查询在集群中的分布方式,可以在承载了 PB 级数据的成百上千台服务器上运行。
- 强大的弹性保障——硬件故障。网络分割。Elasticsearch 检测这些故障并确保集群(和数据)的安全性和可用性。通过跨集群复制功能,辅助集群可以作为热备份随时投入使用。
How —— 如何在Spring Boot实战中使用Elasticsearch?
安装Elasticsearch
https://www.elastic.co/cn/dow...
这里我们选择的是6.2.2版本的ES,因为我在spring-data-elasticsearch的github上看到最新版本的支持的ES是6.2.2
其中3.2.x版本尚未发布正式版,所以这里选择了最新的3.1.8版本,下面我们切换到安装目录的bin目录下,启动es:
./elasticsearch &
这里添加 & 符号的作用是让它在后台运行。
看到这个就说明启动成功了~
安装中文分词器iK
因为,在我们日常的应用中,我们用的比较多的都是中文的分词,所以这里我们需要一个中文的分词器
首先前往github上下载与ES版本对应的zip包
https://github.com/medcl/elas...
然后在es的安装目录下的plugins下新建一个ik的目录,将zip包解压到该目录下重启es即可~
在es的启动日志中看到这个说明插件已经安装并启动成功!
到这里,我们的前期准备工作就已经结束了,下面的就是在Spring Boot项目中进行操作了~
添加pom依赖
我们首先在pom.xml中添加spring-data-elasticsearch的依赖(敲黑板!!这里的版本一定要去参考一下对应的ES的版本,不然就会引起版本兼容性问题而报错!):
<dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-elasticsearch</artifactId> <version>3.1.8.RELEASE</version> </dependency>
依赖已经添加完毕,下面我们就通过简单的配置来完成CRUD
CRUD
这里的配置需要注意一个点,我们访问的9200是HTTP的端口号,而使用Java的时候需要配置成9300:
spring: data: elasticsearch: cluster-name: my-applicatioon cluster-nodes: 127.0.0.1:9300
在启动日志中,我们可以看到这一点:
然后我们通过注解来完成一个index和mapping的创建(即对应关系型数据库中的库和表)
@Data @Document(indexName = "test",type = "article") public class Article implements Serializable { private Long id; @Field(type= FieldType.Text,analyzer = "ik_max_word") private String title; private String content; }
@Filed
注解中的属性可以对分词器进行配置analyzer = "ik_max_word"
,这样就可以在查询标题的时候使我们的中文分词器了~
这样,我们就创建了一个index(database)名为test,并新建一个type(table)名为article。
下面,我们如果想要完成CRUD,只需要创建一个接口去继承ElasticsearchRepository
即可,如下:
public interface ESDao extends ElasticsearchRepository<Article,Long> { }
然后,我们就可以在我们项目这样去用了~
和JPA一样方便,我们这时就可以把ES当做MySQL去操作即可~
项目中用到的对应版本的包我已经上传到了百度网盘,关注公众号回复“ES”即可获取。
完整的Demo代码我已经上传到了github,欢迎fork star pr
https://github.com/viyog/viboot
原创不易,谢谢支持!
公众号
相关推荐
另外一部分,则需要先做聚类、分类处理,将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引,同时将每个聚合主题相关的数据存入每个document下面的某个field下。