ElasticSearch 学习笔记 - 3.核心概念
1 索引
索引(index)是ElasticSearch存放具体数据的地方,是一类具有相似特征的文档的集合。ElasticSearch中索引的概念具有不同意思,这里的索引相当于关系数据库中的一个数据库实例。
在ElasticSearch中索引还可以作为动词,表示对数据进行索引操作。
2 类型
在6.0之前的版本,一个ElasticSearch索引中,可以有多个类型;
从6.0版本开始,,一个ElasticSearch索引中,只有1个类型。一个类型是索引的一个逻辑上的分类,通常具有一组相同字段的文档组成。
ElasticSearch的类型概念相当于关系数据库的数据表。
将来type将被移除。
3 文档
文档是ElasticSearch可被索引的基础逻辑单元,相当于关系数据库中数据表的一行数据。ElasticSearch的文档具有JSON格式,由多个字段组成,字段相当于关系数据库中列的概念。
4 对比
ElasticSearch | RDBMS |
---|---|
索引(index) | 数据库(database) |
类型(type) | 表(table) |
文档(document) | 行(row) |
字段(field) | 列(column) |
映射(mapping) | 表结构(schema) |
全文索引 | 索引 |
查询DSL | SQL |
GET | select |
PUT/POST | update |
DELETE | delete |
5 分片
当数据量较大时,索引的存储空间需求超出单个节点磁盘容量的限制,或者出现单个节点处理速度较慢。
为了解决这些问题,ElasticSearch将索引中的数据进行切分成多个分片(shard),每个分片存储这个索引的一部分数据,分布在不同节点上。
当需要查询索引时,ElasticSearch将查询发送到每个相关分片,之后将查询结果合并,这个过程对ElasticSearch应用来说是透明的,用户感知不到分片的存在。
一个索引的分片一旦指定,不再修改。
6 副本
其实,分片全称是主分片,简称为分片。
主分片是相对于副本来说的,副本是对主分片的一个或多个复制版本(或称拷贝),这些复制版本(拷贝)可以称为复制分片,可以直接称之为副本。
当主分片丢失时,集群可以将一个副本升级为新的主分片。
相关推荐
另外一部分,则需要先做聚类、分类处理,将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引,同时将每个聚合主题相关的数据存入每个document下面的某个field下。