ES入门
ES基础:
索引(index):逻辑存储,相当于关系型数据库的表。每个索引有一或多个分片(shard) 每个分片有多个副本(replica)
分片(shard):单台机器无法存储大量数据,es可以将一个索引中的数据切分为多个分片(shard),分布在多台服务器上存储。有了分片(shard)就可以横向扩展,存储更多数据,让搜索和分析等操作分布到多台服务器上去执行,提升吞吐量和性能。每个分片(shard)都是一个lucene index
副本(replica): 任何一个服务器随时可能宕机,此时分片(shard)可能就会丢失,因此可以为每个分片(shard)创建多个replica副本。replica可以在shard故障时提供备用服务,保证数据不丢失,多个replica还可以提升搜索操作的吞吐量和性能。
文档(document):es中的最小数据单位,一个document可以是一条客户数据,一条商品分类数据,一条订单数据,通常用JSON数据结构表示,每个index下的type中,都可以存储多个document。一个document里面有多个fieId,每个field就是一个数据字段。
面向文档存储:
(1)应用系统的数据结构都是面向对象的,复杂的
(2)对象数据存储到数据库中,只能拆解开来,变为扁平的多张表,每次查询的时候还得还原回对象格式, 相当麻烦
(3)ES是面向文档的,文档中存储的数据结构,与面向对象的数据结构是一样的,基于这种文档数据结构,es可以提供复杂的索引,全文检索,分析聚合等功能
(4)ES的document用JSON数据格式来表达
映射(mapper)
文档中的每个字段根据不同类型做相对应的分析。
ES核心概念 vs. 数据库核心概念
索引(indices)-------------Table 数据表
文档(Document)--------Row 行
字段(Field)-------Columns 列
kibana ES操作
基础操作
1、查看集群健康:GET /_cat/health
2、查看索引:GET /_cat/indices?v