Elasticsearch 实践一：初识

qingmoucsdn

2019-06-28

快速搭建测试环境

window下部署ELK（6.2.2系列）

基础知识

基本认知

索引(index)：类似于传统关系数据库中的一个数据库; 复数词为 indices 或 indexes
类型(type):类似于传统关系数据库中的一个表
文档(docuemnt):类似于传统关系数据库中的表中的一行数据
倒排索引：
关系型数据库通过增加一个 索引 比如一个 B树（B-tree）索引 到指定的列上，以便提升数据检索速度。Elasticsearch 和 Lucene 使用了一个叫做 倒排索引 的结构来达到相同的目的。默认的，一个文档中的每一个属性都是 被索引 的（有一个倒排索引）和可搜索的。一个没有倒排索引的属性是不能被搜索到的

**Elasticsearch 开放的restful api接口通信，所以理论任何语言都可以接入**

分析和过滤器认知

# 字符过滤器
首先，字符串按顺序通过每个 字符过滤器 。他们的任务是在分词前整理字符串。一个字符过滤器可以用来去掉HTML，或者将 & 转化成 `and`。
# 分词器(分析器)
其次，字符串被 分词器 分为单个的词条或词语。一个简单的分词器遇到空格和标点的时候，可能会将文本拆分成词条。
# Token 过滤器
最后，词条按顺序通过每个 token 过滤器 。这个过程可能会改变词条（例如，小写化 Quick ），删除词条（例如， 像 a`， `and`， `the 等无用词），或者增加词条（例如，像 jump 和 leap 这种同义词）。
Elasticsearch提供了开箱即用的字符过滤器、分词器和token过滤器

Curl请求

curl -i -X<VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' -d '<BODY>'
-i: 打印返回的头部信息
VERB: HTTP方法 : `GET`、 `POST`、 `PUT`、 `HEAD 或者 `DELETE`
-d: 请求提内容<BODY>

学习笔记

创建索引

# 创建megacorp索引，分配3封主分配，每个主分片分配1个副本，这里总的是6个分片（3主3副）, 后面章节我们会简单介绍es集群知识
PUT /megacorp
{
   "settings" : {
      "number_of_shards" : 3,
      "number_of_replicas" : 1
   }
}

直接提供id方式索引一个文档

# PUT 索引/类型/id
PUT /megacorp/employee/1
{
    "first_name" : "John",
    "last_name" :  "Smith",
    "age" :        25,
    "about" :      "I love to go rock climbing",
    "interests": [ "sports", "music" ]
}


PUT /megacorp/employee/2
{
    "first_name" :  "Jane",
    "last_name" :   "Smith",
    "age" :         32,
    "about" :       "I like to collect rock albums",
    "interests":  [ "music" ]
}

PUT /megacorp/employee/3
{
    "first_name" :  "Douglas",
    "last_name" :   "Fir",
    "age" :         35,
    "about":        "I like to build cabinets",
    "interests":  [ "forestry" ]
}

基本的查询

# GET 索引/类型/id
GET /megacorp/employee/1

# GET 索引/类型/_search
GET /megacorp/employee/_search

# 增加搜索参数q
GET /megacorp/employee/_search?q=last_name:Smith

# _all表示所有索引里查询
# 查询在 tweet 类型中 tweet 字段包含 elasticsearch 单词的所有文档
GET /_all/employee/_search?q=tweet:elasticsearch

# name 字段中包含 john 并且在 tweet 字段中包含 mary 的文档
GET /_all/employee/_search?q=+name:john +tweet:mary
# /_search?q=%2Bname%3Ajohn+%2Btweet%3Amary

# （name 字段中包含 mary 或者 john ）（date 值大于 2014-09-10） （_all_ 字段包含 aggregations 或者 geo）
GET /_all/employee/_search?q=+name:(mary john) +date:>2014-09-10 +(aggregations geo)

# 搜索返回包含 mary 的所有文档
GET /_search?q=mary

# 查询表达式查询（查询体）
GET /megacorp/employee/_search
{
    "query" : {
        "match" : {
            "about" : "rock albums"
        }
    },
    "highlight": {
        "fields" : {
            "about" : {}
        }
    }
}

# 查询索引下的类型所有和细节
GET /megacorp/_mapping?pretty=true

基本的删除操作

# 删除文档
DELETE /megacorp/employee/1

# 删除索引
DELETE /megacorp

elasticsearch 索引分词词条

qingmoucsdn

0 关注 0 粉丝 0 动态

关注关注

django 对接elasticsearch实现全文检索

# python manage.py rebuild_index #数据库有多少条数据，全部会被同步到es中。object = BookSerializer # 只读,不可以进行反序列化。fields = # text 由索引类进行返回, object

明瞳 2020-08-19

Elasticsearch实战 | 必要的时候，还得空间换时间!

另外一部分，则需要先做聚类、分类处理，将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引，同时将每个聚合主题相关的数据存入每个document下面的某个field下。

sifeimeng 2020-08-03

Elasticsearch索引增量统计及定时邮件实现

如何以相对简单的图形化效果展示数据的增量呢？本文给出思路和实现。2）crontab实现定时任务处理。步骤1，步骤2数据可以Excel统计得出。步骤3:Excel生成图表。3）开发中其他相关物理机器内存、CPU、磁盘读写性能等指标的监控等。

心丨悦 2020-08-03

.net core 如何向elasticsearch中创建索引，插入数据。

{public static readonly string url = "http://ip:9200/";//这个是elasticsearch远程访问ip

李玉志 2020-07-26

Elasticsearch－基础介绍及索引原理分析

Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 Lucene 那么简单，它不仅包括了全文搜索功能，还可以进行以下工作:.

tigercn 2020-07-19

elasticsearch 索引操作

GET /_cat/health?v. GET /_cat/nodes?v. GET /_cat/indices?v. "number_of_shards" : 3,},put /customer/_doc/1?pretty{ &qu

李玉志 2020-07-04

Elasticsearch 面试专题

4、采取冷热分离机制，热数据存储到 SSD，提高检索效率；冷数据定期进行 shrink操作，以缩减存储；

mengyue 2020-07-04

es 实战 —— spring boot 中使用 Elasticsearch

// 使用服务端配置？// 是否独立存储，不需要从 _source 解析，在需要频繁使用某个字段时使用。

mengyue 2020-06-27

Elasticsearch实战 | match_phrase搜不出来，怎么办？

title=公路局正在治理解放大道路面积水问题。实际应用中可能需要： 1）检索关键词”理解”、”解放”、”道路”、“理解放大”，都能搜出这篇文档。标准分析仪是默认分析仪，如果没有指定，则默认使用该分词器。但，会出现冗余数据非常多。针对要求2），排除matc

AFei00 2020-08-03

ElasticSearch的下载、安装使用

下载ik中文分词器。浏览器访问是否启动成功。安装ik中文分词插件。解压分词插件包—->放到es的plugins目录下—->重新启动es即可

sifeimeng 2020-08-01

DockerFile构建ElasticSearch镜像安装IK中文分词器插件

为什么要安装IK中文分词器？ES提供的分词是英文分词，对中文做分词时会拆成单字而不是词语，非常不好，因此索引信息含中文时需要使用中文分词器插件。# 下载IK插件文件。docker run -d -p 9200:9200 -p 9300:9300 -e &q

vtnews 2020-07-29

Elasticsearch py客户端库安装及使用方法解析

elasticsearch-py是一个官方提供的low-level的elasticsearch python客户端库。因为它只是对elasticsearch的rest API接口做了一层简单的封装，因此提供了最大的灵活性，但是于此同时使用起来就不是太方便。

newbornzhao 2020-09-14

ElasticSearch最全详细使用教程

本文介绍了ElasticSearch的必备知识：从入门、索引管理到映射详解。Green - everything is good ，即最佳状态。Yellow - all data is available but some replicas are not

做对一件事很重要 2020-09-07

十张图说清Elasticsearch原理！

说到 Elasticsearch，其中最明显的一个特点就是 near real-time 准实时，当文档存储在 Elasticsearch 中时，将在 1 秒内以几乎实时的方式对其进行索引和完全搜索。Segment：也叫段，类似于倒排索引，相当于一个数据

renjinlong 2020-09-03

ElasticSearch 交互使用

tcp 0 0 10.0.0.121:5601 0.0.0.0:* LISTEN 88636/node

李玉志 2020-08-19

Spring Boot 集成 Elasticsearch 实战

可以在 ES 官方文档中发现，ES 为 Java REST Client 提供了两种方式的 Client：Java Low Level Client 和 Java High Level REST Client。低级别客户端，它允许通过 HTTP 请求与 E

李玉志 2020-08-19

如何对 ElasticSearch 集群进行压力测试

当 ElasticSearch 的业务量足够大，比如每天都会产生数百 GB 数据的时候，你就会自然而然的需要一个性能更强的 ElasticSearch 集群。特别是当你使用的场景是一些典型的大量数据进入的场景，比如网站日志、用户行为记录、大型电商网站的站内

mengyue 2020-08-07

操作ElasticSearch插件和可视化工具 Kibana

当 ElasticSearch 的实例并运行，您可以使用 localhost:9200,基于 JSON 的 REST API 与ElasticSearch 进行通信。在 ElasticSearch 自己的文档中，所有示例都使用 curl。但是，当使用 AP

molong0 2020-08-06

Elasticsearch聚合后分页深入详解

不支持，看看Elasticsearch员工如何解读。这个问题，2014年在github上有很长的讨论。究其为什么ES不支持聚合后分页？可概括如下： 1）性能角度——聚合分页会在大量的记录中产生性能问题。2）正确性角度——聚合的文档计数不准确。所以奇怪的事情

molong0 2020-08-03

Elasticsearch大文件检索性能提升20倍实践（干货）

ES建立索引完成全文检索的前提是将待检索的信息导入Elaticsearch。项目中，有时候需要将一些扫描件、PDF文档、Word、Excel、PPT等文档内容导入Elasticsearch。比如：将《深入理解Elasticsearch》这边书导入ES，而这

wenwentana 2020-08-03

安科网

Elasticsearch 实践一：初识

qingmoucsdn

快速搭建测试环境

基础知识

基本认知

分析和过滤器认知

Curl请求

学习笔记

创建索引

直接提供id方式索引一个文档

基本的查询

基本的删除操作

qingmoucsdn

相关推荐

django 对接elasticsearch实现全文检索

Elasticsearch实战 | 必要的时候，还得空间换时间!

Elasticsearch索引增量统计及定时邮件实现

.net core 如何向elasticsearch中创建索引，插入数据。

Elasticsearch－基础介绍及索引原理分析

elasticsearch 索引操作

Elasticsearch 面试专题

es 实战 —— spring boot 中使用 Elasticsearch

Elasticsearch实战 | match_phrase搜不出来，怎么办？

ElasticSearch的下载、安装使用

DockerFile构建ElasticSearch镜像安装IK中文分词器插件

Elasticsearch py客户端库安装及使用方法解析

ElasticSearch最全详细使用教程

十张图说清Elasticsearch原理！

ElasticSearch 交互使用

Spring Boot 集成 Elasticsearch 实战

如何对 ElasticSearch 集群进行压力测试

操作ElasticSearch插件和可视化工具 Kibana

Elasticsearch聚合后分页深入详解

Elasticsearch大文件检索性能提升20倍实践（干货）

qingmoucsdn