【ElasticSearch】 ElasticSearch SQL（十一）

AFei00

2020-06-16

ElasticSearch SQL介绍

　　Elasticsearch SQL是一个X-Pack组件，它允许针对Elasticsearch实时执行类似SQL的查询。无论使用REST接口，命令行还是JDBC，任何客户端都可以使用SQL 在Elasticsearch内部本机搜索和聚合数据。可以将Elasticsearch SQL视为一种翻译器，它可以理解SQL和Elasticsearch，并可以利用Elasticsearch功能轻松地进行大规模实时读取和处理数据。

Elasticsearch SQL旨在为Elasticsearch提供强大而轻量级的SQL接口。

为什么选择Elasticsearch SQL？

本机集成　　
　　Elasticsearch SQL是为Elasticsearch从头开始构建的。根据基础存储，针对相关节点有效执行每个查询。
没有外部零件
　　无需其他硬件，流程，运行时或库即可查询Elasticsearch；Elasticsearch SQL通过在 Elasticsearch集群中运行来消除多余的运动部件。
轻巧高效
　　Elasticsearch SQL并未抽象化Elasticsearch及其搜索功能-相反，它包含并公开了SQL以允许以相同的声明性，简洁的方式实时进行适当的全文本搜索。

SQL 入门

1、准备数据

本例使用ES版本是7.6.1，准备数据如下：

POST /book/_bulk

{"index":{"_id": "1001"}}
{"id": 1001, "name": "Java编程思想", "author": "小红", "release_date": "2011-06-02", "page_count": 561}
{"index":{"_id": "1002"}}
{"id": 1002, "name": "Java数据结构和算法", "author": "小绿", "release_date": "1989-05-26", "page_count": 482}
{"index":{"_id": "1003"}}
{"id": 1003, "name": "JavaScript权威指南", "author": "小蓝", "release_date": "1965-06-01", "page_count": 604}
{"index":{"_id": "1004"}}
{"id": 1004, "name": "Java并发编程实践", "author": "小白", "release_date": "1975-06-01", "page_count": 704}

2、使用SQL REST API查询

POST /_sql?format=txt
{
    "query": "SELECT * FROM book WHERE release_date < ‘2000-01-01‘"
}

效果如下：

【ElasticSearch】 ElasticSearch SQL（十一）

3、使用SQL CLI查询

Elasticsearch附带了一个脚本，用于在其bin目录中运行SQL CLI ：

1）运行sql cli

　　命令(默认连接http://localhost:9200)：./bin/elasticsearch-sql-cli

　　命令(指定连接url)：./bin/elasticsearch-sql-cli http://some.server:9200

　　命令(指定连接url带认证)：./bin/elasticsearch-sql-cli http://sql_user:.server:9200

　　2、使用sql cli执行查询sql命令

　　　　查询sql：SELECT * FROM book WHERE page_count > 500 ORDER BY page_count DESC;

　　　　效果如下：

　　　　【ElasticSearch】 ElasticSearch SQL（十一）

SQL和Elasticsearch映射概念

尽管SQL和Elasticsearch对于数据的组织方式（和不同的语义）使用不同的术语，但本质上它们的目的是相同的。

SQL	Elasticsearch	描述
column	field	在这两种情况下，数据都以最低级别存储在命名条目中，该条目具有多种数据类型，包含一个值。SQL将此类条目称为列，而Elasticsearch将其称为字段。请注意，在Elasticsearch中，一个字段可以包含多个相同类型的值（本质上是一个列表），而在SQL中，一列可以恰好包含一个所述类型的值。Elasticsearch SQL将尽最大努力保留SQL语义，并根据查询拒绝那些返回具有多个值的字段的查询。
row	document	`Column`s和`field`s 本身不存在；它们是`row`或的一部分`document`。两者的语义略有不同：a `row`趋于严格（并具有更多的强制性），而a `document`趋于更加灵活或宽松（同时仍具有结构）。
table	index	对其执行查询的目标，无论是SQL还是Elasticsearch。
schema	implicit	在RDBMS中，`schema`主要是表的命名空间，通常用作安全边界。Elasticsearch没有为其提供等效的概念。但是，启用安全性后，Elasticsearch会自动应用安全性强制措施，以便角色仅查看允许其访问的数据（在SQL行话中，其模式为）。
catalog or database	cluster instance	在SQL中，`catalog`或`database`可互换使用，并表示一组模式，即多个表。在Elasticsearch中，可用的索引集被分组为一个`cluster`。语义也有所不同。a `database`本质上是另一个名称空间（可能对数据的存储方式有一定影响），而Elasticsearch `cluster`是运行时实例，或者是一组至少一个Elasticsearch实例（通常是分布式运行）。实际上，这意味着，尽管在SQL中一个实例中可能具有多个目录，但在Elasticsearch中一个实例仅限于一个。
cluster	cluster(federated)	传统上，在SQL中，群集是指包含多个`catalog`s或`database`s 的单个RDMBS实例（请参见上文）。同样的单词也可以在Elasticsearch内部重用，但是其语义有所澄清。尽管RDBMS往往只有一个正在运行的实例，但在单台机器（未分布）上，Elasticsearch却相反，默认情况下，它是分布的和多实例的。此外，Elasticsearch `cluster`可以以联合方式连接到其他`cluster`，因此意味着：`cluster` 单个集群：：通常在同一名称空间内运行的多个Elasticsearch实例通常跨计算机分布。多个集群：：多个集群，每个集群都有自己的名称空间，并在联合设置中相互连接

SQL REST API

1、查询

1）普通查询，同上

POST /_sql?format=txt
{
    "query": "SELECT * FROM book ORDER BY page_count DESC LIMIT 5"
}

2）匹配索引查询

POST /_sql?format=txt

{
    "query": "SELECT * FROM \"boo*\" WHERE page_count > 500 ORDER BY page_count DESC"
}

　　注意：索引名需要用双引号（"）引起来

2、响应格式

　　虽然文本格式对人类很有益，但计算机更喜欢结构化的东西。

　　Elasticsearch SQL可以以下格式返回数据，可以通过formatURL中的属性或通过设置AcceptHTTP标头来设置数据：

　　【ElasticSearch】 ElasticSearch SQL（十一）

　　json格式如下：

　　【ElasticSearch】 ElasticSearch SQL（十一）

3、分页

当数据量较大时，需要分页返回，ES提供了游标的形式来分页

示例

1）第一次请求，设置接收数据大小

POST /_sql?format=sql

{
    "query": "SELECT * FROM book order by release_date",
    "fetch_size" : 1
}

　　效果如下：

　　【ElasticSearch】 ElasticSearch SQL（十一）

2）第二页，使用游标获取数据

POST /_sql?format=json

{
    "cursor": "5/WuAwFaAXNARFhGMVpYSjVRVzVrUm1WMFkyZ0JBQUFBQUFBQUFESVdlbVJGWmtzMmVWVlRXRk4zZW1SSFdETTNhMDFrWnc9Pf////8PBQFmBmF1dGhvcgEGYXV0aG9yAQR0ZXh0AAAAAWYCaWQBAmlkAQRsb25nAAAAAWYEbmFtZQEEbmFtZQEEdGV4dAAAAAFmCnBhZ2VfY291bnQBCnBhZ2VfY291bnQBBGxvbmcAAAABZgxyZWxlYXNlX2RhdGUBDHJlbGVhc2VfZGF0ZQEIZGF0ZXRpbWUBAAABHw=="
}

　　　　效果如下：

　　【ElasticSearch】 ElasticSearch SQL（十一）

　　请注意，响应数据中，该columns对象只是第一页的一部分。

　　　　cursor结果未返回时，您已到达最后一页。像Elasticsearch的滚动一样，

　　　　SQL可以在Elasticsearch中保持状态以支持游标。与滚动不同，接收最后一页足以保证清除Elasticsearch状态。

　　3）清空cursor

　　　　示例

POST /_sql/close
{
    "cursor": "sDXF1ZXJ5QW5kRmV0Y2gBAAAAAAAAAAEWYUpOYklQMHhRUEtld3RsNnFtYU1hQQ==:BAFmBGRhdGUBZgVsaWtlcwFzB21lc3NhZ2UBZgR1c2Vy9f///w8="
}

SQL 翻译 API

SQL Translate API接受JSON文档中的SQL，并将其转换为本地Elasticsearch查询。

　　例如：

POST /_sql/translate

{
    "query": "SELECT * FROM book ORDER BY page_count DESC",
    "fetch_size": 10
}

效果如下：

【ElasticSearch】 ElasticSearch SQL（十一）

翻译出来的DSL语句，可以用在Elasticsearch查询上

elasticsearch

AFei00

0 关注 0 粉丝 0 动态

关注关注

Elasticsearch py客户端库安装及使用方法解析

elasticsearch-py是一个官方提供的low-level的elasticsearch python客户端库。因为它只是对elasticsearch的rest API接口做了一层简单的封装，因此提供了最大的灵活性，但是于此同时使用起来就不是太方便。

newbornzhao 2020-09-14

ElasticSearch最全详细使用教程

本文介绍了ElasticSearch的必备知识：从入门、索引管理到映射详解。Green - everything is good ，即最佳状态。Yellow - all data is available but some replicas are not

做对一件事很重要 2020-09-07

十张图说清Elasticsearch原理！

说到 Elasticsearch，其中最明显的一个特点就是 near real-time 准实时，当文档存储在 Elasticsearch 中时，将在 1 秒内以几乎实时的方式对其进行索引和完全搜索。Segment：也叫段，类似于倒排索引，相当于一个数据

renjinlong 2020-09-03

ElasticSearch 交互使用

tcp 0 0 10.0.0.121:5601 0.0.0.0:* LISTEN 88636/node

李玉志 2020-08-19

django 对接elasticsearch实现全文检索

# python manage.py rebuild_index #数据库有多少条数据，全部会被同步到es中。object = BookSerializer # 只读,不可以进行反序列化。fields = # text 由索引类进行返回, object

明瞳 2020-08-19

Spring Boot 集成 Elasticsearch 实战

可以在 ES 官方文档中发现，ES 为 Java REST Client 提供了两种方式的 Client：Java Low Level Client 和 Java High Level REST Client。低级别客户端，它允许通过 HTTP 请求与 E

李玉志 2020-08-19

如何对 ElasticSearch 集群进行压力测试

当 ElasticSearch 的业务量足够大，比如每天都会产生数百 GB 数据的时候，你就会自然而然的需要一个性能更强的 ElasticSearch 集群。特别是当你使用的场景是一些典型的大量数据进入的场景，比如网站日志、用户行为记录、大型电商网站的站内

mengyue 2020-08-07

操作ElasticSearch插件和可视化工具 Kibana

当 ElasticSearch 的实例并运行，您可以使用 localhost:9200,基于 JSON 的 REST API 与ElasticSearch 进行通信。在 ElasticSearch 自己的文档中，所有示例都使用 curl。但是，当使用 AP

molong0 2020-08-06

Elasticsearch实战 | match_phrase搜不出来，怎么办？

title=公路局正在治理解放大道路面积水问题。实际应用中可能需要： 1）检索关键词”理解”、”解放”、”道路”、“理解放大”，都能搜出这篇文档。标准分析仪是默认分析仪，如果没有指定，则默认使用该分词器。但，会出现冗余数据非常多。针对要求2），排除matc

AFei00 2020-08-03

Elasticsearch聚合后分页深入详解

不支持，看看Elasticsearch员工如何解读。这个问题，2014年在github上有很长的讨论。究其为什么ES不支持聚合后分页？可概括如下： 1）性能角度——聚合分页会在大量的记录中产生性能问题。2）正确性角度——聚合的文档计数不准确。所以奇怪的事情

molong0 2020-08-03

Elasticsearch大文件检索性能提升20倍实践（干货）

ES建立索引完成全文检索的前提是将待检索的信息导入Elaticsearch。项目中，有时候需要将一些扫描件、PDF文档、Word、Excel、PPT等文档内容导入Elasticsearch。比如：将《深入理解Elasticsearch》这边书导入ES，而这

wenwentana 2020-08-03

重磅 | 死磕Elasticsearch方法论认知清单（国庆更新版）

每个人都会犯错，别再让相同的错误一再发生，别再让我们为那些错误付出沉痛的代价。清单不是写在纸上的，而是印在心上的。我们别无选择，清单，正在一步步变革我们的生活，变革这个复杂的世界......——[美] 阿图-葛尔德《清单革命》。实战 | Elasticse

YYDU 2020-08-03

Elasticsearch实战 | 必要的时候，还得空间换时间!

另外一部分，则需要先做聚类、分类处理，将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引，同时将每个聚合主题相关的数据存入每个document下面的某个field下。

sifeimeng 2020-08-03

Elasticsearch索引增量统计及定时邮件实现

如何以相对简单的图形化效果展示数据的增量呢？本文给出思路和实现。2）crontab实现定时任务处理。步骤1，步骤2数据可以Excel统计得出。步骤3:Excel生成图表。3）开发中其他相关物理机器内存、CPU、磁盘读写性能等指标的监控等。

心丨悦 2020-08-03

如何在Linux下安装部署分布式全文搜索引擎

Elasticsearch是一个开源的分布式全文本搜索和分析引擎。它支持RESTful操作，并允许您实时存储，搜索和分析大量数据。Elasticsearch是最流行的搜索引擎之一，可为具有复杂搜索要求的应用程序提供动力，例如大型电子商务商店和分析应用程序。

liangwenrong 2020-07-31

ElasticSearch的下载、安装使用

下载ik中文分词器。浏览器访问是否启动成功。安装ik中文分词插件。解压分词插件包—->放到es的plugins目录下—->重新启动es即可

sifeimeng 2020-08-01

我也是才知道ElasticSearch条件更新是这么玩的

ElasticSearch 的使用度越来越普及了，很多公司都在使用。有做日志搜索的，有做商品搜索的，有做订单搜索的。大部分使用场景都是通过程序定期去导入数据到 ElasticSearch 中，或者通过 CDC 的方式来构建索引。在这种场景下，更新数据都是单

mengyue 2020-07-30

读写成功率达99.999%，提升ElasticSearch系统稳定性的秘密

ElasticSearch 是一个分布式的开源搜索和分析引擎，因其功能强大、简单易用而被应用到很多业务场景。在生产环境使用 ES 时，如果未进行优化则服务的稳定性可能得不到保障，目前我们使用 ES 作为账单平台的基础组件为微信支付提供服务时就遇到这种问题。

tigercn 2020-07-29

es快照备份到minio

用 API 删除快照很重要，而不能用其他机制。因为快照是增量的，有可能很多快照依赖于过去的段。deleteAPI 知道哪些数据还在被更多近期快照使用，然后会只删除不再被使用的段。但是，如果你做了一次人工文件删除，你将会面临备份严重损坏的风险，因为你在删除的

IceStreamLab 2020-07-29

Elasticsearch是一把梭，用起来再说？！

我们这边es 都是我们在推,很多开发不会用或者用的不规范！问题3：不评估可行性和高可用性，先搞起来。如下图，某公司26岁的程序员王某的Elasitcsearch一把梭用法，能很形象的说出了问题产生的根因。2019年12月初安全事件《Elasticsearc

IceStreamLab 2020-07-29

安科网

【ElasticSearch】 ElasticSearch SQL（十一）

AFei00

ElasticSearch SQL介绍

为什么选择Elasticsearch SQL？

SQL 入门

1、准备数据

2、使用SQL REST API查询

3、使用SQL CLI查询

SQL和Elasticsearch映射概念

SQL REST API

1、查询

2、响应格式

3、分页

SQL 翻译 API

AFei00

相关推荐

Elasticsearch py客户端库安装及使用方法解析

ElasticSearch最全详细使用教程

十张图说清Elasticsearch原理！

ElasticSearch 交互使用

django 对接elasticsearch实现全文检索

Spring Boot 集成 Elasticsearch 实战

如何对 ElasticSearch 集群进行压力测试

操作ElasticSearch插件和可视化工具 Kibana

Elasticsearch实战 | match_phrase搜不出来，怎么办？

Elasticsearch聚合后分页深入详解

Elasticsearch大文件检索性能提升20倍实践（干货）

重磅 | 死磕Elasticsearch方法论认知清单（国庆更新版）

Elasticsearch实战 | 必要的时候，还得空间换时间!

Elasticsearch索引增量统计及定时邮件实现

如何在Linux下安装部署分布式全文搜索引擎

ElasticSearch的下载、安装使用

我也是才知道ElasticSearch条件更新是这么玩的

读写成功率达99.999%，提升ElasticSearch系统稳定性的秘密

es快照备份到minio

Elasticsearch是一把梭，用起来再说？！

AFei00