django 对接elasticsearch实现全文检索

明瞳

2020-08-19

django 对接elasticsearch实现全文检索

第一步：安装elasticsearch环境（docker安装）

拉取镜像

# docker image pull delron/elasticsearch-ik:2.4.6-1.0

运行容器

# docker run -d -p 9200:9200 -p 9300:9300 --name search delron/elasticsearch-ik:2.4.6-1.0

elasticsearch建立索引库

# curl -XPUT http://localhost:9200/test

django 对接elasticsearch实现全文检索

第二步：首先安装相关的依赖包

# pip3 install drf-haystack 
# pip3 install elasticsearch
# pip3 install djangorestframework

第三步：在django项目配置文件settings.py中注册应用

INSTALLED_APPS = [
    ...
    ‘app01.apps.App01Config‘,        
    ‘haystack‘,
    ‘rest_framework‘
]

第四步：在django项目配置文件settings.py中指定搜索的后端

HAYSTACK_CONNECTIONS = {
    ‘default‘: {
        ‘ENGINE‘: ‘haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine‘,
        ‘URL‘: ‘http://12.0.0.1:9200/‘,  # 此处为elasticsearch运行的服务器ip地址，端口号固定为9200
        ‘INDEX_NAME‘: ‘test‘,  # 指定elasticsearch建立的索引库的名称
    },
}

# 当添加、修改、删除数据时，自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = ‘haystack.signals.RealtimeSignalProcessor‘
 # 指定搜索结果每页的条数
 # HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

第五步：创建索引类

在此之前要先创建model类，并插入数据

from django.db import models
class Book(models.Model):
    nid=models.AutoField(primary_key=True)
    name=models.CharField(max_length=32)
    publish=models.CharField(max_length=32)
    price=models.DecimalField(max_digits=5,decimal_places=2)
#插入多条数据

在需要进行索引的应用的目录下创建文件search_indexes.py, 在该文件内创建该索引类

我在app01应用下创建：search_indexes.py

# 索引模型类的名称必须是 模型类名称 + Index
from haystack import indexes
from .models import Book
class BookIndex(indexes.SearchIndex, indexes.Indexable):
    text = indexes.CharField(document=True, use_template=True)
    def get_model(self):
        """返回建立索引的模型类"""
        return Book
    def index_queryset(self, using=None):
        """返回要建立索引的数据查询集"""
        return self.get_model().objects.all()
"""
说明: 
1.在BookIndex建立的字段，都可以借助haystack由elasticsearch搜索引擎查询。
2.其中text字段声明为document=True，表名该字段是主要进行关键字查询的字段， 该字段的索引值可以由多个数据库模型类字段组成(是多个字段,不是多个数据库模型类,转者注)，具体由哪些模型类字段组成，我们用use_template=True表示后续通过模板来指明。
3.在 REST framework中，索引类的字段会作为查询结果返回数据的来源, 
"""

第六步：在templates目录中创建text字段使用的模板文件

创建文件templates/search/indexes/app01/book_text.txt文件中定义

{{ object.name }}
{{ object.publish }}

第七步：手动更新索引

# python manage.py rebuild_index   #数据库有多少条数据，全部会被同步到es中

第八步：创建haystack序列化器

from drf_haystack.serializers import HaystackSerializer
from rest_framework.serializers import ModelSerializer

from app01 import models

from app01.search_indexes import BookIndex
class BookSerializer(ModelSerializer):
    class Meta:
        model=models.Book
        fields=‘__all__‘
class BookIndexSerializer(HaystackSerializer):
    object = BookSerializer(read_only=True) # 只读,不可以进行反序列化

    class Meta:
        index_classes = [BookIndex]# 索引类的名称
        fields = (‘text‘, ‘object‘)# text 由索引类进行返回, object 由序列化类进行返回,第一个参数必须是text

第九步：创建视图类

from drf_haystack.viewsets import HaystackViewSet
from app01.models import Book
from app01.serializers import BookIndexSerializer
class BookSearchView(HaystackViewSet):
    index_models = [Book]

    serializer_class = BookIndexSerializer
#该视图会返回搜索结果的列表数据，所以如果可以为视图增加REST framework的分页功能。
#我们在配置文件已经定义了分页配置，所以此搜索视图会进行分页

第十步：添加路由

from django.conf.urls import url
from django.contrib import admin
from rest_framework import routers

from app01.views import BookSearchView
router = routers.DefaultRouter()
router.register("book/search", BookSearchView, base_name="book-search") # 全文搜索
urlpatterns = [
    url(r‘^admin/‘, admin.site.urls),
]

urlpatterns += router.urls

第十一步：测试

http://127.0.0.1:8000/?text=北  #查询出名字中和出版社中有北的数据

django 对接elasticsearch实现全文检索

elasticsearch django 全文检索索引

明瞳

0 关注 0 粉丝 0 动态

关注关注

全文检索:sphinx elasticsearch xunsearch 比较

快速创建索引：3分钟左右即可创建近100万条记录的索引，并且采用了增量索引的方式，重建索引非常迅速。为很多脚本语言设计了检索API，如PHP,Python,Perl,Ruby等，因此你可以在大部分编程应用中很方便地调用Sphinx的相关接口。为MySQL设

wenwentana 2020-07-05

Elasticsearch实战 | 必要的时候，还得空间换时间!

另外一部分，则需要先做聚类、分类处理，将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引，同时将每个聚合主题相关的数据存入每个document下面的某个field下。

sifeimeng 2020-08-03

Elasticsearch索引增量统计及定时邮件实现

如何以相对简单的图形化效果展示数据的增量呢？本文给出思路和实现。2）crontab实现定时任务处理。步骤1，步骤2数据可以Excel统计得出。步骤3:Excel生成图表。3）开发中其他相关物理机器内存、CPU、磁盘读写性能等指标的监控等。

心丨悦 2020-08-03

.net core 如何向elasticsearch中创建索引，插入数据。

{public static readonly string url = "http://ip:9200/";//这个是elasticsearch远程访问ip

李玉志 2020-07-26

Elasticsearch－基础介绍及索引原理分析

Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 Lucene 那么简单，它不仅包括了全文搜索功能，还可以进行以下工作:.

tigercn 2020-07-19

elasticsearch 索引操作

GET /_cat/health?v. GET /_cat/nodes?v. GET /_cat/indices?v. "number_of_shards" : 3,},put /customer/_doc/1?pretty{ &qu

李玉志 2020-07-04

Elasticsearch 面试专题

4、采取冷热分离机制，热数据存储到 SSD，提高检索效率；冷数据定期进行 shrink操作，以缩减存储；

mengyue 2020-07-04

es 实战 —— spring boot 中使用 Elasticsearch

// 使用服务端配置？// 是否独立存储，不需要从 _source 解析，在需要频繁使用某个字段时使用。

mengyue 2020-06-27

Elasticsearch py客户端库安装及使用方法解析

elasticsearch-py是一个官方提供的low-level的elasticsearch python客户端库。因为它只是对elasticsearch的rest API接口做了一层简单的封装，因此提供了最大的灵活性，但是于此同时使用起来就不是太方便。

newbornzhao 2020-09-14

ElasticSearch最全详细使用教程

本文介绍了ElasticSearch的必备知识：从入门、索引管理到映射详解。Green - everything is good ，即最佳状态。Yellow - all data is available but some replicas are not

做对一件事很重要 2020-09-07

十张图说清Elasticsearch原理！

说到 Elasticsearch，其中最明显的一个特点就是 near real-time 准实时，当文档存储在 Elasticsearch 中时，将在 1 秒内以几乎实时的方式对其进行索引和完全搜索。Segment：也叫段，类似于倒排索引，相当于一个数据

renjinlong 2020-09-03

ElasticSearch 交互使用

tcp 0 0 10.0.0.121:5601 0.0.0.0:* LISTEN 88636/node

李玉志 2020-08-19

Spring Boot 集成 Elasticsearch 实战

可以在 ES 官方文档中发现，ES 为 Java REST Client 提供了两种方式的 Client：Java Low Level Client 和 Java High Level REST Client。低级别客户端，它允许通过 HTTP 请求与 E

李玉志 2020-08-19

如何对 ElasticSearch 集群进行压力测试

当 ElasticSearch 的业务量足够大，比如每天都会产生数百 GB 数据的时候，你就会自然而然的需要一个性能更强的 ElasticSearch 集群。特别是当你使用的场景是一些典型的大量数据进入的场景，比如网站日志、用户行为记录、大型电商网站的站内

mengyue 2020-08-07

操作ElasticSearch插件和可视化工具 Kibana

当 ElasticSearch 的实例并运行，您可以使用 localhost:9200,基于 JSON 的 REST API 与ElasticSearch 进行通信。在 ElasticSearch 自己的文档中，所有示例都使用 curl。但是，当使用 AP

molong0 2020-08-06

Elasticsearch实战 | match_phrase搜不出来，怎么办？

title=公路局正在治理解放大道路面积水问题。实际应用中可能需要： 1）检索关键词”理解”、”解放”、”道路”、“理解放大”，都能搜出这篇文档。标准分析仪是默认分析仪，如果没有指定，则默认使用该分词器。但，会出现冗余数据非常多。针对要求2），排除matc

AFei00 2020-08-03

Elasticsearch聚合后分页深入详解

不支持，看看Elasticsearch员工如何解读。这个问题，2014年在github上有很长的讨论。究其为什么ES不支持聚合后分页？可概括如下： 1）性能角度——聚合分页会在大量的记录中产生性能问题。2）正确性角度——聚合的文档计数不准确。所以奇怪的事情

molong0 2020-08-03

Elasticsearch大文件检索性能提升20倍实践（干货）

ES建立索引完成全文检索的前提是将待检索的信息导入Elaticsearch。项目中，有时候需要将一些扫描件、PDF文档、Word、Excel、PPT等文档内容导入Elasticsearch。比如：将《深入理解Elasticsearch》这边书导入ES，而这

wenwentana 2020-08-03

重磅 | 死磕Elasticsearch方法论认知清单（国庆更新版）

每个人都会犯错，别再让相同的错误一再发生，别再让我们为那些错误付出沉痛的代价。清单不是写在纸上的，而是印在心上的。我们别无选择，清单，正在一步步变革我们的生活，变革这个复杂的世界......——[美] 阿图-葛尔德《清单革命》。实战 | Elasticse

YYDU 2020-08-03

如何在Linux下安装部署分布式全文搜索引擎

Elasticsearch是一个开源的分布式全文本搜索和分析引擎。它支持RESTful操作，并允许您实时存储，搜索和分析大量数据。Elasticsearch是最流行的搜索引擎之一，可为具有复杂搜索要求的应用程序提供动力，例如大型电子商务商店和分析应用程序。

liangwenrong 2020-07-31

django 对接elasticsearch实现全文检索

django 对接elasticsearch实现全文检索

第一步：安装elasticsearch环境（docker安装）

拉取镜像

运行容器

elasticsearch建立索引库

第二步：首先安装相关的依赖包

第三步：在django项目配置文件settings.py中注册应用

第四步：在django项目配置文件settings.py中指定搜索的后端

第五步：创建索引类

第六步：在templates目录中创建text字段使用的模板文件

第七步：手动更新索引

第八步：创建haystack序列化器

第九步：创建视图类

第十步：添加路由

第十一步：测试

相关推荐