es 电商拓展词库电商 elasticsearch

转载

mob64ca1412ee79 2024-04-14 21:13:44

文章标签 es 电商拓展词库 python Elastic 字段 elasticsearch 文章分类 架构后端开发

文章目录

Elasticsearch

介绍
安装：docker
配置Elasticsearch-ik
使用docker运行Elasticsearch-ik

Haystack

介绍
安装
django中注册应用和路由
Haystack配置
Haystack建立数据索引

1.创建索引类
创建text字段索引值模板文件
3.手动生成初始索引

Elasticsearch

介绍

Elasticsearch 是用 Java 实现的，实现全文检索的开源的搜索引擎。
它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github等都采用它
Elasticsearch 的底层是开源库 Lucene。但是，没法直接使用 Lucene，必须自己写代码去调用它的接口。
Elasticsearch 不支持对中文进行分词建立索引，需要配合扩展elasticsearch-analysis-ik来实现中文分词处理

安装：docker

# 从仓库拉取镜像
$ sudo docker image pull delron/elasticsearch-ik:2.4.6-1.0

配置Elasticsearch-ik

修改/home/python/elasticsearc-2.4.6/config/elasticsearch.yml第54行。
更改ip地址为本机真实ip地址

使用docker运行Elasticsearch-ik

sudo docker run -dti --name=elasticsearch --network=host -v /home/python/elasticsearch-2.4.6/config:/usr/share/elasticsearch/config delron/elasticsearch-ik:2.4.6-1.0

之后可以通过 sudo docker image ls 查看镜像

Haystack

介绍

使用背景：Elasticsearch 的底层是开源库 Lucene。但是没法直接使用 Lucene，必须自己写代码去调用它的接口。
Haystack 是在Django中对接搜索引擎的框架，搭建了用户和搜索引擎之间的沟通桥梁
我们在Django中可以通过使用 Haystack 来调用 Elasticsearch 搜索引擎
Haystack 可以在不修改代码的情况下使用不同的搜索后端（比如 Elasticsearch、Whoosh、Solr等等）

安装

$ pip install django-haystack
$ pip install elasticsearch==2.4.1

django中注册应用和路由

INSTALLED_APPS = [
    'haystack', # 全文检索
]

url(r'^search/', include('haystack.urls')),

Haystack配置

# Haystack
HAYSTACK_CONNECTIONS = {
    'default': {
        'ENGINE': 'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine',
        'URL': 'http://192.168.103.158:9200/', # Elasticsearch服务器ip地址，端口号固定为9200
        'INDEX_NAME': 'meiduo_mall', # Elasticsearch建立的索引库的名称
    },
}

# 当添加、修改、删除数据时，自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

HAYSTACK_SIGNAL_PROCESSOR 配置项：保证了在Django运行起来后，有新的数据产生时，Haystack仍然可以让Elasticsearch实时生成新数据的索引

Haystack建立数据索引

1.创建索引类

通过创建索引类，来指明让搜索引擎对哪些字段建立索引，也就是可以通过哪些字段的关键字来检索数据。
本项目中对SKU信息进行全文检索，所以在goods应用中新建search_indexes.py文件，用于存放索引类。

from haystack import indexes

from .models import SKU


class SKUIndex(indexes.SearchIndex, indexes.Indexable):
    """SKU索引数据模型类"""
    text = indexes.CharField(document=True, use_template=True)

    def get_model(self):
        """返回建立索引的模型类"""
        return SKU

    def index_queryset(self, using=None):
        """返回要建立索引的数据查询集"""
        return self.get_model().objects.filter(is_launched=True)

索引类SKUIndex说明

在SKUIndex建立的字段，都可以借助Haystack由Elasticsearch搜索引擎查询。
其中text字段我们声明为document=True，表名该字段是主要进行关键字查询的字段。
text字段的索引值可以由多个数据库模型类字段组成，具体由哪些模型类字段组成，我们用use_template=True表示后续通过模板来指明

创建text字段索引值模板文件

在templates目录中创建text字段使用的模板文件
在templates/search/indexes/goods/sku_text.txt文件中定义

{{ object.id }}
{{ object.name }}
{{ object.caption }}

模板文件说明：当将关键词通过text参数名传递时，可以

此模板指明SKU的id、name、caption作为text字段的索引值来进行关键字索引查询

3.手动生成初始索引

$ python manage.py rebuild_index

最后写视图：

请求地址：/search/ (刚才自己定义的视图地址)

再将搜索结果处理（比如分页，渲染模板）展示即可。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Ios线程结束后信号量引起崩溃线程的信号量

下一篇：ospf 路由过滤策略 ospf过滤lsa

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

es 电商拓展词库 电商 elasticsearch

es 电商拓展词库 电商 elasticsearch

文章目录

Elasticsearch

介绍

安装：docker

配置Elasticsearch-ik

使用docker运行Elasticsearch-ik

Haystack

介绍

安装

django中注册应用和路由

Haystack配置

Haystack建立数据索引

1.创建索引类

创建text字段索引值模板文件

3.手动生成初始索引

51CTO博客

es 电商拓展词库电商 elasticsearch

es 电商拓展词库电商 elasticsearch