一 搜索前

     添加底纹热搜提示

     动态的切换搜索底纹,搜索底纹为商城商品销售排名topn,通过缓存获取刷新,两个小时进行刷新。

     热门搜索,动态提示热门推荐,通过查询搜索记录topn,缓存两个小时进行更新。

二 搜索中

     联动词

     建立商品名称,品牌,类目 ,类型,属性 等实体的索引,通过查询推荐实现搜索联动,索引进行动态更新。

四 搜索后

1.文本归一

(1).去除停用词,如:用户不小心输入的特殊符号、标点符号

(2).大小写统一,如:Nike/nike,iphone xr/IPHONE Xr

       后台开发工具,对输入的查询请求进行过滤,处理,完成文本归一

(3).不同语言转换,如:iphone/苹果手机,阿迪达斯/adidas

      es配置拼音, es配置同义词 ()

      es配置英文支持 ()

 

2.文本纠错

    如:iphoe => iphone ,美过 =》美国

   基于中英文的拼写纠错,通过suggest查询实现。suggest参考官网使用,获取纠错后的结果,如果没有结果,输出原句。

   ()

3.分词

如:男士运动卫衣连帽李宁 => 男士 运动 卫衣 连帽 李宁

    对处理后的查询请求进行最大分词查询,获取分词结果。调用 get请求,http://ip:prot/index/_analyze 进行分词查询。

    如果返回分词数量超过10个,不进行分词处理。

    返回分词数量少于10个,进行意图识别,中心词识别

4.意图识别/中心词识别

1)建立商品类型,商品前台类目的索引

2)对分词数组逐个进行查询,返回命中条数,按照命中记录数量,数组进行排序。

     分析命中记录,如果在某一个值上出现较大差异,去掉后面差异较大的集合,保留集合前段数据,作为中心词。

     如果没有较大差异,全部保留

5.类目预测/类型预测

男士运动卫衣连帽李宁 => 运动服

联想小新air14电脑 => 电脑/办公

原则:

根据分词分组,分类目统计查询的结果集。

1.如果分类有交集,取交集分类 。如果交集分类下面无商品,取合集类目,其中分词命中最多的排在前面

2.如果分类无交集,取合集分类,其中分词命中最多的排在前面

3.如果无匹配分类,匹配同义词库

6.筛选过滤

 

7.综合排序