一 搜索前
添加底纹热搜提示
动态的切换搜索底纹,搜索底纹为商城商品销售排名topn,通过缓存获取刷新,两个小时进行刷新。
热门搜索,动态提示热门推荐,通过查询搜索记录topn,缓存两个小时进行更新。
二 搜索中
联动词
建立商品名称,品牌,类目 ,类型,属性 等实体的索引,通过查询推荐实现搜索联动,索引进行动态更新。
四 搜索后
1.文本归一
(1).去除停用词,如:用户不小心输入的特殊符号、标点符号
(2).大小写统一,如:Nike/nike,iphone xr/IPHONE Xr
后台开发工具,对输入的查询请求进行过滤,处理,完成文本归一
(3).不同语言转换,如:iphone/苹果手机,阿迪达斯/adidas
es配置拼音, es配置同义词 ()
es配置英文支持 ()
2.文本纠错
如:iphoe => iphone ,美过 =》美国
基于中英文的拼写纠错,通过suggest查询实现。suggest参考官网使用,获取纠错后的结果,如果没有结果,输出原句。
()
3.分词
如:男士运动卫衣连帽李宁 => 男士 运动 卫衣 连帽 李宁
对处理后的查询请求进行最大分词查询,获取分词结果。调用 get请求,http://ip:prot/index/_analyze 进行分词查询。
如果返回分词数量超过10个,不进行分词处理。
返回分词数量少于10个,进行意图识别,中心词识别
4.意图识别/中心词识别
1)建立商品类型,商品前台类目的索引
2)对分词数组逐个进行查询,返回命中条数,按照命中记录数量,数组进行排序。
分析命中记录,如果在某一个值上出现较大差异,去掉后面差异较大的集合,保留集合前段数据,作为中心词。
如果没有较大差异,全部保留
5.类目预测/类型预测
男士运动卫衣连帽李宁 => 运动服
联想小新air14电脑 => 电脑/办公
原则:
根据分词分组,分类目统计查询的结果集。
1.如果分类有交集,取交集分类 。如果交集分类下面无商品,取合集类目,其中分词命中最多的排在前面
2.如果分类无交集,取合集分类,其中分词命中最多的排在前面
3.如果无匹配分类,匹配同义词库
6.筛选过滤
7.综合排序