MySQL 8.0 全文检索实战

原创

HappyBoyLi 2024-05-24 14:50:17 博主文章分类：数据库 ©著作权

©著作权归作者所有：来自51CTO博客作者HappyBoyLi的原创作品，请联系作者获取转载授权，否则将追究法律责任

MySQL在数据量很大时候，进行like %%查询会比较慢，所以可以使用MySQL全文检索。

建表

CREATE TABLE `training`.`t` (
  `id` INT NOT NULL,
  `content` LONGTEXT NOT NULL,
  PRIMARY KEY (`id`));

INSERT INTO `training`.`t` (`id`, `content`) VALUES ('1', '我爱');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('2', '我京');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('3', '北京');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('4', '爱北');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('5', '我');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('6', '爱');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('7', '北');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('8', '京');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('9', '京我');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('10', '我爱北');
INSERT INTO `training`.`t` (`id`, `content`) VALUES ('11', '我爱北京');

如果是英文可以选择默认的分词器：

ALTER TABLE `t`  ADD FULLTEXT INDEX `idx`(`content`)

如果是中文可以选择ngram分词器：

ALTER TABLE `t`  ADD FULLTEXT INDEX `idx`(`content`) WITH PARSER ngram;

ngram分词器默认2个中文分词，也就是"我爱北京"会被分词为"我爱"，"爱北"，"北京"，所以查询时候也必须按照分词后的词语进行查询，可以调整ngram个数来优化分词：

show variables like 'ngram_token_size'; 
SET  ngram_token_size = 1;

但是无法修改，报错：

Error Code: 1238. Variable 'ngram_token_size' is a read only variable

所以必须在MySQL服务器启动配置中修改这个变量。

查询

select * from t where MATCH (content ) AGAINST ('我'); // 0条
select * from t where MATCH (content ) AGAINST ('我爱');// 3条，1，10，11
select * from t where MATCH (content ) AGAINST ('北京');// 2条，3，11
select * from t where MATCH (content ) AGAINST ('爱北'); // 3条，4，10，11
select * from t where MATCH (content ) AGAINST ('我爱北'); // 2条，10，11

可以看出查询结果是严格按照分两个中文词来匹配的，即使数据库有ID=5 ”我“，检索”我“也查不出来，此时需要用like

select * from t where content  like '%我%'; // 6条 1,2,5,9,10,11

所以在需要一个中文查询时候，就必须将ngram改成1.

参考

https://dev.mysql.com/doc/refman/8.3/en/fulltext-search-ngram.html

上一篇：解决curl get命令只能获取到第一个参数

下一篇：Java的List<Integer>转原生数组int[]

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯