51CTO博客开发
在上一篇文章中,详细介绍了如何实现中文分词。但这只是第一步,要想能够使用mysql的全文索引,还需要对分词后的中文词组进行编码。因为mysql的全文索引只将由字母,数字,下划线,单引号构成的字符串判定为单词。 编码的方式很多,只要能将汉字映射成唯一的字母或数字组成的字符串即可。因为产品中的主流开发语言使用的是PHP,同时
在前一篇文章中,分析出了一个实现的具体思路,主要是利用中文分词、Unicode编码来解决无法使用mysql的全文索引进行中文搜索的问题,本篇文章中将详细介绍中文分词的实现方法。 首先是解决中文分词,中文分词就是将一句中文进行拆分,得到一个个单一的词,如“高薪诚聘注册造价工程师”
离开大学团队,网上求职 四月,天气还不太热,但是小蒋却再难压抑住自己的想法,最终鼓起勇气,离开了他的团队,他其实也不知道这个决定是对是错,因此在离开时,小蒋还给他的队友们发了一封邮件“离开是对是错”,来表达他的心思。他的队友们最终也很理解,给小蒋送了祝福,希望他能真正的得到锻炼。 &n
前段时间,突然接到产品需求,需要对站内的职位进行关键字搜索,我们的产品是一个建筑行业的求职招聘平台,系统每天会新增大量的职位,职位信息也比较复杂,如果使用like模糊查询,在性能上肯定承受不了。 经过分析,想到了采用mysql的全文索引,但是mysql自带的全文索引不支持中文搜索,因为中文与英文不同,
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号