这个分词很强大 大 大Java分布式中文分词组件 - word分词word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refi
Maven依赖:在pom.xml中指定dependency,可用版本有1.0、1.1、1.2,1.3:<dependencies> <dependency> <groupId>org.apdplat</groupId> <artifactId>word</artifactId>
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号