描述了中文分词三种主要方法的优劣.
分析了中文分词的作用、难点,中文分词方法和技术路线、中文分词评测和几种中文分词软件下载.
条件随机场 (CRF) 分词序列谈之一 Langiner 判别式机器学习技术来解决分词问题,其中判别式机器学习技术主要代表有条件随机场,最大熵/隐马尔科夫最大熵、感知机,支撑向量机等,有关它们的相同点与不同点以后有机会在谈,今天主要谈利用随机场解决分词问题 条件随机场(Conditional Random Fields)由John Lafferty提出并应用于自然语言处理领域,主要用于序列标
langiner@gmail.com 自然语言处理技术的基础技术:中文分词经过艰苦的研发,终于发布了。中文分词是互联网应用不可缺少的基础技术之一,也是语音和语言产品必不可少的技术组件。 自2003年第一届国际中文分词评测以来,由字构词的分词方法获得了压倒性优势,国内主要通过CRF++开源软件包来学习该分词方法,但是CRF++过于复杂的代码结构,导致了该算法的普及率。本次首先发布
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号