lucene3.0 tika0.5 网站

一个优秀的IR system要做好的第一件事就是利用自然语言处理技术(NLP)对文本进行分析。其中分词是最基本的,其性能直接决定IR system的搜索精度和速度。因此,大型Web搜索引擎都有自己的分词工具。   Lucen...查看全文

【lucene3.0 tika0.5 网站】内容共 240 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
写文章