一、中文分词工具

1)Jieba

 NLP自然语言处理中英文分词工具集锦与基本使用介绍_snowNLP分词工具

2)snowNLP分词工具

 NLP自然语言处理中英文分词工具集锦与基本使用介绍_hanlp_02

3)thulac分词工具

 NLP自然语言处理中英文分词工具集锦与基本使用介绍_jieba_03

4)pynlpir 分词工具

NLP自然语言处理中英文分词工具集锦与基本使用介绍_hanlp_04

5)StanfordCoreNLP分词工具

1.from stanfordcorenlp import StanfordCoreNLP

2.with StanfordCoreNLP(r'E:\Users\Eternal Sun\PycharmProjects\1\venv\Lib\stanford-corenlp-full-2018-10-05',) as nlp:

3.    print("stanfordcorenlp分词:\n",nlp.word_tokenize(Chinese))

6)Hanlp分词工具

 NLP自然语言处理中英文分词工具集锦与基本使用介绍_jieba_05

分词结果如下:

 

NLP自然语言处理中英文分词工具集锦与基本使用介绍_jieba_06

二、英文分词工具

 

1. NLTK:

 

NLP自然语言处理中英文分词工具集锦与基本使用介绍_snowNLP分词工具_07

二者之间的区别在于,如果先分句再分词,那么将保留句子的独立性,即生成结果是一个二维列表,而对于直接分词来说,生成的是一个直接的一维列表,结果如下:

NLP自然语言处理中英文分词工具集锦与基本使用介绍_hanlp_08

2. SpaCy:

 

NLP自然语言处理中英文分词工具集锦与基本使用介绍_jieba_09

3. StanfordCoreNLP:

NLP自然语言处理中英文分词工具集锦与基本使用介绍_hanlp_10

分词结果

 NLP自然语言处理中英文分词工具集锦与基本使用介绍_hanlp_11