如果用规则,除了词库,也就是首字母大写,碰到Apple of Jobs这样中间有 of 的非首字母大写的没辙,等等

因为CRF NER模型是根据上下文信息和词的内部结构的
1,就是上下文确定了,中间的词的tag也就出来了,无论中间的词是什么
2,就是如果一个词内的n-gram特征进去了,词内错少数字母也能行