下面用几幅图对比我们的算法与清华NLP实验室的算法结果:
清华
Chindle的效果(非同一个账号):
Chindle的算法很简单:
1、分词
2、stopword过滤
3、词性过滤(只留下名词和形容词)
4、按照频率排序,去掉出现频率特别高的词汇(出现了10次以上)
下面用几幅图对比我们的算法与清华NLP实验室的算法结果:
清华
Chindle的效果(非同一个账号):
Chindle的算法很简单:
1、分词
2、stopword过滤
3、词性过滤(只留下名词和形容词)
4、按照频率排序,去掉出现频率特别高的词汇(出现了10次以上)
简单的词频统计并不能很好地用于知识发现,例如下面的,高频词汇基本都是垃圾信息。怎么
Chindle内容可以取自微博、rss feed、web
设计目标:根据给定的轮廓和扩展函数生成中文图片。设计思路:从内向外逐步穷举,最坏
1. 分词服务(包装了知识库)2. 通用布局服务(text, pos, angle, size, color)3. 图片生成库务、
设计模式
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M