前几天,我去下载别人的坐标来进行分类.
结果,算了几天后.后面的一大堆垃圾.我叉.
今天,不用算,别人已经搞好了.
不用1个G,不用100M,只有680K.小得不能再小了,却能解决问题.
链接:
链接:https://pan.baidu.com/s/1yHe8QMo58OB3cEclGGPcvA 提取码:qkao 名字叫:近义词大全.txt
哈工大的基于词林的相似度计算.没必要再去分个类了.麻烦,累,还容易出错.
这个玩意儿简直是好啊.

为什么说需要大规模的语料不靠谱呢?
我还敢说统计学和概率论的东西,都不靠谱!这些东西的理念就是多的就是对的. 实质上,这种思维根本就是错的.是避重就轻,想不劳而获.但实质是妄想.