最近一段时间在写关于情感分析方面的论文,用到了SVM作为分类算法进行情感分类。
我选用了著名的SVM开源工具包libSVM,果然效果不错。由于LibSVM的输入语料格式有一定的要求。故有时候怎样把我们的训练语料转换成LibSVM的输入语料格式,是一个比较麻烦的事情。
在做这个的过程中我也遇到了挺多麻烦的事情的,比如刚开始的时候,我把同一类的样例放在了一个,出现的结果是libSVM无法进行准确分类。。。搞了好久都不知道是什么原因,后来终于明白了。后面我将写写是用libSVM的一些心得。
我把基于SVM进行文本分类的程序整理了一下,现在跟大家分享下,因为该程序用到了中科院的分词工具ICTCLAS,及LibSVM,请大家自行到他们的官网下载。只要您按照我文本分类程序中readme文本分类的主要流程.txt 的说明一步一步完成的话,就可以进行文本分类。由于急着写论文,下一阶段我将写个批处理文件,让是用跟容易。
 
如果您的论文实验中使用到了我的工具,那将是我的荣幸。也麻烦您发邮件告诉我一下,把您的论文题目发给我。很希望与您交流学习。共同进步。如果您在使用有什么问题请及时联系我。
 
我目前的主要研究包括情感分析、网络金融信息挖掘。如果您对这方面也感兴趣的话,希望多多交流。我的e-mail: jpshen2008@gmail.com 。

文本分类程序(利用libSVM)V2.0.rar  已经上传,感谢大家的使用及给我提出的宝贵建议。