有时候, 一些网站没有API接口, 就算是想要解析, 也没办法, 这时只有通过HTML解析, 我当时在网上搜索的时候, 因为有一个地方网上没有写, 自己也没注意到, 结果浪费了很长时间.

       网页上的HTML源码一般用的都是gbk编码, 而我们程序中使用的是UTF-8编码, 导致我不管使用哪种方法解析, 得到的结果都是null. 使用之前一定要先转码,  将下载得来的数据, 通过:

       NSStringEncoding gbk = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);

       这种编码格式来得到网页的内容.

       

       另外附上解析的三种方法,

       1.通过第三方库Hpple来解析, 这个使用方法, 网上一搜一大片, 我就不再赘述了.


       2.通过UIWebView来解析, WebView中有一个方法, 是通过JavaScript来解析的      

           [webView stringByEvaluatingJavaScriptFromString:

                                                                       @"document.getElementById('content').innerHTML"]

           字符串中使用的是JavaScript的知识, 通过Id"content"来得到content中的内容, 还有ByName, ByTagName, 具体使用方法请自己查询, 推荐一个网站w3school(http://www.w3school.com.cn/).


       3.通过字符串匹配, 不管是第三方库, 还是JavaScript, 内部的核心原理都是通过字符串匹配得来的,

每一个网站都有自己的框架, 不管里面的内容怎么变, 框架是不会动的, 而你要得到的内容肯定是在一个能唯一标识的框架内, 找到这段内容所在的收尾两部分框架, 通过字符串分割就能得到中间你想要的内容.