需要做一个垂直搜索引擎,比较了nekohtml和htmlparser 的功能,尽管nekohtml在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是nekohtml),但感觉 nekohtml的测试用例和文档都比htmlparser都少,而且htmlparser基本上能够满足垂直搜索引擎页面处理分析的需求

 

htmlparser的类图如下:

 


htmlParser源码分析之1---类图_html
 
htmlParser源码分析之1---类图_搜索引擎_02
 
htmlParser源码分析之1---类图_测试用例_03
 
htmlParser源码分析之1---类图_搜索引擎_04
 
htmlParser源码分析之1---类图_其他_05
 
htmlParser源码分析之1---类图_测试用例_06
 
htmlParser源码分析之1---类图_其他_07
 
htmlParser源码分析之1---类图_测试用例_08