基于Python实现的死链接自动化检测工具


测试环境:

win7

python 3.3.2

chardet 2.3.0


脚本作用:

检测系统中访问异常(请求返回code值非200)的链接


使用方法:

配置

编辑deadLinkDetection\conf\init.conf


配置项如下

:协议,比如https, http

:主机、域名,如192.168.1.3

:端口号,比如 80, 8080, 443

:配置登录用户名

:配置登录密码


2.配置种子url

编辑conf/urlNoLogin.txt文件中填写不需要登录就可访问的种子url,格式如下,每行一条url路径

/
/doc/sadmin.html
/
/doc/refman/5.7/en/statement-optimization.html
/doc/homepage.html

在conf/urlNeedLogin.txt文件中填写需要登录才可访问的种子url,格式同上

根据项目实际情况,修改main.py中login_system函数,实现登录系统


运行程序

进入到deadLinkDetection目录,运行 python main.py


查看运行结果

除了控制台打印的输出,默认的,还会在d:\\目录下,生成filepath_of_urls_visited.txt, d:/filepath_of_urls_in_trouble.txt文件,

分别存放成功访问过的url链接,和访问异常的链接,可在main.py中找到代码行“reptile = Reptile()”,显示指定要生成的文件,如下:

reptile = Reptile('d:/xxxxx_visited.txt', 'd:/xxxxx_in_trouble.txt)


使用限制:

登录系统函数无法通用,需要自己实现

 

源码下载地址:​​基于Python实现的死链接自动化检测工具.zip​