关于python爬虫这方面知识,在网络上有一些教程、文章,很有价值,能够带领新手快速入门。在这里我把自己学习时找到的一些教程列出来,与大家一起分享,欢迎补充!
爬虫
《一只小爬虫》
《一只并发的小爬虫》
《Python与简单网络爬虫的编写》
《Python写爬虫——抓取网页并解析HTML》
《[Python]网络爬虫(一):抓取网页的含义和URL基本构成》
《[Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容》
《[Python]网络爬虫(三):异常的处理和HTTP状态码的分类》
《[Python]网络爬虫(四):Opener与Handler的介绍和实例应用》
《[Python]网络爬虫(五):urllib2的使用细节与抓站技巧》
《[Python]网络爬虫(六):一个简单的百度贴吧的小爬虫》
《[Python]网络爬虫(七):Python中的正则表达式教程》
《[Python]网络爬虫(八):糗事百科的网络爬虫(v0.2)源码及解析》
《[Python]网络爬虫(九):百度贴吧的网络爬虫(v0.4)源码及解析》
《[Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)》
《用python爬虫抓站的一些技巧总结 zz》
《python爬虫高级代码》
正则表达式
《正则表达式30分钟入门教程》
《常用正则表达式》
《Python正则表达式操作指南》
《Python 正则表达式(模式匹配)》
《由浅到深解读Python正则表达式》
《Python正则表达式指南》