接上一篇,我们依据第一页的链接爬取了第一页的博客,我们不难发现,每一页的链接就仅仅有一处不同(页码序号),我们仅仅要在上一篇的代码外面加一个循环,这样就能够爬取全部博客分页的博文。也就是全部博文了。 # -*- coding : -utf-8 -*- import urllib import tim
转载
2017-07-15 09:45:00
115阅读
2评论
网上看到大神对Python爬虫爬到非常多实用的信息,认为非常厉害。突然对想学Python爬虫,尽管自己没学过Python。但在网上找了一些资料看了一下,看到爬取韩寒新浪博客的。共三集,第一节讲爬取一篇博客,第二节讲爬取一页博客。第三集讲爬取所有博客。 看了。也留下了代码。 爬虫第一步:查看网
原创
2022-01-12 10:08:29
473阅读
1喜欢一个人,就是在一起很开心;爱一个人,就是即使不开心,也想在一起。
2. 人生就像一杯茶,不会苦一辈子,但总会苦一阵子。
3. 傻与不傻,要看你会不会装傻。
4. 女人用友情来拒绝爱情,男人用友情来换取爱情。
5. 幸福是可以通过学习来获得的,尽管它不是我们的母语。
6. 不要见一个爱一个,爱的太多,你的爱就要贬值。
7. 想完全了解一个男人,
转载
精选
2010-08-20 21:59:44
1288阅读
#coding:utf-8 import urllib import time url = ['']*350 page = 1 link = 1 while page <= 7: con = urllib.urlopen('http://blog.sina.com.cn/s/articlelist_1191258123_0_'+str(page)+'.html').rea...
转载
2016-04-24 10:49:00
130阅读
2评论
韩寒,是文人,是作家,是大家喜欢的韩寒。
网络对韩寒这样介绍,1982年9月23日出生于中国上海金山。中国职业拉力赛及场地赛车手、作家,《独唱团》杂志主编,并涉足音乐创作。1999年“新概念”作文大赛以《杯中窥人》获一等奖。 1999年3月韩寒开始写作小说《三重门》,出版后至今销量已逾190万多册。现为上海大众333 车队职业赛车手。201
转载
2011-11-05 10:45:23
456阅读
大年初一,去看了《疯狂的外星人》和《飞驰人生》,要觉得哪个更出色,我会选《飞驰人生》,先抛开具体的电影情节,看完整部电影下来,觉得韩寒不再少年。少年时,鲜衣怒马初识韩寒,是在初中的《小溪流》上(初中学校定的期刊),一个挂科七门,获得新概念一等奖的高中生,风光无限。这就是期刊的内容,对于其第二年的主动退学,以及走上抨击中国教育的道路,文中只字不提,这可能就是所谓的应试教育吧
原创
2022-09-01 16:19:22
282阅读
“简说Python”,选择“置顶/星标公众号”福利干货,第一时间送达!1.知识点要求2.1Python基础知识(List和Tuple)2.2urllib模块、超时设置、自动模拟http请求之get方法和post方法2.3异常处理与浏览器伪装技术实战如果你对相关知识有些遗忘,可以点上面的链接,熟悉一下相关知识点。2.爬取CSND博客首页信息实战目的:爬取csdn博客首页上的所有新闻连接,并下载到本地
原创
2020-12-30 19:57:54
438阅读
package mainimport ( "fmt" "io/ioutil" "net/http" "regexp" "strings" "time")func GetHtml(URL string) (html []byte, err error) { tr := &http.Transport{ MaxIdleConns: 10, IdleConnTimeout: 10 * time.Second, DisableCompres...
原创
2021-05-20 09:21:23
206阅读
1. 真理往往是在少数人手里,而少数人必须服从多数人,到头来真理还是在多数人手里,人云亦云就是这样堆积起来的。第一个人说一番话,被第二个人听见,和他一起说,此时第三个人反对,而第四个人一看,一边有两个人而一边只有一个人,便跟着那两个人一起说。可见人多口杂的那一方不一定都有自己的想法,许多是冲着那里人多去的 。
2.我这辈子说得最让人无从反驳的话就是被子不用叠——本来就
转载
精选
2012-03-17 13:20:50
1878阅读
点赞
boke.python:
# coding:utf-8
from bs4 import BeautifulSoup
import requests
import sys
# 设置http请求头伪装成浏览器
send_headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.3
原创
2021-09-02 13:40:34
812阅读
调用 getOneBlogDetails( ) 函数可以获取目标网页的博主姓名, 个人主页网址,原创文章、粉丝、喜欢、评论数量, 等级、访问量、积分、排名。#!/usr/lib/python3.6#encoding = utf-8#爬取一个博客的基本信息#本爬虫仅用于学习,纯属爱好,虽然本爬虫很简单,但还是请大家不要滥用import requestsfrom bs...
原创
2023-12-30 08:13:45
74阅读
下午事情少,顺便把昨天的爬虫练习下,平时都看磊的技术博哥(干货比较多);就试试先写一个简单的爬虫,后期有机会再完善,做整站和多线程。1、观察爬取的URL: 通过观察我们发现,在首页部分包含有文章的标题列表,然后思路就是;通过这一页的url可以获取所有文章标题,再通过标题获取到文章的URL,在通过RUL下载: &n
原创
精选
2015-10-10 17:33:06
1648阅读
点赞
2评论
原创
2023-05-11 18:34:48
80阅读
韩寒一向表现得说话很无畏的样子,也因此赢得了不少粉丝,他被看作是一个比较敢说真话的作家。但这次韩寒在评论刘谦春晚魔术上,充分暴露出了他的无知者无畏。他对一个他所不熟知的领域,按一贯的思维定式去“想当然”地认为,刘谦的春晚魔术,找的全是托,从董卿到导播,连摄影师都是托,是一个诈骗集团,这种论断就不禁让人
转载
精选
2010-02-21 13:40:26
607阅读
文/王易见 知名科技KOL,四川创业者联盟发起人,微学教育创始人写作背景:1999年,新概念作文大赛为韩寒提供了一次补赛的机会——重新给他单独设立考场,重新命题。为了公平起见,作文题只好临场现出。主编李其纲就用考场的现有条件,拿来一个玻璃杯,把一张纸揉成一团,塞进有水的杯子里,只说了一句话:“就这个题目,你写吧。”在短短一个多小时后,纸团沉到杯底,韩寒的文章——《杯中窥人》浮出水面。今...
原创
2022-01-05 17:19:46
198阅读
东北网漠河3月14日讯 (见习记者李楠 记者杨尚峰)3月14日上午进行的漠河汽车拉力锦标赛北极村至北红方向赛段的比赛开始不久,排在第七位发车,首次代表斯巴鲁车队出战拉力赛的“作家车手”韩寒,在一处弯道意外翻车,退出这一赛段比赛,韩寒和他的领航员并没有在事故中受伤。
事故发生的地点距东北网记者采访地点不到两百米,目睹整个翻车经过的记者第一时间赶到事故现场。在现场记者看到,韩寒驾驶的赛车直接翻
转载
2010-03-15 22:28:26
594阅读
文 |木宇韩寒,其实是一名出色的产品经理。《飞驰人生》不出意料在春节档大卖,而韩寒前两部导演作品《后会无期》和《乘风破浪》也均在商业上取得了成功,加之今年1月份阿里战略投资亭东影业,可以说,韩寒真正从“文化现象”走向了“商业现象”。在曾经的时代语境中,韩寒是“叛逆不羁”的辍学少年,在新的话语体系下,韩寒又化为“世故老成”的中年男人。时代变了,价值体系和评判标准也变了,站在互联网大潮下再去看待韩寒影
原创
2022-06-12 01:26:10
198阅读
突然闲来无事想要爬取csdn博客,顺便温习下相关技术点。爬取目标以我的csdn主页为例。
转载
2021-07-23 10:51:18
317阅读
呵呵
原创
2021-07-29 11:23:03
198阅读
# 爬取新浪博客的Python源代码
## 简介
在互联网时代,博客已经成为人们分享知识、观点和经验的重要平台。新浪博客作为中国最大的博客平台之一,拥有大量的博客内容。我们可以利用Python编写爬虫程序来爬取新浪博客上的数据,进行数据分析、文本挖掘等任务。
## 准备工作
在开始编写爬虫程序之前,需要安装Python的相关库。我们使用`requests`库来发送HTTP请求,使用`Bea
原创
2023-10-31 07:11:46
76阅读