Python爬虫是用Python编程语言实现的网络爬虫,主要用于网络数据的抓取和处理,相比于其他语言,Python是一门非常适合开发网络爬虫的编程语言,大量内置包,可以CPython爬虫可以做的事情很多,如搜索引擎、采集数据、广告过滤等,Python爬虫还可以用于数据分析,在数据的抓取方面可以作用巨大!Python爬虫架构组成1. URL管理器:管理待爬取的url集合和已爬取的url集合,传送待爬
还是先讲一下思路: 获得火车票查询URL----->单击‘单程’------->点击出发输入框,输入城市,选取站点------>目的地输入同上一步------>点击出发日期那个框,选取出发日期.------>点击“查询”按钮------>前面几步用selenuim实现------>创建几个列表,分别存储车次,出发站点,到达站点,出发时间,到达时间,行程耗时。
转载 2023-06-20 12:33:38
201阅读
# Python爬虫实现12306的完整指南 在本文中,我们将学习如何使用Python来创建一个简单的爬虫,以获取12306网站的车票信息。这是一个很好的项目,可以帮助你理解爬虫的基本概念、网络请求和解析。 ## 整体流程 下面是实现“Python爬虫12306”的基本流程: ```mermaid flowchart TD A[开始] --> B[准备环境] B --> C
原创 10月前
93阅读
HTTP和HTTPSHTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法。HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加入SSL层。SSL(Secure Sockets Layer 安全套接层)主要用于Web的安全传
转载 2023-07-05 22:18:40
123阅读
前言简单来说互联网是由一个个站点和网络设备组成的大网,我们通过浏览器访问站点,站点把HTML、JS、CSS代码返回给浏览器,这些代码经过浏览器解析、渲染,将丰富多彩的网页呈现我们眼前;一、什么是爬虫如果我们把互联网比作一张大的蜘蛛网,数据便是存放于蜘蛛网的各个节点,而爬虫就是一只小蜘蛛,沿着网络抓取自己的猎物(数据)爬虫指的是:向网站发起请求,获取资源后分析并提取有用数据的程序;从技术层面来说就是
转载 2023-09-29 12:02:48
71阅读
# 使用 Python 爬虫获取 12306 城市数据 随着互联网的发展,很多信息都可以通过编程获取。特别是在旅行中,了解城市之间的火车连接信息是非常重要的。本篇文章将介绍如何使用 Python 爬虫技术抓取中国铁路客户服务中心(12306)网站上的城市信息,以获取所有可用城市的 JSON 数据。 ### 什么是爬虫? **爬虫(Crawler)** 是一种自动访问网页并提取信息的程序。它可
原创 2024-09-21 04:19:07
535阅读
最近这几天,学习了一下python,对于​​爬虫​​比较感兴趣,就做了一个简单的爬虫项目,因为快过年了么,要买回家的火车票,所以呢,通过分析12306网站,写了一个爬虫,现在,就将代码贴出来,分析的过程就不详细的介绍了,就是通过chorme浏览器进行分析。1 # -*- coding: utf-8 -*- 2 # @Date : 2016-12-27 14:26:33 3 # @Auth
原创 2022-04-26 17:56:54
10000+阅读
# Python爬虫爬取12306的科普之旅 在当今互联网时代,数据获取变得越来越便捷,尤其是通过爬虫技术。今天,我们将深入了解如何使用Python爬取12306网站(中国铁路客户服务中心)的火车票信息。本文将涵盖爬虫的基本概念、状态图、旅行流程以及相关代码示例。 ## 什么是爬虫? 网络爬虫是自动访问互联网获取信息的程序或脚本。它们可以在短时间内提取大量数据,通常用于数据分析、市场研究及其
原创 2024-08-27 08:42:33
403阅读
爬虫需要掌握的一些知识图谱:    如果不使用爬虫框架scrapy,也利用一些爬虫模块也可以自定义爬虫的过程,比如 Python标准库中提供的urllib、urllib2、httplib,但是这些模块已经有些过时了,而Requests是使用Apache2 Licensed许可证的,其在Python内置模块的基础上进行了高度的封装,从而使得Pytho
转载 2023-10-23 21:43:32
95阅读
python爬虫12306网站--火车票信息查询思路:1.火车票信息查询是基于车站信息查询,先完成车站信息查询,然后根据车站信息查询生成的url地址去查询当前已知出发站和目的站的所有车次车票信息2.json文件存储当前从出发站到目的站的所有车次的详细信息3.对json文件进行分析4.分类查询车票(高铁、火车)1.json文件:在12306页面选择"车票"》"单程",打开"开发人员工具",然后输入
转载 2023-07-01 16:48:57
341阅读
12306 抢票,极限并发带来的思考虽然现在大多数情况下都能订到票,但是放票瞬间即无票的场景,相信大家都深有体会。尤其是春节期间,大家不仅使用 12306,还会考虑“智行”和其他的抢票软件,全国上下几亿人在这段时间都在抢票。“12306 服务”承受着这个世界上任何秒杀系统都无法超越的 QPS,上百万的并发再正常不过了!笔者专门研究了一下“12306”的服务端架构,学习到了其系统设计上很多亮点,在这
写了个python3的。代码非常简单就不解释了,直接贴代码。#test rdp import urllib.request import re #登录用的帐户信息 data={} data['fromUrl']='' data['fromUrlTemp']='' data['loginId']='12345' data['password']='12345' user_agent='Mozil
转载 2023-05-31 09:50:54
218阅读
有一段时间没有使用Python了,前几天经朋友提起一篇关于用Python实现抢火车票的文章,百度了实现抢火车票的技术细节,网上却有不少资料,也不是新鲜的东西。在了解了一些技术手段,阅读了一些大神的博文后,也尝试实现了一下,代码写得粗糙,纯当娱乐,本文在Windows系统下完成。需要提到的是,抢票过程中的验证码部分只能手动完成。首先,我需要的工具和组件有:Chrome浏览器浏览器驱动ChromeDr
12306抢票爬虫先直接上一下效果图吧:图片上信息是抢票成功后的界面1、技术路线selenium + chromedriver2、思路分析(1)、模拟浏览器登录抢票界面,手动进行登录(2)、登录完成后让浏览器跳转到购票界面(3)、手动输入出发地、目的地、 出发日,检查上面三个信息输入完成后,找到查询按钮,进行车次查询(4)、查找我们需要的车次,看下是否有余票(显示有或数子),找到车次的预定的按钮,
原创 精选 2022-09-21 08:34:33
1526阅读
2点赞
2评论
# Python爬虫12306网站车次信息 在日常生活中,我们经常需要查询火车车次信息,比如出行计划、车次查询等。而12306网站是国内主要的火车票交易平台,我们可以通过Python编写爬虫程序来获取12306网站上的车次信息。本文将介绍如何使用Python爬虫爬取12306网站上的车次信息,并展示一个简单的代码示例。 ## 什么是爬虫爬虫是指通过编写程序自动化地获取网站上的数据的技术。
原创 2024-07-02 06:21:34
253阅读
 由于上篇博客已经把爬取12306功能实现,这篇主要是在上篇文章上进行升级。这里的图形化界面参考博主:写的真漂亮,一直以为tkinter写的图形化界面不可能漂亮到哪去,这篇文章就让我改变了认识。就借鉴了他的,果然不是自己写的,调试代码很繁琐,调试了几天,终于弄好了。先上一张图片镇楼!环境:python3  +编译器(我用是Python idle 和pycharm)可以用你自己喜
开发工具:python2.7主要是用的库:urllib2爬取对象:12306购票系统1、首先我们的任务是选取合适的网页入口,打开12306官网:我们先试试进入余票查询: 第一次进入这个网站我们发现报错了,在网址http处红色显示证书不符合要求,我们暂时忽略。点击查询按钮,这时候我们看到页面并没有变化。我们按F12进入开发者工具看看: 我们进入Network选项,再次点击查询发现下方显示拒绝访问,
转载 2024-02-03 22:01:58
277阅读
 有一段时间没有使用Python了,前几天经朋友提起一篇关于用Python实现抢火车票的文章,百度了实现抢火车票的技术细节,网上却有不少资料,也不是新鲜的东西。在了解了一些技术手段,阅读了一些大神的博文后,也尝试实现了一下,代码写得粗糙,纯当娱乐,本文在Windows系统下完成。需要提到的是,抢票过程中的验证码部分只能手动完成。首先,我需要的工具和组件有:Chrome浏览器浏览器驱动Ch
转载 2023-07-10 18:44:38
152阅读
使用python 的GUI 和爬虫等功能自己构造一个12306的抢票软件。该课程来自网易云课堂的撩课学院,付费课程。地址:网易云课堂搜索以下内容就可找到我跟着学,不一定最后能成功。先
原创 2023-06-14 21:15:20
269阅读
这部分主要是项目环境的配置,下图是概览1.基于项目的虚拟环境--pipenv1.1 简介1.2 安装pip install pipenv, 检查安装状态: pipenv --version 我的系统是mac,该项目使用Windows 10开发更好1.3 创建项目的虚拟环境,使用pycharm1.4 创建完后修改安装源,修改位置为pipfile文件修改:来源修改为清华镜像源地址这
原创 2023-06-14 18:20:10
158阅读
  • 1
  • 2
  • 3
  • 4
  • 5