用Python爬取火车票数据的过程
在这个记录中,我将详细阐述如何使用Python爬取火车票数据,包括从环境预检到最后的最佳实践。整个过程将分为几个主要部分,确保逻辑清晰且结构严谨。
### 环境预检
在开始之前,我们需要对爬取环境进行一些预检。首先要确认我们使用的操作系统、Python版本及所需库。这里提供一个四象限图,帮助我们检测环境的兼容性。
```mermaid
quadrantC
2019.5.25,今天用selenium+chromedriver做了一个12306抢票小爬虫,总共100+行代码,写的真费劲,看来还是没学到家,话不多说,首先看一下README: 12306抢票功能:
通过手动登录,手动填写出发地,目的地,出发日期,然后自动完成抢票
程序流程:
- 1、首先进入登录界面(logging_page),然后等待用户登录。
- 2
转载
2023-11-11 22:51:35
186阅读
python爬虫之12306网站--火车票信息查询思路:1.火车票信息查询是基于车站信息查询,先完成车站信息查询,然后根据车站信息查询生成的url地址去查询当前已知出发站和目的站的所有车次车票信息2.json文件存储当前从出发站到目的站的所有车次的详细信息3.对json文件进行分析4.分类查询车票(高铁、火车)1.json文件:在12306页面选择"车票"》"单程",打开"开发人员工具",然后输入
转载
2023-10-28 14:04:37
267阅读
python爬取火车票网的时刻表数据导包import re,requests,datetime,time,json
from prettytable import PrettyTable
from colorama import init,Fore
from pyquery import PyQuery as pq
import random
import pymysql.cursors导包遇到问
转载
2023-10-13 12:47:04
171阅读
Python 实现火车票查询工具一. 实验介绍通过python3实现一个简单的命令行版本的火车票查询工具,用实际中的例子会更感兴趣,不管怎么样,既练习了又可以自己使用。1. 知识点:Python 基础知识的综合运用docopt, requests, colorama, prettytable 库的使用setuptools 的使用2. 效果截图:二. 接口设计接口我们就按照12306官网
转载
2023-08-16 17:43:24
215阅读
这是之前的一篇推文,由于某种原因,小编被迫删了原文,现在稍微改动了一下,再次分享给大家。前一段时间小编使用matlab爬取火车票信息,小编觉得这个爬取过程还蛮有趣的,所以和大家分享一下如何用matlab爬取火车票信息。比如我想要获取以下这些车次的始发站和终点站信息,大家第一反应可能会是这多简单,去12306逐个搜索不久好了么。但是当我要查询成百上千个车次的始发站和终点站信息时,我们很显然就不能手动
原创
2021-03-24 20:48:46
1209阅读
一共分为俩个函数
1,获取城市的各个缩写
def city_number():#获取城市各地区缩写如 "北京":"KCN"
ko=[]
lp=[]
html=requests.get("https://kyfw.12306.cn/otn/resources/js/framework/station_name.js",headers=headers)
htm
弱鸡代码,不喜轻喷。。。# 爬取12306车次信息
# 浏览器发送请求(请求的url,请求的方式get/post,请求数据)
# 服务器作出响应(响应状态码)
# 服务器响应状态码:418,被发现是爬虫了哦
# 爬虫:模拟浏览器向服务器发送请求并处理响应结果
# 安装一个第三方模块 requests
import requests
import re
# 使用正则表达式
转载
2023-06-27 11:33:05
244阅读
Python3爬取12306车票信息第一次写爬虫,咱从入门级——12306车票爬取 开始我们要爬取的信息是https://www.12306.cn/index/上的车票信息当我们选择出发地和目的地,点击查询可以获得相关的车票信息,我们现在要将这些信息使用Python爬取假如我输入出发地为武汉,目的地为广州,则查询结果如下 程序效果如下:找到车票数据的传输链接按下F12打开Google浏览器的开发者
转载
2023-10-03 18:01:40
103阅读
抽空去12306官网逛了一逛,发现直接爬余票是不是有点难啊哈哈哈,然后我发现了这样一个页面进去页面之后是这样的。。。。。。。。。这个东西爬起来是不是很简单,而且这个页面是半小时更新一次的,其实也蛮有参考价值的,所以就决定是它了,先爬一个小页面练练手,废话不多说,因为第一次入爬虫的坑,所以大概花了半天的时间终于爬取成功。首先第一步,要找到数据源,也就是要爬取的url地址,我用的是火狐,谷歌也一样,之
转载
2024-01-05 22:28:01
47阅读
# Python获取火车票的探索之旅
随着社会的发展,火车成为了人们出行的重要交通工具。特别是在中国,火车网络覆盖广泛,购票需求也随之上升。于是,很多开发者开始尝试用 Python 来获取火车票信息。本文将展示如何使用 Python 爬虫技术获取火车票,同时还将介绍相关的数据库设计。
## 爬虫基础知识
在了解如何获取火车票之前,我们需要知道爬虫的基本概念。网络爬虫是自动访问互联网并提取信息
在今天的博文中,我将分享如何使用 Python 爬取携程的火车票数据。这个过程不仅对我个人的项目很有帮助,也许对你进行类似项目的时候同样有用。
### 背景定位
在进行数据采集之前,我们需要明确我们的业务场景。在当今这个互联网时代,火车票的购买变得越来越方便,但人们总是希望能提前获取到最准确的票务信息,为他们的旅行计划提供支持。为了满足这一需求,我们需要构建一个爬虫程序,通过携程网站来获取相关
思路:1.火车票信息查询是基于车站信息查询,先完成车站信息查询,然后根据车站信息查询生成的url地址去查询当前已知出发站和目的站的所有车次车票信息2.json文件存储当前从出发站到目的站的所有车次的详细信息3.对json文件进行分析4.分类查询车票(高铁、火车)1.json文件:在12306页面选择"车票"》“单程”,打开"开发人员工具",然后输入出发地、目的地 对json文件进行分析,发现是嵌套
转载
2023-09-07 17:12:39
59阅读
前言:学了挺近的python了,一直在初级徘徊不前,想着应该找点实战性的案例来操练一下,以便熟悉各模块的使用;在网上找到了一些有关通过爬虫实现火车票查询的,就拿来参考练练手了。 最终想要的实现效果就是用户通过在命令行输入相关的命令,然后将查询到的车次信息打印输出到屏幕上。命令格式:tickets [-gdtkz] <from> <to> <d
转载
2023-06-19 10:48:46
162阅读
实现后如图所示:
首先我们需要抓取一些基础的数据,各大火车站信息!
import urllib
from urllib import request
import re
url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955'
req = urllib.reque
本文思路主要来源于实验楼的教程,但是一些具体的一些细节是我自己发现的,比如哪里获得站点对应的3位英文编号,怎么获得这个查询的url本文用到的库主要有requests(获取url的内容),prettytable(让文本输出美观),argparse(命令行参数解析)关于这些库怎么使用,可以参见我之前的博文1、首先打开12306余票查询的界面我们想要的信息当然就是在输入了始发站、终点站和日期之后各车次的
转载
2023-12-03 16:32:35
50阅读
登录,查票,购买还没实现,并且我的方法也不是很理想,推荐给小白学习,并且我也是用最易懂的代码来写,所以说如果你是一位python爬虫小白的话,那这篇文章或许会帮到你,干货满满@2021-02-23日更新:各位小伙伴,是不是查询余票都特别困难了?12306升级后,直接使用开发者工具抓包得到的ajax链接直接照搬不管用了,除非是将原cookies加入头文件中,否则访问永远都是提示错误,其实这个很好解决
转载
2023-12-07 07:28:24
287阅读
导语我们来完成项目的最后一部分内容即将两项功能集成到一个Demo,供所有专业/非专业人士更加方便地使用。开发工具python版本:3.5.4chromedriver_win32版本:2.3.4chrome版本:65.0.3298.4相关模块:requests模块、splinter模块、PIL模块以及python自带的一些基本模块。(相关模块均使用pip安装即可)相对之前版本的变动:(1)可视化界面
转载
2023-08-07 20:02:05
100阅读
使用python脚本实现查询火车票信息的效果图如下: 实现的代码:1 # coding: utf-8
2
3 """命令行火车票查看器
4
5 Usage:
6 tickets [-gdtkz]
7
8 Options:
9 -h,--help 显示帮助菜单
10 -g 高铁
11
转载
2023-06-20 01:21:01
169阅读
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置:Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+Navicat11+Django+nodejs。项目技术:django + python+ Vue 等等组成,B/S模式 +pychram管理等等。环境需要1.运行环境:最好是python3.7.7,我们在这
转载
2023-08-13 16:07:16
111阅读