# JSON- 在线工具 - https://www.sojson.com/ - http://www.w3school.com.cn/json/ - http://www.runoob.com/json/json-tutorial.html- JSON(JavaScriptObjectNotation)
# 正则表达式(RegularExpression, re)- 是一个计算机科学的概念- 用于使用单个字符串来描述,匹配符合某个
# FTP编程- FTP(FileTransferProtocol /ˈprəʊtəkɒl/ )文件传输协议- 用途: 定制一些特殊的上传下载文件的服务
# Mail编程## 电子邮件的历史- 起源 - 1969 Leonard K. 教授发给同时的 “LO” - 1971 美国国防部自主的阿帕网
# 网络编程- 网络:- 网络协议: 一套规则- 网络模型: - 七层模型-七层 - 物理层 - 数据链路层 - 网络层
# XPath- 在XML文件中查找信息的一套规则/语言,根据XML的元素或者属性进行遍历- http://www.w3school.com.cn/xpa
# 0 爬虫准备工作 - 参考资料 - python网络数据采集, 图灵工业出版 - 精通Python爬虫框架Scrapy, 人民邮电出版社 - [Python3网络爬虫]() - [Scrapy官方教程](http://scrapy-chs.readthedocs.io/z
- urllib.error
- SSL - SSL证书就是指遵守SSL安全套阶层协议的服务器数字证书(SercureSocketLayer) - 美国网景公司开
# Requests-献给人
- ajax - 异步请求
# 页面解析和数据提取 - 结构数据: 先有的结构,在谈数据 - JSON文件 - JSON Path - 转换成Python类型进行操作(json类) - XML文件 - 转换成python类型(xmltodict) - XPath - CSS选择
# 动态HTM
# CSS选择器 BeautifulSoup4
# scrapy
# scrapy-shell - Linux: ctr+T,打开终端,然后输入scrapy shell "url:xxxx" (注意是 双引号) - windows: scrapy shell "url:xxx" - 启动后自动下载指定url的网页 - 下载完成后,url的内容保存在respons...
import thisThe Zen of Python, by Tim PetersBeautiful is better than ugly.Explicit is better than implicit.Simple is better than complex.
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号