你好,我是悦创。

当我们用浏览器访问网站时,页面各不相同,那么你有没有想过它为何会呈现成这个样子呢?本课时,我们就来讲解网页的基本组成、结构和节点等内容。

1. 为什么要学习网页知识

学习基础的网页知识最重要的一点,是因为课程后续要讲授的技术,都涉及到对网页内容的分析与爬取。哪怕仅仅是作为一名刚入门的爬虫小白,你都需要了解一下网页的相关知识。作为一名开发人员,不仅仅要知其然,更要知其所以然。一味地 Copy 代码,不懂得为什么要这样做,反而会大大降低学习的效果。为此我公众号有一篇学习方法分享给你:

https://mp.weixin.qq.com/s/W4yf0eoUP8ZPcJSVBVyJYQ

2. 浏览网页的过程

  • 输入网址
  • 浏览器向 DNS 服务商发送请求
  • 找到对应服务器
  • 服务器解析请求
  • 服务器处理请求得到最终结果发回去
  • 浏览器解析返回的数据
  • 展示给用户

3. 关于域名

我们写爬虫是离不开域名的,或者我们简单地理解为 URL ,编写的第一步也是先分析其中的规律。

我要了解其中的的一级域名、二级域名即可。如下图: