《深入分析JavaWeb技术内幕》读书笔记  一.Web请求过程与架构

 

最近拜读了大牛许令波大神的著作《深入分析JavaWeb技术内幕》,感觉颇有受益,决定写一写读书笔记,以作总结。第一章,我们就来讲一讲Web请求过程。

随着Web2.0时代的到来,互联网的网络架构已从传统的C/S架构转变为更加方便快捷的B/S架构。这种转变不是没有原因的,下面我们就来说说B/S架构的优点。

B/S:

主要从两方面来阐述B/S的有点:客户端服务端

客户端使用统一的浏览器(Browser)。由于浏览器具有统一性,他不需要特殊的配置和网络连接。有效地屏蔽了不同服务提供商提高给用户使用服务的差异性。另外最重要的一点是浏览器的易用性,能使用户更加轻松方便地使用,大大降低了学习门槛。

服务端(Server)基于统一的HTTP。和传统的C/S架构使用自己定义的应用层协议不同,B/S架构使用统一的HTTP。使用统一的HTTP也为服务提供商简化了开发模式。有很多现成的基于HTTP的服务器,不仅如此,连开发服务的通用框架都不需要单独开发,这大大降低了开发门槛,因此也出现了越来越多的互联网服务。

由此可见,B/S是基于HTTP的,那HTTP又是什么呢?它是如何建立连接的呢?

HTTP是应用层的一种采用无状态的短连接的通信方式。通常情况下,一次请求就完成了一次数据交互,通常也对应一个业务逻辑,然后这次通信连接就断开了。采用这种方式是为了能够同时服务更多的用户,因为当前互联网应用每天都会处理上亿的用户请求,不可能每个用户访问一次后就一直保持这个连接。

B/S网络架构:

目前的B/S网络架构大多采用下图形式:

《深入分析JavaWeb技术内幕》读书笔记_Java

以下是原文截图,关于一次请求的过程。

《深入分析JavaWeb技术内幕》读书笔记_Java_02

《深入分析JavaWeb技术内幕》读书笔记_Java_03

当然,不管网络架构如何变化,始终有一些固定不变的原则。

1.互联网上所有资源都要用一个URL来表示。URL是统一资源定位符,不要小看URL,他几乎包含了整个互联网架构的精髓。当然,这个精髓貌似正在受到Ajax的挑衅。

2.必须基于HTTP与服务端交互。(HTTPS只是在HTTP的基础上加了个安保措施SSL[Secure Socket Layer]安全套接层)

3.数据必须在浏览器中被展示。

那HTTP如何发起请求呢。其实发起HTTP请求和建立一个Socket连接区别不大。只不过outputStream.write写的二进制字节数据格式要符合HTTP格式要求。浏览器就是根据解析出来的IP地址和默认的80端口与远程服务器建立Socket连接,然后浏览器再根据这个URL组装成一个get类型的HTTP请求头发送到服务器。当然,这个过程我们完全可以自己模拟。

HTTP:

我们再来讲一讲HTTP解析

《深入分析JavaWeb技术内幕》读书笔记_Java_04

《深入分析JavaWeb技术内幕》读书笔记_Java_05

《深入分析JavaWeb技术内幕》读书笔记_Java_06

浏览器缓存机制

《深入分析JavaWeb技术内幕》读书笔记_Java_07

Ctrl+F5组合键刷新后,会在请求头加两个请求项。Pragma:no-cache和Cache-Control:no-cache。它们有什么作用呢?

《深入分析JavaWeb技术内幕》读书笔记_Java_08

《深入分析JavaWeb技术内幕》读书笔记_Java_09

DNS域名解析

DNS域名解析是浏览器请求的一个非常重要的过程。我们平时上网可能感觉不到DNS解析的存在,但一旦DNS解析出错,哪台根服务器坏了,那互联网会出些灾难。

DNS域名解析可以分成10步,其中任何一步完成了域名解析,就不再往下进行。

1.查看浏览器缓存

2.查看操作系统缓存

3.向LDNS(本地DNS服务器)发起请求

4.向Root Server(根域名服务器)发起请求

5.根域名服务器返回给本地域名服务器一个所查询的主域名服务器(gTLD Server)。gTLD是国际顶级域名服务器,如.com,.cn,.org等,全球只有13台左右。

6.本地服务器再向上一步返回的gTLD服务器发送请求。

7.接受请求的gTLD服务器查找并返回此域名对应的Name Server域名服务器。

8.Name Server域名服务器会查询存储的域名和IP的映射关系表。

9.返回IP,通常情况下也会返回一个TTL,LDNS缓存时间由TTL值控制。

10.LDNS把解析的结果返回给用户,用户也根据得到的TTL值将结果缓存在本地系统缓存中。

在实际域名解析过程中,可能还不止这10个步骤,如Name Server也可能有多级,或者有一个GTM来进行负载均衡控制,这都有可能会影响域名解析过程。

《深入分析JavaWeb技术内幕》读书笔记_Java_10

Linux和Windows都可以用nslookup命令来查询域名的解析结果。

CDN架构:

最后我们来讲一讲CDN架构

CDN也就是内容分布网络(Content Delivery Network),它是构筑在现有Internet上的一种先进的流量分配网络。

原文截图

《深入分析JavaWeb技术内幕》读书笔记_Java_11

通常的CDN架构:

《深入分析JavaWeb技术内幕》读书笔记_Java_12

负载均衡

负载均衡(Load Balance)就是对工作任务进行平衡,分摊到多个操作单元上执行,如图片服务器、应用服务器等,共同完成工作任务。他可以提高服务器响应速度和利用率,避免软件或者硬件模块出现单点失效,解决网络拥塞问题,实现地理位置无关性,为用户提供较一致的访问质量。

通常有三种负载均衡架构:链路负载均衡(通过DNS解析来完成)集群负载均衡(分硬件和软件)操作系统负载均衡(通过软中断或者硬件中断)

CDN动态加速

《深入分析JavaWeb技术内幕》读书笔记_Java_13

微信公众号

个人公众号:程序员黄小斜

 

《深入分析JavaWeb技术内幕》读书笔记_Java_14

技术公众号:Java技术江湖

 

《深入分析JavaWeb技术内幕》读书笔记_Java_15