1. 负载均衡
负载均衡讲的是如何用多台计算机解决一台计算机超负荷的计算问题,主要针对WEB来做请求分发的,因为WEB开发才涉及域名和解析问题;
例如一台服务器本身的性能能够支持1w个业务并发处理
如果业务并发少于1w个,机器也能负重前行
但是如果有10w个怎么办呢?
简单的办法是使用nginx做前面的类似于堡垒机;
10w个并发都打到这个nginx;
但是nginx本身不处理业务,所以他能接纳10w个并发,但是他本身没有处理能力;
而是把这10w个并发,按照一定的策略分配给后面的其他机器;
这样的好处是:
1.通过1个nginx+n个后面的机器组成一个小集群,能处理超过单台机器接纳的上线;
2.对外提供服务一般会固定一个ip,而往往你的业务一个ip(也就是单台服务器)不能完全处理,那么找一个性能不错的专门负责转发外面的业务请求(一般这种对服务器的压力不会太大),然后发给真正需要处理业务的后面的例如tomcat去,这样能够对外提供一致的提供服务的点;
如果并发有50w个怎么办?
这种即使仅仅是转发,单个nginx都没法处理,性能要求太高,而且即使性能能够跟上,操作系统的端口数也是有限的;
这个时候就需要高级的转发服务器了;
这方面有硬件的例如f5或者软件的ha;
然后将请求分发给nginx,nginx再分发给具体处理业务的例如tomcat;
但是功能都是一样的:提供统一的对外访问入口,转发请求给真正的执行者。
通俗的讲:
没有负载均衡 没有nginx
你有一个人 你要做100件事 你1秒只能做完10件事 这样你就要10秒才能做完
有nginx 他可以 把这100件事 分成10份 给10个你去做 1秒就做完
相当于节省时间 增加人力成本
但是对现在来说 那点人力成本不算什么,追求的是高并发处理
2. 同步 异步 阻塞 非阻塞
“阻塞”与"非阻塞"与"同步"与“异步"不能简单的从字面理解,提供一个从分布式系统角度的回答。
(1)同步与异步
同步和异步关注的是消息通信机制 (synchronous communication/ asynchronous communication)
所谓同步,就是在发出一个调用时,在没有得到结果之前,该调用就不返回。但是一旦调用返回,就得到返回值了。换句话说,就是由调用者主动等待这个调用的结果。
调用在发出之后,这个调用就直接返回了,所以没有返回结果。换句话说,当一个异步过程调用发出后,调用者不会立刻得到结果。而是在调用发出后,被调用者通过状态、通知来通知调用者,或通过回调函数处理这个调用。
典型的异步编程模型比如Node.js;
举个通俗的例子:
你打电话问书店老板有没有《分布式系统》这本书,如果是同步通信机制,书店老板会说,你稍等,”我查一下",然后开始查啊查,等查好了(可能是5秒,也可能是一天)告诉你结果(返回结果)。
而异步通信机制,书店老板直接告诉你我查一下啊,查好了打电话给你,然后直接挂电话了(不返回结果)。然后查好了,他会主动打电话给你。在这里老板通过“回电”这种方式来回调。
(2) 阻塞与非阻塞
阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.
阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。
非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。
还是上面的例子,
你打电话问书店老板有没有《分布式系统》这本书,你如果是阻塞式调用,你会一直把自己“挂起”,直到得到这本书有没有的结果,如果是非阻塞式调用,你不管老板有没有告诉你,你自己先一边去玩了, 当然你也要偶尔过几分钟check一下老板有没有返回结果。
在这里阻塞与非阻塞与是否同步异步无关。跟老板通过什么方式回答你结果无关。
3. 分布式 集群
分布式:一个业务分拆多个子业务,部署在不同的服务器上
集群:同一个业务,部署在多个服务器上
也可以这么说:分布式是指将不同的业务分布在不同的地方。 而集群指的是将几台服务器集中在一起,实现同一业务。
简单说说:分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。