消息队列场景简介

  “消息”是在两台计算机间传送的数据单位。消息可以非常简单,例如只包含文本字符串;也可以更复杂,可能包含嵌入对象。消息被发送到队列中,“消息队列”是在消息的传输过程中保存消息的容器


使用消息队列实现的状态机 消息队列使用的场景_高并发

  在目前广泛的Web应用中,都会出现一种场景:在某一个时刻,网站会迎来一个用户请求的高峰期(比如:淘宝的双十一购物狂欢节,12306的春运抢票节等),一般的设计中,用户的请求都会被直接写入数据库或文件中,在高并发的情形下会对数据库服务器或文件服务器造成巨大的压力,同时呢,也使响应延迟加剧。这也说明了,为什么我们当时那么地抱怨和吐槽这些网站的响应速度了。当时2011年的京东图书促销,曾一直出现在购物车中点击“购买”按钮后一直是“Service is too busy”,其实就是因为当时的并发访问量过大,超过了系统的最大负载能力。当然,后边,刘强东临时购买了不少服务器进行扩展以求增强处理并发请求的能力,还请了信息部的人员“喝茶”,现在京东已经是超大型的网上商城了,我也有同学在京东成都研究院工作了。


使用消息队列实现的状态机 消息队列使用的场景_使用消息队列实现的状态机_02

  从京东当年的“Service is too busy”不难看出,高并发的用户请求是网站成长过程中必不可少的过程,也是一个必须要解决的难题。在众多的实践当中,除了增加服务器数量配置服务器集群实现伸缩性架构设计之外,异步操作也被广泛采用。而异步操作中最核心的就是使用消息队列,通过消息队列,将短时间高并发产生的事务消息存储在消息队列中,从而削平高峰期的并发事务,改善网站系统的性能。在京东之类的电子商务网站促销活动中,合理地使用消息队列,可以有效地抵御促销活动刚开始就开始大量涌入的订单对系统造成的冲击

  记得我在实习期间,成都市XXXX局的一个价格信息采集发布系统项目中有一个采集任务发布的模块,其中每个任务都是一个事务,这个事务中需要向数据库中不断地插入行,每个任务发布时都要往表中插入几百行甚至几千行的任务数据(比如价格采集日报,往往需要发布2-3年的任务数据,每一天都是一个任务,所以大约有2,3千行任务期号数据,还要发给很多个区县的监测中心,因此数据库写操作量很大,更别说同时发布的并发操作),由于业务逻辑的处理比较复杂和往数据库的写操作量交大,所以在没有采用消息队列时点击“发布”按钮后往往需要等待1分钟左右的时间才提示“发布成功”,用户体验极不友好。


使用消息队列实现的状态机 消息队列使用的场景_数据库_03

  这时,我们就可以使用消息队列的思想来重构这个发布模块,在用户点击“发布”按钮后,系统只需要把往数据库插入的这个事务信息插入到指定的任务发布消息队列里边去(入队操作,这里一般有一台独立的消息队列服务器来单独存储和处理),然后系统就可以立即对用户的这个发布请求进行响应(比如给出一个发布成功的操作提示,这里暂不考虑消息队列服务操作失败的情形,如果失败了,可以考虑采用给用户发送邮件、短信或站内消息,让其重新进行发布操作)。


使用消息队列实现的状态机 消息队列使用的场景_数据库_04

  最后,消息队列服务器中有一个进程单独对消息队列进行处理,首先判断消息队列中是否有待处理的消息,如果有,则将其取出(出队操作,坚持“先进先出”的顺序,保证事务的准确性)进行相应地处理(比如这里是进行保存数据的操作,将数据插入到数据库服务器中的指定数据库里边,实质还是文件的IO操作)。就这样,通过消息队列将高并发用户请求进行异步操作,然后一一对消息队列进行出队的同步操作,也避免了并发控制的难题。

  说到这里,大家可能会想到这尼玛不就是生产者消费者模式么?对的,么么嗒,消息队列就是生产者消费者模式的典型场景。简单地说,客户端不同用户发送的操作请求就是生产者,他们将要处理的事务存储到消息队列中,然后消息队列服务器的某个进程不停地将要处理的单个事务从消息队列中一个一个地取出来进行相应地处理,这就是消费者消费的过程。

  下面我们将以异常日志为案例,介绍在.Net中如何采用消息队列的思想解决并发问题。当然,消息队列只是解决并发问题的其中一种方式,在实际中往往需要结合多种不同的技术方式来共同解决,比如负载均衡、反向代理、集群等方案。这里,虽然以异常日志为案例,但是“麻雀虽小五脏俱全”,日志写入文件的高并发操作也同样适用于数据库的高并发,所以,研究这个案例是具有实际意义的。

二、使用预置类型实现异常日志队列


使用消息队列实现的状态机 消息队列使用的场景_消息队列_05

  在日常的Web应用中,异常日志的记录是一个十分重要的要点。因为,人无完人,系统也一样,难免会在什么时候出一个测试阶段未能完全测试到的异常。这时候,不能将异常信息直接显示给客户,那样既不友好也不安全。所以,一般都采用将异常信息记录到日志文件中(比如某个txt文件,数据库中某个表等),然后技术支持人员通过查看异常日志,分析异常原因,改进BUG重新发布,保障系统正常运行。

  在用户的各种操作中,如果出现异常的时间一致,那么记录异常日志的操作就会成为并发操作,而记录异常日志又属于文件的IO操作(其实数据库的读写归根结底也是对文件即对磁盘进行的IO操作),因此很有可能带来并发控制的一系列问题。在以往的编码实践中,我们可以通过给不同的IO请求进行加锁(C#中的lock),等第一个请求完成写入后释放锁,第二个请求再获得锁,进行IO操作,然后释放掉,一直到第N个请求释放后结束。这种方式,虽然解决了并发操作带来的问题,但是通过加锁延迟了用户响应请求的时间(比如第一个正在IO写入操作时,后面的均处于等待状态),并且加锁也会给服务器带来一定的性能负担,造成服务器性能的下降。