更多的参数请参照:http://cbonte.github.io/haproxy-dconv/index.html

有1.6、1.5、1.4对应的版本详解

 

一、简介
HAProxy 提供高可用性、负载均衡以及基于TCP和HTTP应用的代 理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。 HAProxy运行在当前的硬件上,完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中,同时可以保护你的web服务器不被暴露到网络上。
   HAProxy实现了一种事件驱动, 单一进程模型,此模型支持非常大的并发连接数。多进程或多线程模型受内存限制、系统调度器限制以及无处不在的锁限制,很少能处理数千并发连接。事件驱动模型因为在有更好的资源和时间管理的用户端(User-Space)实现所有这些任务,所以没有这些问题。此模型的弊端是,在多核系统上,这些程序通常扩展性较差。这就是为什么他们必须进行优化以 使每个CPU时间片(Cycle)做更多的工作。
   HAProxy是免费、极速且可靠的用于为TCP和基于HTTP应用程序提供高可用、负载均衡和代理服务的解决方案,尤其适用于高负载且需要持久连接或7层处理机制的web站点。
   HAProxy目前主要有两个版本:
   1.4——提供较好的弹性:衍生于1.2版本,并提供了额外的新特性,其中大多数是期待已久的。
      客户端侧的长连接(client-sidekeep-alive)
      TCP加速(TCP speedups)
      响应池(response buffering)
      RDP协议
      基于源的粘性(source-basedstickiness)
      更好的统计数据接口(a much betterstats interfaces)
      更详细的健康状态检测机制(moreverbose health checks)
      基于流量的健康评估机制(traffic-basedhealth)
      支持HTTP认证
      服务器管理命令行接口(servermanagement from the CLI)
      基于ACL的持久性(ACL-based persistence)
      日志分析器
   1.3——内容交换和超强负载:衍生于1.2版本,并提供了额外的新特性。
      内容交换(content switching):基于任何请求标准挑选服务器池;
      ACL:编写内容交换规则;
      负载均衡算法(load-balancingalgorithms):更多的算法支持;
      内容探测(contentinspection):阻止非授权协议;
      透明代理(transparent proxy):在Linux系统上允许使用客户端IP直接连入服务器;
      内核TCP拼接(kernel TCP splicing):无copy方式在客户端和服务端之间转发数据以实现数G级别的数据速率;
      分层设计(layered design):分别实现套接字、TCP、HTTP处理以提供更好的健壮性、更快的处理机制及便捷的演进能力;
      快速、公平调度器(fast and fairscheduler):为某些任务指定优先级可实现理好的QoS;
      会话速率限制(session ratelimiting):适用于托管环境;
   支持的平台及OS:
    x86、x86_64、Alpha、SPARC、MIPS及PARISC平台上的Linux 2.4;
    x86、x86_64、ARM (ixp425)及PPC64平台上的Linux2.6;
    UltraSPARC 2和3上的Sloaris 8/9;
    Opteron和UltraSPARC平台上的Solaris 10;
    x86平台上的FreeBSD4.1-8;
    i386, amd64, macppc, alpha, sparc64和VAX平台上的OpenBSD3.1-current;
   在较新版本的Linux 2.6(>=2.6.27.19)上,HAProxy还能够使用splice()系统调用在接口间无复制地转发任何数据,这甚至可以达到10Gbps的性能。 


二、性能
   HAproxy借助于OS上的集中常见的技术来实现性能的最大化
      单进程、时间驱动模型显著降低了上下文切换的开销和内存占用
      0(1)事件检查器(event checker)允许在其高并发连接中队任何连接的任何事件实现即时探测
      在任何可用的情况下,单缓存(singerbuerffing)机制能以不复制任何数据的方式完成读写操作,这会节约大量的CPU时钟周期及内存带宽
      借助于Linux2.6(其实是2.6.19以上)上的splice()系统调用,HAproxy可以实现0复制转发(Zero-copyforwarding),在linux3.5及以上的OS中还可以实现零复制启动(Zero-starting)
      MRU内存分配器在固定大小的内存池中实现即时内存分配,这能够显著减少一个会话的时间
      树形存储:侧重于使用作者多年前开发的弹性二叉树,实现了以0(log(N))的低开销来保持计时器命令、保持运行队列及管理轮询及最少连接队列
      优化的HTTP首部分析:优化的首部分析过程避免了在HTTP首部分析过程中重读任何内存区域,精心的降低了昂贵的系统调用,大部时间都在用户空间完成,如时间读取、缓存聚合及文件描述符的启用和禁用等
   所有的这些细微之处的优化实现了在中等规模负载之上依然有着相当低的CPU负载,甚至在非常高的负载场景中,5%的用户空间占用率和95%的系统空间占 用率也是非常普遍的现象,这意味着HAproxy集成消耗比系统消耗低了20倍以上,因此,对0S进行性能调优是非常重要的,即时用户空间的占用率提升了 一倍,其CPU占用率也仅为10%,这也监视了为何7层处理对性能影响有限这一现象,由此,在高端系统上HAproxy的7层性能可轻易超过硬件负载均衡 器
   可以从三个因素来评估负载均衡器的性能:会话率、会话并发能力、数据率           


三、配置HAproxy
   3.1 配置文件格式
     HAproxy的配置处理3类主要参数来源:
          最优先处理的命令行参数
          "global"配置段,用于设定全局配置参数
          prxoy相关配置端,如"defaults","listen","frontend"和"backend"等
   3.2 时间格式
      一些包含了值得参数表示时间,如超时时长。这些值一般都以毫秒为单位,但也可以使用其他的时间单位做后缀,如us(微妙,1/10000000秒),ms(毫秒,1/1000秒),s(秒),m(分钟),h(小时),d(天)
   3.3 全局配置
   “global”配置中的参数为进程级别的参数,且通常与其运行的OS有关
     进程管理及安全相关的参数
        chroot: 修改haproxy的工作目录至指定的目录,并在放弃权限之前执行chroot()操作,可以提升haproxy的安全级别,不过需要注意的是确保指定的目录为空目录且任何用户均不能有写权限
        daemon:让haproxy以守护进程的方式工作于后台,其等同于“-D”选项的功能,当然,也可以在命令行中以“-db”选项将其禁用
        gid:以指定的GID运行haproxy,建议使用专用于运行haproxy的GID,以避免因权限带来的风险
        group:同gid,不过这里为指定的组名
        uid: 已指定的UID身份运行haproxy进程
        user:同uid,但这里使用的为用户名
        log:定义全局的syslog服务器,最多可以定义两个
        log-send-hostname <string>:在syslog信息的同步添加当前主机名,可以为“string”指定的名称,也可以缺省使用当前主机名
        nbproc: 指定启动的haproxy进程个数,只能用于守护进程模式的haproxy;默认为止启动一个进程,鉴于调试困难等多方面的原因,一般只在但进程仅能打开少数文件描述符的场中中才使用多进程模式
        pidfile: pid文件的存放位置
        ulimit-n:设定每个进程所能够打开的最大文件描述符,默认情况下其会自动进行计算,因此不建议修改此选项
        node:定义当前节点的名称,用于HA场景中多haproxy进程共享同一个IP地址时
        description: 当前实例的描述信息
     性能调整有关的参数
        maxconn:设定每个haproxy进程所接受的最大并发连接数,其等同于命令行选项"-n","ulimit-n"自动计算的结果正式参照从参数设定的
        maxpipes: haproxy使用pipe完成基于内核的tcp报文重组,此选项用于设定每进程所允许使用的最大pipe个数,每个pipe会打开两个文件描述符,因 此,"ulimit -n"自动计算的结果会根据需要调大此值,默认为maxcoon/4
        noepoll: 在linux系统上禁用epoll机制
        nokqueue:在BSE系统上禁用kqueue机制
        nopoll:禁用poll机制
        nosepoll: 在linux系统上禁用启发式epoll机制
        nosplice:禁止在linux套接字上使用tcp重组,这会导致更多的recv/send调用,不过,在linux2.6.25-28系列的内核上,tcp重组功能有bug存在
        spread-checks<0..50,in percent>: 在haprorxy后端有着众多服务器的场景中,在紧缺是时间间隔后统一对中服务器进行健康状况检查可能会带来意外问题,此选项用于将检查的时间间隔长度上增加或减少一定的随机时长,为当前检查检测时间的%
        tune.bufsize: 设定buffer的大小,同样的内存条件下,较小的值可以让haproxy有能力接受更多的并发连接,较大的值了可以让某些应用程序使用较大的 cookie信息,默认为16384,其可以在编译时修改,不过强烈建议使用默认值
        tune.chksize: 设定检查缓冲区的大小,单位为字节,更大的值有助于在较大的页面中完成基于字符串或模式的文本查找,但也会占用更多的系统资源,不建议修改
        tune.maxaccept:设定haproxy进程内核调度运行时一次性可以接受的连接的个数,较大的值可以带来较大的吞吐量,默认为单进程模式下为100,多进程模式下为8,设定为-1可以禁止此限制,一般不建议修改
        tune.maxpollevents:设定一次系统调用可以处理的事件最大数,默认值取决于OS,其至小于200时可介于带宽,但会略微增大网络延迟,但大于200时会降低延迟,但会稍稍增加网络带宽的占用
        tune.maxrewrite:设定在首部重写或追加而预留的缓存空间,建议使用1024左右的大小,在需要更大的空间时,haproxy会自动增加其值
        tune.rcvbuf.client:设定内核套接字中客户端接收缓存区的大小,单位为字节,强烈推荐使用默认值
        tune.rcvbuf.server:设定内核套接字中服务器接收缓存区的大小,单位为字节,强烈推荐使用默认值
        tune.sndbuf.client:设定内核套接字中客户端发送缓存区的大小,单位为字节,强烈推荐使用默认值
        tune.sndbuf.server:设定内核套接字中服务器端发送缓存区的大小,单位为字节,强烈推荐使用默认值
     与调试相关的参数
        debug
        quiet
   3.4 代理
      代理相关的配置可以如下配置端中
         defaults:用于为所有其他配置段提供默认参数,这配置默认配置参数可由下一个"defaults"所重新设定
         forntend:用于定义一系列监听的套接字,这些套接字可以接受客户端请求并与子建立连接
         backend: 用于定义一系列“后端”服务器,代理将会将对应客户端的请求转发至这些服务器
         listen: 用于定义通过关联“前段”和“后端”一个完整的代理,通常只对TCP流量有用
         所有代理的名称只能使用大写字母、小写字母、数字、-(中线)、_(下划线)、.(点号)和:(冒号)。此外,ACL名称会区分大小写



四、配置文件中的关键字详解
   
4.1 balance
       balance<algorithm> [<arguments>] 
       balance url_param<param> [check_post [<max_wait>]]
      
定义负载均衡算法,可用于"defaults"、"listen"和"backend"中。<algorithm>用于在负载均衡场景中挑选 一个server,其仅用于持久信息不可用的条件下或需要将一个连接重新派发至另一个服务器时。支持的算法有:
          roundrobin
:基于权重进行轮询,在服务器的处理时间保持均匀分布时 ,这是最平衡、最公平的算法。此算法是动态的,这表示某权重可以在运行时进行调整,不过,在设计上,每个后端服务器仅能最多支持4128个连接
          static-rr
:基于权重进行轮询,与roundrobin类似,但是为静态方法,在运行时调整期后端权重不会生效,不过,其在后端服务器连接数上没有限制
          leastconn
:新的连接强求笨哦派发至具有最少连接数目的后端服务器,在有这较长会话的场景中推荐使用此算法,如LDAP、SQL等。其并不太适合用于较短会话的应用层协议,如HTTP,此算法是动态的,可以在运行时调整其权重
          source
:将请求的源地址进行hash运算,并有后端的服务器的权重总数相处后派发至某匹配的服务器,这可以使得同一个客户端IP的请求始终被 派发至某特定的服务器,不过,当服务器权重总数发生变化时,如某服务器宕机或者添加新服务器,许多的请求可能会被派发至与此前请求不同的服务器,常用于负载均衡无cooki功能的基于TCP的协议,默认为动态,不过可以使用hash-type修改此特性
          uri
:对URI的左半部分(“问号”标记之前的部分)或整个URI进行hash运算,并由服务器的总权重相除后派发至某匹配的服务器;这可以使得对同一个URI的请求总是派发至某匹配的服务器,除法服务器的权重总数发生了变化,此算法常用于代理缓存或反病毒代理以提高缓存的命中率,需要注意的是,此算法仅应用于HTTP后端服务器场景,其默认为静态算法,不过可以使用hash-type修改此特性
          url_param
:通过<argument>为URL指定的参数在每个HTTP GET请求中将会被索引,日过找到了指定的参数且其通过等于号“=”被赋予了一个值,那么此值将被执行hash运算并被服务器的总权重相处后派发至某匹配 的服务器,此算法可以通过追踪请求中的用户标识进而确保同一个用户的ID请求被发送同一个特定的服务器,除非服务器的总权重发生了变化;如果某请求中没有 出现指定的参数或其没有有效值,则使用轮询算法对其想用请求进行调度,此算法默认为静态,不过可以使用hash-type修改此特性
          har
(<name>):对于每个HTTP请求,通过<name>指定的HTTP首部将会被检索,如果对于那个的首部没有 出现或其没有有效值,则使用轮询算法对响应请求进行调度,其有一个可选项“use_domain_only”可以指定检索类似host类的首部时仅计算域名部分(比如通过www.wangfeng7399.com来说,仅计算wangfeng7399.com字符串的hash值)以降低hash算法的运算量,此算法默认为静态,不过可以使用hash-type修改此特性
          rdp-cookie
          rdp-cookie
(name):
 
 4.2 bind
       bind[<address>]:<port_range>[,.....]
       bind[<address>]:<port_range>[,.....] interface <interface>
      
从指令仅能用于frontend和listen区段,用于定义一个或多个监听的套接字
       <address>:
可选项,其可以为主机名、IPV4地址、IPV6地址或*:省略此选项、将其指定为*或0.0.0.0时,将监听当前系统的所有IPv4地址
       <port_range>:
可以是一个特定的TCP端口,也可是一个端口范围(如6604-6610),代理服务器将通过制定的端口来接受客 户端请求,需要注意的是,每组监听的套接字<address:prot>在同一个实例上只能使用一次,而且小于1024的端口需要有特定的权限的用户才能使用,这可能需要通过uid参数来定义
       <interface>
:指定物理接口的名称,仅能在linux系统上使用,其不能使用接口别名,二进程使用物理端口名称,而且只有管理有权限指定绑定的物理端口
   
4.3 mode
       mode{ tcp|http|health}
      
设定实例的运行模式或协议,当实现内容交换时,前段和后端必须工作与统一中模式(一般说来时tcp模式),否则将无法启动实例
       tcp:
实例运行于纯tcp模式,在客户端和服务器端之间将建立一个全双工的连接,且不会对7层报文做任何类型的检查,此为默认模式,通常用于SSL、SSH、SMTP等应用
       http
:实例运行于http模式,客户端请求在转发至后端服务器之前将被深度分析,所有不与RFC模式兼容的请求都会被拒绝
       health
:实例运行于health模式,其对入站请求仅响应“OK”信息并关闭连接,且不会记录任何日志信息 ,此模式将用于相应外部组件的监控状态检测请求;目前来讲,此模式已经废弃,因为tcp或http模式中的monitor关键字可完成此类功能
   
4.4 hash-type
       hash-type<method>
      
定义用户将hash码映射至后端服务器的方法:其不能用于forntend区段,可用方法有map-based和consistent,在大多数场景下推荐使用默认的map-based方法
        map-based
:hash表示一个包含了所有在线服务器的静态数组。其hash值将会非常平滑,会将权重考虑在列,但其为静态方法,对在线服务 器的权重进行调整将不会生效,这意味着不支持慢速启动。此外,挑选服务器是根据其在属组中的位置运行的,因此,当一台服务器宕机或添加了一台新的服务器时,大多数连接将会倍重新派发至一个与此前不同的服务器上,对于缓存服务器的工作场景来说,此方法不甚适应
       consistent
:hash表一个由个服务器填充而成的树状结构;基于hash间在hash树种查找相应的服务器时,最近的服务器将被选中,此方法是动态的,支持在运行时修改服务器的权重,因此兼容慢启动的特性,添加一个新的服务器时,仅会对一部分请求产生影响,因此,尤其适用于后端服务器为 cache的场景 。不过,此算法不甚平滑,派发至各服务器的请求未必能达到理想的均衡效果,因此,可能需要不时的调整上游服务器的权重以获得更好的均衡性
 
 4.5  log
       log global
      log<address><facility>[<level>[<minlevel>]]
      
为每个实例启用事件和流量日志,因此可用于所有区段。每个实例最多可硬定义两个log参数,不过,如果使用了“log global”且“global”端定义了两个log参数时,多余的log参数将会倍忽略
       global
:当前实例的日志系统参数同“global”段中的定义时,将使用此格式,每个实例仅能定义一个“log global”语句,且其没有额外的参数
       <address>
:定义日志发往的位置,其格式之一可以为<ipv4_address:port>,其中prot为udp协议,默认为514,格式之二为Unix套接字文件路径,当需要留心chroot应用及用户读写权限
       <facility>:
可以为syslog系统的标准facility之一
       <level>:
定义日志级别,即输出信息过滤器,默认为所有信息,指定级别时,所有等于或高于此级别的日志信息将会被发送
 
 4.6 maxconn
       maxconn <conns>
      
设定一个前段的最大并发连接数,因此,其不能用于backend区段,对于大型站点来说,可以尽可能提高此值以便让haproxy管理连接队列,从而便面 无法应答用户请求。当然,此最大值不能超过“global”段中的定义。此外,需要留心的是,haproxy会为每个连接维持两个缓冲,每个缓存的大小为 8KB,在加上其他的数据,每个连接将大约占用17KB的RAM空间,这意味着经过适当优化后 ,有着1GB的可用RAM空间时将维护40000-50000并发连接
      
如果为<conns>指定了一个过大值,极端场景中,其最终所占据的空间可能会超过当前主机的可用内存,这可能会带来意想不到的结果,因此,将其设定一个可接受值放为明智绝对,其默认为2000
  
4.7 default_backend
       default_backend<backend>
      
在没有匹配的“use_backend”规则时为实例指定使用的默认后端,因此,其不可应用于backend区段,在“frontend”和 “backend”之间进行内容交换时,通常使用“use-backend”定义其匹配规则,而没有被匹配到的请求将有此参数指定的后端接收
       <backend>:
指定使用的后端名称
   4.8 server
      server<name><address>[:port][param*]
      
在后端声明一个server,因此,不能用于defaults和frontend区段。
       <name>:
为此服务器指定的内部名称,其将会出现在日志及警告信息中;如果设定了“http-send-server-name”,他还将会被添加至发往此服务器的请求首部中
       <adderss>
:此服务器的IPv4地址,也支持使用可解析的主机名,只不过在启动时需要解析主机名至响应的IPV4地址
       <:port>
:指定将连接请求所发往此服务器时的目标端口,其为可选项,为设定是,将使用客户端请求时的同一相同端口
       [param*]
:为此服务器设定的一系列参数:其可以得参数非常多,具体请参考官方文档(http://cbonte.github.io/haproxy-dconv/configuration-1.4.html#5)中的说明,下面仅说明几个常用的参数
           
服务器或默认服务器参数:
              backup
:设定为备用服务器,仅在负载均衡场景中的其他server均不可以启用此server
              check
:启动对此server执行监控状态检查,其可以借助于额外的其他参数完成更精细的设定,如:
                  inter<delay>:
设定监控状态检查的时间间隔,单位为毫秒,默认为2000,也可以使用fastinter和downinter来根据服务器端专题优化此事件延迟
                  rise<count>
:设定检查状态检查中,某离线的server从离线状态转换至正常状态需要成功检查的次数
                  fall<count>
:设定检查状态检查中,某离线的server从正常状态转换至离线状态需要成功检查的次数
              cookie<value>
:为指定server设定cookie值,此处指定的值将会在请求入站时被检查,第一次为此值挑选的server将会倍后续的请求所选中,其目的在于实现持久连接的功能
              maxconn<maxconn>
:指定此服务器接受的最大并发连接数,如果发往此服务器的连接数目高于此处指定的值,其将被放置于请求队列,以等待其他连接被释放
              maxqueue<maxqueue>
:通过观察服务器的通信状况来判断其健康状态,默认为禁用,其支持的类型有“layer4”和“layer 7”,“layer 7”仅能用于http代理场景
              redir<prefix>
:启用重定向功能,将发往此服务的GET和HEAD请求均以302状态码响应,需要注意的是,在prefix后面不能使用/,且不能使用相对地址,以避免造成循环,例如
1
server srv1 192..168.1.202:80 redir 
http://p_w_picpathserver.wangfeng7399.com check
              weight<weight>:
权重,默认为1,最大值为256,0表示不参与负载均衡
              
检查方法:
              option httpchk
              option httpchk<uri>
              option httpchk<method><uri>
              option httpchk<method><uri><version>
:不能用于frontend端,例如:

backend https_relay
    mode tcp
    option httpchk OPTIONS *HTTP/1.1\r\nHost:\ www
    server apache1 192.168.1.1:443check port 80
 
 4.9 capture request header
       capture requestheader <name> len <length>
      
捕获并记录指定的请求首部最近一次出现时的第一个值,仅能用于“frontend”和“listen”区段,捕获的首部值使用花括号{}括起来后添加进日 志中,如果需要捕获多个首部值,他们将以指定的次序出现在日志文件中,并以竖线“|”作为分隔符,不存在的首部记录为空字符串,最长需要捕获的首部包括在 虚拟主机环境中使用的“host”、上传请求首部中的“Content-length”、快速区别现实用户和网络机器人“User-agent”,已经代 理环境中距离请求来源的“X-Forword-For”
       <name>:
要捕获的首部的名称,此名称不区分大小写,但建议与他们出现在首部中的格式相同,比如大写首字母,需要注意的是,记录在日志的是首部的值,而非首部名称
       <length>:
指定距离首部值时所记录的精确长度,超出的部分将会倍忽略
          
可以捕获的请求首部的个数没有限制,但每个捕获最多能记录64个字符,为了保证同一个frontend中日志格式的统一性,首部捕获仅能在frontend中定义
   
4.10 capture response header
       capture responseheader <name> len <length>
        
捕获并记录响应首部。其格式和要点同捕获的请求首部响应
   
4.11  stats enable
      
启用基于程序编译时默认设置的统计报告,不能用于“frontend”区段,只要没有额外的其他设定,他们就会使用如下的配置        

- stats uri   : /haproxy?stats 
- stats realm : "HAProxy Statistics"
- stats auth  : no authentication
- stats scope : no restriction
      
尽管“stats enable”一条就能够启用统计报告,但还是建议设定其他所有的参数,以避免其依赖默认设定而带来非预期后果,下面是一个配置案例实例

backend public_www
    server srv1 192.168.1.201:80
    stats enable
    stats hide-version
    stats scope   .
    stats uri    /admin?stats
    stats realm   Haproxy\Statistics
    stats auth   admin1:AdMiN123
    stats auth   admin2:AdMiN321
   
4.12 stats hide-version
       stats hide-version
      
启用统计报告并因此HAProxy版本报告,不能用于“frontend”区域,默认情况下,统计页面会显示一些有用信息,包括HAProxy的版本号,然后,向所有人公开HAproxy的准确版本号是非常有危险的,因为他能够版主恶意用户快速定位版本的缺陷和漏洞,尽管“stats hide-version”一条就能够启用统计报告,但还是建议设定其他所有的参数,以避免其依赖默认设定而带来非预期后果请参照“stats enable”一节的说明
 
 4.13 stats realm
        statsrealm <realm>
        
启用统计报告并高精认证领域,不能用于“frontend”区域,haproxy在读取realm是会讲是做一个单词,因此,中间的空白字符都必须使用反斜线进行转移。此参数仅在与“stats auth”配置使用时有意义
       <realm>
:实现HTTP基本认证时显示在浏览器中的领域名称,用于提示用户输入一个用户名和密码
      
尽管“stats realm”一条就能够启用统计报告,但还是建议设定其他所有的参数,以避免其依赖默认设定而带来非预期,后果请参照“stats enable”一节的说明
   
4.14 stats scope
       stats scope{<name>|"."}
      
启用统计报告并限定报告的区段,不能用于“frontend”区域,当指定此语句时,统计报告将仅显示其列举出区段的报告信息,所有其他区段的信息将被隐藏,如果需要显示多个区段的统计报告,此语句可以定义多次,需要注意的是,区段名称进程仅仅是以字符串比较的方式进行,他不会真检查指定的区段是否真正存 在
       <name>
:可以是一个“listen”、“frontend”或“backend”区段的名称,而“.”则表示stats scope语句所定义的当前区段
        
尽管“stats scope”一条就能够启用统计报告,但还是建议设定其他所有的参数,以避免其依赖默认设定而带来非预期后果,请参照“stats enable”一节的说明
 
 4.15 stats auth
       stats auth<user>:<password>
      
启用带认证的统计报告功能并授权一个用户账号,不能用于“frontend”区域
       <user>
:授权进行访问的用户名
       <password>
:此用户的访问密码,明文格式
      
此语句将给予默认设定启用统计功能报告,并仅允许其定义的用户访问,其也可以定义多次以手段多个用户账号,可以结合“stats realm”参数在提示用户认证是给出一个领域说明信息,在使用非法用户访问统计功能时,其将会响应一个“401 Forbidden”页面,其认证方式为HTTP Basic认证,密码传输会以明文方式进行,因此,配置文件中也使用存储明文方式存储以说明其非保密信息故此不能想用与其他关键性账号的密码。
      
尽管“stats auth”一条就能够启用统计报告,但还是建议设定其他所有的参数,以避免其依赖默认设定而带来非预期后果,请参照“stats enable”一节的说明
 
 4.16 stats admin 
       atsts admin{if|unless}<cond>
      
在指定的条件满足时启用统计报告页面的管理级别功能,他允许通过web接口启用或禁用服务器,不过,基于安全的角度考虑,统计报告页面应该尽可能为只读的,此外,如果启用了HAproxy的多进程模式,启用此管理级别将会可能导致异常行为
        
目前来说,POST请求方法被限制于仅能使用缓冲区减去保留之外的空间,因此,服务器列表不能过长,否则,此请求将无法正常工作,因此,建议一次仅调整少数几个服务器,例如

Example :
# statistics admin level only for localhost
backend stats_localhost
    stats enable
    stats admin if LOCALHOST
限制了技能在本机打开报告页面时启用管理级别功能
Example :
# statistics admin level always enabled becauseof the authentication
backend stats_auth
    stats enable
    statsauth  admin:AdMiN123
    stats admin if TRUE
定义了仅允许通过认证的用户使用管理级别功能
 
 4.17 option httplog
       option httplog [clf]
      
启用记录HTTP请求、会话状态和计时器的功能
       clf
:使用CLF格式来代替HAproxy默认的HTTP格式,通常在使用仅支持CLF格式的特定日志分析器时才需要使用此格式
      
默认情况下,日志输入格式非常简陋。因为其仅包括源地址、目标地址和实例名称、而“optionhttplog”参数将会使得日志变得丰富许多,其通常包括但不局限于HTTP请求、连接计时器、会话状态、连接数、捕获的首部及cookie、 “frontend”、“backend”及服务器名称。当然也包括源地址和端口号等。
 
 4.18 option logasap  
        no optionlogasap
        
启用或禁用提前将HTTP请求记入日志,不能用于“frontend”区段。
        
默认情况下,HTTP请求是在请求结束时进行记录以便能够将其整体输入时长和字节数记入日志,由此,传较大的对象时,其记入日志的市场可能会略有延迟,“option logasap”参数能够在服务器发送complete首部时及时记录日志,只不过,此时将不记录整体传输时长和字节数。此情形下,捕获 “Content-Length”响应报文来记录的字节数是以一个较好的选择
 
 4.19 option forwardfor
        optionforwardfor[ except <network> ][ header <name> ][ if-none ]  
        
允许在发往服务器的请求首部中插入“X-Forwarded-For”首部
       <network>
:可选参数,当指定时,源地址为皮至此网络中的请求都禁用此功能
       <name>
:可选参数,可使用一个自定义的首部,如“X-Cluster-Client-IP”来代替“X-Forwarded-For”,有些独特的web服务器的确需要用一个独特的首部
        if-none:
仅在此首部不存在时才会将其添加至请求报文中
        HAproxy
工作与反向代理模式,其发往服务器的请求中的客户端IP均为HAproxy主机的地址而非真正的客户端地址,这会使得服务器的日志记 录不了真正的请求来源,“X-Forwarded-For”首部则可用于解决此问题,HAproxy可以向每个房网服务器的请求上添加此首部,并以客户端 IP为其value
      
需要注意的是,HAproxy工作与隧道模式,其仅检查每一个连接的第一个请求,一次,仅第一个请求报文中被附加此首部,请确保同时使用“option httpclose”、“option forceclose”和“option http-server-close”几个option,例如

frontend www
    mode http
    option forwardfor except127.0.0.1  # stunnel already adds the header
# Those servers want the IP Address in X-Client
backend www
    mode http
    option forwardfor header X-Client
   
4.20 errorfile
       errorfile<code> <file>
      
在用户请求不存在的页面时,返回一个页面给客户端而非有haproxy生成的错误代码,可用于所有段中
       <code>:
指定对HTTP的那些状态码发回指定的页面,这里可用的状态码有200、400、403、408、500、502、503和504
       <file>
:指定用于响应的页面文件
      
例如:

errorfile 400/etc/haproxy/errorfiles/400badreq.http
errorfile 403/etc/haproxy/errorfiles/403forbid.http
errorfile 503/etc/haproxy/errorfiles/503sorry.http
   
4.21 errorloc和errorloc302
       errorloc <code><url>
       errorloc302<code> <url>
      
请求错误时,返回一个HTTP重定向至某URL的信息,可以用于所有端中
       <code>:
指定对HTTP的那些状态码发回指定的页面,这里可用的状态码有200、400、403、408、500、502、503和504
       <url>
:Location首部中指定的页面位置的具体路径,可以是在当前服务器上的页面的相对路径,也可以使用绝对路径,需要注意的是,如果URI之神错误时禅师某特定状态码信息的话,有可能会导致循环定向
      
需要留意的时,这两个关键字都会返回302状态码,浙江使得客户端使用同样的HTTP方法获取指定的URL。对于非GET方法获取指定的URL,对于非 GET方法的场景(如POST)来说会产生问题,因为返回客户端的URL是不允许使用GET意外的其他方法的,如果的确有这种问题,可以使用 errorloc303来返回303状态码给客户端
 
 4.22 errorloc303
       errorloc303<code> <url>
       <code>:
指定对HTTP的那些状态码发回指定的页面,这里可用的状态码有400、403、408、500、502、503和504
       <url>
:Location首部中指定的页面位置的具体路径,可以是在当前服务器上的页面的相对路径,也可以使用绝对路径,需要注意的是,如果URI之神错误时禅师某特定状态码信息的话,有可能会导致循环定向


五、ACL  
   haproxy的ACL用于实现基于请求报文的首部、响应报文的内容或其他的环境状态信息来做出转发决策,这大大增强了其配置弹性,其配置法则通常非为两步,首先定义ACL,及定义一个测试条件,而后在条件得到满足时执行某特定的动作,如阻止请求或转发至某特定的后端,官方文档(http://cbonte.github.io/haproxy-dconv/configuration-1.4.html#7)定义ACL的语法格式如下:
  acl<aclname><criterion>[flags][operator]<value> ...
   <aclname>
:ACL名称,区分字符大小写,其只能包含大小写字符、数字、-(连接线)、_(下划线)、.(点号)和:冒号,haproxy中,acl可以重名,还可以把多个测试条件定义为一个共同的acl
   <criterion>:
测试标准,即对什么信息发起测试,测试方式可以有[flags]指定的标志进行调整,而有些测试标准也可以需要在其为<value>之前指定一个操作符[operator]
   [flags]
:目前haproxy的acl支持的标志位有3个
       -i
:不区分<value>中模式字符的大小写
       -f
:从指定的文件中加载模式
       --
:标识符的强制结束标记,在模式中的字符串像标记符时使用
    <value>
:acl测试条件支持的值有以下四类
      
整数或证书范围:如1024:65535表示从1024到65535,仅支持使用正整数(如果出现类似小数的标识,其通常为测试版本),其支持使用的操作符有5个,分别为eq(等于)、ge(大于等于)、gt(大于)、le(小于等于)和lt(小于)
      
字符串:支持使用“-i”以忽略字符大小写,支持使用“\”进行转义,如果在模式首部出现了-i,可以在之前使用“--”标识位
      
正则表达式:其机制类同于字符串匹配
       IP
地址及网络地址
   
同一个acl中可以指定多个测试条件,这些测试条件需要由逻辑操作符指定其关系,条件间的组合测试关系有三种:“与”(默认即为与操作)、“或”(使用“||”操作符和“or”)和“非”(使用“!”操作符)
   
常用的测试标准
      
5.1 be_sess_rate (integer)
          be_sess_rate(backend) (integer)
          
用于测试指定的backend上会话创建的速率(即每秒创建的会话数)是否满足指定的条件,常用于在指定的backend上的会话速率过高时将用户请求转发至另外的backend,或用于阻止***行为。例如:

backend dynamic
    mode http
    acl being_scanned be_sess_rate gt100
    redirect location /denied.html ifbeing_scanned
      
5.2 fe_sess_rate <integer>
        fe_sess_rate(backend) (integer)
          
用于测试指定的frontend(或当前fortend)上的创建速率是否满足指定的条件,常用于为frontend指定一个合理的会话创建速率的上限以防止服务器被滥用,例如

frontend mail
    bind :25
    mode tcp
    maxconn 500
    acl too_fast fe_sess_rate ge 50
    tcp-request inspect-delay 50ms
    tcp-request content accept if !too_fast
    tcp-request content accept ifWAIT_END
定律限定入站邮件速率不能大于50封/秒,所有在指定范围之外的请求都被延时50毫秒
      
5.3 hdr <string>
          hdr(header) <string>
          
用于测定请求报文中的所有首部或指定首部是否满足指定的条件,指定首部时,其名称不区分大小写,且在括号“()”中不能有任何多余的空白字符,测试 服务器端的响应报文时可以使用shdr()。例如。下面的例子用于测试首部Connection的值是否为close
1
hdr(Connection) -i close
      
5.4 method <string>
          
测试HTTP请求报文中使用的方法
      
5.5 path_beg <string>
          
用于测试请求的URI是否以<string>指定的模式开头。

acl url_static      path_beg       -i /static /p_w_picpaths /javascript /stylesheets
测试URL是个以/static /p_w_picpaths /javascript /stylesheets开头
      
5.6 path_end <string>
          
用于测试请求的URL是否以<string>指定的模式结尾

acl url_static      path_end       -i .jpg .gif .png .css .js

测试URI是否以.jpg .gif .png .css .js结尾
      
5.7 hdr_beg <string>
          
用于测试请求报文的指定首部的开头部分是否符合<string>指定的模式

acl host_static hdr_beg(host) -i img. video.download. ftp.
用于测试请求报文首部中的主机是否已img.video. download. ftp.开头
      
5.8 hdr_beg <string>
          
用于测试请求报文的指定首部结尾是否符合<string>指定的模式



六、简单配置文件举例说明:

global
    # to have these messages end up in /var/log/haproxy.log youwill
    # need to:
    #
    # 1) configure syslog to accept network log events. This is done
    #    by adding the '-r' option to theSYSLOGD_OPTIONS in
    #    /etc/sysconfig/syslog
    #
    # 2) configure local2 events to go to the/var/log/haproxy.log
    #   file. A line like the following can be addedto
    #   /etc/sysconfig/syslog
    #
    #   local2.*                      /var/log/haproxy.log
    #
    log        127.0.0.1 local2

    chroot      /var/lib/haproxy
    pidfile     /var/run/haproxy.pid
    maxconn     4000
    user        haproxy
    group       haproxy
    daemon

    # turn on stats unix socket
    stats socket /var/lib/haproxy/stats

#---------------------------------------------------------------------
# common defaults that all the 'listen' and 'backend' sections will
# use if not designated in their block
#---------------------------------------------------------------------
defaults
   mode                   http
    log                    global
   option                 httplog
   option                 dontlognull
    option http-server-close
    option forwardfor       except127.0.0.0/8
   option                 redispatch
   retries                3
    timeout http-request    10s
    timeoutqueue           1m
    timeoutconnect         10s
    timeoutclient          1m
    timeoutserver          1m
    timeout http-keep-alive 10s
    timeoutcheck           10s
   maxconn                3000

listen stats
    mode http
    bind *:1080
    stats enable
    stats hide-version
    stats uri /haproxyadmin?stats
    stats realm Haproxy\ Statistics
    stats auth admin:kevin
    stats auth kevin:skymobi
    stats admin if TRUE 

    acl statsrc src 172.16.250.189
    http-request allow if statsrc
    http-request deny


frontend web
    bind *:80
    mode http
    log global
    option httpclose
    option logasap
    option dontlognull
    capture request header host len 20
    capture request header Referer len 60
    default_backend servers

backend servers
    balance roundrobin
    server apache1 10.1.1.110:80 check maxconn 2000
    server apache2 10.1.1.120:80 check maxconn 2000

frontend mysql
    bind *:3306
    mode tcp
    log global
    default_backend mysqlserver

backend mysqlserver
    balance leastconn
    server mysql1 10.1.1.110:3306 check port 3306 maxconn 300
    server mysql2 10.1.1.120:3306 check port 3306 maxconn 200