Open vSwitch(OVS)中的DPDK性能加速

在NFV基础设施(NFVI)中有一个重要的组成部分,叫虚拟交换机。

什么是虚拟交换机

虚拟交换机是运行在通用平台上的一个软件层,可以连接虚拟机的网络端口、提供一套纯软件的路由交换协议栈的一个机制,帮助平台上运行的虚拟机实例(虚拟机之间、虚拟机与外部网络之间)。

虚拟机的虚拟网卡对应虚拟交换机的一个虚拟端口,通用平台上的物理网卡作为虚拟交换机的上行链路端口。

虽然是虚拟交换机,但是他的工作原理和物理交换机类似。虚拟交换机的主要好处体现在扩展灵活。

OVS简介

OVS是一个开源的虚拟交换机,遵循apache2.0许可,其定位是要做一个产品级质量的多层虚拟交换机,通过支持可编程扩展来实现大规模的网络自动化。

设计目标是方便管理和配置虚拟机网络,能够主动检测多物理机在动态虚拟环境中的流量情况。

OVS具有很强的灵活性,可以在管理程序中作为软件交换机运行,也可以直接部署到硬件设备上作为控制层。

OVS孩子吃多种标准的管理接口。

OVS在实现中分为用户空间和内核空间两个部分。

用户空间拥有多个组件,他们主要负责实现数据交换和OpenFlow流表功能,还有一些工具用于虚拟交换机管理、数据库搭建以及内核组件的交互。

内核组件主要负责流表查找的快速通道。

OVS数据流转发的大致流程如下

  1. OVS的datapah接收到从OVS连接的某个网络端口发来的数据包,从数据包中提取源/目的IP、源/目的MAC、端口等信息。
  2. OVS在内核态查看流表结构(通过HASH),如果命中,则快速转发。
  3. 如果没有命中,内核态不知道如何处置这个数据包。所以,通过netlink upcall机制从内核态通知用户态,发送给ovs-vswitchd组件处 理。
  4. ovs-vswitchd查询用户态精确流表和模糊流表,如果还不命中,在SDN控制器接入的情况下,经过OpenFlow协议,通告给控制器,由控制器处理。
  5. 如果模糊命中,ovs-vswitchd会同时刷新用户态精确流表和内核态精确流表;如果精确命中,则只更新内核态流表。
  6. 刷新后,重新把该数据包注入给内核态datapath模块处理。
  7. datapath重新发起选路,查询内核流表,匹配;报文转发,结束。

DPDK加速的OVS

虽然OVS作为虚拟交换机已经很好,但是它在NFV的场景下,在转发性能、时延、抖动上离商业应用还有一段距离。Intel利用DPDK的加 速思想,对OVS进行了性能加速。

OVS的数据通路

根据上小节OVS的大致流程分析,跟数据包转发性能相关的主要有两个组件:ovs-vswitchd(用户态慢速通路)和openvswitch.ko(内核态快速通路)。

ovs-vswitchd主要包含ofproto、dpif、netdev模块。

  1. ofproto模块实现openflow的交换机;
  2. dpif模块抽象一个单转发路径;
  3. netdev模块抽象网络接口(无论物理的还是虚拟的)。

openvswitch.ko主要由数据通路模块组成,里面包含着流表。流表中的每个表项由一些匹配字段和要做的动作组成。

DPDK加速的数据通路

OVS在2.4版本中加入了DPDK的支持,作为一个编译选项,可以选用原始OVS还是DPDK加速的OVS。DPDK加速的OVS利用了DPDK的 PMD驱动,向量指令,大页、绑核等技术,来优化用户态的数据通路,直接绕过内核态的数据通路,加速物理网口和虚拟网口的报文处理速度。

DPDK加速的OVS数据流转发的大致流程如下

  1. OVS的ovs-vswitchd接收到从OVS连接的某个网络端口发来的数据包,从数据包中提取源/目的IP、源/目的MAC、端口等信息。
  2. OVS在用户态查看精确流表和模糊流表,如果命中,则直接转发。
  3. 如果还不命中,在SDN控制器接入的情况下,经过OpenFlow协议,通告给控制器,由控制器处理。
  4. 控制器下发新的流表,该数据包重新发起选路,匹配;报文转发,结束。

DPDK加速的OVS与原始OVS的区别在于,从OVS连接的某个网络端口接收到的报文不需要openvswitch.ko内核态的处理,报文通过DPDK PMD驱动直接到达用户态ovs-vswitchd里。

对DPDK加速的OVS优化工作还在持续进行中,重点在用户态的转发逻辑(dpif)和vhost/virtio上,比如采用DPDK实现的cuckoo哈希算法替换原有的哈希算法去做流表查找,vhost后端驱动采用mbuf bulk分配的优化,等等。

DPDK加速的OVS性能比较

Intel发布过原始OVS与DPDK加速的OVS的性能比较,主要比较两种场景:一个是物理网口到物理网口,另一个是物理网口到虚拟机再到物理网口。

在这两种场景和256字节数据包的大小下,DPDK加速的OVS比原始OVS的性能分别提高了11.4倍和7.1倍。

如果用两个处理器核做OVS的转发逻辑比用一个处理器核体高了1.81倍,其可扩展性还是不错的。