如何将DSP和MCU两者完美结合
 

2007年03月07日 星期三 11:11

按照传统方式,嵌入式应用中的数字信号处理器(DSP)相对于主微控制器(MCU)起从属作用。在这些应用中,MCU用作系统控制器,而大量的数据处理留给DSP。例如,在音频或视频处理应用中有可能需要人机界面管理,或者是整个系统的控制。 

  设计方案选择

  为完成这些任务,有几种系统设计方案选择。

  第一种方案将DSP和MCU芯片组合在印制电路板(PCB)上。这种方案成本高并且占用面积大,但是可适当地调整每个芯片的尺寸以最大限度地满足系统需要。

  第二种方案是一种将DSP和MCU组合在单个封装内的多芯片模块(MCM)。这种方案的局限性是,设计工程师必须按“50/50”的时间比例分 配给控制和DSP功能;例如,一旦DSP超出时间,MCU将不能完成计算任务。像第一种方案选择一样,当DSP和MCU内核独立存在时,需要两套开发工 具。

  第三种方案是将DSP功能合并到一个MCU中。这种方案只适合于直接的信号处理应用。MCU的时钟频率和计算体系结构根本上不太适合大量的数字 处理。有些MCU试图通过增加一个乘法和累加器(MAC)(DSP的一个特点)来补偿上述不足。但是这种方案仍然缺乏高级应用所需要的基本的“由下至上  ”的体系结构设计 。

  最近,已经出现第四种方案它是将MCU的功能合并到一个DSP中。这类方案的一个例子是美国模拟器件公司 (Anolog Device Inc.,简称ADI)的Blackfin™ 处理器系列。这些新型处理器具有统一的经过优化的体系结构,不仅适于数据计 算,而且也适于有关的控制任务。通过平衡执行控制任务与复杂计算的要求,这种方案可以根据系统实时处理的需要,完成100%的控制或者100%的计算任 务。完成所有这一切任务不需要在DSP模式和MCU模式之间的模式转换。

  (translation of graphics)
  System Control Blocks=系统控制单元
  Emulator & Test Control=仿真器和测试控制
  Voltage Regulation=稳压电源
  Event Controller=事件控制器
  Clock(PLL)=时钟
  锁相环(PLL)
  Memory DMA=存储器
  直接存储器存取(DMA)
  Watchdog Timer=监视定时器
  Real Time Clock=实时时钟
  Core=内核
  48 KB Instruction SRAM/Cache=48 KB指令
  静态存储器(SRAM)
  和高速缓存
  32 KB Instruction ROM=32 KB指令
  只读存储器(ROM)
  32 KB Data SRAM/Cache=32 KB数据
  静态存储器(SRAM)
  和高速缓存
  4 KB Scratchpad RAM=4 KB
  高速暂存
  随机存储器(RAM)
  System Interface Unit=系统接口单元
  External Memory Interface=外部存储器接口
  High Speed I/O=高速I/O端口
  Parallel Peripheral Interface/GPIO=并行外围接口(PPI)
  和通用输入输出接口(GPIO)
   
  UART=通用异步收发器
  SPI=串行外围接口(SPI)
  Hi-speed Serial Ports=高速串行端口
  PCI/USB=可编程通信接口(PCI)和通用串行总线(USB)
  Timers 0/1/2=定时器0,1,2
  Peripheral Blocks=外围设备单元

  一类新型的DSP也提供一套RISC指令系统集、存储器管理单元、事件控制器和多种外设以便在一颗单芯片内提供大量计算和高效系统控制功能。

  DSP与MCU比较

  首先让我们回顾一下DSP和MCU的典型功能。DSP主要是在一单个时钟周期内尽可能完成多个MAC(乘法和累加)操作。为了这一点,指令的操 作代码通常是可变的超长的指令字(VLIW)。DSP也适于工作在紧密、高效的环路中。另外,为了达到性能指标通常需要编写优化的汇编代码。由于DSP的 算法程序一般装在小容量、短等待时间的内置存储器中,所以代码密度通常不是大问题。

  像DSP主要用于完成计算一样,MCU主要用于完成控制功能。同样地,典型的MCU应用包括许多条件操作,在程序流程中频繁地跳转。通常使用C 或者C++语言编写程序。代码密度极为重要,并且根据编译代码的长度来评估算法。存储器系统是基于高速缓存从而允许该系统设计工程师用较长等待时间从较大 的存储器中调用较大程序。利用基于高速缓存系统,程序员不需要考虑如何以及何时将指令输入到内核去执行。

  统一的DSP和MCU兼备两者的优点。它的指令集由16 bit,32 bit和64 bit操作码组成,但是由于最常用的指令采用 16 bit编码,所以编译代码密度大小与那些流行的MCU相同。另外,它包括一个存储器保护功能以及指令高速缓存和数据高速缓存,作为整个存储器管理单 元(MMU)的一部分。此外,容易提供一套完整的C/C++开发工具,提供可选汇编语言或者全部汇编语言适合算法优化的编程。

  支持RTOS

  系统控制的一个重要方面是任务管理。实时操作系统(RTOS)逐渐地用于控制复杂系统中多种正在进行的和同时发生的任务。通过提供对任务调度与 管理的支持,RTOS简化了编程模式,这通常是由MCU控制的,由于普通的DSP不具备支持RTOS需要的所有功能以便有效地控制。

  然而,统一的DSP和MCU促进了RTOS几个重要功能的发展。第一个是限制访问功能以保护或者保留存储单元。第二个是配备单独的堆栈和帧指针 以减少操作系统(OS)请求以及中断和异常处理所需的等待时间。第三个是具备单独的用户操作模式和管理员操作模式。过去,DSP按照等效于管理员操作模式 工作,从而允许在任何时间完全访问所有的系统资源。然而MCU提供类似的在用户操作模式,它允许在OS的顶层运行应用软件。现在,在一个统一的体系结构下 提供两种操作模式,因为增强的DSP系统能够限制用户应用软件仅通过OS访问系统资源。

  外围设备

  MCU的一个优点是包含使用灵活和种类齐全的外围设备。作为通用的嵌入式控制器,它们通常具备可编程输入输出(I/O)标志、定时器、串行接口 和日益增加越来越复杂的标准接口。MCU外围设备的主要作用是嵌入式控制,而不是大量计算。例如,一个实时时钟信号可以唤醒一只温度传感器用以采集环境温 度并且将一个延迟的信息通过I/O引脚反馈到MCU。然后,一个定时器的脉冲宽度调制(PWM)输出相应地能够增加或者减小风扇电机的转速。

  像MCU一样,统一的DSP和MCU具备一套系统控制外围设备(例如,实时时钟、多功能定时器、监视定时器、双向标志位引脚)。然而,它还包括 一些高速接口(例如,PCI、异步或者同步存储器控制器、USB、并行视频接口)以便通过这些接口,与许多DMA通道配合快速搬移数据,从而有助于有效利 用高速DSP内核的信号处理能力。

  电源管理

  功耗控制一直是嵌入式控制器的一项功能。但是,当系统要求DSP具有优良的性能时,对其电源的选择就不太理想。如果将独立的MCU和DSP芯片 应用于电源敏感的场合,通常必须为每个芯片提供一个单独的开关稳压器,因为这两个器件的内核电压经常不一致。这会导致降低电源变换效率和增加设计器件的引 脚数目,最终增加布线的复杂程度和解决方案的成本。此外,当MCU和DSP的内核集成到一个芯片上时,电源解决方案本质上不是最佳的,因为它必须满足2个 完全独立并具有不同负载特性处理器的需求。

  将这种情况与统一的DSP和MCU相比较,它包含一个集成动态电源管理(DPM)控制器。由于它是只有一个处理器的体系结构,所以该控制器能够 完全适合给定应用的需求。它提供几种固有的电源模式以支持多种系统性能等级。另外,对于未使用的时钟和L2存储器可选择性地禁止。该PLL的频率可在一个 宽范围(通常1倍~31倍)进行调节,以满足在DSP和MCU内部多层次的处理需求。最后能够调节电压(外部或者通过一个集成的开关控制器)以提供指数式 的节省功耗。