痞子衡嵌入式：串行NOR Flash的页编程模式对于量产效率的影响

原创

痞子衡V 2021-07-21 09:53:12 博主文章分类：G1.技术标准 ©著作权

文章标签 其他 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者痞子衡V的原创作品，请联系作者获取转载授权，否则将追究法律责任

　　大家好，我是痞子衡，是正经搞技术的痞子。今天痞子衡给大家分享的是串行NOR Flash的页编程模式对于量产效率的影响。

　　任何嵌入式产品最终都绕不开量产效率话题，尤其是对于主控是非内置 Flash 型 MCU（比如恩智浦的 i.MXRT 系列、意法半导体的 H7 系列等），单片量产时间直接决定了工厂生产效率，对于那种百万级出货量的消费类产品，任何关于量产时间的重大优化都能带来明显受益（据说产线都是按分钟来计费的）。

　　目前市面上的量产方案主要如下三类，其中方案二是最通用灵活的方式，因为其下载算法可由用户自由调整，所以这种量产方案下产品最终 Flash 型号选择上相对不受限。

方案一：利用专门的编程器直接对 Flash 进行离线烧录，不需要连接目标 MCU；

方案二：利用通用的调试器连接目标 MCU 板卡对 Flash 进行在线烧录；

方案三：利用目标 MCU 里的厂商/自定义 Bootloader 对 Flash 进行在线烧录；

　　说到下载算法设计，就离不开 Flash 擦写命令模式，其中写命令是 Page Program（页编程），即一次性写入一个 Page 大小的数据块到 Flash 中。我们知道关于 Flash 读命令有非常多的模式（Single, Dual, Quad, Octal, SPI/QPI, SDR/DTR等），而对于 Flash 写命令，从手册里看模式寥寥无几，为什么写命令模式这么少？不同写命令模式有何区别？痞子衡今天从其对量产时间/效率的影响角度跟大家聊一聊：

一、量产过程中时间组成

　　下图是咱们前面提到的量产方案二的功能示意简图，这里目标 MCU 是以恩智浦 i.MXRT 系列来示例的，调试器就以 Segger J-Link 为例，上位机量产软件即 Segger J-Flash。量产时间一共由三部分时间共同决定：

时间一：上位机软件 J-Flash 调度时间（将用户程序二进制文件分包通过 USB 口发送给调试器硬件，并与调试器实时交互）；

时间二：硬件调试器 J-Link 中转时间（调试器从 USB 口收到上位机传来的一包包用户程序数据后，通过 SWD/JTAG 口转存到目标 MCU - i.MXRT 的内部 RAM 中）；

时间三：目标 MCU - i.MXRT 执行下载算法时间（执行下载算法中的擦写函数，将 RAM 中缓存的用户程序数据写入 Flash 中）；

　　最终量产总时间并不是简单的三部分时间之和，这三部分时间之间实际上是互有交叠的，简单地说，量产过程是以流水线方式进行的。时间一、二主要取决于 Segger 的设计，我们轻易无法改动，而时间三是我们可以量化和分析改进的地方，本文要讨论的也是这个时间三。

痞子衡嵌入式：串行NOR Flash的页编程模式对于量产效率的影响_其他

二、Flash页编程模式

　　常用的 NOR Flash 一共有三类：QSPI、OctalFlash、HyperFlash，这三类 Flash 关于 Page Program 模式设计本质上都一样，我们就以最常见的 QSPI 为例来介绍。下图是典型的 QSPI Flash IS25WP064A 支持的全部三种写模式：Single SPI Page Program（命令地址数据全在 IO0 上传输），Quad Input Page Program（命令地址在 IO0 上传输，数据在 IO[x:0] 上传输）、QPI Page Program（命令地址数据全在 IO[x:0] 上传输）。

注：四线 Flash，QPI 模式是传输效率最高的模式，八线 Flash，OPI 模式是传输效率最高的模式。

痞子衡嵌入式：串行NOR Flash的页编程模式对于量产效率的影响_其他_02

　　单从页数据传输的角度而言，QPI Page Program 效率最高，Single SPI Page Program 效率最低，相同 Flash 工作频率下，前者所花时间仅后者的 1/4（如果是Octal/Hyper Flash，则是 1/8）。按道理在量产过程中应尽可能选择 QPI/OPI 模式并以最高 Flash 工作频率去做 Page Program，但实际量产过程中往往是 Single SPI 模式且较低 Flash 工作频率去 Page Program 用得更多，这是为什么？继续往下看。

三、不同类型Flash量产时间分析

　　带着上一节留下的疑问，我们从几个实际 Flash 型号入手，量化分析下 Flash 量产时间，分别以 50MHz Single SPI 模式和最高频率 QPI/OPI 模式 Page Prorgam 来看两者带来的差异有多大。

3.1 四线QSPI Flash

痞子衡嵌入式：串行NOR Flash的页编程模式对于量产效率的影响_其他_03

程序长度	数据传输时间		Program总等待时间	Erase总等待时间	量产总时间T3
程序长度	50MHz Single SPI	133MHz QPI	Program总等待时间	Erase总等待时间	50MHz Single SPI	133MHz QPI
4KB	665.6us	62.556us	0.2ms * 16	70ms * 1	73.8656ms	73.262556ms
4MB	681.574ms	64.058ms	0.2ms * 16384	0.1s * 128	16.758374s	16.140858s
4MB	681.574ms	64.058ms	0.2ms * 16384	0.15s * 64	13.558374s	12.940858s
8MB	1.36315s	128.115ms	0.2ms * 32768	16s	23.91675s	22.681715s

3.2 八线Octal Flash

痞子衡嵌入式：串行NOR Flash的页编程模式对于量产效率的影响_其他_04

程序长度	数据传输时间		Program总等待时间	Erase总等待时间	量产总时间T3
程序长度	50MHz Single SPI	200MHz OPI	Program总等待时间	Erase总等待时间	50MHz Single SPI	200MHz OPI
4KB	668.16us	20.88us	0.15ms * 16	25ms * 1	28.06816ms	27.42088ms
32MB	5.4736s	0.171049s	0.15ms * 131072	0.22s * 512	137.7744s	132.471849s
64MB	10.9471s	0.342098s	0.15ms * 262144	150s	200.2687s	189.663698s

　　从上面的量化结果来看，因为擦除和写入等待时间较长，相比较下单纯数据传输时间在总量产时间 T3 里占比太小，因此 Single SPI 模式相比 QPI/OPI 模式的 Page Program 并没有显出多大劣势。那么低速 Single SPI 模式 Page Program 好处体现在哪呢？我们知道影响 Flash 器件最大的因素是擦写次数（寿命），低速 Single SPI 模式在数据传输上的抗干扰能力远比高速 QPI/OPI 模式要强，对于 Flash 写入而言，正确性才是最重要的，低速一次写成功比高速下因为发生传输错误而重复去写更有利于延长 Flash 使用寿命。

　　至此，串行NOR Flash的页编程模式对于量产效率的影响痞子衡便介绍完毕了，掌声在哪里~~~

衡杰(痞子衡)，目前就职于恩智浦MCU系统部门，担任嵌入式系统应用工程师。

专栏内所有文章的转载请注明出处：