Linux nand system


现在很多嵌入式设备都使用nand flash,特别是一些需要大容量的存储介质时,nand flash的高性价比是别的存储介质不能代替的,下面就行nand系统的简要分析,并将nand flash独有的ECC和OOB进行说明。


注:有兴趣的可以先查看如何编写Linux下Nand Flash驱动这篇文章,里面对部分内容分析的很透彻。

nand flash的驱动不同于i2c/spi这类总线类驱动,nand与cpu直接的传输是通过IO来进行的,所以nand的驱动只有控制器驱动,没有设备器驱动,只需要platform即可。

nand的驱动是简单了,可是与nand硬件相关的ECC是一块内容,与内存管理相关的mtd是一块,与应用层相关的文件系统也算一块,所以是很大的一块内容。

1、控制器驱动

与其他platform总线的驱动类似,在arch或dts下面进行platform_device的add,如下:

static struct resource comcerto_nand_resources[] = {
{
.start = COMCERTO_NAND_FIO_ADDR,
.end = COMCERTO_NAND_FIO_ADDR + COMCERTO_NAND_IO_SZ - 1,
.flags = IORESOURCE_MEM,
}
};

static struct platform_device comcerto_nand = {
.name = "comcertonand",
.id = -1,
.dev = {
.platform_data = NULL,
},
.resource = comcerto_nand_resources,
.num_resources = ARRAY_SIZE(comcerto_nand_resources),
};

最后通过​​platform_add_devices()​​函数进行添加。

platform_driver一般位于​​/drivers/mtd/nand​​中,大概如下:

static struct platform_driver comcerto_nand_driver = {
.probe = comcerto_nand_probe,
.remove = __devexit_p(comcerto_nand_remove),
.driver = {
.name = "comcertonand",
},
};

int __init comcerto_nand_init(void)
{
return platform_driver_register(&comcerto_nand_driver);
}

static void __exit comcerto_nand_exit(void)
{
platform_driver_unregister(&comcerto_nand_driver);
}

module_init(comcerto_nand_init);
module_exit(comcerto_nand_exit);

device与driver的name相同则match到,执行probe函数,nand一般都是配合mtd使用的,所以probe函数的最后是mtd的添加函数​​mtd_device_parse_register()​​​,该函数最后调用​​add_mtd_partitions()​​​函数进行mtd分区的添加,关于mtd的知识查看《Linux mtd system》这篇文章,probe函数还有ecc的相关信息下面进行说明。

2、nand flash的读取/编程

在熟悉nand的读写之前,先看下nand的硬件大概结构,如下图:

10-Linux nand system_linux

可见其最小单位是Page,下表也列出flash与普通设备读写时的一些区别。

操作

普通设备(硬盘/内存等)

Flash

读取/写入的叫法

读取/写入

读取/编程(Program)

读取/写入的最小单位

Bit/位

Page/页

擦除(Erase)操作的最小单位

Bit/位

Block/块

擦除操作的含义

将数据删除/全部写入0

将整个块都擦除成全是1,也就是里面的数据都是0xFF

对于写操作

直接写即可

在写数据之前,要先擦除,然后再写

对nand flash的读取/编程有统一的规范ONFI(Open Nand Flash Interface specification),其定义了如下标准的读写指令:

10-Linux nand system_数据_02

可以看到,其中常见的一些命令使用的都是两个周期,比如

page read(0x00,0x30)、page write(0x80,0x10)、block erase(0x60,0xD0),其读写时序图如下:

10-Linux nand system_linux_03

先发送第一周期的起始指令0x00,后面跟着列地址和行地址,再接着发送第二周期的指令0x30,最后才得到要读取的数据,这部分内容在博客文章里面也有提到,记得去细看。

这些指令的定义在​​/include/linux/mtd/nand.h​​中,如下:

/*
* Standard NAND flash commands
*/
#define NAND_CMD_READ0 0
#define NAND_CMD_READ1 1
#define NAND_CMD_RNDOUT 5
#define NAND_CMD_PAGEPROG 0x10
#define NAND_CMD_READOOB 0x50
#define NAND_CMD_ERASE1 0x60
#define NAND_CMD_STATUS 0x70
#define NAND_CMD_STATUS_MULTI 0x71
#define NAND_CMD_SEQIN 0x80
#define NAND_CMD_RNDIN 0x85
#define NAND_CMD_READID 0x90
#define NAND_CMD_ERASE2 0xd0
#define NAND_CMD_PARAM 0xec
#define NAND_CMD_RESET 0xff

#define NAND_CMD_LOCK 0x2a
#define NAND_CMD_UNLOCK1 0x23
#define NAND_CMD_UNLOCK2 0x24

/* Extended commands for large page devices */
#define NAND_CMD_READSTART 0x30
#define NAND_CMD_RNDOUTSTART 0xE0
#define NAND_CMD_CACHEDPROG 0x15

真正的实现函数为​​/drivers/mtd/nand/nand_base.c​​​中的​​nand_command_lp()​​函数,如下:

static void nand_command_lp(struct mtd_info *mtd, unsigned int command,
int column, int page_addr)
{
/* Command latch cycle */
chip->cmd_ctrl(mtd, command & 0xff, /* 发送控制指令 1 */
NAND_NCE | NAND_CLE | NAND_CTRL_CHANGE);

if (column != -1 || page_addr != -1) {
int ctrl = NAND_CTRL_CHANGE | NAND_NCE | NAND_ALE;

/* Serially input address */
if (column != -1) {
/* Adjust columns for 16 bit buswidth */
if (chip->options & NAND_BUSWIDTH_16)
column >>= 1;
chip->cmd_ctrl(mtd, column, ctrl); /* 发送Col Addr 1 */
ctrl &= ~NAND_CTRL_CHANGE;
chip->cmd_ctrl(mtd, column >> 8, ctrl); /* 发送Col Addr 2 */
}
if (page_addr != -1) {
chip->cmd_ctrl(mtd, page_addr, ctrl); /* 发送Row Addr 1 */
chip->cmd_ctrl(mtd, page_addr >> 8, /* 发送Row Addr 2 */
NAND_NCE | NAND_ALE);
/* One more address cycle for devices > 128MiB */
if (chip->chipsize > (128 << 20))
chip->cmd_ctrl(mtd, page_addr >> 16, /* 发送Row Addr 3 */
NAND_NCE | NAND_ALE);
}
}
...
case NAND_CMD_READ0:
chip->cmd_ctrl(mtd, NAND_CMD_READSTART, /* 发送控制指令 2 */
NAND_NCE | NAND_CLE | NAND_CTRL_CHANGE);
...
}

这边值得注意的是由于nand的读写最小单位为page,所以不管你传的是不是该page的首地址,硬件都会把整页返回给你,但是读出来之后,内部数据指针会定位到所要读取的那个位置,所以读取是正常的。

3、nand flash的ECC

Nand Flash物理特性上使得其数据读写过程中会发生一定几率的错误,所以要有个对应的错误检测和纠正的机制,于是才有此ECC(Error Code Correction, 或者 Error Checking and Correcting),用于数据错误的检测与纠正。Nand Flash的ECC,常见的算法有海明码和BCH,这类算法的实现,可以是软件也可以是硬件。不同系统,根据自己的需求,采用对应的软件或者是硬件。

在上面nand的硬件框图里面,可以看到page下面有一块oob数据块,叫做空闲区域(spare area)/冗余区域(redundant area),而Linux系统中,一般叫做OOB(Out Of Band),Oob的读写操作,一般是随着页的操作一起完成的,即读写页的时候,对应地就读写了oob。

关于oob具体用途,总结起来有:


  • 标记是否是坏快
  • 存储ECC数据
  • 存储一些和文件系统相关的数据。如jffs2就会用到这些空间存储一些特定信息,而yaffs2文件系统,会在oob中,存放很多和自己文件系统相关的信息。

ECC这部分还没看明白,后期进行补充。

Linux nand system的分析就到这边,有感悟时会持续会更新。