如何编写Linux下Nand Flash驱动_系统运维

1. 硬件特性：

【Flash的硬件实现机制】

Flash全名叫做Flash Memory，属于非易失性存储设备(Non-volatile Memory Device)，与此相对应的是易失性存储设备(Volatile Memory Device)。关于什么是非易失性/易失性，从名字中就可以看出，非易失性就是不容易丢失，数据存储在这类设备中，即使断电了，也不会丢失，这类设备，除了Flash，还有其他比较常见的入硬盘，ROM等，与此相对的，易失性就是断电了，数据就丢失了，比如大家常用的内存，不论是以前的SDRAM，DDR SDRAM，还是现在的DDR2，DDR3等，都是断电后，数据就没了。

Flash的内部存储是MOSFET，里面有个悬浮门(Floating Gate)，是真正存储数据的单元。

在Flash之前，紫外线可擦除(uv-erasable)的EPROM，就已经采用用Floating Gate存储数据这一技术了。

图1.典型的Flash内存单元的物理结构

数据在Flash内存单元中是以电荷(electrical charge) 形式存储的。存储电荷的多少，取决于图中的外部门（external gate）所被施加的电压，其控制了是向存储单元中冲入电荷还是使其释放电荷。而数据的表示，以所存储的电荷的电压是否超过一个特定的阈值Vth来表示。

【SLC和MLC的实现机制】

Nand Flash按照内部存储数据单元的电压的不同层次，也就是单个内存单元中，是存储1位数据，还是多位数据，可以分为SLC和MLC：

1.SLC，Single Level Cell:

单个存储单元，只存储一位数据，表示成1或0.

就是上面介绍的，对于数据的表示，单个存储单元中内部所存储电荷的电压，和某个特定的阈值电压Vth，相比，如果大于此Vth值，就是表示1，反之，小于Vth，就表示0.

对于nand Flash的数据的写入1，就是控制External Gate去充电，使得存储的电荷够多，超过阈值Vth，就表示1了。而对于写入0，就是将其放电，电荷减少到小于Vth，就表示0了。

关于为何Nand Flash不能从0变成1，我的理解是，物理上来说，是可以实现每一位的，从0变成1的，但是实际上，对于实际的物理实现，出于效率的考虑，如果对于，每一个存储单元都能单独控制，即，0变成1就是，对每一个存储单元单独去充电，所需要的硬件实现就很复杂和昂贵，同时，所进行对块擦除的 *** 作，也就无法实现之前的，一闪而过的速度了，也就失去了Flash的众多特性了。

2.MLC，Multi Level Cell：

与SLC相对应，就是单个存储单元，可以存储多个位，比如2位，4位等。其实现机制，说起来比较简单，就是，通过控制内部电荷的多少，分成多个阈值，通过控制里面的电荷多少，而达到我们所需要的存储成不同的数据。比如，假设输入电压是Vin＝4V（实际没有这样的电压，此处只是为了举例方便），那么，可以设计出2的2次方＝4个阈值， 1/4 的Vin＝1V，2/4的Vin＝2V，3/4的Vin＝3V，Vin＝4V，分别表示2位数据00，01，10，11，对于写入数据，就是充电，通过控制内部的电荷的多少，对应表示不同的数据。

对于读取，则是通过对应的内部的电流（与Vth成反比），然后通过一系列解码电路完成读取，解析出所存储的数据。这些具体的物理实现，都是有足够精确的设备和技术，才能实现精确的数据写入和读出的。

单个存储单元可以存储2位数据的，称作2的2次方＝4 Level Cell，而不是2 Level Cell，这点，之前差点搞晕了。。。，同理，对于新出的单个存储单元可以存储4位数据的，称作 2的4次方＝16 Level Cell。

【关于如何识别SLC还是MLC】

Nand Flash设计中，有个命令叫做Read ID，读取ID，意思是读取芯片的ID，就像大家的身份z一样，这里读取的ID中，是读取好几个字节，一般最少是4个，新的芯片，支持5个甚至更多，从这些字节中，可以解析出很多相关的信息，比如此Nand Flash内部是几个芯片（chip）所组成的，每个chip包含了几片（Plane），每一片中的页大小，块大小，等等。在这些信息中，其中有一个，就是识别此flash是SLC还是MLC。下面这个就是最常见的Nand Flash的datasheet中所规定的，第3个字节，3rd byte，所表示的信息，其中就有SLC/MLC的识别信息：

image

表1.Nand Flash 第3个ID的含义

【Nand Flash的物理存储单元的阵列组织结构】

Nand flash的内部组织结构，此处还是用图来解释，比较容易理解：

图2.Nand Flash物理存储单元的阵列组织结构

上图是K9K8G08U0A的datasheet中的描述。

简单解释就是:

1.一个nand flash由很多个块（Block）组成，块的大小一般是128KB，256KB，512KB，此处是128KB。

2.每个块里面又包含了很多页（page）。每个页的大小，对于现在常见的nand flash多数是2KB，更新的nand flash是4KB，这类的，页大小大于2KB的nand flash，被称作big block，对应的发读写命令地址，一共5个周期(cycle)，而老的nand flash，页大小是256B，512B，这类的nand flash被称作small block，。地址周期只有4个。

而块，也是Nand Flash的擦除 *** 作的基本/最小单位。

3.每一个页，对应还有一块区域，叫做空闲区域（spare area）/冗余区域（redundant area），而Linux系统中，一般叫做OOB（Out Of Band），这个区域，是最初基于Nand Flash的硬件特性：数据在读写时候相对容易错误，所以为了保证数据的正确性，必须要有对应的检测和纠错机制，此机制被叫做EDC(Error Detection Code)/ECC（Error Code Correction, 或者 Error Checking and Correcting），所以设计了多余的区域，用于放置数据的校验值。

页是Nand Flash的写入 *** 作的基本/最小的单位。

【Nand Flash数据存储单元的整体架构】

简单说就是，常见的nand flash，内部只有一个chip，每个chip只有一个plane。

而有些复杂的，容量更大的nand flash，内部有多个chip，每个chip有多个plane。这类的nand flash，往往也有更加高级的功能，比如下面要介绍的Multi Plane Program和Interleave Page Program等。

比如，型号为K9K8G08U0A这个芯片（chip），内部有两个K9F4G08U0A，每个K9F4G08U0A包含了2个Plane，每个Plane是1Gb，所以K9F4G08U0A的大小是1Gb×2＝2Gb＝256MB，因此，K9K8G08U0A内部有2个K9F4G08U0A，即4个Plane，总大小是4×256MB＝1GB。

而型号是K9WAG08U1A的nand flash，内部包含了2个K9K8G08U0A，所以，总容量是K9K8G08U0A的两倍＝1GB×2＝2GB，类似地K9NBG08U5A，内部包含了4个K9K8G08U0A，总大小就是4×1GB＝4GB。

【Flash名称的由来】

Flash的擦除 *** 作是以block块为单位的，与此相对应的是其他很多存储设备，是以bit位为最小读取/写入的单位，Flash是一次性地擦除整个块：在发送一个擦除命令后，一次性地将一个block，常见的块的大小是128KB/256KB。。，全部擦除为1，也就是里面的内容全部都是0xFF了，由于是一下子就擦除了，相对来说，擦除用的时间很短，可以用一闪而过来形容，所以，叫做Flash Memory。中文有的翻译为（快速）闪存。

【Flash相对于普通设备的特殊性】

1. 上面提到过的，Flash最小 *** 作单位，有些特殊。

一般设备，比如硬盘/内存，读取和写入都是以bit位为单位，读取一个bit的值，将某个值写入对应的地址的位，都是可以按位 *** 作的。

但是Flash由于物理特性，使得内部存储的数据，只能从1变成0，这点，可以从前面的内部实现机制了解到，只是方便统一充电，不方便单独的存储单元去放电，所以才说，只能从1变成0，也就是释放电荷。

所以，总结一下Flash的特殊性如下：

image

表2.Flash和普通设备相比所具有的特殊性

注：

① 之所以将写 *** 作叫做编程，是因为，flash 和之前的EPROM，EEPROM继承发展而来，而之前的EEPROM(Electrically Erasable Programmable Read-Only Memory)，往里面写入数据，就叫做编程Program，之所以这么称呼，是因为其对数据的写入，是需要用电去擦除/写入的，就叫做编程。

② 对于目前常见的页大小是2K/4K的Nand Flash，其块的大小有128KB/256KB/512KB等。而对于Nor Flash，常见的块大小有64K/32K等。

③在写数据之前，要先擦除，内部就都变成0xFF了，然后才能写入数据，也就是将对应位由1变成0。

【Nand Flash引脚(Pin)的说明】

图3.Nand Flash引脚功能说明

上图是常见的Nand Flash所拥有的引脚（Pin）所对应的功能，简单翻译如下：

1. I/O0 ~ I/O7：用于输入地址/数据/命令，输出数据

2. CLE：Command Latch Enable，命令锁存使能，在输入命令之前，要先在模式寄存器中，设置CLE使能

3. ALE：Address Latch Enable，地址锁存使能，在输入地址之前，要先在模式寄存器中，设置ALE使能

4. CE#：Chip Enable，芯片使能，在 *** 作Nand Flash之前，要先选中此芯片，才能 *** 作

5. RE#：Read Enable，读使能，在读取数据之前，要先使CE＃有效。

6. WE#：Write Enable，写使能, 在写取数据之前，要先使WE＃有效。

7. WP#：Write Protect，写保护

8. R/B#:Ready/Busy Output,就绪/忙,主要用于在发送完编程/擦除命令后,检测这些 *** 作是否完成,忙,表示编程/擦除 *** 作仍在进行中,就绪表示 *** 作完成.

9. Vcc：Power，电源

10. Vss：Ground，接地

11. N.C：Non-Connection,未定义，未连接。

1. 硬件特性：

【Flash的硬件实现机制】

Flash的内部存储是MOSFET，里面有个悬浮门(Floating Gate)，是真正存储数据的单元。

在Flash之前，紫外线可擦除(uv-erasable)的EPROM，就已经采用用Floating Gate存储数据这一技术了。

图1.典型的Flash内存单元的物理结构

【SLC和MLC的实现机制】

Nand Flash按照内部存储数据单元的电压的不同层次，也就是单个内存单元中，是存储1位数据，还是多位数据，可以分为SLC和MLC：

1.SLC，Single Level Cell:

单个存储单元，只存储一位数据，表示成1或0.

2.MLC，Multi Level Cell：

【关于如何识别SLC还是MLC】

表1.Nand Flash 第3个ID的含义

【Nand Flash的物理存储单元的阵列组织结构】

Nand flash的内部组织结构，此处还是用图来解释，比较容易理解：

图2.Nand Flash物理存储单元的阵列组织结构

上图是K9K8G08U0A的datasheet中的描述。

简单解释就是:

1.一个nand flash由很多个块（Block）组成，块的大小一般是128KB，256KB，512KB，此处是128KB。

而块，也是Nand Flash的擦除 *** 作的基本/最小单位。

页是Nand Flash的写入 *** 作的基本/最小的单位。

【Nand Flash数据存储单元的整体架构】

简单说就是，常见的nand flash，内部只有一个chip，每个chip只有一个plane。

【Flash名称的由来】

【Flash相对于普通设备的特殊性】

1. 上面提到过的，Flash最小 *** 作单位，有些特殊。

一般设备，比如硬盘/内存，读取和写入都是以bit位为单位，读取一个bit的值，将某个值写入对应的地址的位，都是可以按位 *** 作的。

所以，总结一下Flash的特殊性如下：

表2.Flash和普通设备相比所具有的特殊性

注：

② 对于目前常见的页大小是2K/4K的Nand Flash，其块的大小有128KB/256KB/512KB等。而对于Nor Flash，常见的块大小有64K/32K等。

③在写数据之前，要先擦除，内部就都变成0xFF了，然后才能写入数据，也就是将对应位由1变成0。

【Nand Flash引脚(Pin)的说明】

图3.Nand Flash引脚功能说明

上图是常见的Nand Flash所拥有的引脚（Pin）所对应的功能，简单翻译如下：

1. I/O0 ~ I/O7：用于输入地址/数据/命令，输出数据

2. CLE：Command Latch Enable，命令锁存使能，在输入命令之前，要先在模式寄存器中，设置CLE使能

3. ALE：Address Latch Enable，地址锁存使能，在输入地址之前，要先在模式寄存器中，设置ALE使能

4. CE#：Chip Enable，芯片使能，在 *** 作Nand Flash之前，要先选中此芯片，才能 *** 作

5. RE#：Read Enable，读使能，在读取数据之前，要先使CE＃有效。

6. WE#：Write Enable，写使能, 在写取数据之前，要先使WE＃有效。

7. WP#：Write Protect，写保护

8. R/B#:Ready/Busy Output,就绪/忙,主要用于在发送完编程/擦除命令后,检测这些 *** 作是否完成,忙,表示编程/擦除 *** 作仍在进行中,就绪表示 *** 作完成.

9. Vcc：Power，电源

10. Vss：Ground，接地

11. N.C：Non-Connection,未定义，未连接。

[小常识]

在数据手册中，你常会看到，对于一个引脚定义，有些字母上面带一横杠的，那是说明此引脚/信号是低电平有效，比如你上面看到的RE头上有个横线，就是说明，此RE是低电平有效，此外，为了书写方便，在字母后面加“＃”，也是表示低电平有效，比如我上面写的CE＃；如果字母头上啥都没有，就是默认的高电平有效，比如上面的CLE，就是高电平有效。

【为何需要ALE和CLE】

突然想明白了，Nand Flash中, 为何设计这么多的命令,把整个系统搞这么复杂的原因了:

比如命令锁存使能(Command Latch Enable,CLE) 和地址锁存使能(Address Latch Enable，ALE)，那是因为，Nand Flash就8个I/O，而且是复用的，也就是，可以传数据，也可以传地址，也可以传命令，为了区分你当前传入的到底是啥，所以，先要用发一个CLE（或ALE）命令，告诉nand Flash的控制器一声，我下面要传的是命令（或地址），这样，里面才能根据传入的内容，进行对应的动作。否则,nand flash内部,怎么知道你传入的是数据,还是地址,还是命令啊,也就无法实现正确的 *** 作了.

【Nand Flash只有8个I/O引脚的好处】

1.减少外围引脚：相对于并口(Parellel)的Nor Flash的48或52个引脚来说，的确是大大减小了引脚数目，这样封装后的芯片体积，就小很多。现在芯片在向体积更小，功能更强，功耗更低发展，减小芯片体积，就是很大的优势。同时，减少芯片接口，也意味着使用此芯片的相关的外围电路会更简化，避免了繁琐的硬件连线。

2.提高系统的可扩展性，因为没有像其他设备一样用物理大小对应的完全数目的addr引脚，在芯片内部换了芯片的大小等的改动，对于用全部的地址addr的引脚，那么就会引起这些引脚数目的增加，比如容量扩大一倍，地址空间/寻址空间扩大一倍，所以，地址线数目/addr引脚数目，就要多加一个，而对于统一用8个I/O的引脚的Nand Flash，由于对外提供的都是统一的8个引脚，内部的芯片大小的变化或者其他的变化，对于外部使用者(比如编写nand flash驱动的人)来说，不需要关心，只是保证新的芯片，还是遵循同样的接口，同样的时序，同样的命令，就可以了。这样就提高了系统的扩展性。

在学习系统移植的相关知识，在学习和调试过程中，发现了很多问题，也解决了很多问题，但总是对于我们的开发结果有一种莫名其妙的感觉，纠其原因，主要对于我们的开发环境没有一个深刻的认识，有时候几个简单的命令就可以完成非常复杂的功能，可是我们有没有想过，为什么会有这样的效果？

如果没有去追问，只是机械地完成，并且看到实验效果，这样做其实并没有真正的掌握系统移植的本质。

在做每一个步骤的时候， 首先问问自己，为什么要这样做，然后再问问自己正在做什么？ 搞明白这几个问题，我觉得就差不多了，以后不管更换什么平台，什么芯片，什么开发环境，你都不会迷糊，很快就会上手。对于嵌入式的学习方法，我个人方法就是：从宏观上把握(解决为什么的问题)，微观上研究(解决正在做什么的问题)，下面以自己学习的arm-cortex_a8开发板为目标，介绍下自己的学习方法和经验。

嵌入式Linux系统移植主要由四大部分组成：

一、搭建交叉开发环境

二、bootloader的选择和移植

三、kernel的配置、编译、和移植

四、根文件系统的制作

第一部分：搭建交叉开发环境

先介绍第一分部的内容：搭建交叉开发环境，首先必须得思考两个问题，什么是交叉环境? 为什么需要搭建交叉环境？

先回答第一个问题，在嵌入式开发中，交叉开发是很重要的一个概念，开发的第一个环节就是搭建环境，第一步不能完成，后面的步骤从无谈起，这里所说的交叉开发环境主要指的是：在开发主机上(通常是我的pc机)开发出能够在目标机(通常是我们的开发板)上运行的程序。嵌入式比较特殊的是不能在目标机上开发程序(狭义上来说)，因为对于一个原始的开发板，在没有任何程序的情况下它根本都跑不起来，为了让它能够跑起来，我们还必须要借助pc机进行烧录程序等相关工作，开发板才能跑起来，这里的pc机就是我们说的开发主机，想想如果没有开发主机，我们的目标机基本上就是无法开发，这也就是电子行业的一句名言：搞电子，说白了，就是玩电脑！

然后回答第二个问题，为什么需要交叉开发环境？主要原因有以下几点：

原因 1：嵌入式系统的硬件资源有很多限制，比如cpu主频相对较低，内存容量较小等，想想让几百MHZ主频的MCU去编译一个Linux kernel会让我们等的不耐烦，相对来说，pc机的速度更快，硬件资源更加丰富，因此利用pc机进行开发会提高开发效率。

原因2： 嵌入式系统MCU体系结构和指令集不同，因此需要安装交叉编译工具进行编译，这样编译的目标程序才能够在相应的平台上比如：ARM、MIPS、 POWEPC上正常运行。

交叉开发环境的硬件组成主要由以下几大部分 ：

1.开发主机

2.目标机（开发板）

3.二者的链接介质，常用的主要有3种方式：(1)串口线 (2)USB线 (3)网线

对应的硬件介质，还必须要有相应的软件“介质”支持：

1.对于串口，通常用的有串口调试助手，putty工具等，工具很多，功能都差不多，会用一两款就可以；

2.对于USB线，当然必须要有USB的驱动才可以，一般芯片公司会提供，比如对于三星的芯片，USB下载主要由DNW软件来完成；

3.对于网线，则必须要有网络协议支持才可以， 常用的服务主要两个

第一：tftp服务：

主要用于实现文件的下载，比如开发调试的过程中，主要用tftp把要测试的bootloader、kernel和文件系统直接下载到内存中运行，而不需要预先烧录到Flash芯片中，一方面，在测试的过程中，往往需要频繁的下载，如果每次把这些要测试的文件都烧录到Flash中然后再运行也可以，但是缺点是：过程比较麻烦，而且Flash的擦写次数是有限的；另外一方面：测试的目的就是把这些目标文件加载到内存中直接运行就可以了，而tftp就刚好能够实现这样的功能，因此，更没有必要把这些文件都烧录到Flash中去。

第二： nfs服务：

主要用于实现网络文件的挂载，实际上是实现网络文件的共享，在开发的过程中，通常在系统移植的最后一步会制作文件系统，那么这是可以把制作好的文件系统放置在我们开发主机PC的相应位置，开发板通过nfs服务进行挂载，从而测试我们制作的文件系统是否正确，在整个过程中并不需要把文件系统烧录到Flash中去，而且挂载是自动进行挂载的，bootload启动后，kernel运行起来后会根据我们设置的启动参数进行自动挂载，因此，对于开发测试来讲，这种方式非常的方便，能够提高开发效率。

另外，还有一个名字叫 samba 的服务也比较重要，主要用于文件的共享，这里说的共享和nfs的文件共享不是同一个概念，nfs的共享是实现网络文件的共享，而samba实现的是开发主机上 Windows主机和Linux虚拟机之间的文件共享，是一种跨平台的文件共享 ，方便的实现文件的传输。

以上这几种开发的工具在嵌入式开发中是必备的工具，对于嵌入式开发的效率提高做出了伟大的贡献，因此，要对这几个工具熟练使用，这样你的开发效率会提高很多。等测试完成以后，就会把相应的目标文件烧录到Flash中去，也就是等发布产品的时候才做的事情，因此对于开发人员来说，所有的工作永远是测试。

通过前面的工作，我们已经准备好了交叉开发环境的硬件部分和一部分软件，最后还缺少交叉编译器，读者可能会有疑问，为什么要用交叉编译器？前面已经讲过，交叉开发环境必然会用到交叉编译工具，通俗地讲就是在一种平台上编译出能运行在体系结构不同的另一种平台上的程序，开发主机PC平台（X86 CPU）上编译出能运行在以ARM为内核的CPU平台上的程序，编译得到的程序在X86 CPU平台上是不能运行的，必须放到ARM CPU平台上才能运行，虽然两个平台用的都是Linux系统。相对于交叉编译，平常做的编译叫本地编译，也就是在当前平台编译，编译得到的程序也是在本地执行。用来编译这种跨平台程序的编译器就叫交叉编译器，相对来说，用来做本地编译的工具就叫本地编译器。所以要生成在目标机上运行的程序，必须要用交叉编译工具链来完成。

这里又有一个问题，不就是一个交叉编译工具吗？为什么又叫交叉工具链呢？原因很简单，程序不能光编译一下就可以运行，还得进行汇编和链接等过程，同时还需要进行调试，对于一个很大工程，还需要进行工程管理等等，所以，这里说的交叉编译工具是一个由 编译器、连接器和解释器 组成的综合开发环境，交叉编译工具链主要由binutils(主要包括汇编程序as和链接程序ld)、gcc(为GNU系统提供C编译器)和glibc(一些基本的C函数和其他函数的定义) 3个部分组成。有时为了减小libc库的大小，也可以用别的 c 库来代替 glibc，例如 uClibc、dietlibc 和 newlib。

那么，如何得到一个交叉工具链呢？是从网上下载一个“程序”然后安装就可以使用了吗？回答这个问题之前先思考这样一个问题，我们的交叉工具链顾名思义就是在PC机上编译出能够在我们目标开发平台比如ARM上运行的程序，这里就又有一个问题了，我们的ARM处理器型号非常多，难道有专门针对我们某一款的交叉工具链吗？若果有的话，可以想一想，这么多处理器平台，每个平台专门定制一个交叉工具链放在网络上，然后供大家去下载，想想可能需要找很久才能找到适合你的编译器，显然这种做法不太合理，且浪费资源！因此，要得到一个交叉工具链，就像我们移植一个Linux内核一样，我们只关心我们需要的东西，编译我们需要的东西在我们的平台上运行，不需要的东西我们不选择不编译，所以，交叉工具链的制作方法和系统移植有着很多相似的地方，也就是说，交叉开发工具是一个支持很多平台的工具集的集合(类似于Linux源码)，然后我们只需从这些工具集中找出跟我们平台相关的工具就行了，那么如何才能找到跟我们的平台相关的工具，这就是涉及到一个如何制作交叉工具链的问题了。

通常构建交叉工具链有如下三种方法：

方法一： 分步编译和安装交叉编译工具链所需要的库和源代码，最终生成交叉编译工具链。该方法相对比较困难，适合想深入学习构建交叉工具链的读者。如果只是想使用交叉工具链，建议使用下列的方法二构建交叉工具链。

方法二： 通过Crosstool-ng脚本工具来实现一次编译，生成交叉编译工具链，该方法相对于方法一要简单许多，并且出错的机会也非常少，建议大多数情况下使用该方法构建交叉编译工具链。

方法三： 直接通过网上下载已经制作好的交叉编译工具链。该方法的优点不用多说，当然是简单省事，但与此同时该方法有一定的弊端就是局限性太大，因为毕竟是别人构建好的，也就是固定的，没有灵活性，所以构建所用的库以及编译器的版本也许并不适合你要编译的程序，同时也许会在使用时出现许多莫名其妙的错误，建议读者慎用此方法。

crosstool-ng是一个脚本工具，可以制作出适合不同平台的交叉编译工具链，在进行制作之前要安装一下软件：

$ sudo apt-get install g++ libncurses5-dev bison flex texinfo automake libtool patch gcj cvs cvsd gawk

crosstool脚本工具可以在http://ymorin.is-a-geek.org/projects/crosstool下载到本地，然后解压，接下来就是进行安装配置了，这个配置优点类似内核的配置。主要的过程有以下几点：

1. 设定源码包路径和交叉编译器的安装路径

2. 修改交叉编译器针对的构架

3. 增加编译时的并行进程数，以增加运行效率，加快编译，因为这个编译会比较慢。

4. 关闭JAVA编译器，减少编译时间

5. 编译

6. 添加环境变量

7. 刷新环境变量。

8. 测试交叉工具链

到此，嵌入式Linux系统移植四大部分的第一部分工作全部完成，接下来可以进行后续的开发了。

第二部分：bootloader的选择和移植

01 Boot Loader 概念

就是在 *** 作系统内核运行之前运行的一段小程序。通过这段小程序，我们可以初始化硬件设备、建立内存空间的映射图，从而将系统的软硬件环境带到一个合适的状态，以便为最终调用 *** 作系统内核准备好正确的环境，他就是所谓的引导加载程序（Boot Loader）。

02 为什么系统移植之前要先移植BootLoader？

BootLoader的任务是引导 *** 作系统，所谓引导 *** 作系统，就是启动内核，让内核运行就是把内核加载到内存RAM中去运行，那先问两个问题：第一个问题，是谁把内核搬到内存中去运行？第二个问题：我们说的内存是SDRAM，大家都知道，这种内存和SRAM不同，最大的不同就是SRAM只要系统上电就可以运行，而SDRAM需要软件进行初始化才能运行，那么在把内核搬运到内存运行之前必须要先初始化内存吧，那么内存是由谁来初始化的呢？其实这两件事情都是由bootloader来干的，目的是为内核的运行准备好软硬件环境，没有bootloadr我们的系统当然不能跑起来。

03 bootloader的分类

首先更正一个错误的说法，很多人说bootloader就是U-boot，这种说法是错误的，确切来说是u-boot是bootloader的一种。也就是说bootloader具有很多种类，

由上图可以看出，不同的bootloader具有不同的使用范围，其中最令人瞩目的就是有一个叫U-Boot的bootloader，是一个通用的引导程序，而且同时支持X86、ARM和PowerPC等多种处理器架构。U-Boot，全称 Universal Boot Loader，是遵循GPL条款的开放源码项目，是由德国DENX小组开发的用于多种嵌入式CPU的bootloader程序，对于Linux的开发，德国的u-boot做出了巨大的贡献，而且是开源的。

u-boot具有以下特点：

① 开放源码；

② 支持多种嵌入式 *** 作系统内核，如Linux、NetBSD, VxWorks, QNX, RTEMS, ARTOS, LynxOS；

③ 支持多个处理器系列，如PowerPC、ARM、x86、MIPS、XScale；

④ 较高的可靠性和稳定性；

⑤ 高度灵活的功能设置，适合U-Boot调试、 *** 作系统不同引导要求、产品发布等；

⑥ 丰富的设备驱动源码，如串口、以太网、SDRAM、FLASH、LCD、NVRAM、EEPROM、RTC、键盘等；

⑦ 较为丰富的开发调试文档与强大的网络技术支持；

其实，把u-boot可以理解为是一个小型的 *** 作系统。

04 u-boot的目录结构

* board 目标板相关文件，主要包含SDRAM、FLASH驱动；

* common 独立于处理器体系结构的通用代码，如内存大小探测与故障检测；

* cpu 与处理器相关的文件。如mpc8xx子目录下含串口、网口、LCD驱动及中断初始化等文件；

* driver 通用设备驱动，如CFI FLASH驱动(目前对INTEL FLASH支持较好)

* doc U-Boot的说明文档；

* examples可在U-Boot下运行的示例程序；如hello_world.c,timer.c；

* include U-Boot头文件；尤其configs子目录下与目标板相关的配置头文件是移植过程中经常要修改的文件；

* lib_xxx 处理器体系相关的文件，如lib_ppc, lib_arm目录分别包含与PowerPC、ARM体系结构相关的文件；

* net 与网络功能相关的文件目录，如bootp,nfs,tftp；

* post 上电自检文件目录。尚有待于进一步完善；

* rtc RTC驱动程序；

* tools 用于创建U-Boot S-RECORD和BIN镜像文件的工具；

05 u-boot的工作模式

U-Boot的工作模式有 启动加载模式和下载模式 。启动加载模式是Bootloader的正常工作模式，嵌入式产品发布时，Bootloader必须工作在这种模式下，Bootloader将嵌入式 *** 作系统从FLASH中加载到SDRAM中运行，整个过程是自动的。 下载模式 就是Bootloader通过某些通信手段将内核映像或根文件系统映像等从PC机中下载到目标板的SDRAM中运行，用户可以利用Bootloader提供的一些令接口来完成自己想要的 *** 作，这种模式主要用于测试和开发。

06 u-boot的启动过程

大多数BootLoader都分为stage1和stage2两大部分，U-boot也不例外。依赖于cpu体系结构的代码（如设备初始化代码等）通常都放在stage1且可以用汇编语言来实现，而stage2则通常用C语言来实现，这样可以实现复杂的功能，而且有更好的可读性和移植性。

1、 stage1(start.s代码结构)

U-boot的stage1代码通常放在start.s文件中，它用汇编语言写成，其主要代码部分如下：

（1）定义入口。由于一个可执行的image必须有一个入口点，并且只能有一个全局入口，通常这个入口放在rom(Flash)的0x0地址，因此，必须通知编译器以使其知道这个入口，该工作可通过修改连接器脚本来完成。

（2）设置异常向量(exception vector)。

（3）设置CPU的速度、时钟频率及中断控制寄存器。

（4）初始化内存控制器。

（5）将rom中的程序复制到ram中。

（6）初始化堆栈。

（7）转到ram中执行，该工作可使用指令ldrpc来完成。

2、 stage2（C语言代码部分）

lib_arm/board.c中的start armboot是C语言开始的函数，也是整个启动代码中C语言的主函数，同时还是整个u-boot（armboot）的主函数，该函数主要完成如下 *** 作：

（1）调用一系列的初始化函数。

（2）初始化flash设备。

（3）初始化系统内存分配函数。

（4）如果目标系统拥有nand设备，则初始化nand设备。

（5）如果目标系统有显示设备，则初始化该类设备。

（6）初始化相关网络设备，填写ip,c地址等。

（7）进入命令循环（即整个boot的工作循环），接受用户从串口输入的命令，然后进行相应的工作。

07 基于cortex-a8的s5pc100bootloader启动过程分析

s5pc100支持两种启动方式，分别为USB启动方式和NandFlash启动方式：

1. S5PC100 USB启动过程

[1] A8 reset, 执行iROM中的程序

[2] iROM中的程序根据S5PC100的配置管脚(SW1开关4，拨到4对面)，判断从哪里启动(USB)

[3] iROM中的程序会初始化USB，然后等待PC机下载程序

[4] 利用DNW程序，从PC机下载SDRAM的初始化程序到iRAM中运行，初始化SDRAM

[5] SDRAM初始化完毕，iROM中的程序继续接管A8, 然后等待PC下载程序(BootLoader)

[6] PC利用DNW下载BootLoader到SDRAM

[7] 在SDRAM中运行BootLoader

2. S5PC100 Nandflash启动过程

[1] A8 reset, 执行IROM中的程序

[2] iROM中的程序根据S5PC100的配置管脚(SW1开关4，拨到靠4那边)，判断从哪里启动(Nandflash)

[3] iROM中的程序驱动Nandflash

[4] iROM中的程序会拷贝Nandflash前16k到iRAM

[5] 前16k的程序(BootLoader前半部分)初始化SDRAM，然后拷贝完整的BootLoader到SDRAM并运行

[6] BootLoader拷贝内核到SDRAM，并运行它

[7] 内核运行起来后，挂载rootfs，并且运行系统初始化脚本

08 u-boot移植(基于cortex_a8的s5pc100为例)

1.建立自己的平台

(1).下载源码包2010.03版本，比较稳定

(2).解压后添加我们自己的平台信息，以smdkc100为参考版，移植自己s5pc100的开发板

(3).修改相应目录的文件名，和相应目录的Makefile，指定交叉工具链。

(4).编译

(5).针对我们的平台进行相应的移植，主要包括修改SDRAM的运行地址，从0x20000000

(6).“开关”相应的宏定义

(7).添加Nand和网卡的驱动代码

(8).优化go命令

(9).重新编译 make distclean(彻底删除中间文件和配置文件) make s5pc100_config(配置我们的开发板) make(编译出我们的u-boot.bin镜像文件)

(10).设置环境变量，即启动参数，把编译好的u-boot下载到内存中运行，过程如下：

1. 配置开发板网络

ip地址配置:

$setenv ipaddr 192.168.0.6 配置ip地址到内存的环境变量

$saveenv 保存环境变量的值到nandflash的参数区

网络测试:

在开发开发板上ping虚拟机：

$ ping 192.168.0.157(虚拟机的ip地址)

如果网络测试失败,从下面几个方面检查网络：

1. 网线连接好

2. 开发板和虚拟机的ip地址是否配置在同一个网段

3. 虚拟机网络一定要采用桥接(VM--Setting-->option)

4. 连接开发板时，虚拟机需要设置成 静态ip地址

2. 在开发板上，配置tftp服务器(虚拟机)的ip地址

$setenv serverip 192.168.0.157(虚拟机的ip地址)

$saveenv

3. 拷贝u-boot.bin到/tftpboot(虚拟机上的目录)

4. 通过tftp下载u-boot.bin到开发板内存

$ tftp 20008000(内存地址即可) u-boot.bin(要下载的文件名)

如果上面的命令无法正常下载:

1. serverip配置是否正确

2. tftp服务启动失败，重启tftp服务

#sudo service tftpd-hpa restart

5. 烧写u-boot.bin到nandflash的0地址

$nand erase 0(起始地址) 40000(大小) 擦出nandflash 0 - 256k的区域

$nand write 20008000((缓存u-boot.bin的内存地址) 0(nandflash上u-boot的位置) 40000(烧写大小)

6. 切换开发板的启动方式到nandflash

1. 关闭开发板

2. 把SW1的开关4拨到4的那边

3. 启动开发板，它就从nandflash启动

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/yw/7551573.html

如何编写Linux下Nand Flash驱动

发表评论

评论列表（0条）