?
1.DMA概述
DMA是外設與主存之間的一種數據傳輸機制。一般來說,外設與主存之間存在兩種數據傳輸方法:(1)Pragrammed I/O(PIO)方法,也即由CPU通過內存讀寫指令或I/O指令來持續地讀寫外設的內存單元(8位、16位或32位),直到整個數據傳輸過程完成。(2)DMA,即由DMA控制器(DMA Controller,簡稱DMAC)來完成整個數據傳輸過程。在此期間,CPU可以并發地執行其他任務,當DMA結束后,DMAC通過中斷通知CPU數據傳輸已經結束,然后由CPU執行相應的ISR進行后處理。
DMA技術產生時正是ISA總線在PC中流行的時侯。因此,ISA卡的DMA數據傳輸是通過ISA總線控制芯片組中的兩個級聯8237 DMAC來實現的。這種DMA機制也稱為“標準DMA”(standard DMA)。標準DMA有時也稱為“第三方DMA”(third-part
y DMA),這是因為:系統DMAC完成實際的傳輸過程,所以它相對于傳輸過程的“前兩方”(傳輸的發送者和接收者)來說是“第三方”。
標準DMA技術主要有兩個缺點:(1)8237 DMAC的數據傳輸速度太慢,不能與更高速的總線(如PCI)配合使用。(2)兩個8237 DMAC一起只提供了8個DMA通道,這也成為了限制系統I/O吞吐率提升的瓶頸。
鑒于上述兩個原因,PCI總線體系結構設計一種成為“第一方DMA”(first-party DMA)的DMA機制,也稱為“Bus Mastering”(總線主控)。在這種情況下,進行傳輸的PCI卡必須取得系統總線的主控權后才能進行數據傳輸。實際的傳輸也不借助慢速的ISA DMAC來進行,而是由內嵌在PCI卡中的DMA電路(比傳統的ISA DMAC要快)來完成。Bus Mastering方式的DMA可以讓PCI外設得到它們想要的傳輸帶寬,因此它比標準DMA功能滿足現代高性能外設的要求。
隨著計算機外設技術的不斷發展,現代能提供更快傳輸速率的Ultra DMA(UDMA)也已經被廣泛使用了。本為隨后的篇幅只討論ISA總線的標準DMA技術在Linux中的實現。記住:ISA卡幾乎不使用Bus Mastering模式的DMA;而PCI卡只使用Bus Mastering模式的DMA,它從不使用標準DMA。
2.Intel 8237 DMAC
最初的IBM PC/XT中只有一個8237 DMAC,它提供了4個8位的DMA通道(DMA channel 0-3)。從IBM AT開始,又增加了一個8237 DMAC(提供4個16位的DMA通道,DMA channel 4-7)。兩個8237 DMAC一起為系統提供8個DMA通道。與中斷控制器8259的級聯方式相反,第一個DMAC被級聯到第二個DMAC上,通道4被用于DMAC級聯,因此它對外設來說是不可用的。第一個DMAC也稱為“slave DAMC”,第二個DMAC也稱為“Master DMAC”。
下面我們來詳細敘述一下Intel 8237這個DMAC的結構。
每個8237 DMAC都提供4個DMA通道,每個DMA通道都有各自的寄存器,而8237本身也有一組控制寄存器,用以控制它所提供的所有DMA通道。
2.1 DMA通道的寄存器
8237 DMAC中的每個DMA通道都有5個寄存器,分別是:當前地址寄存器、當前計數寄存器、地址寄存器(也稱為偏移寄存器)、計數寄存器和頁寄存器。其中,前兩個是8237的內部寄存器,對外部是不可見的。
(1)當前地址寄存器(Current Address Register):每個DMA通道都有一個16位的當前地址寄存器,表示一個DMA傳輸事務(Transfer Transaction)期間當前DMA傳輸操作的DMA物理內存地址。在每個DMA傳輸開始前,8237都會自動地用該通道的Address Register中的值來初始化這個寄存器;在傳輸事務期間的每次DMA傳輸操作之后該寄存器的值都會被自動地增加或減小。
(2)當前計數寄存器(Current Count Register):每個每個DMA通道都有一個16位的當前計數寄存器,表示當前DMA傳輸事務還剩下多少未傳輸的數據。在每個DMA傳輸事務開始之前,8237都會自動地用該通道的Count Register中的值來初始化這個寄存器。在傳輸事務期間的每次DMA傳輸操作之后該寄存器的值都會被自動地增加或減小(步長為1)。
(3)地址寄存器(Address Register)或偏移寄存器(Offset Register):每個DMA通道都有一個16位的地址寄存器,表示系統RAM中的DMA緩沖區的起始位置在頁內的偏移。
(4)計數寄存器(Count Register):每個DMA通道都有一個16位的計數寄存器,表示DMA緩沖區的大小。
(5)頁寄存器(Page Register):該寄存器定義了DMA緩沖區的起始位置所在物理頁的基地址,即頁號。頁寄存器有點類似于PC中的段基址寄存器。
2.2 8237 DAMC的控制寄存器
(1)命令寄存器(Command Register)
這個8位的寄存器用來控制8237芯片的操作。其各位的定義如下圖所示:
(2)模式寄存器(Mode Register)
用于控制各DMA通道的傳輸模式,如下所示:
(3)請求寄存器(Request Register)
用于向各DMA通道發出DMA請求。各位的定義如下:
(4)屏蔽寄存器(Mask Register)
用來屏蔽
某個DMA通道。當一個DMA通道被屏蔽后,它就不能在服務于DMA請求,直到通道的屏蔽碼被清除。各位的定義如下:
上述屏蔽寄存器也稱為“單通道屏蔽寄存器”(Single Channel Mask Register),因為它一次只能屏蔽一個通道。此外含有一個屏蔽寄存器,可以實現一次屏蔽所有4個DMA通道,如下:
(5)狀態寄存器(Status Register)
一個只讀的8位寄存器,表示各DMA通道的當前狀態。比如:DMA通道是否正服務于一個DMA請求,或者某個DMA通道上的DMA傳輸事務已經完成。
2.3 8237 DMAC的I/O端口地址
主、從8237 DMAC的各個寄存器都是編址在I/O端口空間的。而且其中有些I/O端口地址對于I/O讀、寫操作有不同的表示含義。如下表示所示:
Slave DMAC’s I/O port Master DMAC’sI/O port read write
0x000 0x0c0 Channel 0/4 的Address Register
0x001 0x0c1 Channel 0/4的Count Register
0x002 0x0c2 Channel 1/5 的Address Register
0x003 0x0c3 Channel 1/5的Count Register
0x004 0x0c4 Channel 2/6的Address Register
0x005 0x0c5 Channel 2/6的Count Register
0x006 0x0c6 Channel 3/7的Address Register
0x007 0x0c7 Channel 3/7的Count Register
0x008 0x0d0 Status Register Command Register
0x009 0x0d2 Request Register
0x00a 0x0d4 Single Channel Mask Register
0x00b 0x0d6 Mode Register
0x00c 0x0d8 Clear Flip-Flop Register
0x00d 0x0da Temporary Register Reset DMA controller
0x00e 0x0dc Reset all channel masks
0x00f 0x0de all-channels Mask Register
各DMA通道的Page Register在I/O端口空間中的地址如下:
DMA channel Page Register’sI/O port address
0 0x087
1 0x083
2 0x081
3 0x082
4 0x08f
5 0x08b
6 0x089
7 0x08a
注意兩點:
1. 各DMA通道的Address Register是一個16位的寄存器,但其對應的I/O端口是8位寬,因此對這個寄存器的讀寫就需要兩次連續的I/O端口讀寫操作,低8位首先被發送,然后緊接著發送高8位。
2. 各DMA通道的Count Register:這也是一個16位寬的寄存器(無論對于8位DMA還是16位DMA),但相對應的I/O端口也是8位寬,因此讀寫這個寄存器同樣需要兩次連續的I/O端口讀寫操作,而且同樣是先發送低8位,再發送高8位。往這個寄存器中寫入的值應該是實際要傳輸的數據長度減1后的值。在DMA傳輸事務期間,這個寄存器中的值在每次DMA傳輸操作后都會被減1,因此讀取這個寄存器所得到的值將是當前DMA事務所剩余的未傳輸數據長度減1后的值。當DMA傳輸事務結束時,該寄存器中的值應該被置為0。
2.4 DMA通道的典型使用
在一個典型的PC機中,某些DMA通道通常被固定地用于一些PC機中的標準外設,如下所示:
Channel Size Usage
0 8-bit Memory Refresh
1 8-bit Free
2 8-bit Floppy Disk Controller
3 8-bit Free
4 16-bit Cascading
5 16-bit Fr
ee
6 16-bit Free
7 16-bit Free
2.5 啟動一個DMA傳輸事務的步驟
要啟動一個DMA傳輸事務必須對8237進行編程,其典型步驟如下:
1.通過CLI指令關閉中斷。
2.Disable那個將被用于此次DMA傳輸事務的DMA通道。
3.向Flip-Flop寄存器中寫入0值,以重置它。
4.設置Mode Register。
5.設置Page Register。
6.設置Address Register。
7.設置Count Register。
8.Enable那個將被用于此次DMA傳輸事務的DMA通道。
9.用STI指令開中斷。
3.3 對DMAC的保護
DMAC是一種全局的共享資源,為了保證設備驅動程序對它的獨占訪問,Linux在kernel/dma.c文件中定義了自旋鎖dma_spin_lock來保護它(實際上是保護DMAC的I/O端口資源)。任何想要訪問DMAC的設備驅動程序都首先必須先持有自旋鎖dma_spin_lock。如下:
static __inline__ unsigned long claim_dma_lock(void)
{
unsigned long flags;
spin_lock_irqsave(&dma_spin_lock, flags); /* 關中斷,加鎖*/
return flags;
}
static __inline__ void release_dma_lock(unsigned long flags)
{
spin_unlock_irqrestore(&dma_spin_lock, flags);/* 開中斷,開鎖*/
}
4 Linux對ISA DMA通道資源的管理
DMA通道是一種系統全局資源。任何ISA外設想要進行DMA傳輸,首先都必須取得某個DMA通道資源的使用權,并在傳輸結束后釋放所使用DMA通道資源。從這個角度看,DMA通道資源是一種共享的獨占型資源。
Linux在kernel/Dma.c文件中實現了對DMA通道資源的管理。
4.1 對DMA通道資源的描述
Linux在kernel/Dma.c文件中定義了數據結構dma_chan來描述DMA通道資源。該結構類型的定義如下:
struct dma_chan {
int lock;
const char *device_id;
};
其中,如果成員lock!=0則表示DMA通道正被某個設備所使用;否則該DMA通道就處于free狀態。而成員device_id就指向使用該DMA通道的設備名字字符串。
基于上述結構類型dma_chan,Linux定義了全局數組dma_chan_busy[],以分別描述8個DMA通道資源各自的使用狀態。如下:
static struct dma_chan dma_chan_busy[MAX_DMA_CHANNELS] = {
{ 0, 0 },
{ 0, 0 },
{ 0, 0 },
{ 0, 0 },
{ 1, "cascade" },
{ 0, 0 },
{ 0, 0 },
{ 0, 0 }
};
顯然,在初始狀態時除了DMA通道4外,其余DMA通道皆處于free狀態。
4.2 DMA通道資源的申請
任何ISA卡在使用某個DMA通道進行DMA傳輸之前,其設備驅動程序都必須向內核提出DMA通道資源的申請。只有申請獲得成功后才能使用相應的DMA通道。否則就會發生資源沖突。
函數request_dma()實現DMA通道資源的申請。其源碼如下:
int request_dma(unsigned int dmanr, const char * device_id)
{
if (dmanr >= MAX_DMA_CHANNELS)
return -EINVAL;
if (xchg(&dma_chan_busy[dmanr].lock, 1) != 0)
return -EBUSY;
dma_chan_busy[dmanr].device_id = device_id;
/* old flag was 0, now contains 1 to indicate busy */
return 0;
}
上述函數的核心實現就是用原子操作xchg()讓成員變量dma_chan_busy[dmanr].lock和值1進行交換操作,xchg()將返回lock成員在交換操作之前的值。因此:如果xchg()返回非0值,這說明dmanr所指定的DMA通道已被其他設備所占用,所以request_dma()函數返回錯誤值-EBUSY表示指定DMA通道正忙;否則,如果xchg()返回0值,說明dmanr所指定的DMA通道正處于free狀態,于是xchg()將其lock成員設置為1,取得資源的使用權。
4.3 釋放DMA通道資源
DMA傳輸事務完成后,設備驅動程序一定要記得釋放所占用的DMA通道資源。否則別的外設將一直無法使用該DMA通道。
函數free_dma()釋放指定的DMA通道資源。如下:
void free_dma(unsigned int dmanr)
{
if (dmanr >= MAX_DMA_CHANNELS) {
printk("Trying to free DMA%d
", dmanr);
return;
}
if (xchg(&dma_chan_busy[dmanr].lock, 0) == 0) {
printk("Trying to free free DMA%d
", dmanr);
return;
}
} /* free_dma */
顯然,上述函數的核心實現就是用原子操作xchg()將lock成員清零。
4.4 對/proc/dma文件的實現
文件/proc/dma將列出當前8個DMA通道的使用狀況。Linux在kernel/Dma.c文件中實現了函數個get_dma_list()函數來至此/proc/dma文件的實現。函數get_dma_list()的實現比較簡單。主要就是遍歷數組dma_chan_busy[],并將那些lock成員為非零值的數組元素輸出到列表中即可。如下:
int get_dma_list(char *buf)
{
int i, len = 0;
for (i = 0 ; i < MAX_DMA_CHANNELS ; i++) {
if (dma_chan_busy.lock) {
len += sprintf(buf+len, "%2d: %s
",
i,
dma_chan_busy.device_id);
}
}
return len;
} /* get_dma_list */
5 使用DMA的ISA設備驅動程序
DMA雖然是一種硬件機制,但它離不開軟件(尤其是設備驅動程序)的配合。任何使用DMA進行數據傳輸的ISA設備驅動程序都必須遵循一定的框架。
5.1 DMA通道資源的申請與釋放
同I/O端口資源類似,設備驅動程序必須在一開始就調用request_dma()函數來向內核申請DMA通道資源的使用權。而且,最好在設備驅動程序的open()方法中完成這個操作,而不是在模塊的初始化例程中調用這個函數。因為這在一定程度上可以讓多個設備共享DMA通道資源(只要多個設備不同時使用一個DMA通道)。這種共享有點類似于進程對CPU的分時共享。
設備使用完DMA通道后,其驅動程序應該記得調用free_dma()函數來釋放所占用的DMA通道資源。通常,最好再驅動程序的release()方法中調用該函數,而不是在模塊的卸載例程中進行調用。
還需要注意的一個問題是:資源的申請順序。為了避免死鎖(deadlock),驅動程序一定要在申請了中斷號資源后才申請DMA通道資源。釋放時則要先釋放DMA通道,然后再釋放中斷號資源。
使用DMA的ISA設備驅動程序的open()方法的如下:
int xxx_open(struct inode * inode, struct file * filp)
{
┆
if((err = request_irq(irq,xxx_ISR,SA_INTERRUPT,”YourDeviceName”,NULL))
return err;
if((err = request_dma(dmanr, “YourDeviceName”)){
free_irq(irq, NULL);
return err;
}
┆
return 0;
}
release()方法的范例代碼如下:
void xxx_release(struct inode * inode, struct file * filp)
{
┆
free_dma(dmanr);
free_irq(irq,NULL);
┆
}
5.2 申請DMA緩沖區
由于8237 DMAC只能尋址系統RAM中低16MB物理內存,因此:ISA設備驅動程序在申請DMA緩沖區時,一定要以GFP_DMA標志來調用kmalloc()函數或get_free_pages()函數,以便在系統內存的DMA區中分配物理內存。
5.3 編程DMAC
設備驅動程序可以在他的read()方法、write()方法或ISR中對DMAC進行編程,以便準備啟動一個DMA傳輸事務。一個DMA傳輸事務有兩種典型的過程:(1)用戶請求設備進行DMA傳輸;(2)硬件異步地將外部數據寫道系統中。
用戶通過I/O請求觸發設備進行DMA傳輸的步驟如下:
1.用戶進程通過系統調用read()/write()來調用設備驅動程序的read()方法或write()方法,然后由設備驅動程序read/write方法負責申請DMA緩沖區,對DMAC進行編程,以準備啟動一個DMA傳輸事務,最后正確地設置設備(setup device),并將用戶進程投入睡眠。
2.DMAC負責在DMA緩沖區和I/O外設之間進行數據傳輸,并在結束后觸發一個中斷。
3.設備的ISR檢查DMA傳輸事務是否成功地結束,并將數據從DMA緩沖區中拷貝到驅動程序的其他內核緩沖區中(對于I/O device to memory的情況)。然后喚醒睡眠的用戶進程。
硬件異步地將外部數據寫到系統中的步驟如下:
1.外設觸發一個中斷通知系統有新數據到達。
2.ISR申請一個DMA緩沖區,并對DMAC進行編程,以準備啟動一個DMA傳輸事務,最后正確地設置好外設。
3.硬件將外部數據寫到DMA緩沖區中,DMA傳輸事務結束后,觸發一個中斷。
4. ISR檢查DMA傳輸事務是否成功地結束,然后將DMA緩沖區中的數據拷貝驅動程序的其他內核緩沖區中,最后喚醒相關的等待進程。
網卡就是上述過程的一個典型例子。
為準備一個DMA傳輸事務而對DMAC進行編程的典型代碼段如下:
unsigned long flags;
flags = claim_dma_lock();
disable_dma(dmanr);
clear_dma_ff(dmanr);
set_dma_mode(dmanr,mode);
set_dma_addr(dmanr, virt_to_bus(buf));
set_dma_count(dmanr, count);
enable_dma(dmanr);
release_dma_lock(flags);
檢查一個DMA傳輸事務是否成功地結束的代碼段如下:
int residue;
unsigned long flags = claim_dma_lock();
residue = get_dma_residue(dmanr);
release_dma_lock(flags);
ASSERT(residue == 0);
評論
查看更多