PCI是一種廣泛采用的總線標準,它提供了許多優于其它總線標準(如EISA)的新特性,目前已經成為計算機系統中應用最為廣泛,并且最為通用的總線標準。Linux的內核能較好地支持PCI總線,本文以Intel 386體系結構為主,探討了在Linux下開發PCI設備驅動程序的基本框架。
一、PCI總線系統體系結構
PCI是外圍設備互連(Peripheral Component Interconnect)的簡稱,作為一種通用的總線接口標準,它在目前的計算機系統中得到了非常廣泛的應用。PCI提供了一組完整的總線接口規范,其目的是描述如何將計算機系統中的外圍設備以一種結構化和可控化的方式連接在一起,同時它還刻畫了外圍設備在連接時的電氣特性和行為規約,并且詳細定義了計算機系統中的各個不同部件之間應該如何正確地進行交互。
無論是在基于Intel芯片的PC機中,或是在基于Alpha芯片的工作站上,PCI毫無疑問都是目前使用最廣泛的一種總線接口標準。同舊式的ISA總線不同,PCI將計算機系統中的總線子系統與存儲子系統完全地分開,CPU通過一塊稱為PCI橋(PCI-Bridge)的設備來完成同總線子系統的交互,如圖1所示。
圖1 PCI子系統的體系結構
由于使用了更高的時鐘頻率,因此PCI總線能夠獲得比ISA總線更好的整體性能。PCI總線的時鐘頻率一般在25MHz到33MHz范圍內,有些甚至能夠達到66MHz或者133MHz,而在64位系統中則最高能達到266MHz。盡管目前PCI設備大多采用32位數據總線,但PCI規范中已經給出了64位的擴展實現,從而使PCI總線能夠更好地實現平臺無關性,現在PCI總線已經能夠用于IA-32、Alpha、PowerPC、SPARC64和IA-64等體系結構中。
PCI總線具有三個非常顯著的優點,使得它能夠完成最終取代ISA總線這一歷史使命:
在計算機和外設間傳輸數據時具有更好的性能;
能夠盡量獨立于具體的平臺;
可以很方便地實現即插即用。
圖2是一個典型的基于PCI總線的計算機系統邏輯示意圖,系統的各個部分通過PCI總線和PCI-PCI橋連接在一起。從圖中不難看出,CPU和RAM需要通過PCI橋連接到PCI總線0(即主PCI總線),而具有PCI接口的顯卡則可以直接連接到主PCI總線上。PCI-PCI橋是一個特殊的PCI設備,它負責將PCI總線0和PCI總線1(即從PCI主線)連接在一起,通常PCI總線1稱為PCI-PCI橋的下游(downstream),而PCI總線0則稱為PCI-PCI橋的上游(upstream)。圖中連接到從PCI總線上的是SCSI卡和以太網卡。為了兼容舊的ISA總線標準,PCI總線還可以通過PCI-ISA橋來連接ISA總線,從而能夠支持以前的ISA設備。圖中ISA總線上連接著一個多功能I/O控制器,用于控制鍵盤、鼠標和軟驅。
圖2 PCI系統示意圖
在此我只對PCI總線系統體系結構作了概括性介紹,如果讀者想進一步了解,David A Rusling在The Linux Kernel(http://tldp.org/LDP/tlk/dd/pci.html)中對Linux的PCI子系統有比較詳細的介紹。
回頁首
二、Linux驅動程序框架
Linux將所有外部設備看成是一類特殊文件,稱之為“設備文件”,如果說系統調用是Linux內核和應用程序之間的接口,那么設備驅動程序則可以看成是Linux內核與外部設備之間的接口。設備驅動程序向應用程序屏蔽了硬件在實現上的細節,使得應用程序可以像操作普通文件一樣來操作外部設備。
1. 字符設備和塊設備
Linux抽象了對硬件的處理,所有的硬件設備都可以像普通文件一樣來看待:它們可以使用和操作文件相同的、標準的系統調用接口來完成打開、關閉、讀寫和I/O控制操作,而驅動程序的主要任務也就是要實現這些系統調用函數。Linux系統中的所有硬件設備都使用一個特殊的設備文件來表示,例如,系統中的第一個IDE硬盤使用/dev/hda表示。每個設備文件對應有兩個設備號:一個是主設備號,標識該設備的種類,也標識了該設備所使用的驅動程序;另一個是次設備號,標識使用同一設備驅動程序的不同硬件設備。設備文件的主設備號必須與設備驅動程序在登錄該設備時申請的主設備號一致,否則用戶進程將無法訪問到設備驅動程序。
在Linux操作系統下有兩類主要的設備文件:一類是字符設備,另一類則是塊設備。字符設備是以字節為單位逐個進行I/O操作的設備,在對字符設備發出讀寫請求時,實際的硬件I/O緊接著就發生了,一般來說字符設備中的緩存是可有可無的,而且也不支持隨機訪問。塊設備則是利用一塊系統內存作為緩沖區,當用戶進程對設備進行讀寫請求時,驅動程序先查看緩沖區中的內容,如果緩沖區中的數據能滿足用戶的要求就返回相應的數據,否則就調用相應的請求函數來進行實際的I/O操作。塊設備主要是針對磁盤等慢速設備設計的,其目的是避免耗費過多的CPU時間來等待操作的完成。一般說來,PCI卡通常都屬于字符設備。
所有已經注冊(即已經加載了驅動程序)的硬件設備的主設備號可以從/proc/devices文件中得到。使用mknod命令可以創建指定類型的設備文件,同時為其分配相應的主設備號和次設備號。例如,下面的命令:
[root@gary root]# mknod /dev/lp0 c 6 0
將建立一個主設備號為6,次設備號為0的字符設備文件/dev/lp0。當應用程序對某個設備文件進行系統調用時,Linux內核會根據該設備文件的設備類型和主設備號調用相應的驅動程序,并從用戶態進入到核心態,再由驅動程序判斷該設備的次設備號,最終完成對相應硬件的操作。
2. 設備驅動程序接口
Linux中的I/O子系統向內核中的其他部分提供了一個統一的標準設備接口,這是通過include/linux/fs.h中的數據結構file_operations來完成的:
struct file_operations { struct module *owner; loff_t (*llseek) (struct file *, loff_t, int); ssize_t (*read) (struct file *, char *, size_t, loff_t *); ssize_t (*write) (struct file *, const char *, size_t, loff_t *); int (*readdir) (struct file *, void *, filldir_t); unsigned int (*poll) (struct file *, struct poll_table_struct *); int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long); int (*mmap) (struct file *, struct vm_area_struct *); int (*open) (struct inode *, struct file *); int (*flush) (struct file *); int (*release) (struct inode *, struct file *); int (*fsync) (struct file *, struct dentry *, int datasync); int (*fasync) (int, struct file *, int); int (*lock) (struct file *, int, struct file_lock *); ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *); ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *); ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int); unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);};
當應用程序對設備文件進行諸如open、close、read、write等操作時,Linux內核將通過file_operations結構訪問驅動程序提供的函數。例如,當應用程序對設備文件執行讀操作時,內核將調用file_operations結構中的read函數。
2. 設備驅動程序模塊
Linux下的設備驅動程序可以按照兩種方式進行編譯,一種是直接靜態編譯成內核的一部分,另一種則是編譯成可以動態加載的模塊。如果編譯進內核的話,會增加內核的大小,還要改動內核的源文件,而且不能動態地卸載,不利于調試,所有推薦使用模塊方式。
從本質上來講,模塊也是內核的一部分,它不同于普通的應用程序,不能調用位于用戶態下的C或者C++庫函數,而只能調用Linux內核提供的函數,在/proc/ksyms中可以查看到內核提供的所有函數。
在以模塊方式編寫驅動程序時,要實現兩個必不可少的函數init_module( )和cleanup_module( ),而且至少要包含和兩個頭文件。在用gcc編譯內核模塊時,需要加上-DMODULE -D__KERNEL__ -DLINUX這幾個參數,編譯生成的模塊(一般為.o文件)可以使用命令insmod載入Linux內核,從而成為內核的一個組成部分,此時內核會調用模塊中的函數init_module( )。當不需要該模塊時,可以使用rmmod命令進行卸載,此進內核會調用模塊中的函數cleanup_module( )。任何時候都可以使用命令來lsmod查看目前已經加載的模塊以及正在使用該模塊的用戶數。
3. 設備驅動程序結構
了解設備驅動程序的基本結構(或者稱為框架),對開發人員而言是非常重要的,Linux的設備驅動程序大致可以分為如下幾個部分:驅動程序的注冊與注銷、設備的打開與釋放、設備的讀寫操作、設備的控制操作、設備的中斷和輪詢處理。
釋放設備是通過調用file_operations結構中的函數release( )來完成的,這個設備方法有時也被稱為close( ),它的作用正好與open( )相反,通常要完成下列工作:
驅動程序的注冊與注銷
向系統增加一個驅動程序意味著要賦予它一個主設備號,這可以通過在驅動程序的初始化過程中調用register_chrdev( )或者register_blkdev( )來完成。而在關閉字符設備或者塊設備時,則需要通過調用unregister_chrdev( )或unregister_blkdev( )從內核中注銷設備,同時釋放占用的主設備號。
設備的打開與釋放
打開設備是通過調用file_operations結構中的函數open( )來完成的,它是驅動程序用來為今后的操作完成初始化準備工作的。在大部分驅動程序中,open( )通常需要完成下列工作:
檢查設備相關錯誤,如設備尚未準備好等。
如果是第一次打開,則初始化硬件設備。
識別次設備號,如果有必要則更新讀寫操作的當前位置指針f_ops。
分配和填寫要放在file->private_data里的數據結構。
使用計數增1。
使用計數減1。
釋放在file->private_data中分配的內存。
如果使用計算為0,則關閉設備。
設備的讀寫操作
字符設備的讀寫操作相對比較簡單,直接使用函數read( )和write( )就可以了。但如果是塊設備的話,則需要調用函數block_read( )和block_write( )來進行數據讀寫,這兩個函數將向設備請求表中增加讀寫請求,以便Linux內核可以對請求順序進行優化。由于是對內存緩沖區而不是直接對設備進行操作的,因此能很大程度上加快讀寫速度。如果內存緩沖區中沒有所要讀入的數據,或者需要執行寫操作將數據寫入設備,那么就要執行真正的數據傳輸,這是通過調用數據結構blk_dev_struct中的函數request_fn( )來完成的。
設備的控制操作
除了讀寫操作外,應用程序有時還需要對設備進行控制,這可以通過設備驅動程序中的函數ioctl( )來完成。ioctl( )的用法與具體設備密切關聯,因此需要根據設備的實際情況進行具體分析。
設備的中斷和輪詢處理
對于不支持中斷的硬件設備,讀寫時需要輪流查詢設備狀態,以便決定是否繼續進行數據傳輸。如果設備支持中斷,則可以按中斷方式進行操作。
回頁首
三、PCI驅動程序實現
1. 關鍵數據結構
PCI設備上有三種地址空間:PCI的I/O空間、PCI的存儲空間和PCI的配置空間。CPU可以訪問PCI設備上的所有地址空間,其中I/O空間和存儲空間提供給設備驅動程序使用,而配置空間則由Linux內核中的PCI初始化代碼使用。內核在啟動時負責對所有PCI設備進行初始化,配置好所有的PCI設備,包括中斷號以及I/O基址,并在文件/proc/pci中列出所有找到的PCI設備,以及這些設備的參數和屬性。
Linux驅動程序通常使用結構(struct)來表示一種設備,而結構體中的變量則代表某一具體設備,該變量存放了與該設備相關的所有信息。好的驅動程序都應該能驅動多個同種設備,每個設備之間用次設備號進行區分,如果采用結構數據來代表所有能由該驅動程序驅動的設備,那么就可以簡單地使用數組下標來表示次設備號。
在PCI驅動程序中,下面幾個關鍵數據結構起著非常核心的作用:
pci_driver
這個數據結構在文件include/linux/pci.h里,這是Linux內核版本2.4之后為新型的PCI設備驅動程序所添加的,其中最主要的是用于識別設備的id_table結構,以及用于檢測設備的函數probe( )和卸載設備的函數remove( ):
struct pci_driver { struct list_head node; char *name; const struct pci_device_id *id_table; int (*probe) (struct pci_dev *dev, const struct pci_device_id *id); void (*remove) (struct pci_dev *dev); int (*save_state) (struct pci_dev *dev, u32 state); int (*suspend)(struct pci_dev *dev, u32 state); int (*resume) (struct pci_dev *dev); int (*enable_wake) (struct pci_dev *dev, u32 state, int enable);};
pci_dev
這個數據結構也在文件include/linux/pci.h里,它詳細描述了一個PCI設備幾乎所有的硬件信息,包括廠商ID、設備ID、各種資源等:
struct pci_dev { struct list_head global_list; struct list_head bus_list; struct pci_bus *bus; struct pci_bus *subordinate; void *sysdata; struct proc_dir_entry *procent; unsigned int devfn; unsigned short vendor; unsigned short device; unsigned short subsystem_vendor; unsigned short subsystem_device; unsigned int class; u8 hdr_type; u8 rom_base_reg; struct pci_driver *driver; void *driver_data; u64 dma_mask; u32 current_state; unsigned short vendor_compatible[DEVICE_COUNT_COMPATIBLE]; unsigned short device_compatible[DEVICE_COUNT_COMPATIBLE]; unsigned int irq; struct resource resource[DEVICE_COUNT_RESOURCE]; struct resource dma_resource[DEVICE_COUNT_DMA]; struct resource irq_resource[DEVICE_COUNT_IRQ]; char name[80]; char slot_name[8]; int active; int ro; unsigned short regs; int (*prepare)(struct pci_dev *dev); int (*activate)(struct pci_dev *dev); int (*deactivate)(struct pci_dev *dev);};
2. 基本框架
在用模塊方式實現PCI設備驅動程序時,通常至少要實現以下幾個部分:初始化設備模塊、設備打開模塊、數據讀寫和控制模塊、中斷處理模塊、設備釋放模塊、設備卸載模塊。下面給出一個典型的PCI設備驅動程序的基本框架,從中不難體會到這幾個關鍵模塊是如何組織起來的。
/* 指明該驅動程序適用于哪一些PCI設備 */static struct pci_device_id demo_pci_tbl [] __initdata = { {PCI_VENDOR_ID_DEMO, PCI_DEVICE_ID_DEMO, PCI_ANY_ID, PCI_ANY_ID, 0, 0, DEMO}, {0,}};/* 對特定PCI設備進行描述的數據結構 */struct demo_card { unsigned int magic; /* 使用鏈表保存所有同類的PCI設備 */ struct demo_card *next; /* ... */}/* 中斷處理模塊 */static void demo_interrupt(int irq, void *dev_id, struct pt_regs *regs){ /* ... */}/* 設備文件操作接口 */static struct file_operations demo_fops = { owner: THIS_MODULE, /* demo_fops所屬的設備模塊 */ read: demo_read, /* 讀設備操作*/ write: demo_write, /* 寫設備操作*/ ioctl: demo_ioctl, /* 控制設備操作*/ mmap: demo_mmap, /* 內存重映射操作*/ open: demo_open, /* 打開設備操作*/ release: demo_release /* 釋放設備操作*/ /* ... */};/* 設備模塊信息 */static struct pci_driver demo_pci_driver = { name: demo_MODULE_NAME, /* 設備模塊名稱 */ id_table: demo_pci_tbl, /* 能夠驅動的設備列表 */ probe: demo_probe, /* 查找并初始化設備 */ remove: demo_remove /* 卸載設備模塊 */ /* ... */};static int __init demo_init_module (void){ /* ... */}static void __exit demo_cleanup_module (void){ pci_unregister_driver(&demo_pci_driver);}/* 加載驅動程序模塊入口 */module_init(demo_init_module);/* 卸載驅動程序模塊入口 */module_exit(demo_cleanup_module);
上面這段代碼給出了一個典型的PCI設備驅動程序的框架,是一種相對固定的模式。需要注意的是,同加載和卸載模塊相關的函數或數據結構都要在前面加上__init、__exit等標志符,以使同普通函數區分開來。構造出這樣一個框架之后,接下去的工作就是如何完成框架內的各個功能模塊了。
3. 初始化設備模塊
在Linux系統下,想要完成對一個PCI設備的初始化,需要完成以下工作:
檢查PCI總線是否被Linux內核支持;
檢查設備是否插在總線插槽上,如果在的話則保存它所占用的插槽的位置等信息。
讀出配置頭中的信息提供給驅動程序使用。
當Linux內核啟動并完成對所有PCI設備進行掃描、登錄和分配資源等初始化操作的同時,會建立起系統中所有PCI設備的拓撲結構,此后當PCI驅動程序需要對設備進行初始化時,一般都會調用如下的代碼:
static int __init demo_init_module (void){ /* 檢查系統是否支持PCI總線 */ if (!pci_present()) return -ENODEV; /* 注冊硬件驅動程序 */ if (!pci_register_driver(&demo_pci_driver)) { pci_unregister_driver(&demo_pci_driver); return -ENODEV; } /* ... */ return 0;}
驅動程序首先調用函數pci_present( )檢查PCI總線是否已經被Linux內核支持,如果系統支持PCI總線結構,這個函數的返回值為0,如果驅動程序在調用這個函數時得到了一個非0的返回值,那么驅動程序就必須得中止自己的任務了。在2.4以前的內核中,需要手工調用pci_find_device( )函數來查找PCI設備,但在2.4以后更好的辦法是調用pci_register_driver( )函數來注冊PCI設備的驅動程序,此時需要提供一個pci_driver結構,在該結構中給出的probe探測例程將負責完成對硬件的檢測工作。
static int __init demo_probe(struct pci_dev *pci_dev, const struct pci_device_id *pci_id){ struct demo_card *card; /* 啟動PCI設備 */ if (pci_enable_device(pci_dev)) return -EIO; /* 設備DMA標識 */ if (pci_set_dma_mask(pci_dev, DEMO_DMA_MASK)) { return -ENODEV; } /* 在內核空間中動態申請內存 */ if ((card = kmalloc(sizeof(struct demo_card), GFP_KERNEL)) == NULL) { printk(KERN_ERR "pci_demo: out of memory\n"); return -ENOMEM; } memset(card, 0, sizeof(*card)); /* 讀取PCI配置信息 */ card->iobase = pci_resource_start (pci_dev, 1); card->pci_dev = pci_dev; card->pci_id = pci_id->device; card->irq = pci_dev->irq; card->next = devs; card->magic = DEMO_CARD_MAGIC; /* 設置成總線主DMA模式 */ pci_set_master(pci_dev); /* 申請I/O資源 */ request_region(card->iobase, 64, card_names[pci_id->driver_data]); return 0;}
4. 打開設備模塊
在這個模塊里主要實現申請中斷、檢查讀寫模式以及申請對設備的控制權等。在申請控制權的時候,非阻塞方式遇忙返回,否則進程主動接受調度,進入睡眠狀態,等待其它進程釋放對設備的控制權。
static int demo_open(struct inode *inode, struct file *file){ /* 申請中斷,注冊中斷處理程序 */ request_irq(card->irq, &demo_interrupt, SA_SHIRQ, card_names[pci_id->driver_data], card)) { /* 檢查讀寫模式 */ if(file->f_mode & FMODE_READ) { /* ... */ } if(file->f_mode & FMODE_WRITE) { /* ... */ } /* 申請對設備的控制權 */ down(&card->open_sem); while(card->open_mode & file->f_mode) { if (file->f_flags & O_NONBLOCK) { /* NONBLOCK模式,返回-EBUSY */ up(&card->open_sem); return -EBUSY; } else { /* 等待調度,獲得控制權 */ card->open_mode |= f_mode & (FMODE_READ | FMODE_WRITE); up(&card->open_sem); /* 設備打開計數增1 */ MOD_INC_USE_COUNT; /* ... */ } }}
5. 數據讀寫和控制信息模塊
PCI設備驅動程序可以通過demo_fops 結構中的函數demo_ioctl( ),向應用程序提供對硬件進行控制的接口。例如,通過它可以從I/O寄存器里讀取一個數據,并傳送到用戶空間里:
static int demo_ioctl(struct inode *inode, struct file *file, unsigned int cmd, unsigned long arg){ /* ... */ switch(cmd) { case DEMO_RDATA: /* 從I/O端口讀取4字節的數據 */ val = inl(card->iobae + 0x10); /* 將讀取的數據傳輸到用戶空間 */ return 0; } /* ... */}
事實上,在demo_fops里還可以實現諸如demo_read( )、demo_mmap( )等操作,Linux內核源碼中的driver目錄里提供了許多設備驅動程序的源代碼,找那里可以找到類似的例子。在對資源的訪問方式上,除了有I/O指令以外,還有對外設I/O內存的訪問。對這些內存的操作一方面可以通過把I/O內存重新映射后作為普通內存進行操作,另一方面也可以通過總線主DMA(Bus Master DMA)的方式讓設備把數據通過DMA傳送到系統內存中。
6. 中斷處理模塊
PC的中斷資源比較有限,只有0~15的中斷號,因此大部分外部設備都是以共享的形式申請中斷號的。當中斷發生的時候,中斷處理程序首先負責對中斷進行識別,然后再做進一步的處理。
static void demo_interrupt(int irq, void *dev_id, struct pt_regs *regs){ struct demo_card *card = (struct demo_card *)dev_id; u32 status; spin_lock(&card->lock); /* 識別中斷 */ status = inl(card->iobase + GLOB_STA); if(!(status & INT_MASK)) { spin_unlock(&card->lock); return; /* not for us */ } /* 告訴設備已經收到中斷 */ outl(status & INT_MASK, card->iobase + GLOB_STA); spin_unlock(&card->lock); /* 其它進一步的處理,如更新DMA緩沖區指針等 */}
7. 釋放設備模塊
釋放設備模塊主要負責釋放對設備的控制權,釋放占用的內存和中斷等,所做的事情正好與打開設備模塊相反:
static int demo_release(struct inode *inode, struct file *file){ /* ... */ /* 釋放對設備的控制權 */ card->open_mode &= (FMODE_READ | FMODE_WRITE); /* 喚醒其它等待獲取控制權的進程 */ wake_up(&card->open_wait); up(&card->open_sem); /* 釋放中斷 */ free_irq(card->irq, card); /* 設備打開計數增1 */ MOD_DEC_USE_COUNT; /* ... */ }
8. 卸載設備模塊
卸載設備模塊與初始化設備模塊是相對應的,實現起來相對比較簡單,主要是調用函數pci_unregister_driver( )從Linux內核中注銷設備驅動程序:
static void __exit demo_cleanup_module (void){ pci_unregister_driver(&demo_pci_driver);}
回頁首
四、小結
PCI總線不僅是目前應用廣泛的計算機總線標準,而且是一種兼容性最強、功能最全的計算機總線。而Linux作為一種新的操作系統,其發展前景是無法估量的,同時也為PCI總線與各種新型設備互連成為可能。由于Linux源碼開放,因此給連接到PCI總線上的任何設備編寫驅動程序變得相對容易。本文介紹如何編譯Linux下的PCI驅動程序,針對的內核版本是2.4。
PCI是一種廣泛采用的總線標準,它提供了許多優于其它總線標準(如EISA)的新特性,目前已經成為計算機系統中應用最為廣泛,并且最為通用的總線標準。Linux的內核能較好地支持PCI總線,本文以Intel 386體系結構為主,探討了在Linux下開發PCI設備驅動程序的基本框架。
一、PCI總線系統體系結構
PCI是外圍設備互連(Peripheral Component Interconnect)的簡稱,作為一種通用的總線接口標準,它在目前的計算機系統中得到了非常廣泛的應用。PCI提供了一組完整的總線接口規范,其目的是描述如何將計算機系統中的外圍設備以一種結構化和可控化的方式連接在一起,同時它還刻畫了外圍設備在連接時的電氣特性和行為規約,并且詳細定義了計算機系統中的各個不同部件之間應該如何正確地進行交互。
無論是在基于Intel芯片的PC機中,或是在基于Alpha芯片的工作站上,PCI毫無疑問都是目前使用最廣泛的一種總線接口標準。同舊式的ISA總線不同,PCI將計算機系統中的總線子系統與存儲子系統完全地分開,CPU通過一塊稱為PCI橋(PCI-Bridge)的設備來完成同總線子系統的交互,如圖1所示。
圖1 PCI子系統的體系結構
由于使用了更高的時鐘頻率,因此PCI總線能夠獲得比ISA總線更好的整體性能。PCI總線的時鐘頻率一般在25MHz到33MHz范圍內,有些甚至能夠達到66MHz或者133MHz,而在64位系統中則最高能達到266MHz。盡管目前PCI設備大多采用32位數據總線,但PCI規范中已經給出了64位的擴展實現,從而使PCI總線能夠更好地實現平臺無關性,現在PCI總線已經能夠用于IA-32、Alpha、PowerPC、SPARC64和IA-64等體系結構中。
PCI總線具有三個非常顯著的優點,使得它能夠完成最終取代ISA總線這一歷史使命:
在計算機和外設間傳輸數據時具有更好的性能;
能夠盡量獨立于具體的平臺;
可以很方便地實現即插即用。
圖2是一個典型的基于PCI總線的計算機系統邏輯示意圖,系統的各個部分通過PCI總線和PCI-PCI橋連接在一起。從圖中不難看出,CPU和RAM需要通過PCI橋連接到PCI總線0(即主PCI總線),而具有PCI接口的顯卡則可以直接連接到主PCI總線上。PCI-PCI橋是一個特殊的PCI設備,它負責將PCI總線0和PCI總線1(即從PCI主線)連接在一起,通常PCI總線1稱為PCI-PCI橋的下游(downstream),而PCI總線0則稱為PCI-PCI橋的上游(upstream)。圖中連接到從PCI總線上的是SCSI卡和以太網卡。為了兼容舊的ISA總線標準,PCI總線還可以通過PCI-ISA橋來連接ISA總線,從而能夠支持以前的ISA設備。圖中ISA總線上連接著一個多功能I/O控制器,用于控制鍵盤、鼠標和軟驅。
圖2 PCI系統示意圖
在此我只對PCI總線系統體系結構作了概括性介紹,如果讀者想進一步了解,David A Rusling在The Linux Kernel(http://tldp.org/LDP/tlk/dd/pci.html)中對Linux的PCI子系統有比較詳細的介紹。
回頁首
二、Linux驅動程序框架
Linux將所有外部設備看成是一類特殊文件,稱之為“設備文件”,如果說系統調用是Linux內核和應用程序之間的接口,那么設備驅動程序則可以看成是Linux內核與外部設備之間的接口。設備驅動程序向應用程序屏蔽了硬件在實現上的細節,使得應用程序可以像操作普通文件一樣來操作外部設備。
1. 字符設備和塊設備
Linux抽象了對硬件的處理,所有的硬件設備都可以像普通文件一樣來看待:它們可以使用和操作文件相同的、標準的系統調用接口來完成打開、關閉、讀寫和I/O控制操作,而驅動程序的主要任務也就是要實現這些系統調用函數。Linux系統中的所有硬件設備都使用一個特殊的設備文件來表示,例如,系統中的第一個IDE硬盤使用/dev/hda表示。每個設備文件對應有兩個設備號:一個是主設備號,標識該設備的種類,也標識了該設備所使用的驅動程序;另一個是次設備號,標識使用同一設備驅動程序的不同硬件設備。設備文件的主設備號必須與設備驅動程序在登錄該設備時申請的主設備號一致,否則用戶進程將無法訪問到設備驅動程序。
在Linux操作系統下有兩類主要的設備文件:一類是字符設備,另一類則是塊設備。字符設備是以字節為單位逐個進行I/O操作的設備,在對字符設備發出讀寫請求時,實際的硬件I/O緊接著就發生了,一般來說字符設備中的緩存是可有可無的,而且也不支持隨機訪問。塊設備則是利用一塊系統內存作為緩沖區,當用戶進程對設備進行讀寫請求時,驅動程序先查看緩沖區中的內容,如果緩沖區中的數據能滿足用戶的要求就返回相應的數據,否則就調用相應的請求函數來進行實際的I/O操作。塊設備主要是針對磁盤等慢速設備設計的,其目的是避免耗費過多的CPU時間來等待操作的完成。一般說來,PCI卡通常都屬于字符設備。
所有已經注冊(即已經加載了驅動程序)的硬件設備的主設備號可以從/proc/devices文件中得到。使用mknod命令可以創建指定類型的設備文件,同時為其分配相應的主設備號和次設備號。例如,下面的命令:
[root@gary root]# mknod /dev/lp0 c 6 0
將建立一個主設備號為6,次設備號為0的字符設備文件/dev/lp0。當應用程序對某個設備文件進行系統調用時,Linux內核會根據該設備文件的設備類型和主設備號調用相應的驅動程序,并從用戶態進入到核心態,再由驅動程序判斷該設備的次設備號,最終完成對相應硬件的操作。
2. 設備驅動程序接口
Linux中的I/O子系統向內核中的其他部分提供了一個統一的標準設備接口,這是通過include/linux/fs.h中的數據結構file_operations來完成的:
struct file_operations { struct module *owner; loff_t (*llseek) (struct file *, loff_t, int); ssize_t (*read) (struct file *, char *, size_t, loff_t *); ssize_t (*write) (struct file *, const char *, size_t, loff_t *); int (*readdir) (struct file *, void *, filldir_t); unsigned int (*poll) (struct file *, struct poll_table_struct *); int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long); int (*mmap) (struct file *, struct vm_area_struct *); int (*open) (struct inode *, struct file *); int (*flush) (struct file *); int (*release) (struct inode *, struct file *); int (*fsync) (struct file *, struct dentry *, int datasync); int (*fasync) (int, struct file *, int); int (*lock) (struct file *, int, struct file_lock *); ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *); ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *); ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int); unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);};
當應用程序對設備文件進行諸如open、close、read、write等操作時,Linux內核將通過file_operations結構訪問驅動程序提供的函數。例如,當應用程序對設備文件執行讀操作時,內核將調用file_operations結構中的read函數。
2. 設備驅動程序模塊
Linux下的設備驅動程序可以按照兩種方式進行編譯,一種是直接靜態編譯成內核的一部分,另一種則是編譯成可以動態加載的模塊。如果編譯進內核的話,會增加內核的大小,還要改動內核的源文件,而且不能動態地卸載,不利于調試,所有推薦使用模塊方式。
從本質上來講,模塊也是內核的一部分,它不同于普通的應用程序,不能調用位于用戶態下的C或者C++庫函數,而只能調用Linux內核提供的函數,在/proc/ksyms中可以查看到內核提供的所有函數。
在以模塊方式編寫驅動程序時,要實現兩個必不可少的函數init_module( )和cleanup_module( ),而且至少要包含和兩個頭文件。在用gcc編譯內核模塊時,需要加上-DMODULE -D__KERNEL__ -DLINUX這幾個參數,編譯生成的模塊(一般為.o文件)可以使用命令insmod載入Linux內核,從而成為內核的一個組成部分,此時內核會調用模塊中的函數init_module( )。當不需要該模塊時,可以使用rmmod命令進行卸載,此進內核會調用模塊中的函數cleanup_module( )。任何時候都可以使用命令來lsmod查看目前已經加載的模塊以及正在使用該模塊的用戶數。
3. 設備驅動程序結構
了解設備驅動程序的基本結構(或者稱為框架),對開發人員而言是非常重要的,Linux的設備驅動程序大致可以分為如下幾個部分:驅動程序的注冊與注銷、設備的打開與釋放、設備的讀寫操作、設備的控制操作、設備的中斷和輪詢處理。
釋放設備是通過調用file_operations結構中的函數release( )來完成的,這個設備方法有時也被稱為close( ),它的作用正好與open( )相反,通常要完成下列工作:
驅動程序的注冊與注銷
向系統增加一個驅動程序意味著要賦予它一個主設備號,這可以通過在驅動程序的初始化過程中調用register_chrdev( )或者register_blkdev( )來完成。而在關閉字符設備或者塊設備時,則需要通過調用unregister_chrdev( )或unregister_blkdev( )從內核中注銷設備,同時釋放占用的主設備號。
設備的打開與釋放
打開設備是通過調用file_operations結構中的函數open( )來完成的,它是驅動程序用來為今后的操作完成初始化準備工作的。在大部分驅動程序中,open( )通常需要完成下列工作:
檢查設備相關錯誤,如設備尚未準備好等。
如果是第一次打開,則初始化硬件設備。
識別次設備號,如果有必要則更新讀寫操作的當前位置指針f_ops。
分配和填寫要放在file->private_data里的數據結構。
使用計數增1。
使用計數減1。
釋放在file->private_data中分配的內存。
如果使用計算為0,則關閉設備。
設備的讀寫操作
字符設備的讀寫操作相對比較簡單,直接使用函數read( )和write( )就可以了。但如果是塊設備的話,則需要調用函數block_read( )和block_write( )來進行數據讀寫,這兩個函數將向設備請求表中增加讀寫請求,以便Linux內核可以對請求順序進行優化。由于是對內存緩沖區而不是直接對設備進行操作的,因此能很大程度上加快讀寫速度。如果內存緩沖區中沒有所要讀入的數據,或者需要執行寫操作將數據寫入設備,那么就要執行真正的數據傳輸,這是通過調用數據結構blk_dev_struct中的函數request_fn( )來完成的。
設備的控制操作
除了讀寫操作外,應用程序有時還需要對設備進行控制,這可以通過設備驅動程序中的函數ioctl( )來完成。ioctl( )的用法與具體設備密切關聯,因此需要根據設備的實際情況進行具體分析。
設備的中斷和輪詢處理
對于不支持中斷的硬件設備,讀寫時需要輪流查詢設備狀態,以便決定是否繼續進行數據傳輸。如果設備支持中斷,則可以按中斷方式進行操作。
回頁首
三、PCI驅動程序實現
1. 關鍵數據結構
PCI設備上有三種地址空間:PCI的I/O空間、PCI的存儲空間和PCI的配置空間。CPU可以訪問PCI設備上的所有地址空間,其中I/O空間和存儲空間提供給設備驅動程序使用,而配置空間則由Linux內核中的PCI初始化代碼使用。內核在啟動時負責對所有PCI設備進行初始化,配置好所有的PCI設備,包括中斷號以及I/O基址,并在文件/proc/pci中列出所有找到的PCI設備,以及這些設備的參數和屬性。
Linux驅動程序通常使用結構(struct)來表示一種設備,而結構體中的變量則代表某一具體設備,該變量存放了與該設備相關的所有信息。好的驅動程序都應該能驅動多個同種設備,每個設備之間用次設備號進行區分,如果采用結構數據來代表所有能由該驅動程序驅動的設備,那么就可以簡單地使用數組下標來表示次設備號。
在PCI驅動程序中,下面幾個關鍵數據結構起著非常核心的作用:
pci_driver
這個數據結構在文件include/linux/pci.h里,這是Linux內核版本2.4之后為新型的PCI設備驅動程序所添加的,其中最主要的是用于識別設備的id_table結構,以及用于檢測設備的函數probe( )和卸載設備的函數remove( ):
struct pci_driver { struct list_head node; char *name; const struct pci_device_id *id_table; int (*probe) (struct pci_dev *dev, const struct pci_device_id *id); void (*remove) (struct pci_dev *dev); int (*save_state) (struct pci_dev *dev, u32 state); int (*suspend)(struct pci_dev *dev, u32 state); int (*resume) (struct pci_dev *dev); int (*enable_wake) (struct pci_dev *dev, u32 state, int enable);};
pci_dev
這個數據結構也在文件include/linux/pci.h里,它詳細描述了一個PCI設備幾乎所有的硬件信息,包括廠商ID、設備ID、各種資源等:
struct pci_dev { struct list_head global_list; struct list_head bus_list; struct pci_bus *bus; struct pci_bus *subordinate; void *sysdata; struct proc_dir_entry *procent; unsigned int devfn; unsigned short vendor; unsigned short device; unsigned short subsystem_vendor; unsigned short subsystem_device; unsigned int class; u8 hdr_type; u8 rom_base_reg; struct pci_driver *driver; void *driver_data; u64 dma_mask; u32 current_state; unsigned short vendor_compatible[DEVICE_COUNT_COMPATIBLE]; unsigned short device_compatible[DEVICE_COUNT_COMPATIBLE]; unsigned int irq; struct resource resource[DEVICE_COUNT_RESOURCE]; struct resource dma_resource[DEVICE_COUNT_DMA]; struct resource irq_resource[DEVICE_COUNT_IRQ]; char name[80]; char slot_name[8]; int active; int ro; unsigned short regs; int (*prepare)(struct pci_dev *dev); int (*activate)(struct pci_dev *dev); int (*deactivate)(struct pci_dev *dev);};
2. 基本框架
在用模塊方式實現PCI設備驅動程序時,通常至少要實現以下幾個部分:初始化設備模塊、設備打開模塊、數據讀寫和控制模塊、中斷處理模塊、設備釋放模塊、設備卸載模塊。下面給出一個典型的PCI設備驅動程序的基本框架,從中不難體會到這幾個關鍵模塊是如何組織起來的。
/* 指明該驅動程序適用于哪一些PCI設備 */static struct pci_device_id demo_pci_tbl [] __initdata = { {PCI_VENDOR_ID_DEMO, PCI_DEVICE_ID_DEMO, PCI_ANY_ID, PCI_ANY_ID, 0, 0, DEMO}, {0,}};/* 對特定PCI設備進行描述的數據結構 */struct demo_card { unsigned int magic; /* 使用鏈表保存所有同類的PCI設備 */ struct demo_card *next; /* ... */}/* 中斷處理模塊 */static void demo_interrupt(int irq, void *dev_id, struct pt_regs *regs){ /* ... */}/* 設備文件操作接口 */static struct file_operations demo_fops = { owner: THIS_MODULE, /* demo_fops所屬的設備模塊 */ read: demo_read, /* 讀設備操作*/ write: demo_write, /* 寫設備操作*/ ioctl: demo_ioctl, /* 控制設備操作*/ mmap: demo_mmap, /* 內存重映射操作*/ open: demo_open, /* 打開設備操作*/ release: demo_release /* 釋放設備操作*/ /* ... */};/* 設備模塊信息 */static struct pci_driver demo_pci_driver = { name: demo_MODULE_NAME, /* 設備模塊名稱 */ id_table: demo_pci_tbl, /* 能夠驅動的設備列表 */ probe: demo_probe, /* 查找并初始化設備 */ remove: demo_remove /* 卸載設備模塊 */ /* ... */};static int __init demo_init_module (void){ /* ... */}static void __exit demo_cleanup_module (void){ pci_unregister_driver(&demo_pci_driver);}/* 加載驅動程序模塊入口 */module_init(demo_init_module);/* 卸載驅動程序模塊入口 */module_exit(demo_cleanup_module);
上面這段代碼給出了一個典型的PCI設備驅動程序的框架,是一種相對固定的模式。需要注意的是,同加載和卸載模塊相關的函數或數據結構都要在前面加上__init、__exit等標志符,以使同普通函數區分開來。構造出這樣一個框架之后,接下去的工作就是如何完成框架內的各個功能模塊了。
3. 初始化設備模塊
在Linux系統下,想要完成對一個PCI設備的初始化,需要完成以下工作:
檢查PCI總線是否被Linux內核支持;
檢查設備是否插在總線插槽上,如果在的話則保存它所占用的插槽的位置等信息。
讀出配置頭中的信息提供給驅動程序使用。
當Linux內核啟動并完成對所有PCI設備進行掃描、登錄和分配資源等初始化操作的同時,會建立起系統中所有PCI設備的拓撲結構,此后當PCI驅動程序需要對設備進行初始化時,一般都會調用如下的代碼:
static int __init demo_init_module (void){ /* 檢查系統是否支持PCI總線 */ if (!pci_present()) return -ENODEV; /* 注冊硬件驅動程序 */ if (!pci_register_driver(&demo_pci_driver)) { pci_unregister_driver(&demo_pci_driver); return -ENODEV; } /* ... */ return 0;}
驅動程序首先調用函數pci_present( )檢查PCI總線是否已經被Linux內核支持,如果系統支持PCI總線結構,這個函數的返回值為0,如果驅動程序在調用這個函數時得到了一個非0的返回值,那么驅動程序就必須得中止自己的任務了。在2.4以前的內核中,需要手工調用pci_find_device( )函數來查找PCI設備,但在2.4以后更好的辦法是調用pci_register_driver( )函數來注冊PCI設備的驅動程序,此時需要提供一個pci_driver結構,在該結構中給出的probe探測例程將負責完成對硬件的檢測工作。
static int __init demo_probe(struct pci_dev *pci_dev, const struct pci_device_id *pci_id){ struct demo_card *card; /* 啟動PCI設備 */ if (pci_enable_device(pci_dev)) return -EIO; /* 設備DMA標識 */ if (pci_set_dma_mask(pci_dev, DEMO_DMA_MASK)) { return -ENODEV; } /* 在內核空間中動態申請內存 */ if ((card = kmalloc(sizeof(struct demo_card), GFP_KERNEL)) == NULL) { printk(KERN_ERR "pci_demo: out of memory\n"); return -ENOMEM; } memset(card, 0, sizeof(*card)); /* 讀取PCI配置信息 */ card->iobase = pci_resource_start (pci_dev, 1); card->pci_dev = pci_dev; card->pci_id = pci_id->device; card->irq = pci_dev->irq; card->next = devs; card->magic = DEMO_CARD_MAGIC; /* 設置成總線主DMA模式 */ pci_set_master(pci_dev); /* 申請I/O資源 */ request_region(card->iobase, 64, card_names[pci_id->driver_data]); return 0;}
4. 打開設備模塊
在這個模塊里主要實現申請中斷、檢查讀寫模式以及申請對設備的控制權等。在申請控制權的時候,非阻塞方式遇忙返回,否則進程主動接受調度,進入睡眠狀態,等待其它進程釋放對設備的控制權。
static int demo_open(struct inode *inode, struct file *file){ /* 申請中斷,注冊中斷處理程序 */ request_irq(card->irq, &demo_interrupt, SA_SHIRQ, card_names[pci_id->driver_data], card)) { /* 檢查讀寫模式 */ if(file->f_mode & FMODE_READ) { /* ... */ } if(file->f_mode & FMODE_WRITE) { /* ... */ } /* 申請對設備的控制權 */ down(&card->open_sem); while(card->open_mode & file->f_mode) { if (file->f_flags & O_NONBLOCK) { /* NONBLOCK模式,返回-EBUSY */ up(&card->open_sem); return -EBUSY; } else { /* 等待調度,獲得控制權 */ card->open_mode |= f_mode & (FMODE_READ | FMODE_WRITE); up(&card->open_sem); /* 設備打開計數增1 */ MOD_INC_USE_COUNT; /* ... */ } }}
5. 數據讀寫和控制信息模塊
PCI設備驅動程序可以通過demo_fops 結構中的函數demo_ioctl( ),向應用程序提供對硬件進行控制的接口。例如,通過它可以從I/O寄存器里讀取一個數據,并傳送到用戶空間里:
static int demo_ioctl(struct inode *inode, struct file *file, unsigned int cmd, unsigned long arg){ /* ... */ switch(cmd) { case DEMO_RDATA: /* 從I/O端口讀取4字節的數據 */ val = inl(card->iobae + 0x10); /* 將讀取的數據傳輸到用戶空間 */ return 0; } /* ... */}
事實上,在demo_fops里還可以實現諸如demo_read( )、demo_mmap( )等操作,Linux內核源碼中的driver目錄里提供了許多設備驅動程序的源代碼,找那里可以找到類似的例子。在對資源的訪問方式上,除了有I/O指令以外,還有對外設I/O內存的訪問。對這些內存的操作一方面可以通過把I/O內存重新映射后作為普通內存進行操作,另一方面也可以通過總線主DMA(Bus Master DMA)的方式讓設備把數據通過DMA傳送到系統內存中。
6. 中斷處理模塊
PC的中斷資源比較有限,只有0~15的中斷號,因此大部分外部設備都是以共享的形式申請中斷號的。當中斷發生的時候,中斷處理程序首先負責對中斷進行識別,然后再做進一步的處理。
static void demo_interrupt(int irq, void *dev_id, struct pt_regs *regs){ struct demo_card *card = (struct demo_card *)dev_id; u32 status; spin_lock(&card->lock); /* 識別中斷 */ status = inl(card->iobase + GLOB_STA); if(!(status & INT_MASK)) { spin_unlock(&card->lock); return; /* not for us */ } /* 告訴設備已經收到中斷 */ outl(status & INT_MASK, card->iobase + GLOB_STA); spin_unlock(&card->lock); /* 其它進一步的處理,如更新DMA緩沖區指針等 */}
7. 釋放設備模塊
釋放設備模塊主要負責釋放對設備的控制權,釋放占用的內存和中斷等,所做的事情正好與打開設備模塊相反:
static int demo_release(struct inode *inode, struct file *file){ /* ... */ /* 釋放對設備的控制權 */ card->open_mode &= (FMODE_READ | FMODE_WRITE); /* 喚醒其它等待獲取控制權的進程 */ wake_up(&card->open_wait); up(&card->open_sem); /* 釋放中斷 */ free_irq(card->irq, card); /* 設備打開計數增1 */ MOD_DEC_USE_COUNT; /* ... */ }
8. 卸載設備模塊
卸載設備模塊與初始化設備模塊是相對應的,實現起來相對比較簡單,主要是調用函數pci_unregister_driver( )從Linux內核中注銷設備驅動程序:
static void __exit demo_cleanup_module (void){ pci_unregister_driver(&demo_pci_driver);}
回頁首
四、小結
PCI總線不僅是目前應用廣泛的計算機總線標準,而且是一種兼容性最強、功能最全的計算機總線。而Linux作為一種新的操作系統,其發展前景是無法估量的,同時也為PCI總線與各種新型設備互連成為可能。由于Linux源碼開放,因此給連接到PCI總線上的任何設備編寫驅動程序變得相對容易。本文介紹如何編譯Linux下的PCI驅動程序,針對的內核版本是2.4。
PCI是一種廣泛采用的總線標準,它提供了許多優于其它總線標準(如EISA)的新特性,目前已經成為計算機系統中應用最為廣泛,并且最為通用的總線標準。Linux的內核能較好地支持PCI總線,本文以Intel 386體系結構為主,探討了在Linux下開發PCI設備驅動程序的基本框架。
一、PCI總線系統體系結構
PCI是外圍設備互連(Peripheral Component Interconnect)的簡稱,作為一種通用的總線接口標準,它在目前的計算機系統中得到了非常廣泛的應用。PCI提供了一組完整的總線接口規范,其目的是描述如何將計算機系統中的外圍設備以一種結構化和可控化的方式連接在一起,同時它還刻畫了外圍設備在連接時的電氣特性和行為規約,并且詳細定義了計算機系統中的各個不同部件之間應該如何正確地進行交互。
無論是在基于Intel芯片的PC機中,或是在基于Alpha芯片的工作站上,PCI毫無疑問都是目前使用最廣泛的一種總線接口標準。同舊式的ISA總線不同,PCI將計算機系統中的總線子系統與存儲子系統完全地分開,CPU通過一塊稱為PCI橋(PCI-Bridge)的設備來完成同總線子系統的交互,如圖1所示。
圖1 PCI子系統的體系結構
由于使用了更高的時鐘頻率,因此PCI總線能夠獲得比ISA總線更好的整體性能。PCI總線的時鐘頻率一般在25MHz到33MHz范圍內,有些甚至能夠達到66MHz或者133MHz,而在64位系統中則最高能達到266MHz。盡管目前PCI設備大多采用32位數據總線,但PCI規范中已經給出了64位的擴展實現,從而使PCI總線能夠更好地實現平臺無關性,現在PCI總線已經能夠用于IA-32、Alpha、PowerPC、SPARC64和IA-64等體系結構中。
PCI總線具有三個非常顯著的優點,使得它能夠完成最終取代ISA總線這一歷史使命:
在計算機和外設間傳輸數據時具有更好的性能;
能夠盡量獨立于具體的平臺;
可以很方便地實現即插即用。
圖2是一個典型的基于PCI總線的計算機系統邏輯示意圖,系統的各個部分通過PCI總線和PCI-PCI橋連接在一起。從圖中不難看出,CPU和RAM需要通過PCI橋連接到PCI總線0(即主PCI總線),而具有PCI接口的顯卡則可以直接連接到主PCI總線上。PCI-PCI橋是一個特殊的PCI設備,它負責將PCI總線0和PCI總線1(即從PCI主線)連接在一起,通常PCI總線1稱為PCI-PCI橋的下游(downstream),而PCI總線0則稱為PCI-PCI橋的上游(upstream)。圖中連接到從PCI總線上的是SCSI卡和以太網卡。為了兼容舊的ISA總線標準,PCI總線還可以通過PCI-ISA橋來連接ISA總線,從而能夠支持以前的ISA設備。圖中ISA總線上連接著一個多功能I/O控制器,用于控制鍵盤、鼠標和軟驅。
圖2 PCI系統示意圖
在此我只對PCI總線系統體系結構作了概括性介紹,如果讀者想進一步了解,David A Rusling在The Linux Kernel(http://tldp.org/LDP/tlk/dd/pci.html)中對Linux的PCI子系統有比較詳細的介紹。
回頁首
二、Linux驅動程序框架
Linux將所有外部設備看成是一類特殊文件,稱之為“設備文件”,如果說系統調用是Linux內核和應用程序之間的接口,那么設備驅動程序則可以看成是Linux內核與外部設備之間的接口。設備驅動程序向應用程序屏蔽了硬件在實現上的細節,使得應用程序可以像操作普通文件一樣來操作外部設備。
1. 字符設備和塊設備
Linux抽象了對硬件的處理,所有的硬件設備都可以像普通文件一樣來看待:它們可以使用和操作文件相同的、標準的系統調用接口來完成打開、關閉、讀寫和I/O控制操作,而驅動程序的主要任務也就是要實現這些系統調用函數。Linux系統中的所有硬件設備都使用一個特殊的設備文件來表示,例如,系統中的第一個IDE硬盤使用/dev/hda表示。每個設備文件對應有兩個設備號:一個是主設備號,標識該設備的種類,也標識了該設備所使用的驅動程序;另一個是次設備號,標識使用同一設備驅動程序的不同硬件設備。設備文件的主設備號必須與設備驅動程序在登錄該設備時申請的主設備號一致,否則用戶進程將無法訪問到設備驅動程序。
在Linux操作系統下有兩類主要的設備文件:一類是字符設備,另一類則是塊設備。字符設備是以字節為單位逐個進行I/O操作的設備,在對字符設備發出讀寫請求時,實際的硬件I/O緊接著就發生了,一般來說字符設備中的緩存是可有可無的,而且也不支持隨機訪問。塊設備則是利用一塊系統內存作為緩沖區,當用戶進程對設備進行讀寫請求時,驅動程序先查看緩沖區中的內容,如果緩沖區中的數據能滿足用戶的要求就返回相應的數據,否則就調用相應的請求函數來進行實際的I/O操作。塊設備主要是針對磁盤等慢速設備設計的,其目的是避免耗費過多的CPU時間來等待操作的完成。一般說來,PCI卡通常都屬于字符設備。
所有已經注冊(即已經加載了驅動程序)的硬件設備的主設備號可以從/proc/devices文件中得到。使用mknod命令可以創建指定類型的設備文件,同時為其分配相應的主設備號和次設備號。例如,下面的命令:
[root@gary root]# mknod /dev/lp0 c 6 0
將建立一個主設備號為6,次設備號為0的字符設備文件/dev/lp0。當應用程序對某個設備文件進行系統調用時,Linux內核會根據該設備文件的設備類型和主設備號調用相應的驅動程序,并從用戶態進入到核心態,再由驅動程序判斷該設備的次設備號,最終完成對相應硬件的操作。
2. 設備驅動程序接口
Linux中的I/O子系統向內核中的其他部分提供了一個統一的標準設備接口,這是通過include/linux/fs.h中的數據結構file_operations來完成的:
struct file_operations { struct module *owner; loff_t (*llseek) (struct file *, loff_t, int); ssize_t (*read) (struct file *, char *, size_t, loff_t *); ssize_t (*write) (struct file *, const char *, size_t, loff_t *); int (*readdir) (struct file *, void *, filldir_t); unsigned int (*poll) (struct file *, struct poll_table_struct *); int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long); int (*mmap) (struct file *, struct vm_area_struct *); int (*open) (struct inode *, struct file *); int (*flush) (struct file *); int (*release) (struct inode *, struct file *); int (*fsync) (struct file *, struct dentry *, int datasync); int (*fasync) (int, struct file *, int); int (*lock) (struct file *, int, struct file_lock *); ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *); ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *); ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int); unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);};
當應用程序對設備文件進行諸如open、close、read、write等操作時,Linux內核將通過file_operations結構訪問驅動程序提供的函數。例如,當應用程序對設備文件執行讀操作時,內核將調用file_operations結構中的read函數。
2. 設備驅動程序模塊
Linux下的設備驅動程序可以按照兩種方式進行編譯,一種是直接靜態編譯成內核的一部分,另一種則是編譯成可以動態加載的模塊。如果編譯進內核的話,會增加內核的大小,還要改動內核的源文件,而且不能動態地卸載,不利于調試,所有推薦使用模塊方式。
從本質上來講,模塊也是內核的一部分,它不同于普通的應用程序,不能調用位于用戶態下的C或者C++庫函數,而只能調用Linux內核提供的函數,在/proc/ksyms中可以查看到內核提供的所有函數。
在以模塊方式編寫驅動程序時,要實現兩個必不可少的函數init_module( )和cleanup_module( ),而且至少要包含和兩個頭文件。在用gcc編譯內核模塊時,需要加上-DMODULE -D__KERNEL__ -DLINUX這幾個參數,編譯生成的模塊(一般為.o文件)可以使用命令insmod載入Linux內核,從而成為內核的一個組成部分,此時內核會調用模塊中的函數init_module( )。當不需要該模塊時,可以使用rmmod命令進行卸載,此進內核會調用模塊中的函數cleanup_module( )。任何時候都可以使用命令來lsmod查看目前已經加載的模塊以及正在使用該模塊的用戶數。
3. 設備驅動程序結構
了解設備驅動程序的基本結構(或者稱為框架),對開發人員而言是非常重要的,Linux的設備驅動程序大致可以分為如下幾個部分:驅動程序的注冊與注銷、設備的打開與釋放、設備的讀寫操作、設備的控制操作、設備的中斷和輪詢處理。
釋放設備是通過調用file_operations結構中的函數release( )來完成的,這個設備方法有時也被稱為close( ),它的作用正好與open( )相反,通常要完成下列工作:
驅動程序的注冊與注銷
向系統增加一個驅動程序意味著要賦予它一個主設備號,這可以通過在驅動程序的初始化過程中調用register_chrdev( )或者register_blkdev( )來完成。而在關閉字符設備或者塊設備時,則需要通過調用unregister_chrdev( )或unregister_blkdev( )從內核中注銷設備,同時釋放占用的主設備號。
設備的打開與釋放
打開設備是通過調用file_operations結構中的函數open( )來完成的,它是驅動程序用來為今后的操作完成初始化準備工作的。在大部分驅動程序中,open( )通常需要完成下列工作:
檢查設備相關錯誤,如設備尚未準備好等。
如果是第一次打開,則初始化硬件設備。
識別次設備號,如果有必要則更新讀寫操作的當前位置指針f_ops。
分配和填寫要放在file->private_data里的數據結構。
使用計數增1。
使用計數減1。
釋放在file->private_data中分配的內存。
如果使用計算為0,則關閉設備。
設備的讀寫操作
字符設備的讀寫操作相對比較簡單,直接使用函數read( )和write( )就可以了。但如果是塊設備的話,則需要調用函數block_read( )和block_write( )來進行數據讀寫,這兩個函數將向設備請求表中增加讀寫請求,以便Linux內核可以對請求順序進行優化。由于是對內存緩沖區而不是直接對設備進行操作的,因此能很大程度上加快讀寫速度。如果內存緩沖區中沒有所要讀入的數據,或者需要執行寫操作將數據寫入設備,那么就要執行真正的數據傳輸,這是通過調用數據結構blk_dev_struct中的函數request_fn( )來完成的。
設備的控制操作
除了讀寫操作外,應用程序有時還需要對設備進行控制,這可以通過設備驅動程序中的函數ioctl( )來完成。ioctl( )的用法與具體設備密切關聯,因此需要根據設備的實際情況進行具體分析。
設備的中斷和輪詢處理
對于不支持中斷的硬件設備,讀寫時需要輪流查詢設備狀態,以便決定是否繼續進行數據傳輸。如果設備支持中斷,則可以按中斷方式進行操作。
回頁首
三、PCI驅動程序實現
1. 關鍵數據結構
PCI設備上有三種地址空間:PCI的I/O空間、PCI的存儲空間和PCI的配置空間。CPU可以訪問PCI設備上的所有地址空間,其中I/O空間和存儲空間提供給設備驅動程序使用,而配置空間則由Linux內核中的PCI初始化代碼使用。內核在啟動時負責對所有PCI設備進行初始化,配置好所有的PCI設備,包括中斷號以及I/O基址,并在文件/proc/pci中列出所有找到的PCI設備,以及這些設備的參數和屬性。
Linux驅動程序通常使用結構(struct)來表示一種設備,而結構體中的變量則代表某一具體設備,該變量存放了與該設備相關的所有信息。好的驅動程序都應該能驅動多個同種設備,每個設備之間用次設備號進行區分,如果采用結構數據來代表所有能由該驅動程序驅動的設備,那么就可以簡單地使用數組下標來表示次設備號。
在PCI驅動程序中,下面幾個關鍵數據結構起著非常核心的作用:
pci_driver
這個數據結構在文件include/linux/pci.h里,這是Linux內核版本2.4之后為新型的PCI設備驅動程序所添加的,其中最主要的是用于識別設備的id_table結構,以及用于檢測設備的函數probe( )和卸載設備的函數remove( ):
struct pci_driver { struct list_head node; char *name; const struct pci_device_id *id_table; int (*probe) (struct pci_dev *dev, const struct pci_device_id *id); void (*remove) (struct pci_dev *dev); int (*save_state) (struct pci_dev *dev, u32 state); int (*suspend)(struct pci_dev *dev, u32 state); int (*resume) (struct pci_dev *dev); int (*enable_wake) (struct pci_dev *dev, u32 state, int enable);};
pci_dev
這個數據結構也在文件include/linux/pci.h里,它詳細描述了一個PCI設備幾乎所有的硬件信息,包括廠商ID、設備ID、各種資源等:
struct pci_dev { struct list_head global_list; struct list_head bus_list; struct pci_bus *bus; struct pci_bus *subordinate; void *sysdata; struct proc_dir_entry *procent; unsigned int devfn; unsigned short vendor; unsigned short device; unsigned short subsystem_vendor; unsigned short subsystem_device; unsigned int class; u8 hdr_type; u8 rom_base_reg; struct pci_driver *driver; void *driver_data; u64 dma_mask; u32 current_state; unsigned short vendor_compatible[DEVICE_COUNT_COMPATIBLE]; unsigned short device_compatible[DEVICE_COUNT_COMPATIBLE]; unsigned int irq; struct resource resource[DEVICE_COUNT_RESOURCE]; struct resource dma_resource[DEVICE_COUNT_DMA]; struct resource irq_resource[DEVICE_COUNT_IRQ]; char name[80]; char slot_name[8]; int active; int ro; unsigned short regs; int (*prepare)(struct pci_dev *dev); int (*activate)(struct pci_dev *dev); int (*deactivate)(struct pci_dev *dev);};
2. 基本框架
在用模塊方式實現PCI設備驅動程序時,通常至少要實現以下幾個部分:初始化設備模塊、設備打開模塊、數據讀寫和控制模塊、中斷處理模塊、設備釋放模塊、設備卸載模塊。下面給出一個典型的PCI設備驅動程序的基本框架,從中不難體會到這幾個關鍵模塊是如何組織起來的。
/* 指明該驅動程序適用于哪一些PCI設備 */static struct pci_device_id demo_pci_tbl [] __initdata = { {PCI_VENDOR_ID_DEMO, PCI_DEVICE_ID_DEMO, PCI_ANY_ID, PCI_ANY_ID, 0, 0, DEMO}, {0,}};/* 對特定PCI設備進行描述的數據結構 */struct demo_card { unsigned int magic; /* 使用鏈表保存所有同類的PCI設備 */ struct demo_card *next; /* ... */}/* 中斷處理模塊 */static void demo_interrupt(int irq, void *dev_id, struct pt_regs *regs){ /* ... */}/* 設備文件操作接口 */static struct file_operations demo_fops = { owner: THIS_MODULE, /* demo_fops所屬的設備模塊 */ read: demo_read, /* 讀設備操作*/ write: demo_write, /* 寫設備操作*/ ioctl: demo_ioctl, /* 控制設備操作*/ mmap: demo_mmap, /* 內存重映射操作*/ open: demo_open, /* 打開設備操作*/ release: demo_release /* 釋放設備操作*/ /* ... */};/* 設備模塊信息 */static struct pci_driver demo_pci_driver = { name: demo_MODULE_NAME, /* 設備模塊名稱 */ id_table: demo_pci_tbl, /* 能夠驅動的設備列表 */ probe: demo_probe, /* 查找并初始化設備 */ remove: demo_remove /* 卸載設備模塊 */ /* ... */};static int __init demo_init_module (void){ /* ... */}static void __exit demo_cleanup_module (void){ pci_unregister_driver(&demo_pci_driver);}/* 加載驅動程序模塊入口 */module_init(demo_init_module);/* 卸載驅動程序模塊入口 */module_exit(demo_cleanup_module);
上面這段代碼給出了一個典型的PCI設備驅動程序的框架,是一種相對固定的模式。需要注意的是,同加載和卸載模塊相關的函數或數據結構都要在前面加上__init、__exit等標志符,以使同普通函數區分開來。構造出這樣一個框架之后,接下去的工作就是如何完成框架內的各個功能模塊了。
3. 初始化設備模塊
在Linux系統下,想要完成對一個PCI設備的初始化,需要完成以下工作:
檢查PCI總線是否被Linux內核支持;
檢查設備是否插在總線插槽上,如果在的話則保存它所占用的插槽的位置等信息。
讀出配置頭中的信息提供給驅動程序使用。
當Linux內核啟動并完成對所有PCI設備進行掃描、登錄和分配資源等初始化操作的同時,會建立起系統中所有PCI設備的拓撲結構,此后當PCI驅動程序需要對設備進行初始化時,一般都會調用如下的代碼:
static int __init demo_init_module (void){ /* 檢查系統是否支持PCI總線 */ if (!pci_present()) return -ENODEV; /* 注冊硬件驅動程序 */ if (!pci_register_driver(&demo_pci_driver)) { pci_unregister_driver(&demo_pci_driver); return -ENODEV; } /* ... */ return 0;}
驅動程序首先調用函數pci_present( )檢查PCI總線是否已經被Linux內核支持,如果系統支持PCI總線結構,這個函數的返回值為0,如果驅動程序在調用這個函數時得到了一個非0的返回值,那么驅動程序就必須得中止自己的任務了。在2.4以前的內核中,需要手工調用pci_find_device( )函數來查找PCI設備,但在2.4以后更好的辦法是調用pci_register_driver( )函數來注冊PCI設備的驅動程序,此時需要提供一個pci_driver結構,在該結構中給出的probe探測例程將負責完成對硬件的檢測工作。
static int __init demo_probe(struct pci_dev *pci_dev, const struct pci_device_id *pci_id){ struct demo_card *card; /* 啟動PCI設備 */ if (pci_enable_device(pci_dev)) return -EIO; /* 設備DMA標識 */ if (pci_set_dma_mask(pci_dev, DEMO_DMA_MASK)) { return -ENODEV; } /* 在內核空間中動態申請內存 */ if ((card = kmalloc(sizeof(struct demo_card), GFP_KERNEL)) == NULL) { printk(KERN_ERR "pci_demo: out of memory\n"); return -ENOMEM; } memset(card, 0, sizeof(*card)); /* 讀取PCI配置信息 */ card->iobase = pci_resource_start (pci_dev, 1); card->pci_dev = pci_dev; card->pci_id = pci_id->device; card->irq = pci_dev->irq; card->next = devs; card->magic = DEMO_CARD_MAGIC; /* 設置成總線主DMA模式 */ pci_set_master(pci_dev); /* 申請I/O資源 */ request_region(card->iobase, 64, card_names[pci_id->driver_data]); return 0;}
4. 打開設備模塊
在這個模塊里主要實現申請中斷、檢查讀寫模式以及申請對設備的控制權等。在申請控制權的時候,非阻塞方式遇忙返回,否則進程主動接受調度,進入睡眠狀態,等待其它進程釋放對設備的控制權。
static int demo_open(struct inode *inode, struct file *file){ /* 申請中斷,注冊中斷處理程序 */ request_irq(card->irq, &demo_interrupt, SA_SHIRQ, card_names[pci_id->driver_data], card)) { /* 檢查讀寫模式 */ if(file->f_mode & FMODE_READ) { /* ... */ } if(file->f_mode & FMODE_WRITE) { /* ... */ } /* 申請對設備的控制權 */ down(&card->open_sem); while(card->open_mode & file->f_mode) { if (file->f_flags & O_NONBLOCK) { /* NONBLOCK模式,返回-EBUSY */ up(&card->open_sem); return -EBUSY; } else { /* 等待調度,獲得控制權 */ card->open_mode |= f_mode & (FMODE_READ | FMODE_WRITE); up(&card->open_sem); /* 設備打開計數增1 */ MOD_INC_USE_COUNT; /* ... */ } }}
5. 數據讀寫和控制信息模塊
PCI設備驅動程序可以通過demo_fops 結構中的函數demo_ioctl( ),向應用程序提供對硬件進行控制的接口。例如,通過它可以從I/O寄存器里讀取一個數據,并傳送到用戶空間里:
static int demo_ioctl(struct inode *inode, struct file *file, unsigned int cmd, unsigned long arg){ /* ... */ switch(cmd) { case DEMO_RDATA: /* 從I/O端口讀取4字節的數據 */ val = inl(card->iobae + 0x10); /* 將讀取的數據傳輸到用戶空間 */ return 0; } /* ... */}
事實上,在demo_fops里還可以實現諸如demo_read( )、demo_mmap( )等操作,Linux內核源碼中的driver目錄里提供了許多設備驅動程序的源代碼,找那里可以找到類似的例子。在對資源的訪問方式上,除了有I/O指令以外,還有對外設I/O內存的訪問。對這些內存的操作一方面可以通過把I/O內存重新映射后作為普通內存進行操作,另一方面也可以通過總線主DMA(Bus Master DMA)的方式讓設備把數據通過DMA傳送到系統內存中。
6. 中斷處理模塊
PC的中斷資源比較有限,只有0~15的中斷號,因此大部分外部設備都是以共享的形式申請中斷號的。當中斷發生的時候,中斷處理程序首先負責對中斷進行識別,然后再做進一步的處理。
static void demo_interrupt(int irq, void *dev_id, struct pt_regs *regs){ struct demo_card *card = (struct demo_card *)dev_id; u32 status; spin_lock(&card->lock); /* 識別中斷 */ status = inl(card->iobase + GLOB_STA); if(!(status & INT_MASK)) { spin_unlock(&card->lock); return; /* not for us */ } /* 告訴設備已經收到中斷 */ outl(status & INT_MASK, card->iobase + GLOB_STA); spin_unlock(&card->lock); /* 其它進一步的處理,如更新DMA緩沖區指針等 */}
7. 釋放設備模塊
釋放設備模塊主要負責釋放對設備的控制權,釋放占用的內存和中斷等,所做的事情正好與打開設備模塊相反:
static int demo_release(struct inode *inode, struct file *file){ /* ... */ /* 釋放對設備的控制權 */ card->open_mode &= (FMODE_READ | FMODE_WRITE); /* 喚醒其它等待獲取控制權的進程 */ wake_up(&card->open_wait); up(&card->open_sem); /* 釋放中斷 */ free_irq(card->irq, card); /* 設備打開計數增1 */ MOD_DEC_USE_COUNT; /* ... */ }
8. 卸載設備模塊
卸載設備模塊與初始化設備模塊是相對應的,實現起來相對比較簡單,主要是調用函數pci_unregister_driver( )從Linux內核中注銷設備驅動程序:
static void __exit demo_cleanup_module (void){ pci_unregister_driver(&demo_pci_driver);}
回頁首
四、小結
PCI總線不僅是目前應用廣泛的計算機總線標準,而且是一種兼容性最強、功能最全的計算機總線。而Linux作為一種新的操作系統,其發展前景是無法估量的,同時也為PCI總線與各種新型設備互連成為可能。由于Linux源碼開放,因此給連接到PCI總線上的任何設備編寫驅動程序變得相對容易。本文介紹如何編譯Linux下的PCI驅動程序,針對的內核版本是2.4。
?
評論
查看更多