1. 程式人生 > >linux驅動---用I/O命令訪問PCI匯流排裝置配置空間

linux驅動---用I/O命令訪問PCI匯流排裝置配置空間

PCI匯流排推出以來,以其獨有的特性受到眾多廠商的青睞,已經成為計算機擴充套件匯流排的主流。目前,國內的許多技術人員已經具備開發PCI匯流排介面裝置的能 力。但是PCI匯流排的程式設計技術,也就是對PCI匯流排裝置的操作技術,一直是一件讓技術人員感到頭疼的事情。PCI匯流排程式設計的核心技術是對相應板卡配置空間 的理解和訪問。一般軟體程式設計人員基於對硬體裝置原理的生疏,很難理解並操作配置空間,希望硬體開發人員直接告訴他們怎樣操作;而PCI匯流排硬體開發人員雖 深刻地理解了其意義,在沒有太多程式設計經驗地前提下,也難於輕易地操作PCI板卡。結果大多是硬體技術人員花費大量時間和精力去學習DDK、 WINDRVER等驅動程式開發軟體。

作者在開發PCI匯流排介面裝置時,經過對PCI匯流排協議的深入研究,從協議本身的角度出發,找到一種方面而快捷的PCI配置空間操作方法,只使用簡單的 I/O命令即可找到特定的PCI匯流排裝置並對其所有的配置空間進行讀寫操作。一旦讀得其配置空間的內容,即可中得到擔任系統對該PCI匯流排裝置的資源分 配。

1 PCI匯流排配置空間及配置機制

為避免各PCI裝置在資源的佔用上發生衝突,PCI匯流排採用即插即用協議。即在系統建立時由作業系統按照各裝置的要求統一分配資源,資源分配的資訊由系統 寫入各PCI裝置的配置空間暫存器,並在作業系統內部備份。各PCI裝置有其獨自的配置空間,設計者通過對積壓裝置(或插槽)的ISDEL引腳的驅動區分 不同裝置的配置空間。配置空間的前64個位元組稱為配置空間的預定自區,它對每個裝置都具有相同的定義且必須被支援;共後的空間稱為裝置關聯區,由裝置製造 商根據需要定義。與程式設計有關的配置空間資訊主要有:

(1)裝置號(Device ID)及銷售商號(Vendor ID),配置空間偏移量為00h,用於對各PCI裝置的區分和查詢。為了保證其唯一性,Vendor ID應當向PCI特別興趣小組(PCI SIG)申請而得到。

(2)PCI基地址(PCI Base Address),配置空間偏移量為10~24h,裝置通過設定可讀寫的高位數值來向作業系統指示所需資源空間的大小。比如,某裝置需要64K位元組的記憶體 空間,可以將配置空間的某基地址暫存器的高16位設成可讀寫的,而將低16位置為0(只可讀)。作業系統在建立時,先向所有位寫1,實際上只有高16位被 接收而被置成了1,低16位仍為0.這樣作業系統讀取該暫存器時,返回值為FFFF0000h,據此作業系統可以斷定其需要的空間大小是64K位元組,然後 分配一段空閒的記憶體空間並向該暫存器的高16位填寫其地址。

其它可能與程式設計有關的配置空間的定義及地址請參閱參考文獻[1]。

由於PC-AT相容系統CPU只有記憶體和I/O兩種空間,沒有專用的配置空間,PCI協議規定利用特定的I/O空間操作驅動PCI橋路轉換成配置空間的操 作。目前存在兩種轉換機制,即配置機制1#和配置機制2#。配置機制2#在新的設計中將不再被採用,新的設計應使用配置機制1#來產生配置空間的物理操 作。這種機制使用了兩個特定的32位I/O空間,即CF8h和CFCh。這兩個空間對應於PCI橋路的兩個暫存器,當橋路看到CPU在區域性匯流排對這兩個 I/O空間進行雙字操作時,就將該I/O操作轉變為PCI匯流排的配置操作。暫存器CF8h用於產生配置空間的地址(CONFIG-ADDRESS),寄存 器CFCh用於儲存配置空間的讀寫資料(CONFIG-DATA)。

配置空間地址暫存器的格式如圖1。



CF8H(區域性匯流排):

當CPU發出對I/O空間CFCh的操作時,PCI橋路將檢查配置空間地址暫存器CF8h的31位。如果為1,就在PCI總線上產生一個相應的配置空間讀或寫操作,其地址由PCI橋路根據配置空間地址暫存器的內容作如圖2所示的轉換。

CFCh (區域性匯流排):

裝置號被PCI橋路譯碼產生PCI匯流排地址的高位地址,它們被設計者用作IDSEL訊號來區分相應的PCI裝置。6位暫存器號用於定址該PCI裝置配置空 間62個雙字的配置暫存器(256位元組)。功能號用於區分多功能裝置的某特定功能的配置空間,對常用的單功能裝置為000。某中PCI插槽的匯流排號隨系統 (主機板)的不同稍有區別,大多數PC機為1,工控機可能為2或3。為了找到某裝置,應在系統的各個匯流排號上查詢,直到定位。如果在0~5號總線上不能發現 該裝置,即可認為該裝置不存在。

理解了上述PCI協議裡的配置機制後,就可以直接對CF8h和CFCh兩個雙字的I/O空間進行操作,查詢某個PCI裝置並訪問其配置空間,從而得到作業系統對該PCI裝置的資源分配。

2 用I/O命令訪問PCI匯流排配置空間



要訪問PCI匯流排裝置的配置空間,必須先查詢該裝置。查詢的基本根據是各PCI裝置的配置空間裡都存有特定的裝置號(Device ID)及銷售商號(Vendor ID),它們佔用配置空間的00h地址。而查詢的目的是獲得該裝置的匯流排號和裝置號。查詢的基本過程如下:用I/O命令寫配置空間的地址暫存器CF8h, 使其最高位為1,匯流排號及裝置為0,功能號及暫存器號為0,即往I/O埠CF8h80000000h;然後用I/O命令讀取配置空間的資料暫存器 CFCh。如果該暫存器值與該PCI裝置的Device ID及Vendor ID不相符,則依次遞增裝置號/匯流排號,重複上述操作直到找到該裝置為止。如果查完所有的裝置號/匯流排號(1~5)仍不能找到該裝置,則應當考慮硬體上的 問題。對於多功能裝置,只要裝置配置暫存器相應的功能號值,其餘步驟與單功能裝置一樣。

如查詢裝置號為9054h,銷售商號為10b5的單功能PCI裝置,編寫的程式如下:

CODE:char bus;char device; 

unsigned int ioa0,iod; 

int scan( ) 



bus=0;device=0; 

for(char i=0;i<5;i++) { 

for(char j=0;j<32;j++) { 

bus=i; device=j; 

ioa0=0x80000000+bus*0x10000 

+(device*8)*0x100; 

_outpd(0xcf8,ioa0); 

iod=_inpd(0xcfc); 

if (iod0= =0x905410b5) return 0; 





retrn -1 

}

呼叫子程式scan( ),如果返回值為-1,則沒有找到該PCI裝置。如果返回值為0,則找到了該PCI裝置。該裝置的匯流排號和裝置號分別在全域性變數bus和device中, 利用這兩個變數即可輕易對該裝置的配置空間進行訪問,從而得到分配的資源資訊。假設該PCI裝置佔用了4個資源空間,分別對應於配置空間10h~1ch, 其中前兩個為I/O空間,後兩個為記憶體空間,若定義其基地址分別為ioaddr1,ioaddr2,memaddr1,memaddr2,相應的程式如 下:

CODE:unsigned short ioaddr1,ioaddr2; 

unsigned int memaddr1,memaddr2; 

unsigned int iobase,ioa; 

void getbaseaddr(char bus,char device); 



iobase=0x80000000+bus*0x10000+(device*8)*0x100; 

ioa=iobase+0x10;/*定址基地址暫存器0*/ 

_outpd(0xcf8,ioa); 

ioaddr1=(unsigned short)_inpd(0xcfc)&0xfffc; 

/*遮蔽低兩位和高16位*/ 

ioa=iobase+0x14; /*定址基地址暫存器1*/ 

_outpd(0xcf8,ioa); 

ioaddr2=(unsigned short)_inpd(0xcfc)&0xfffc; 

ioa=iobase+0x18;/*定址基地暫存器2*/ 

_outpd(0xcf8,ioa); 

memaddr1=_inpd(0xcfc) & 0xfffffff0; 

/*遮蔽低4位*/ 

ioa=iobase+0x1c; /*定址基地址暫存器3*/ 

_outpd(0xcf8,ioa); 

memaddr2=_inpd(0xcfc) & 0xfffffff0; 

}

對於I/O基地址,最低兩位D0、D1固定為01,對地址本身無效,應當被遮蔽。對PC-AT相容機,I/O有效地址為16位,因此高位也應被遮蔽。對於 記憶體地址,最低位D0固定為0,而D1~D3用於指示該地址的一些物理特性[1],因此其低4位地址應當被遮蔽。需要指出的是該記憶體地址是系統的物理地 址,在WINDOWS運行於保護模式時,需要經過轉換得到相應的線性地址才能對該記憶體空間進行直接讀寫。介紹該轉換方法的相關文章較為常見,此處不再贅 述。

上述程式給出了讀取配置空間裡的基地址的方法。另有相當多PCI裝置通過配置空間的裝置關聯區來設定該裝置的工作狀態,可輕易地用I/O命令進行相應的設定,無須編寫繁雜的驅動程式。在開發PCI視訊影象採集卡的過程中,該方法得到了實際應用。

#define PCI_CFG_DATA    0xcfc
#define PCI_CFG_CTRL    0xcf8
 
void pci_read_config_byte(unsigned char bus, unsigned char dev, unsigned char offset, unsigned char *val)
{
    unsigned char fun = 0;
   
    outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL);
    *val = inl(PCI_CFG_DATA) >> ((offset & 3) * 8);
}
 
void pci_read_config_word(unsigned char bus, unsigned char dev, unsigned char offset, unsigned short *val)
{
    unsigned char fun = 0;
   
    outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL);
    *val = inl(PCI_CFG_DATA) >> ((offset & 3) * 8);
}
 
void pci_read_config_dword(unsigned char bus, unsigned char dev, unsigned char offset, unsigned int *val)
{
    unsigned char fun = 0;
   
    outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset)), PCI_CFG_CTRL);
    *val = inl(PCI_CFG_DATA);
}
很明顯就是先向控制暫存器寫入綜合地址,格式前面已經提到,對比一下是完全一樣的。然後從資料暫存器讀資料即可,由於資料暫存器是32位的,如果不是讀取雙字,需要做移位操作。
另外一定需要注意大小端問題,如需要就要進行大小端轉換,下面寫程式也一樣。
 
5. 寫程式
void pci_write_config_dword(unsigned char bus, unsigned char dev, unsigned char offset, unsigned int val)
{
    unsigned char fun = 0;
   
    outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset)), PCI_CFG_CTRL);
    outl(val, PCI_CFG_DATA);
}
 
void pci_write_config_word(unsigned char bus, unsigned char dev, unsigned char offset, unsigned short val)
{
    unsigned long tmp;
    unsigned char fun = 0;
 
    outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL);
    tmp = inl(PCI_CFG_DATA);
    tmp &= ~(0xffff << ((offset & 0x3) * 8));
    tmp |= (val << ((offset & 0x3) * 8));
    outl(tmp, PCI_CFG_DATA);
}
 
void pci_write_config_byte(unsigned char bus, unsigned char dev, unsigned char offset, unsigned short val)
{
    unsigned long tmp;
    unsigned char fun = 0;
   
    outl((0x80000000 | ((bus)<<16) |((dev)<<11) |((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL);
    tmp = inl(PCI_CFG_DATA);
    tmp &= ~(0xff << ((offset & 0x3) * 8));
    tmp |= (val << ((offset & 0x3) * 8));
    outl(tmp, PCI_CFG_DATA);
}
寫程式同讀程式一樣,先向控制暫存器寫入綜合地址,然後向資料暫存器寫入資料。
 
6. 問題
上面的程式都是參考linux核心對pci空間的讀寫程式寫的。但是在應用程式中讀寫pci空間和在核心中讀寫pci空間是完全不同的。在linux原始碼中可以看到,在進行pci空間的讀寫操作都是在關閉中斷的情況下進行的,而在使用者程式空間就沒有這個手段了。所以,讀寫可能會出錯。
經過本人試驗,讀基本上沒有出錯過,而寫有一定出錯的概率,慎用!
有興趣的,可以隨便寫個應用程式試試看。
 
7. 原始碼
附上一份原始碼,可以直接編譯執行。
#include <stdio.h>
#include <stdlib.h>
#include <sys/io.h>
static unsigned int read_pci_config_32(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset)
{
 unsigned int v;
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);
 v = inl(0xcfc);
 return v;
}
unsigned char read_pci_config_8(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset)
{
 unsigned char v;
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);
 v = inb(0xcfc + (offset&3));
 return v;
}
unsigned short read_pci_config_16(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset)
{
 unsigned short v;
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);
 v = inw(0xcfc + (offset&2));
 return v;
}
void write_pci_config_32(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset, unsigned int val)
{
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);
 outl(val, 0xcfc);
}
void write_pci_config_8(unsigned char bus,unsigned char slot, unsigned char func, unsigned char offset, unsigned char val)
{
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);
 outb(val, 0xcfc + (offset&3));
}
void write_pci_config_16(unsigned char bus,unsigned char slot, unsigned char func, unsigned char offset, unsigned char val)
{
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);
 outw(val, 0xcfc + (offset&2));
}
int main(void)
{
 iopl(3);
 
 printf("0 0 0 0 = %x\n", read_pci_config_16(0, 0 , 0, 0));
 printf("0 0 0 2 = %x\n", read_pci_config_16(0, 0 , 0, 2));
 printf("0 1 0 0 = %x\n", read_pci_config_16(0, 1 , 0, 0));
 printf("0 1 0 2 = %x\n", read_pci_config_16(0, 1 , 0, 2));
 
 printf("0 7 1 0 = %x\n", read_pci_config_16(0, 7 , 1, 0));
 printf("0 7 1 2 = %x\n", read_pci_config_16(0, 7 , 1, 2));
 return 0;
}
//
/////////////////////////////////////////////////////////
#include <sys/io.h>
#include <sys/mman.h>  
#include <sys/types.h>  
#include <sys/stat.h>  
#include <sys/fcntl.h>  
#include <errno.h>  
#include <string.h>  
#include <stdio.h>  
#include <stdlib.h>  

unsigned char bus;
unsigned char device,i,j;
unsigned int pcicfgaddr=0;


static unsigned int read_pci_config_32(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset)  
{  
 unsigned int v;  
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);  
 v = inl(0xcfc);  
 return v;  
}  
void write_pci_config_32(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset, unsigned int val)  
{  
 outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8);  
 outl(val, 0xcfc);  
}  
int scan()
{//list pci device 
   bus=0;device=0; 
	  for( i=0;i<5;i++)
    { 
			for( j=0;j<32;j++) 
	    { 
				bus=i; device=j; 
	      pcicfgaddr=read_pci_config_32(bus,device,0,0);
	  //       printf("%d %d 0x%x\n",bus,device, pcicfgaddr);
				if (pcicfgaddr==0x27201103)//deviceID&vendorID
	      {
	         pcicfgaddr=read_pci_config_32(bus,device,0,0x18)&0xfffffff0;
	         printf("%d %d 0x%x\n",bus,device,pcicfgaddr );
	         return pcicfgaddr;
	      } 
			} 

	  } 

	return 0 ;
}
int main(int argc, char *argv[])
{
	int i;
	unsigned char * base2addr;
	int  fd;
  iopl(3);
  if(scan()==0)
  {
      printf("no card\n");
      return 0;
  }

	if ( (argc < 2) || (1 != strlen(argv[1])))
	{
	    printf("1: set raid to sata1.0(1.5Gbps)\n");
	    printf("2: set raid to sata2.0(3Gbps)\n");
	    printf("3: set raid to sata3.0(6Gbps)\n");
	    return -1;
	}      

	fd = open ("/dev/mem", O_RDWR);
	if (fd < 0)
	{
	   printf("cannot open /dev/mem.\n");
	   return -1;
	}
	//map raid card bar2 physical addr 
	base2addr = (unsigned char *)mmap(0, 0x40000, PROT_READ | PROT_WRITE, MAP_SHARED, fd, pcicfgaddr);
	
	if(base2addr < 0)
	{
	  printf("base2addr mmap failed.\n");
	  return -1;
	
	}
 
	switch (*argv[1])
	{
		case '1':    
				//sata1.0(1.5Gbps)
				for(i=0; i<4; i++)
				{
					*(unsigned int *)(base2addr+0x20000+0x250+i*8) = 0x08;  
					*(unsigned int *)(base2addr+0x20000+0x254+i*8) = ((*(unsigned int *)(base2addr+0x20000+0x254+i*8))&0xffffff8f)|0x00000011;
					
					*(unsigned int *)(base2addr+0x24000+0x250+i*8) = 0x08; 
					*(unsigned int *)(base2addr+0x24000+0x254+i*8) = ((*(unsigned int *)(base2addr+0x24000+0x254+i*8))&0xffffff8f)|0x00000011;
				}
				printf("1: set raid to sata1.0(1.5Gbps)\n");
				break;
		case '2':
				//sata2.0(3Gbps)
				for(i=0; i<4; i++)
				{
					*(unsigned int *)(base2addr+0x20000+0x250+i*8) = 0x08;  
					*(unsigned int *)(base2addr+0x20000+0x254+i*8) = ((*(unsigned int *)(base2addr+0x20000+0x254+i*8))&0xffffff8f)|0x00000031;
					
					*(unsigned int *)(base2addr+0x24000+0x250+i*8) = 0x08; 
					*(unsigned int *)(base2addr+0x24000+0x254+i*8) = ((*(unsigned int *)(base2addr+0x24000+0x254+i*8))&0xffffff8f)|0x00000031;
				}				
				printf("2: set raid to sata2.0(3Gbps)\n");
				break;
		case '3':   
				//sata3.0(6Gbps)
				for(i=0; i<4; i++)
				{
					*(unsigned int *)(base2addr+0x20000+0x250+i*8) = 0x08;  
					*(unsigned int *)(base2addr+0x20000+0x254+i*8) = ((*(unsigned int *)(base2addr+0x20000+0x254+i*8))&0xffffff8f)|0x00000071;
					
					*(unsigned int *)(base2addr+0x24000+0x250+i*8) = 0x08; 
					*(unsigned int *)(base2addr+0x24000+0x254+i*8) = ((*(unsigned int *)(base2addr+0x24000+0x254+i*8))&0xffffff8f)|0x00000071;
				}				
				printf("3: set raid to sata3.0(6Gbps)\n");
				break;
	}
	
	/*
 ((*(unsigned int *)(base2addr+0x20258))) = 0xc;
 sleep(1);
 printf("base2addr mmap 0x%x.\n",((*(unsigned int *)(base2addr+0x2025c))));
 sleep(1);
 ((*(unsigned int *)(base2addr+0x24258))) = 0xc;
sleep(1);
 printf("base2addr mmap 0x%x.\n",((*(unsigned int *)(base2addr+0x2425c))));
*/
	munmap(base2addr, 0x40000); //destroy map memory
	close(fd);  //close
            
	return 0;       	
}