區域性變數、全域性變數、堆、棧
預備知識—程式的記憶體分配
一個由C/C++編譯的程式佔用的記憶體分為以下幾個部分
- 棧區(stack)— 由編譯器自動分配釋放,存放函式的引數值,區域性變數的值等。其操作方式類似於資料結構中的棧。
- 堆區(heap) — 一般由程式設計師分配釋放,若程式設計師不釋放,程式結束時可能由OS回收 。注意它與資料結構中的堆是兩回事,分配方式倒是類似於連結串列。
- 全域性區/靜態區(global/static)—,全域性變數和靜態變數的儲存是放在一塊的,初始化的全域性變數和靜態變數在一塊區域, 未初始化的全域性變數、未初始化的靜態變數在相鄰的另一塊區域。 - 程式結束後有系統釋放 【靜態儲存區】
- 文字常量區
- 程式程式碼區—存放函式體的二進位制程式碼。
一個正常的程式在記憶體中通常分為程式段、資料端、堆疊三部分。程式段裡放著程式的機器碼、只讀資料,這個段通常是隻讀,對它的寫操作是非法的。資料段放的是程式中的靜態資料。動態資料則通過堆疊來存放。
在記憶體中,它們的位置如下:
+------------------+ 記憶體低端
| 程式段 |
|------------------|
| 資料段 |
|------------------|
| 堆疊 |
+------------------+ 記憶體高階
堆疊是記憶體中的一個連續的塊
在高階語言中,程式函式呼叫、函式中的臨時變數都用到堆疊。為什麼呢?因為在呼叫一個函式時,我們需要對當前的操作進行保護,也為了函式執行後,程式可以正確的找到地方繼續執行,所以引數的傳遞和返回值也用到了堆疊。通常對區域性變數的引用是通過給出它們對SP的偏移量來實現的。另外還有一個基址指標(FP,在Intel晶片中是BP),許多編譯器實際上是用它來引用本地變數和引數的。通常,引數的相對FP的偏移是正的,區域性變數是負的。
當程式中發生函式呼叫時,計算機做如下操作:
在函式體中定義的變數通常是在棧上,用malloc, calloc, realloc等分配記憶體的函式分配得到的就是在堆上。在所有函式體外定義的是全域性量,加了static修飾符後不管在哪裡都存放在全域性區(靜態區),在所有函式體外定義的static變量表示在該檔案中有效,不能extern到別的檔案用;在函式體內定義的static表示只在該函式體內有效。另外,函式中的"adgfdf"這樣的字串存放在常量區。
對比:
1 效能
棧:棧存在於RAM中。棧是動態的,它的儲存速度是第二快的。stack
堆:堆位於RAM中,是一個通用的記憶體池。所有的物件都儲存在堆中。heap
2 申請方式
stack【棧】: 由系統自動分配。 例如,宣告在函式中一個區域性變數 int b; 系統自動在棧中為b開闢空間 。
heap【堆】: 需要程式設計師自己申請,並指明大小,在c中malloc函式 如p1 = (char *)malloc(10); 在C++中用new運算子 如p2 = (char *)malloc(10); 但是注意:p1、p2本身是在棧中的。
3 申請後系統的響應
棧【stack】:只要棧的剩餘空間大於所申請空間,系統將為程式提供記憶體,否則將報異常提示棧溢位。
堆【heap】:首先應該知道作業系統有一個記錄空閒記憶體地址的連結串列,當系統收到程式的申請時,會遍歷該連結串列,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點連結串列中刪除,並將該結點的空間分配給程式;另外,對於大多數系統,會在這塊記憶體空間中的首地址處記錄本次分配的大小,這樣,程式碼中的delete語句才能正確的釋放本記憶體空間。另外,由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多餘的那部分重新放入空閒連結串列中。
4 申請大小的限制
棧【stack】:在Windows下,棧是向低地址擴充套件的資料結構,是一塊連續的記憶體的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因此,能從棧獲得的空間較小。
堆【heap】:堆是向高地址擴充套件的資料結構,是不連續的記憶體區域。這是由於系統是用連結串列來儲存的空閒記憶體地址的,自然是不連續的,而連結串列的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬記憶體。由此可見,堆獲得的空間比較靈活,也比較大。
5 申請效率的比較
棧【stack】:由系統自動分配,速度較快。但程式設計師是無法控制的。
堆【heap】:是由new分配的記憶體,一般速度比較慢,而且容易產生記憶體碎片,不過用起來最方便.
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配記憶體,他不是在堆,也不是在棧是直接在程序的地址空間中保留一快記憶體,雖然用起來最不方便。但是速度快,也最靈活。
6 堆和棧中的儲存內容
棧【stack】:在函式呼叫時,第一個進棧的是主函式中後的下一條指令(函式呼叫語句的下一條可執行語句)的地址,然後是函式的各個引數,在大多數的C編譯器中,引數是由右往左入棧的,然後是函式中的區域性變數。注意靜態變數是不入棧的。
當本次函式呼叫結束後,區域性變數先出棧,然後是引數,最後棧頂指標指向最開始存的地址,也就是主函式中的下一條指令,程式由該點繼續執行。
堆【heap】:一般是在堆的頭部用一個位元組存放堆的大小。堆中的具體內容有程式設計師安排。
7 存取效率的比較
char s1[] = "aaaaaaaaaaaaaaa";
char *s2 = "bbbbbbbbbbbbbbbbb";
aaaaaaaaaaa是在執行時刻賦值的; 而bbbbbbbbbbb是在編譯時就確定的; 但是,在以後的存取中,在棧上的陣列比指標所指向的字串(例如堆)快。
比如:
#include
void main()
{
char a = 1;
char c[] = "1234567890";
char *p ="1234567890";
a = c[1];
a = p[1];
return;
}
對應的彙編程式碼
10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al
第一種在讀取時直接就把字串中的元素讀到暫存器cl中,而第二種則要先把指標值讀到edx中,在根據edx讀取字元,顯然慢了。
小結:
堆和棧的區別可以用如下的比喻來看出:
使用棧就象我們去飯館裡吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。
使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。
-------------------------------------------------------------
一般全域性變數存放在資料區,區域性變數存放在棧區,
動態變數存放在堆區,函式程式碼放在程式碼區。
---------------------------------------------------------------
棧區是普通的棧資料結構,遵循LIFO後進先出的規則,區域性變數安排在那裡是ASM時就規定的,這樣可以在一個函式結束後平衡堆疊,操作簡單,效率高
堆(動態區)在這裡應當叫堆疊(不要和資料結構中的堆搞混)是程式在編譯時產生的一塊用於產生動態記憶體分配使用的塊,操作比較棧要麻煩許多,在分配時要判 斷最優的地址(防止產生無用的記憶體碎片(由於屢次的NEW和DELETE產生的夾在兩塊使用中記憶體中的空餘小記憶體(不容易被分配))),分配和回收時的效 率比棧低多了
---------------------------------------------------------------
棧是系統提供的功能,特點是快速高效,缺點是有限制,資料不靈活;而堆是函式庫提供的功能,特點是靈活方便,資料適應面廣泛,但是效率有一定降低。棧是系 統資料結構,對於程序/執行緒是唯一的;堆是函式庫內部資料結構,不一定唯一。不同堆分配的記憶體無法互相操作。棧空間分靜態分配和動態分配兩種。靜態分配是 編譯器完成的,比如自動變數(auto)的分配。動態分配由malloc函式完成。棧的動態分配無需釋放(是自動的),也就沒有釋放函式。為可移植的程式 起見,棧的動態分配操作是不被鼓勵的!堆空間的分配總是動態的,雖然程式結束時所有的資料空間都會被釋放回系統,但是精確的申請記憶體/ 釋放記憶體匹配是良好程式的基本要素。
---------------------------------------------------------------
堆是程式設計師管理的,棧是系統管理的.
---------------------------------------------------------------
---------------------------------------------------------------
另外關於靜態和全域性的一些問題:
靜態變數的特點:
1、 一次儲存:靜態區域性變數只被初始化一次,下一次初始化根據上一次的結果值,有點類似於c++中類的靜態成員變數,即無論該型別生成多少個例項物件,所有的物件共用一個靜態變數,到這裡就是無論這個函式呼叫多少次,該靜態變數只初始化一次,並沒有因為超出其生存期而被銷燬,只是外部不可見而已,用個例子說明之:
void fun1( int v )
{
static int value = v;
static int value = v;
}
int main( int arc, char *args[ ])
{
fun1( 50 );
fun1( 100 );
}
執行的結果是:value : 50 value : 50
說明在第二次呼叫fun1( )時的初始化value的採用的是上一次value的值,value在靜態區的儲存空間並沒有因為fun1( )的結束而被釋放,即體現了一次儲存;
2、 作用域限定:靜態修飾的作用域限定功能同時體現在函式與變數上;
a)對於函式而言,任何用static修飾的函式,其作用域僅為當前原始檔,而對外部來說這個函式是不可見的,即只有和其在同一原始檔中的函式才能呼叫這個靜態函式;反過來說,如果一個函式僅僅被同一原始檔中的其他函式呼叫,那麼這個函式應該宣告為靜態的,這樣做的好處在於:可以一定程度上的解決不同原始檔之間函式的命名衝突問題;
b)對於變數而言,static修飾的全域性變數,只在當前原始檔中有效,對外部不可見,外部檔案不能夠引用;
顧名思義,全域性變數是指能夠在全域性引用的變數,相對於區域性變數的概念,也叫外部變數;同靜態變數一樣,全域性變數位於靜態資料區,全域性變數一處定義,多處引用,用關鍵字“extern”引用“外部”的變數。
全域性變數也可以是靜態的,在前面有過說明,靜態全域性變數的意義就是不讓“外部”引用,是單個原始檔裡的全域性變數,即是編譯階段的全域性變數,而不是連線階段的全域性變數。
---------------------------------------------------------------
通過上面的分析,我們不難得出以下結論:
1.靜態函式與普通函式的區別在於:靜態函式不可以被同一原始檔以外的函式呼叫。
2.靜態區域性變數與普通區域性變數的區別在於:靜態區域性變數只初始化一次,下一次初始化實際上是依然是上一次的值;
3.靜態全域性變數與普通全域性變數的區別在於:靜態全域性變數的作用域僅限於所在的原始檔。