C語言編譯流程全面分析

阿新 • • 發佈：2018-11-11

程式的編譯流程大概分為前處理器 -> 編譯器 -> 彙編器 -> 連結器，4個階段。
編譯器又可以分為詞法分析 -> 語法分析 -> 語義分析 -> 中間程式碼生成 -> 程式碼優化 ->生成目的碼等階段。

階段	功能
前處理器	處理巨集定義，如#include表示引入其他原始檔的程式碼，#define表示定義巨集，對程式碼片進行一個替換，#if系列命令可以控制前處理器的功能做到面向不同環境的程式碼等等。
編譯器	編譯過程就是把預處理完的檔案進行一系列的詞法分析，語法分析，語義分析及優化後生成相應的彙編程式碼
詞法分析	將高階語言程式碼文字切割成詞彙，輸出單詞流，刪除註釋、空格、空行等
語法分析	根據單詞流生成語法樹
語義分析	構建帶型別和符號表的語法樹、檢查型別是否匹配、檢查等號左側是否為左值等
中間程式碼生成	生成中間程式碼
程式碼優化	優化中間程式碼
彙編器	彙編器是將彙編程式碼轉變成機器可以執行的命令，每一個彙編語句幾乎都對應一條機器指令。彙編相對於編譯過程比較簡單，根據彙編指令和機器指令的對照表一一翻譯即可
連結器	將多個目的碼庫連結成可執行檔案

詞法分析（Lexical analysis或Scanning）和詞法分析程式（Lexical analyzer或Scanner）
　　詞法分析階段是編譯過程的第一個階段。這個階段的任務是從左到右一個字元一個字元地讀入源程式，即對構成源程式的字元流進行掃描然後根據構詞規則識別單詞(也稱單詞符號或符號)。詞法分析程式實現這個任務。詞法分析程式可以使用lex等工具自動生成。

語法分析（Syntax analysis或Parsing）和語法分析程式（Parser）
　　語法分析是編譯過程的一個邏輯階段。語法分析的任務是在詞法分析的基礎上將單詞序列組合成各類語法短語，如“程式”，“語句”，“表示式”等等.語法分析程式判斷源程式在結構上是否正確.源程式的結構由上下文無關文法描述.

語義分析（Syntax analysis）
　　語義分析是編譯過程的一個邏輯階段. 語義分析的任務是對結構上正確的源程式進行上下文有關性質的審查, 進行型別審查.例如一個C程式片斷:
　　int arr[2],b;
　　b = arr * 10;
　　源程式的結構是正確的.
　　語義分析將審查型別並報告錯誤:不能在表示式中使用一個數組變數,賦值語句的右端和左端的型別不匹配.

Lex
　　一個詞法分析程式的自動生成工具。它輸入描述構詞規則的一系列正規式,然後構建有窮自動機和這個有窮自動機的一個驅動程式,進而生成一個詞法分析程式.

Yacc
　　一個語法分析程式的自動生成工具。它接受語言的文法,構造一個LALR(1)分析程式.因為它採用語法制導翻譯的思想,還可以接受用C語言描述的語義動作,從而構造一個編譯程式. Yacc 是 Yet another compiler compiler的縮寫.

源語言（Source language）和源程式（Source program）
　　被編譯程式翻譯的程式稱為源程式,書寫該程式的語言稱為源語言.

目標語言（Object language or Target language）和目標程式（Object program or Target program）
　　編譯程式翻譯源程式而得到的結果程式稱為目標程式, 書寫該程式的語言稱為目標語言.

中間語言（中間表示）（Intermediate language(representation)）
　　在進行了語法分析和語義分析階段的工作之後，有的編譯程式將源程式變成一種內部表示形式，這種內部表示形式叫做中間語言或中間表示或中間程式碼。所謂“中間程式碼”是一種結構簡單、含義明確的記號系統，這種記號系統複雜性介於源程式語言和機器語言之間，容易將它翻譯成目的碼。另外，還可以在中間程式碼一級進行與機器無關的優化。

文法（Grammars）
　　文法是用於描述語言的語法結構的形式規則。文法G定義為四元組(，，，)。其中為非終結符號(或語法實體，或變數)集；為終結符號集；為產生式(也稱規則)的集合；產生式(規則)是形如或 a ::=b 的(a , b)有序對,其中(∪)且至少含有一個非終結符，而(∪)。，和是非空有窮集。稱作識別符號或開始符號，它是一個非終結符，至少要在一條規則中作為左部出現。
　　一個文法的例子: G=(={A，R},={0,1} ，={A?0R，A?01,R?A1},=A)

文法分類（A hierarchy of Grammars）
　　著名語言學家Noam Chomsky定義了四類文法和四種形式語言類，文法的四種類型分別是0型、1型、2型和3型。幾類文法的差別在於對產生式施加不同的限制，分別是：
　　0型文法(短語結構文法)(phrase structure grammars)：
　　設G=(，，，)，如果它的每個產生式是這樣一種結構： (∪)　　且至少含有一個非終結符，而(∪)，則G是一個0型文法。
　　1型文法（上下文有關文法）(context-sensitive grammars)：
　　設G=(，，，)為一文法，若中的每一個產生式均滿足|，僅僅　　除外，則文法G是1型或上下文有關的。
　　2型文法（上下文無關文法）(context-free grammars)：
　　設G=(，，，)，若P中的每一個產生式滿足：是一非終結符，(∪)　　則此文法稱為2型的或上下文無關的。
　　3型文法（正規文法）(regular grammars)：
　　設G=(，，，)，若中的每一個產生式的形式都是A→aB或A→a，其中A和B都是非終結，a是終結符，則G是3型文法或正規文法。
　　0型文法產生的語言稱為0型語言。
　　1型文法產生的語言稱為1型語言，也稱作上下文有關語言。
　　2型文法產生的語言稱為2型語言，也稱作上下文無關語言。
　　3型文法產生的語言稱為3型語言，也稱作正規語言。

原始碼優化 = 中間程式碼生成 + 程式碼優化。

優化舉個簡單的例子： int a = 2+6 , 優化後好比 int a = 8

跨平臺的編譯器可以針對不同的平臺使用同一個前端和針對不同機器平臺的數個後端

前端部分：從語法分析一直到原始碼優化（編譯器）

後端部分：目的碼生成到目的碼優化（彙編器）

以上只是對編譯器大概的說明，想要深入的瞭解推薦看編譯原理的書，還是很深奧，對於開發人員來說可以不必要了解的很深入，除非你是專門做這一塊的。

C語言編譯流程全面分析

程式的編譯流程大概分為前處理器 -> 編譯器 -> 彙編器 -> 連結器，4個階段。編譯器又可以分為詞法分析 -> 語法分析 -> 語義分析 -> 中間程式碼生成 -> 程式碼優化 ->生成目的碼等階段。

C語言連結裝載流程全面分析

連結的主要內容是把各個模組之間相互引用的部分處理好，使得各個模組之間能夠正確地銜接。連結的主要過程包括：地址和空間分配（Address and Storage Allocation），符號決議（Symbol Resolution），重定位（Relocation）等。連結分為靜態連結和動態

linux input輸入子系統分析《四》：input子系統整體流程全面分析

總線返回值分代並不是事件等等 lag pri 位置 1 input輸入子系統整體流程本節分析input子系統在內核中的實現，包括輸入子系統（Input Core），事件處理層（Event Handler）和設備驅動層。由於上節代碼講解了設備驅動層的寫法

結對編程--C語言子程序詞法分析

字符串之前 info default 管理問題 min div == 一、問題描述 C語言小子集表的定義 2.設計單詞屬性值，各類表格（表示標識符表、常量表），單詞符號及機內表示,采用標準輸入和輸出的方式。程序從鍵盤接收代碼，遇到代碼結束符“#”時結束，並將

C語言編譯數組中有的加code有的不加，有什麽區別

hid 比較嵌入編碼系統 itl targe www bsp 像uchar code table[]={0xfe,0xfd,0xfb,0xf7,0xef,0xdf,0xbf,0x7f};和uchar ds1302[]={0xfe,0xfd,0xfb,0xf7,0

C語言靜態順序表分析

順序表是一種可以按元素序號隨機訪問元素的一種儲存結構。比較簡單，但是插入和刪除操作較為複雜。以下是我們要實現的介面： #ifndef __SEQLIST_H__ #define __SEQLIST_H__ #include<stdio.h> #include<assert.

C語言編譯和連結

編譯連結是使用高階語言程式設計所必須的操作，一個源程式只有經過編譯、連結操作以後才可以變成計算機可以理解並執行的二進位制可執行檔案。編譯是指根據使用者寫的源程式程式碼，經過詞法和語法分析，將高階語言編寫的程式碼轉變為功能有效的彙編程式碼。編譯過程如下： 1、預編譯過程在c語言的

GSM A5/1演算法C語言程式碼實現和分析

介紹全球超過200個國家和地區超過10億人正在使用GSM電話。對中國使用者來說，GSM就是移動和聯通的2g模式。在1982年A5首次提出時，人們認為A5 / 1金鑰長度要128位，但最終確定的結果是64位金鑰（政府可以使用暴力破解算出）。很可能是政府的壓力迫使金鑰位數縮

5.C語言編譯執行

C語言編譯執行在程式執行模式章節中，說到程式設計師編寫的程式碼並不能直接執行，在計算機的底層CPU中執行的是各種指令，程式碼必須經過處理後，變成CPU所能識別的指令，才能執行。程式碼在經過處理的過程比較繁雜，其中一個重要的部分就是編譯。C語言程式碼變為可執行檔案的過程比較複雜，可參

Mr.J--C語言編譯錯誤C3861

識別符號：找不到識別符號即使使用自變數相關的查詢，編譯器也無法解析對識別符號的引用。備註若要修復此錯誤，比較使用識別符號到識別符號宣告的大小寫和拼寫。驗證範圍解析運算子和名稱空間using 指令的用法正確。如果在標標頭檔案中宣告該識別符號

Mr.J--C語言編譯錯誤C2039

編譯器錯誤 C2039 identifier1：不是 identifier2 的成員程式碼錯誤地呼叫或引用的結構、類或聯合成員。示例下面的示例生成 C2039。複製 // C2039.cpp struct S { int mem0; } s, *pS = &

C語言編譯

這一篇文章我們來聊一聊C語言的編譯過程，就是從 .c 檔案到 .exe 檔案的過程。關於C語言的編譯過程，對很多人來說都感到特別苦澀，但是理解了這個過程對大家以後的能力上的提升是很有幫助的，在這裡我會努力用最淺顯有趣的語言來為大家解讀，還請大家認真仔細品讀，辛苦諸位嘍！ C語言的編譯過程分

C++/《C/C++程式編譯流程》

程式的基本流程如圖： 1.預處理預處理相當於根據預處理指令組裝新的C/C++程式。經過預處理，會產生一個沒有巨集定義，沒有條件編譯指令，沒有特殊符號的輸出檔案，這個檔案的含義同原本的檔案無異，只是內容上有所不同。讀取C/C++源程式，對其中的偽

C語言編譯環境搭建

gcc 編譯器下載解壓並配置環境變數在下解壓的目錄是 C:\MinGW，其目錄結構如下圖： ├─bin ├─doc │ └─runtime ├─include │ ├─ddk │ ├─gdb │ ├─gdiplus │ ├─GL │ └─sys

C語言編譯常見錯誤解析

C語言編譯錯誤資訊及說明1、在函式 ‘transform’ 中：7: 錯誤：expected ‘;’ before ‘{’ token 解釋：‘{’之前的某個語句缺少分號‘;’； 2、在函式 ‘Insert_SqList’ 中：6: 錯誤：‘listsize’ 未宣告

C語言-指針深度分析

char float 指針常量指向需要 std style 不可參數 1、變量回顧程序中的變量只是—段存儲空間的別名，那麽是不是必須通過這個別名才能使用這段存儲空間？ 2、思考下面的程序輸出什麽？為什麽？ 1

Linux下C語言編譯的問題

　在Linux下程式設計發現一個詭異的現象，就是在連結一個靜態庫的時候總是報錯，類似下面這樣的錯誤：　　(.text+0x13): undefined reference to `func'　　關於undefined reference這樣的問題，大家其實經常會遇到，在此，我以詳細地示例給出常見錯誤的各

c語言編譯過程和標頭檔案<>與""的區別

編譯過程：　　預處理--編譯--彙編--連結預處理：用於將所有#include標頭檔案及#define等巨集定義替換成真正的內容，預處理後的得到的仍然是文字檔案，但體積會大很多。編譯：將預處理之後的程式轉換成特定彙編程式碼的過程

linux C語言編譯後執行檔案從命令輸入引數

linux使用gcc編譯C檔案後，會生成一個執行檔案，而我們執行這個檔案的時候想要使用輸入的引數怎麼辦呢，其實很簡單，我們在main函式中加入形參即可，如下圖 int main（int argc,cha

KEIL編譯器C語言編譯選項優化等級說明

0 Minimum optimization. Turns off most optimizations.It gives the best possible debug view and the lowest level of optimization. 近乎不優化，用於除錯程式碼。出

C語言編譯流程全面分析

階段

功能

相關推薦