PHP7核心學習--語言的執行原理

阿新 • • 發佈：2018-11-22

我們常用的高階語言有很多種，比較出名的有C\C++、Python、PHP、Go、Pascal等。而這些語言根據執行的方式不同，大體分為兩種：編譯型語言和解釋型語言。
其中，編譯型語言包括C\C++、Pascal、Go等。這裡說的編譯是指在應用源程式執行之前，就將程式原始碼編譯成組合語言，然後進一步根據軟硬體環境"翻譯"成目標檔案。一般稱完成編譯工作的工具為編譯器。而解釋型語言，在程式執行時才被“翻譯”為機器語言。但是執行一次“翻譯”一次，所以執行效率較低。直譯器的工作就是解釋型語言中，負責“翻譯”原始碼的程式。

在這裡插入圖片描述

我們對編譯型語言與解釋型語言的區別的理解，立足於原始碼被編譯成目標平臺CPU指令的時機

。對於編譯型語言，編譯結果已經是針對當前CPU體系的指令；而

解釋型語言，需要先編譯成中間程式碼，再經由該解釋型語言的特定虛擬機器，翻譯成特定CPU體系的指令被執行

。解釋型語言是在執行過程中，翻譯為目標平臺的指令。常說解釋型語言“慢”，主要也是慢在這裡。

php7中執行原理

在PHP 7中，原始碼首先進行詞法分析，將原始碼切割為多個字串單元，分割後的字串稱為Token。而一個一個獨立的Token是無法表達完整語義的，需經過語法分析階段，將Token轉換為抽象語法樹（簡稱AST）。之後，抽象語法樹被轉換為機器指令執行。在PHP中，這些指令稱為opcode（以後會對opcode做更詳細的解釋，此處可以將其看待為CPU指令）。
到AST的生成這一步，編譯型語言與解釋型語言所需經歷的過程相似

。從抽象語法樹之後開始產生差異。
簡圖(最後一步的左側分支是編譯型語言的過程)

第1步：原始碼通過詞法分析得到Token。
第2步：基於語法分析器生成抽象語法樹（AST）。
第3步：抽象語法樹轉換為opcodes（opcode指令集合），PHP解釋執行opcodes。

接下來在基本步驟的基礎上，細化PHP語言的執行原理，以便更清晰地建立認知。

第1步：詞法分析將PHP程式碼轉換為有意義的標識Token。該步驟的詞法分析器使用Re2c實現。

第2步：語法分析將Token和符合文法規則的程式碼生成抽象語法樹。語法分析器基於Bison實現。語法分析使用了BNF

（Backus-Naur Form，巴科斯正規化）來表達文法規則，Bison藉助狀態機、狀態轉移表和壓棧、出棧等一系列操作，生成抽象語法樹。

第3步：上步的抽象語法樹生成對應的opcode，並被虛擬機器執行。opcode是PHP 7定義的一組指令標識，指令對應著相應的handler（處理函式）。當虛擬機器呼叫opcode，會找到opcode背後的處理函式，執行真正的處理。以常見的echo語句為例，其對應的opcode便是ZEND_ECHO。

注意　這裡為了便於理解詞法分析和語法分析過程，將兩者分開描述。但實際情況下，出於效率考慮，兩個過程並非完全獨立。

在這裡插入圖片描述

下面通過一段示例程式碼，來建立PHP 7運轉的初步理解。

echo "hello world";

這段程式碼首先會被切割為Token
Token

Token是PHP程式碼被切割成的有意義的標識。本次使用的PHP 7版本中有137種Token，在zend_language_parser.h檔案中做了定義

http://php.net/manual/zh/tokens.php

PHP提供了token_get_all()函式來獲取PHP程式碼被切割後的Token，可以在深入原始碼學習前，粗略檢視PHP程式碼被切割後的Token。對於如下程式碼片段：

./php -r 'print_r(token_get_all("<?php echo \"hello world\";?>"));'

//輸出:
Array
(
    [0] => Array
        (
            [0] => 379
            [1] => <?php 
            [2] => 1
        )

    [1] => Array
        (
            [0] => 328
            [1] => echo
            [2] => 1
        )

    [2] => Array
        (
            [0] => 382
            [1] =>  
            [2] => 1
        )

    [3] => Array
        (
            [0] => 323
            [1] => "hello world"
            [2] => 1
        )

    [4] => ;
    [5] => Array
        (
            [0] => 381
            [1] => ?>
            [2] => 1
        )

)

其中，二維陣列的每個成員陣列的第一個值為Token對應的列舉值。第二個值為Token對應的原始字串內容。第三個值為程式碼對應的行號。可以看出，詞法解析器將“<?php echo"hello world";”這段文字內容切分成了4部分。
1）文字“<?php”，切割後對應的Token值為379，參考PHP 7中的原始碼：

2）echo對應的Token是T_ECHO,對應的Token值為328：

3）原始碼中的空格，對應的Token為T_WHITESPACE，值為382：

4）字串"hello world"，對應的Token值為323：

可見，Token就是一個個的“詞塊”，但是單獨存在的詞塊不能表達完整的語義，還需要藉助規則進行組織串聯。語法分析器就是這個組織者。它會檢查語法，匹配Token，對Token進行關聯。
PHP 7中，組織串聯的產物就是AST（Abstract Syntax Tree，抽象語法樹）。

AST

AST是PHP 7版本新特性。在這之前的版本中，PHP程式碼的執行過程中是沒有生成AST這一步的。PHP 7對抽象語法樹的支援，實現了PHP編譯器和直譯器解耦，有效提升了可維護性。
顧名思義，抽象語法樹具有樹狀結構。AST的節點分為多種型別，對應著PHP語法。我們可以認為節點型別是對語法規則的抽象，例如賦值語句，生成的抽象語法樹節點為ZEND_AST_ASSIGN。而賦值語句的左右運算元又將作為ZEND_AST_ASSIGN型別節點的孩子。通過這樣的節點關係，構建出抽象語法樹。

PHP-Parser工具，它可以用來檢視PHP程式碼生成的AST。
注意　PHP-Parser是PHP 7核心作者之一Nikic編寫的將PHP原始碼生成AST的工具。原始碼見https://github.com/nikic/PHP-Parser。

opcodes

AST扮演了原始碼到中間程式碼的臨時儲存介質的角色，還需要將其轉換為opcode，才能被引擎直接執行。opcode只是單條指令，opcodes是opcode的集合形式，是PHP執行過程中的中間程式碼，類似Java中的位元組碼。opcode生成之後由虛擬機器執行。

我們知道，PHP工程優化措施中有一個比較常見的“開啟opcache”，指的就是這裡的opcodes的快取（opcodes cache）。通過省去從原始碼到opcode的階段，引擎可以直接執行快取的opcode，以此提升效能。

藉助vld外掛，可以直觀地看到一段PHP程式碼生成的opcode：(未完待續)

PHP7核心學習--語言的執行原理

我們常用的高階語言有很多種，比較出名的有C\C++、Python、PHP、Go、Pascal等。而這些語言根據執行的方式不同，大體分為兩種：編譯型語言和解釋型語言。其中，編譯型語言包括C\C++、Pascal、Go等。這裡說的編譯是指在應用源程式執行之前，就將程式原始碼編譯成組

[零] Java 語言執行原理 JVM原理淺析入門瞭解簡介 Java語言組成部分 javap命令使用

The Java Virtual MachineJava虛擬機器是Java平臺的基石。是java實現硬體和作業系統的獨立性(也就是無關性)，生成極小體積的編譯程式碼,以及保護使用者免受惡意程式攻擊的的關鍵技術組成部分。Java虛擬機器是一種抽象計算機器。像真正的計算機一樣，它有一個指令集以及在執行時各種記憶

SpringBoot15-springboot核心-Spring Boot執行原理

這篇來先通過學習分析Spring Boot的執行原理後，根據已掌握的知識來自定義一個start pom。 Spring Boot關於自動配置的原始碼在spring-boot-autoconfigure-xxx.jar內。若想檢視有哪些自動配置，可以檢

(轉）Spark核心技術原理透視一（Spark執行原理）

Spark核心技術原理透視一（Spark執行原理）在大資料領域，只有深挖資料科學領域，走在學術前沿，才能在底層演算法和模型方面走在前面，從而佔據領先地位。來源：加米穀大資料在大資料領域，只有深挖資料科學領域，走在學術前沿，才能在底層演算法和模型方面走在前面，從而佔據領先地位。 Sp

webpack核心概念詳解及其執行原理

* Entry: 入口, webpack執行構建的第一步將從Entry開始，可抽象成輸入 * Module: 模組，在webpcak中一切皆模組，一個模組對應一個檔案。webpack會從配置的Entry開始遞迴找出所有依賴的模組。 * Chunk: 程式碼塊，一個Chunk由多個模組組合

綜合學習---執行原理總結

/****************************************************************************/ /*****************************執行原理總結*********************************

[四] java8 函數語言程式設計收集器淺析收集器Collector常用方法執行原理內部實現

/** * Simple implementation class for {@code Collector}. * * @param <T> the type of elements to be collected * @param <R> the type of the r

[三]java8 函數語言程式設計Stream 概念深入理解 Stream 執行原理 Stream設計思路

這些流的方法是如何實現的?類StreamSupport提供了許多用於建立流的低階方法，所有這些方法都使用某種形式的Spliterator.一個Spliterator.是迭代器Iterator的並行版本它描述了一個（可能是無限的）元素集合，支援順序前進、批量遍歷，並將一部分輸入分割成另一個可並行處理的Split

一起學習Mybatis----mybatis的執行原理

mybatis的生命週期包含4部分： 1. SqlSessionFactoryBuilder 2.SqlSessionFactory

學習Mybatis(7)：Mybatis執行原理原始碼分析

Mybatis執行主要有三步： 1）建立SqlSessionFactory工廠物件一般使用的方法是使用SqlSessionFactoryBuilder生成器的build方法載入配置檔案生成： SqlSessionFactory sqlSessionFactory=new SqlSess

Docker學習總結（29）——Docker核心技術與實現原理

提到虛擬化技術，我們首先想到的一定是 Docker，經過四年的快速發展 Docker 已經成為了很多公司的標配，也不再是一個只能在開發階段使用的玩具了。作為在生產環境中廣泛應用的產品，Docker 有著非常成熟的社群以及大量的使用者，程式碼庫中的內容也變得非常龐大。同樣，由於

Spring學習10-SpringMVC原理及核心元件1

一、SpringMVC原理請求到來時，第一個接受這個請求的前端控制器叫DispatcherServlet（這個需要在web.xml中配置），後端控制器叫Controller。負責處理請求URL和後端控制器對映的叫HandMapping，它有多種型別，比較靈活，也是在一個xml檔案上進行配置。負責業務

機器學習十大演算法的核心思想、工作原理、適用情況及優缺點

機器學習十大演算法的每個演算法的核心思想、工作原理、適用情況及優缺點一、C4.5 演算法： ID3 演算法是以資訊理論為基礎，以資訊熵和資訊增益度為衡量標準，從而實現對資料的歸納分類。ID3 演算法計算每個屬性的資訊增益，並選取具有最高增益的屬性作為給定的測試屬性。 C4.5 演算法核心思想是ID3

.Net MVC 裡面的核心檔案Global.asax執行原理分析

這個 Global.asax檔案是MVC裡面的起始檔案，它不同於其它檔案比如，M層，V層和C層。他是一個獨立的可配置的檔案。因為.Net MVC把前後端完全分離，極度抽象的一個框架。或許導致了很多從WebForm轉過來的不適應。Global檔案就是此類。它與MVC裡面的篩選器，控

【PHP7核心剖析】3.3 Zend引擎執行過程

3.3 Zend引擎執行過程 Zend引擎主要包含兩個核心部分：編譯、執行：前面分析了Zend的編譯過程以及PHP使用者函式的實現，接下來分析下Zend引擎的執行過程。 3.3.1 資料結構執行流程中有幾個重要的資料結構，先看下這幾個

c語言程式-hello world-執行原理簡介

本文從一個最簡單C程式（hello）是如何被編譯和連結講起，描述了一個程式執行的原理。一、程式執行之前使用IDE（整合開發環境）的朋友們經常會有這樣的疑問：程式碼是怎麼從一個文字檔案變成可執行程式的呢？程式碼畢竟不是咒語，一個c程式在被執行之前其實經過了四個步驟，兩次編譯，彙編和連結。 1.預編

hadoop核心執行原理

我們通過下面這個天氣資料處理的例子來說明Hadoop的執行原理. 1、Map-Reduce的邏輯過程假設我們需要處理一批有關天氣的資料，其格式如下： · 按照ASCII碼儲存，每行一條記錄 · 每一行字元從0開始計數，第15個到第18

Java執行緒池的使用方式，核心執行原理、以及注意事項

Java執行緒池的使用方式，核心執行原理、以及注意事項執行緒池的緣由執行緒池的處理流程執行緒池的使用(ThreadPoolExecutor) 執行緒池的注意事項執行緒池的緣由 java中為了提高併發度，可以使用多執行緒共同

springboot深入學習(二)-----profile配置、執行原理、web開發

一、profile配置通常企業級應用都會區分開發環境、測試環境以及生產環境等等。spring提供了全域性profile配置的方式，使得在不同環境下使用不同的applicaiton.properties，走不同的配置。模板：application-{profile}.properties 示例：

Zigbee學習（二）之Zstack協議棧執行原理分析

Zigbee協議棧的實現方式採用的是分層的思想，分別有物理層、資料鏈路層（介質訪問控制層）、網路層和應用層。每一層都實現了不同的功能，但是每一層實現的功能對於其它層來說又是封閉的，如果要進行資料互通，需要呼叫一些API函式。這是一些淺顯的基本概念，百度一下都可以知道的啦！那

PHP7核心學習--語言的執行原理

相關推薦