【體系結構系列】指令排程

阿新 • • 發佈：2021-01-04

技術標籤：計算機基礎系列

指令排程

動態分支預測

重要性

在n-流出的處理機中，遇到分支指令的可能性增加了n倍。
要給處理器連續提供指令，就需要準確地預測分支。

動態分支預測

動態分支預測
- 在程式執行時，根據分支指令過去的表現來預測其將來的行為。
- 如果分支行為發生了變化，預測結果也跟著改變。
- 有更好的預測準確度和適應性。
分支預測的有效性取決於
- 預測的準確性
- 預測正確和不正確兩種情況下的分支開銷
- 決定分支開銷的因素：
  - 流水線的結構
  - 預測的方法
  - 預測錯誤時的恢復策略等

目標與關鍵問題

採用動態分支預測技術的目標
- 預測分支是否成功
- 儘快找到分支目標地址（或指令）（避免控制相關造成流水線停頓）
需要解決的關鍵問題
- 如何記錄分支的歷史資訊，要記錄哪些資訊？
- 如何根據這些資訊來預測分支的去向，甚至提前取出分支目標處的指令？

預測錯誤時的處理方法

在預測錯誤時，要作廢已經預取和分析的指令，恢復現場，並從另一條分支路徑重新取指令。

分支歷史表 BHT

概念
- Branch History Table，BHT
- 最簡單的動態分支預測方法。
- 用BHT來記錄分支指令最近一次或幾次的執行情況（成功還是失敗），並據此進行預測。
只有1個預測位的分支預測表
- 記錄分支指令最近一次的歷史，BHT中只需要1位二進位制位（最簡單）
2個預測位的分支預測
- 提高預測的準確度
- 研究結果表明：兩位分支預測的效能與n位（n>2）分支預測的效能差不多。
預測步驟
- 分支預測：當分支指令到達譯碼段（ID）時，根據從BHT讀出的資訊進行分支預測。
  - 若預測正確，就繼續處理後續的指令，流水線沒有斷流。
  - 否則，就要作廢已經預取和分析的指令，恢復現場，並從另一條分支路徑重新取指令。
- 狀態修改。
BHT的作用範圍
- 判定分支是否成功所需的時間大於確定分支目標地址所需的時間。
BHT的作用效果
- 對於SPEC89測試程式來說，具有大小為4KB 的BHT的預測準確率為82%～99%。
- 一般來說，採用4KB的BHT就可以了。
BHT的實現
- BHT可以跟分支指令一起存放在指令Cache中。
- 也可以用一塊專門的硬體來實現。

分支目標緩衝器BTB

概念
- 目標：將分支的開銷降為 0
- 方法：分支目標緩衝將分支成功的分支指令的地址和它的分支目標地址都放到一個緩衝區中儲存起來，緩衝區以分支指令的地址作為標識。
- 這個緩衝區就是分支目標緩衝器（Branch-Target Buffer，簡記為BTB，或者分支目標Cache （ranch-Target Cache）。
BTB的結構
- 看成是用專門的硬體實現的一張表格。
- 表格中的每一項至少有兩個欄位：執行過的成功分支指令的地址（作為該表的匹配標識）、預測的分支目標地址
BTB的操作
各種情況下的延遲
改進BTB——提升預測準確率
- 在分支目標緩衝器中增設一個至少是兩位的“分支歷史表”欄位
更進一步，在表中對於每條分支指令都存放若干條分支目標處的指令，就形成了分支目標指令緩衝器。

靜態指令排程

指令排程

找出不相關的指令序列，讓它們在流水線上重疊並行執行。
制約編譯器指令排程的因素
- 程式固有的指令級並行
- 流水線功能部件的延遲
部件延遲示例

指令排程例項

對於下面的原始碼，轉換成 MIPS 組合語言，在不進行指令排程和進行指令排程兩種情況下，分析其程式碼一次迴圈所需的執行時間。
```
for (i=1000; i>0; i --) 
	x[i] = x[i] + s;
```

先把該程式翻譯成MIPS 組合語言程式碼

Loop：L.D  F0, 0(R1)
    ADD.D F4, F0, F2
    S.D F4, 0(R1)
    DADDIU R1, R1, #-8
    BNE R1, R2, Loop

延遲分析
僅使用指令排程優化

進一步的優化：迴圈展開

把迴圈體的程式碼複製多次並按順序排放，然後相應調整迴圈的結束條件。
開發迴圈級並行的有效方法
示例：將例1 中的迴圈展開3 次得到4 個迴圈體，然後對展開後的指令序列在不排程和排程兩種情況下，分析程式碼的效能。假定R1 的初值為32 的倍數，即迴圈次數為4 的倍數。消除冗餘的指令，並且不要重複使用暫存器。
- 未展開：50%是空轉週期
- 展開且再次排程後：沒有空轉週期

迴圈展開和指令排程的注意事項

保證正確性
注意有效性
使用不同的暫存器
刪除多餘的測試指令和分支指令，並對迴圈結束程式碼和新的迴圈體程式碼進行相應的修正。
注意對儲存器資料的相關性分析
注意新的相關性

【體系結構系列】指令排程

技術標籤：計算機基礎系列指令排程動態分支預測重要性在n-流出的處理機中，遇到分支指令的可能性增加了n倍。要給處理器連續提供指令，就需要準確地預測分支。

【體系結構系列】流水線實現

技術標籤：計算機基礎系列計算機體系結構流水線的實現非流水通路 MIPS（子集）資料通路（非流水）例項

【體系結構】第2章資料表示、定址方式與指令系統

一、指令集架構 1、資料來源累加器、堆疊、暫存器和儲存單元 2、指令集架構的三種類型

【自學Python系列】Python 基礎 (內建資料結構-列表，集合，字典）之列表

列表開篇講了一些語言的基礎，今天開始記錄一些學習中的其他python的知識。

【ClickHouse 技術系列】- ClickHouse 中的巢狀資料結構

簡介：本文翻譯自 Altinity 針對 ClickHouse 的系列技術文章。面向聯機分析處理（OLAP）的開源分析引擎 ClickHouse，因其優良的查詢效能，PB級的資料規模，簡單的架構，被國內外公司廣泛採用。本系列技術文章，將

【面試題系列】——Java基礎

本文主要包括Java基礎及面向物件相關面試題。目錄1，Java科普1.1 為什麼安裝包要分JDK和JRE？1.2 為什麼Java語言是跨平臺的？1.3 為什麼安裝完JDK後要設定環境變數？1.4 Java和C++區別2，資料型別&變數2.1 boolean佔

【Gin-API系列】請求和響應引數的檢查繫結（二）

引數設計一套合格的API的服務需要規範的輸入請求和標準的輸出響應格式。為了更規範的設計，也是為了程式碼的可讀性和擴充套件性，我們需要對Http請求和響應做好模型設計。

【Gin-API系列】需求設計和功能規劃（一）

場景需求資料庫儲存2個模型，每個模型都有一個或多個IP欄位，需要通過 Golang Http Api(Restful Api) 返回 IP 資訊。

【Gin-API系列】配置檔案和資料庫操作（三）

我們前面已經實現了API的基礎版本，能對引數校驗和返回指定資料，這一章，我們將對主機和交換機進行建模，存入資料庫。

【swift 結構體】

//swift結構體的用法與類是極其相似的，在定義，初始化，例項，呼叫幾乎是一模一樣的。除了結構體不具有繼承的相關屬性方法，他們在用法上完全可以等同。

【Gin-API系列】Gin中介軟體之日誌模組（四）

日誌是程式開發中必不可少的模組，同時也是日常運維定位故障的最重要環節之一。一般日誌類的操作包括日誌採集，日誌查詢，日誌監控、日誌統計等等。本文，我們將介紹日誌模組在Gin中的使用。

【Gin-API系列】Gin中介軟體之鑑權訪問（五）

在完成中介軟體的介紹和日誌中介軟體的程式碼後，我們的程式已經基本能正常跑通了，但如果要上生產，還少了一些必要的功能，例如鑑權、異常捕捉等。本章我們介紹如何編寫鑑權中介軟體。

【Azure DevOps系列】Azure DevOps構建併發布Nuget程式包

在Azure DevOps中，管道可以用來構建解決方案，O(∩_∩)O哈哈~快萬能了，本章主要介紹如何建立Nuget包並且將其釋出到Nuget伺服器的過程。

【Gin-API系列】守護程序和平滑重啟（八）

生產環境的API服務我們都會部署在Linux伺服器上，為了不受終端狀態的影響，啟動服務的時候會讓服務在後臺執行。那麼如何讓服務在後臺執行呢，目前有2種常見的方法。

【Azure DevOps系列】使ASP.NET Core應用程式託管到Azure Web App Service

使用Azure DevOps Project設定ASP.NET專案我們需要先在Azure面板中建立一個Azure WebApp服務，此處步驟我將省略，然後點選部署中心如下圖所示：

【SpringBoot DB 系列】h2databse 整合示例 demo

【SpringBoot DB 系列】h2databse 整合示例 demo h2dabase 基於記憶體的資料庫，更常見於嵌入式資料庫的使用場景，依賴小，功能齊全；一般來講，正常的商業專案用到它的場景不多，但是在一些特殊的 case 中，還是

【SpringBoot DB 系列】Jooq 初體驗

【SpringBoot DB 系列】Jooq 初體驗 java 環境中，說到資料庫的操作，我們通常會想到的是 mybatis 或者 hibernate，今天給大家介紹一個國內可能用得不太多的操作方式 JOOQ，一款基於 Java 訪問關係型資料庫的工具

【Azure DevOps系列】Azure DevOps構建併發布.NET5應用程式

Azure App Service 獨立部署在Azure App Service中我們可以通過獨立部署進行部署我們的.NET5應用程式，因為它不會依賴目標系統上的環境，並且所有元件（包括librarys和執行時）都與該應用程式一起使用，並且與其他應

【Azure DevOps系列】如何在Azure DevOps上構建Docker映象（一）

建立Pipeline trigger: - master pool: vmImage: \'windows-latest\' steps: - task: DotNetCoreCLI@2 inputs: command: \'restore\'

【CV/Matlab系列】基於小波的音訊訊號去噪Matlab實現

DATE: 2010.10.17 文章目錄 1、前言2、語音去噪效果圖2.1、示例12.2、示例2 1、前言在之前的時候，畢業設計中實現了基於小波的音訊訊號去噪的GUI介面，展示如下：

【體系結構系列】指令排程

指令排程

動態分支預測

靜態指令排程

相關推薦