The Vector-Thread Architecture（2004）

阿新 • • 發佈：2018-11-18

The Vector-Thread Architecture（2004）

向量-執行緒（VT）體系結構支援向量和多執行緒的無縫整合，從而靈活而緊湊的編碼應用程式的並行性和區域性性，能夠提供高效能的同時，保證了低功耗和小面積
- VT簡潔地編碼了大量的結構化並行，以一種簡單的微架構，通過避免複雜的控制和資料通路，同時減少了長導線上的活動，降低了功耗，並且獲得了高效能
嵌入式計算領域的問題：
- 應用越來越複雜，對高效能，低功耗資訊處理的需求也在增長
- 定製電路很適合，但是不斷增加的掩模和開發成本使其不適合在小規模的領域使用。同時固定的設計，不適合不斷變化的要求
- 多種特定領域的可程式設計處理器的異構混合的問題在於難以程式設計，並且當負載不均衡時，效率低下
- 通用處理器雖然靈活，但是過於複雜，並且效能不夠高或者是功耗太大。現代超標量處理器主要從非結構化應用的順序編碼中獲取並行性，但是嵌入式應用通常包含豐富的結構化並行性，其中的依賴關係也可以在靜態時確定。
VT的抽象模型
- VT的程式設計模型結合了向量和多執行緒計算
- 將傳統的控制處理器和虛擬處理器（VPs）向量相結合
- 虛擬處理器VP包含一組暫存器，可以執行一組封裝在原子指令塊（AIB）中的類RISC指令
- VPs不包括PC或者其它隱式的取指機制，所有的指令塊都由CP/VP本身顯式的請求
- VT尤其擅長於執行迴圈，每個VP執行迴圈中的一次，CP會剝離迴圈，進行控制
  - CP使用向量取指指令將AIBs廣播到所有的VPs，同時CP可以使用向量load/store指令來高效的完成資料在記憶體和VP暫存器之間的移動
  - 當迴圈之間有依賴關係時，VPs以單向環形拓撲結構連線，通過傳送和接收指令對資料進行傳輸
  - 當迴圈帶有條件指令，甚至內部迴圈時，每個VP使用執行緒的形式來獲取自身的AIB，並且指導自己的控制流，自主執行
- VPs除了執行迴圈迭代，還可以執行自由執行的執行緒，獨立於CP進行操作，並且可以從共享的工作佇列中檢索任務
VT的物理模型
- 組成：一個傳統的控制處理器+一個VT單元（VTU），用於執行VP程式碼。一個VTU中包括一組可以並行處理器的lanes。每個lane包括物理暫存器（用於儲存對映到lane的VPs的狀態）+功能單元（被VPs分時複用）
- VTU中每個lane相互獨立執行，擁有自己的小的AIB cache。每個lane還包括一個命令管理單元CMU，將來自CP的命令還在一個佇列中（cmd-Q），同時儲存著每個VP的執行緒掛起時，取指的地址。
- CMU選擇vector-fetch/thread-fetch命令執行，同時在AIB的cache tags中查詢地址。如果命中了cache，CMU傳送一條包括索引的指令到AIB cache。對於vector-fetch指令，所有的VPs都需要執行AIB中指令；對於thread-fetch指令，只有一個VP需要指令AIB中指令。
- CMU會將執行指令傳送到一個佇列中，從而將cache過程和執行過程解耦，實現重疊執行
- 執行過程：從AIB cache中，一條一條的讀取指令，然後為正確的VP執行。當執行指令是在vector fetch指令之後的，則當前VP會執行AIB中的所有指令，在轉移到另一個VP之前

The Vector-Thread Architecture（2004）

The Vector-Thread Architecture（2004）向量-執行緒（VT）體系結構支援向量和多執行緒的無縫整合，從而靈活而緊湊的編碼應用程式的並行性和區域性性，能夠提供高效能的同時，保證了低功耗和小面積 VT簡潔地編碼了大量的結構化並

Java Thread系列（十）Future 模式

業務 throw 而且代碼 ack void rri 是不是決定 Java Thread系列（十）Future 模式 Future 模式適合在處理很耗時的業務邏輯時進行使用，可以有效的減少系統的響應時間，提高系統的吞吐量。一、Future 模式核心思想如下的請求

Java Thread系列（五）synchronized

執行 java 釋放 lock java t 操作 bject 線程出現 Java Thread系列（五）synchronized synchronized鎖重入關鍵字 synchronized 擁有鎖重入的功能，也就是在使用 synchronized 時，當線程等到

Java Thread系列（二）線程狀態

做的 tor throws 前臺 bject 線程休眠 enume 死鎖做出 Java Thread系列（二）線程狀態一、線程的五種狀態新建狀態（New）：新創建了一個線程對象，尚未啟動。就緒狀態（Runnable）：也叫可運行狀態。線程對象創建後，其他線程調用

Java Thread系列（九）Master-Worker模式

線程支持需要列表 deque 開啟 exc oid src Java Thread系列（九）Master-Worker模式 Master-Worker模式是常用的並行設計模式. 一、Master-Worker 模式核心思想 Master-Worker 系統由兩個角

Java Thread系列（一）線程創建

nds list www imp tor 所有 clas HR dex Java Thread系列（一）線程創建 Java 中創建線程主要有三種方式：繼承 Thread、實現 Runnable 接口、使用 ExecutorService、Callable、Future 實現

Java Thread系列（三）線程安全

AI 資源習慣 get string tar rup end 就是 Java Thread系列（三）線程安全一、什麽是線程安全線程安全概念：當多個線程訪問某一個類(對象或方法)時，這個類始終都能表現出正確的行為，那麽這個類(對象或方法)就是線程安全的。線程安全來

Java Thread系列（四）線程通信

ice 集合就是 int name 發出 max 執行生產 Java Thread系列（四）線程通信一、傳統通信 public static void main(String[] args) { //volatile實現兩個線程間數據可見性 priva

Til the Cows Come Home（Dijkstra）

pan std ble book amp TP col AC home Dijkstra （迪傑斯特拉）最短路算法，算是模板 POJ - 2387 1 #include<iostream> 2 #include<algorithm> 3 #

【Codeforces】CF 2 B The least round way（dp）

clu 更新 .org ORC 我們 std 預處理 blank putc 題目傳送門：QWQ 分析求結尾0的數量QwQ。 10只能是$ 2 \times 5 $，我們預處理出每個數因子中2和5的數量。我們接著dp出從左上到右下的經過的最少的

6.1 Architecture（YARN）

YARN的基本思想是將資源管理和作業排程/監控的功能分解為單獨的守護程序。我們的想法是擁有一個全域性ResourceManager（RM）和每個應用程式ApplicationMaster（AM）。應用程式可以是單個作業，也可以是作業的DAG。 ResourceManager和NodeManager構成了資料

【C++】Vector的知識點（一）

概況 vector是c++中的容器，作用相當於動態陣列，可以用於存放各種型別（int、double、string、struct）的資料基本操作尾部插入元素 vec.push_back(a)

C++ vector的用法（整理）

vector 是向量型別，它可以容納許多型別的資料，如若干個整數，所以稱其為容器。vector 是C++ STL的一個重要成員，使用它時需要包含標頭檔案： #include<vector>; 一、vector 的初始化：可以有五種方式,舉例說明如下： (1) vector&

貼一個Thread 程式碼（自用）

貼一個Thread 執行程式碼請將執行函式放在MainMethod()中！詳細： 1、帶有 Init()函式； 2、帶有Abort()函式；另設計了AbortAsync()任務。 3、加入Watchdog！ using System; using System.D

【LeetCode】566. Reshape the Matrix 解題報告（Python）

作者：負雪明燭 id： fuxuemingzhu 個人部落格： http://fuxuemingzhu.cn/ 目錄題目描述題目大意解題方法變長陣列求餘法維護行列

TZOJ--3968: The K-th Substring （模擬）

3968: The K-th Substring 時間限制(普通/Java):1000MS/3000MS 記憶體限制:65536KByte 描述 bdep__ gets a string of length N (1 ≤ N ≤ 100

Views versus the Data Source View（MS_SSAS）

-_-! MAIN The Data Source View (DSV) is one of the places where we can create an interface between Analysis Services and the underlying r

Python：What the f*ck Python（上）

GitHub 上有一個名為《What the f*ck Python!》的專案，這個有趣的專案意在收集 Python 中那些難以理解和反人類直覺的例子以及鮮為人知的功能特性，並嘗試討論這些現象背後真正的原理！原版地址：https://github.com/satwikkansal/wtfpython

The partial sum problem （DFS）nyoj

The partial sum problem 時間限制：1000 ms | 記憶體限制：65535 KB 輸入 There are multiple test cases. Each test case contains three lines.The first

The Vector-Thread Architecture（2004）

The Vector-Thread Architecture（2004）

相關推薦