深入理解計算機系統家庭作業第六章

阿新 • • 發佈：2018-12-31

***6.23

等價於求xr(1 - x)的最大值，由代數知識得x=0.5的時候取得最大。

***6.24

0.5 * 60 / 12000 * 1000 + 60 / 12000 * 1000 /500 + 3 = 5.51ms

***6.25

定位時間 = 3 + 2.5 = 5.5ms

A. 3072 / 500 * 5 + 5.5 = 36.22ms

B. 5.5 * 3072 = 16896ms

6.26,6.27 根據公式C = B * E * S即可推得，此處略之

***6.28

A. 0x1238, 0x1239, 0x123a, 0x123b

B. 0x8a4, 0x8a5, 0x8a6, 0x8a7 0x704, 0x705, 0x706, 0x707

***6.29

A. 0x1bdc, 0x1bdd, 0x1bde, 0x1bdf

B. 0xe34, 0xe35, 0xe36, 0xe37

C. 0x18f0, 0x18f1, 0x18f2, 0x18f3 0xb0, 0xb1, 0xb2, 0xb3

D. 不會命中

***6.30

B. 1.不命中，有效位為0

2.命中。在1中已載入

3.命中。值為D0

***6.31

A. C= E*B*S = 128

B. CO 最後兩位

CI 除去最後兩位的後三位

CT 前8位

***6.32

A. 0011100011000

B. CO 0x0

CI 0x6

CT 0x38

沒有命中

***6.33

A. 1011011101100

B. CO 0x0

CI 0x3

CT 0xB7

沒有命中

***6.34

0x1314, 0x1315, 0x1316, 0x1317

0x1794, 0x1795, 0x1796, 0x1797

***6.35

快取一共有兩個塊，src[0],src[2],dst[0],dst[2]訪問快取第一個塊，src[1],src[3],dst[1],dst[3]訪問快取第二個塊。

dst陣列

m h m h

m m h m

m h m h

m m h m

src陣列

m m m m

***6.36

當總大小為128時，能容納下src與dst陣列中的所有元素

dst陣列

m h h h

src陣列

m h h h

***6.37

A. x[0][i]和x[1][i]是同一個快取條目。不命中率為100%，屬於交叉不命中

B. 快取大小可容納陣列所有內容。不命中率為1/8。

C. x[0][i]和x[1][i]載入到不同行。不命中率為1/8.

D. 不能，存在冷不命中。

E. 能。加大塊大小能減小冷不命中概率。

***6.38

N=64時：

sumA: 1/4

sumB: 1

sumC: 1/2

N= 60時：

sumA ,sumB,sumC的快取不命中率均為 1/4

比較難判斷的是N = 60時sumB的快取不命中率（sumC與sumB是一樣的），我寫了一個函式返回不命中次數，將形參n賦值60即可。

//快取記憶體命中率函式，返回不命中次數
int noHitPercentage(int n)
{
	//不命中的次數
	int result = 0;
	//總共要迴圈的次數
	int count;
	//儲存塊的標記位
	int a[256];
	for(int i =0;i < 256;i++)
	{
		a[i] = -1;
	}
	for(int j = 0;j < n;j++)
		for(int i = 0;i < n;i++)
		{
			//求出這個數的相對索引
			count = i * n + j;
			//求這個索引對應的塊號
			int blockNo = (count/4) % 256;
			//求出標記t
			int t = (count/4)/256;
			//如果標記位不相等則不明中
			if(t != a[blockNo])
			{
				a[blockNo] = t;
				result++;
			}


		}

		return result;	
}

***6.39

A. 16 * 16 * 4 = 1024

B. 64

C. 1/16

***6.40

A. 1024

B. 256

C. 1/4

***6.41

A. 1024

B. 64 + 64 = 128

C. 1/8

***6.42

25%

***6.43

25%

***6.44

100%

***6.46

void betterTranspose(int *dst,int *src,int dim)
{
<span style="white-space:pre">	</span>int i, j;
<span style="white-space:pre">	</span>int iCount,jCount;


<span style="white-space:pre">	</span>//以4 * 4 的方陣為單位依次計算，增加了寫的快取命中率，多個元素一起讀寫還減少了迴圈開銷
<span style="white-space:pre">	</span>for(i = 0;i < dim - 3;i += 4)
<span style="white-space:pre">	</span>{
<span style="white-space:pre">		</span>iCount = i * dim;
<span style="white-space:pre">		</span>for(j = 0;j < dim - 3;j += 4)
<span style="white-space:pre">		</span>{
<span style="white-space:pre">			</span>jCount = j * dim;


<span style="white-space:pre">			</span>dst[jCount + i] = src[iCount + j];      //dst[j][i] = src[i][j]
<span style="white-space:pre">			</span>dst[jCount + i + 1] = src[iCount + dim + j];  //dst[j][i + 1] = src[i + 1][j]
<span style="white-space:pre">			</span>dst[jCount + i + 2] = src[iCount + dim * 2 + j];   //dst[j][i + 2] = src[i + 2][j]
<span style="white-space:pre">			</span>dst[jCount + i + 3] = src[iCount + dim * 3 + j];   //dst[j][i + 3] = src[i + 3][j]


<span style="white-space:pre">			</span>dst[jCount + dim + i] = src[iCount + j + 1];      //dst[j + 1][i] = src[i][j + 1]
<span style="white-space:pre">			</span>dst[jCount + dim + i + 1] = src[iCount + dim + j + 1];  //dst[j + 1][i + 1] = src[i + 1][j + 1]
<span style="white-space:pre">			</span>dst[jCount + dim + i + 2] = src[iCount + dim * 2 + j + 1];   //dst[j + 1][i + 2] = src[i + 2][j + 1]
<span style="white-space:pre">			</span>dst[jCount + dim + i + 3] = src[iCount + dim * 3 + j + 1];   //dst[j + 1][i + 3] = src[i + 3][j + 1]


<span style="white-space:pre">			</span>dst[jCount + dim * 2 + i] = src[iCount + j + 2];      //dst[j + 2][i] = src[i][j + 2]
<span style="white-space:pre">			</span>dst[jCount + dim * 2 + i + 1] = src[iCount + dim + j + 2];  //dst[j + 2][i + 1] = src[i + 1][j + 2]
<span style="white-space:pre">			</span>dst[jCount + dim * 2 + i + 2] = src[iCount + dim * 2 + j + 2];   //dst[j + 2][i + 2] = src[i + 2][j + 2]
<span style="white-space:pre">			</span>dst[jCount + dim * 2+ i + 3] = src[iCount + dim * 3 + j + 2];   //dst[j + 2][i + 3] = src[i + 3][j + 2]


<span style="white-space:pre">			</span>dst[jCount + dim * 3 + i] = src[iCount + j + 3];      //dst[j + 3][i] = src[i][j + 3]
<span style="white-space:pre">			</span>dst[jCount + dim * 3 + i + 1] = src[iCount + dim + j + 3];  //dst[j + 3][i + 1] = src[i + 1][j + 3]
<span style="white-space:pre">			</span>dst[jCount + dim * 3 + i + 2] = src[iCount + dim * 2 + j + 3];   //dst[j + 3][i + 2] = src[i + 2][j + 3]
<span style="white-space:pre">			</span>dst[jCount + dim * 3 + i + 3] = src[iCount + dim * 3 + j + 3];   //dst[j + 3][i + 3] = src[i + 3][j + 3]
<span style="white-space:pre">			</span>
<span style="white-space:pre">		</span>}
<span style="white-space:pre">	</span>}


<span style="white-space:pre">	</span>//記錄當前行和列的索引，以便執行完剩餘的項
<span style="white-space:pre">	</span>int curIndex = i;


<span style="white-space:pre">	</span>//處理剩餘項，簡單的交換處理
<span style="white-space:pre">	</span>for(i = 0;i < curIndex;i++)
<span style="white-space:pre">		</span>for(j = curIndex;j < dim;j++)
<span style="white-space:pre">		</span>{
<span style="white-space:pre">			</span>dst[j * dim + i] = src[i * dim + j];
<span style="white-space:pre">		</span>}


<span style="white-space:pre">	</span>for(i = curIndex;i < dim;i++)
<span style="white-space:pre">		</span>for(j = 0;j < dim;j++)
<span style="white-space:pre">		</span>{
<span style="white-space:pre">			</span>dst[j * dim + i] = src[i * dim + j];
<span style="white-space:pre">		</span>}
}

***6.47

void better_col_convert(int *G,int dim)
{
	int i, j;
	int iCount,jCount;

	//以4 * 4 的方陣為單位依次計算，增加了寫的快取命中率，多個元素一起讀寫還減少了迴圈開銷
	for(i = 0;i < dim - 3;i += 4)
	{
		iCount = i * dim;
		for(j = 0;j < dim - 3;j += 4)
		{
			jCount = j * dim;

			G[jCount + i] = G[iCount + j] || G[jCount + i];      //G[j][i] = G[i][j] || G[j][i]
			G[jCount + i + 1] = G[iCount + dim + j] || G[jCount + i + 1];  //G[j][i + 1] = G[i + 1][j] || G[j][i + 1]
			G[jCount + i + 2] = G[iCount + dim * 2 + j] || G[jCount + i + 2];   //G[j][i + 2] = G[i + 2][j] || G[j][i + 2]
			G[jCount + i + 3] = G[iCount + dim * 3 + j] || G[jCount + i + 3];   //G[j][i + 3] = G[i + 3][j] || G[j][i + 3]

			G[jCount + dim + i] = G[iCount + j + 1] || G[jCount + dim + i];      //G[j + 1][i] = G[i][j + 1] || G[j + 1][i]
			G[jCount + dim + i + 1] = G[iCount + dim + j + 1] || G[jCount + dim + i + 1];  //G[j + 1][i + 1] = G[i + 1][j + 1] || G[j +1][i + 1]
			G[jCount + dim + i + 2] = G[iCount + dim * 2 + j + 1] || G[jCount + dim + i + 2];   //G[j + 1][i + 2] = G[i + 2][j + 1] || G[j +1][i + 2]
			G[jCount + dim + i + 3] = G[iCount + dim * 3 + j + 1] || G[jCount + dim + i + 3];   //G[j + 1][i + 3] = G[i + 3][j + 1] || G[j + 1][i + 3]

			G[jCount + dim * 2 + i] = G[iCount + j + 2] || G[jCount + dim * 2 + i];      //G[j + 2][i] = G[i][j + 2] || G[j +2][i]
			G[jCount + dim * 2 + i + 1] = G[iCount + dim + j + 2] || G[jCount + dim * 2 + i +1];  //G[j + 2][i + 1] = G[i + 1][j + 2] || G[j +2][i + 1]
			G[jCount + dim * 2 + i + 2] = G[iCount + dim * 2 + j + 2] || G[jCount + dim * 2 + i + 2];   //G[j + 2][i + 2] = G[i + 2][j + 2] || G[j +2][i + 2]
			G[jCount + dim * 2+ i + 3] = G[iCount + dim * 3 + j + 2] || G[jCount + dim * 2 + i + 3];   //G[j + 2][i + 3] = G[i + 3][j + 2] || G[j + 2][i + 3]

			G[jCount + dim * 3 + i] = G[iCount + j + 3] || G[jCount + dim * 3 + i];      //G[j + 3][i] = G[i][j + 3] || G[j +3][i]
			G[jCount + dim * 3 + i + 1] = G[iCount + dim + j + 3] || G[jCount + dim * 3 + i + 1];  //G[j + 3][i + 1] = G[i + 1][j + 3] || G[j +3][i + 1]
			G[jCount + dim * 3 + i + 2] = G[iCount + dim * 2 + j + 3] || G[jCount + dim * 3 + i + 2];   //G[j + 3][i + 2] = G[i + 2][j + 3] || G[j + 3][i + 2]
			G[jCount + dim * 3 + i + 3] = G[iCount + dim * 3 + j + 3] || G[jCount + dim * 3 + i + 3];   //G[j + 3][i + 3] = G[i + 3][j + 3] || G[j + 3][i + 3]

		}
	}

	//記錄當前行和列的索引，以便執行完剩餘的項
	int curIndex = i;

	//處理剩餘項，簡單的交換處理
	for(i = 0;i < curIndex;i++)
		for(j = curIndex;j < dim;j++)
		{
			G[j * dim + i] = G[i * dim + j] || G[j * dim + i];
		}

		for(i = curIndex;i < dim;i++)
			for(j = 0;j < dim;j++)
			{
				G[j * dim + i] = G[i * dim + j] || G[j * dim + i];
			}
}

深入理解計算機系統家庭作業第六章

/* ***6.23 */ 等價於求xr(1 - x)的最大值，由代數知識得x=0.5的時候取得最大。 /* ***6.24 */ 0.5 * 60 / 12000 * 1000 + 60 / 12000 * 1000 /500 + 3 = 5.51ms /* ***6

深入理解計算機系統家庭作業第三章

/* ***3.54 ***寫出decode2的原型*/ int decode2(int x ,int y, int z) { int a = z - y; int b = (a << 15) >> 15; return (x ^ a) *

深入理解計算機系統家庭作業第五章

/* ***5.15 */ A. 畫圖略 B. 3 C. 1 D. 乘法不在關鍵路徑上，故乘法可以按流水線執行 /* ***5.16 */ A. 每次要載入兩個資料，故至少需要兩個週期 B. 迴圈展開並沒有改變關鍵路徑長 /* ***5.1

深入理解計算機系統家庭作業第四章(4.43-4.54)

/* *****4.43 */ A. 根據4.6可知，push %esp 是將%esp的舊值壓入棧中；而這段程式碼壓入的新值，兩者不一致。 B. 將%esp的舊值先放入另一個暫存器中再進行操作 movl REG %eax sub

CSAPP深入理解計算機系統(第二版)第三章家庭作業答案

《深入理解計算機系統(第二版)》CSAPP 第三章家庭作業這一章介紹了AT&T的彙編指令比較重要本人完成了《深入理解計算機系統(第二版)》(以下簡稱CSAPP)第三章的家庭作業，並與網上的一些答案進行了對比修正。感謝博主summerhust的整理，以下貼出AT&T常用匯編指令

深入理解計算機系統大作業

摘要本論文從一個程式檔案hello.c出發，通過講述該檔案實現P2P,O2O的過程，簡單地展現了計算機系統的工作原理，並且回顧了許多實用的工具。關鍵詞：P2P,O2O，計算機系統，程式；第1章概述 1.1 Hello簡介 P2P 1.編譯過程 2. 建立並執行程

《深入理解計算機系統(原書第2版)》pdf

出版者的話譯者序前　言第1章　計算機系統漫遊1 1.1　資訊就是位+上下文1 1.2　程式被其他程式翻譯成不同的格式3 1.3　瞭解編譯系統如何工作是大有益處的4 1.4　處理器讀並解釋儲存在儲存器中的指令5 1.4.1　系統的硬體組成5 1.4.2　執行hello程式7 1.5　快取記憶體至關重要7

哈工大計算機系統課後作業第七章7.13A的解釋

關於libm.a的問題，現解釋如下： 1. 正常情況下是如此結果： $ ar -t /usr/lib/x86_64-linux-gnu/libm.a ar: /usr/lib/x86_64-linux-gnu/libm.a: File format not recognized

[深入理解Android卷一全文-第六章]深入理解Binder

由於《深入理解Android 卷一》和《深入理解Android卷二》不再出版，而知識的傳播不應該因為紙質媒介的問題而中斷，所以我將在CSDN部落格中全文轉發這兩本書的全部內容。第6章深入理解Binder本章主要內容· 以MediaServer為切入點，對Binder的工作

《深入理解計算機系統》讀書筆記 —— 第二章資訊的表示和處理

> 本章主要研究了計算機中無符號數，補碼，浮點數的編碼方式，通過研究數字的實際編碼方式，我們能夠了解計算機中不同型別的資料可表示的值的範圍，不同算術運算的屬性，可以知道計算機是如何處理資料溢位的。瞭解計算機的編碼方式，對於我們寫出可以跨越不同機器，不同作業系統和編譯器組合的程式碼具有重要的幫助。 > @[T

[第六章] 深入理解計算機系統第三版家庭作業參考答案

6.22 磁軌數 d 與 r - x * r 成正比設 d = k(r - x * r) = kr(1 - x) 總容量 c = 2πxk(r^2)(1 - x) = 2πk(r^2)(x - x^2) 上式實際上是關於 x 的二次式，其對稱軸為 1/2，即當

深入理解計算機系統_3e 第四章家庭作業（部分） CS:APP3e chapter 4 homework

ray design sed copy default ror this 處理 implement 4.52以後的題目中的代碼大多是書上的，如需使用請聯系 [email protected] 流水線部分只寫了偶數題號的，這幾天太浮躁，落下了好多課。。。 4.

深入理解計算機系統_3e 第八章家庭作業 CS:APP3e chapter 8 homework

fig lar man message -- ali rail raise mat 8.9 關於並行的定義我之前寫過一篇文章，參考：並發與並行的區別 The differences between Concurrency and Parallel +----------

深入理解計算機系統_3e 第十一章家庭作業 CS:APP3e chapter 11 homework

cep serve 技術分享 apn only class control 相同法則註：tiny.c csapp.c csapp.h等示例代碼均可在Code Examples獲取 11.6 A. 書上寫的示例代碼已經完成了大部分工作：doit函數中的printf("%

《深入理解計算機系統第三版》第三章家庭作業參考答案

簡述最近看docker和k8s的底層實現原理,嚴重感覺自己對底層的知識瞭解不足，於是開始業餘時間深入看一些底層書籍，就找了本據說是理解整個計算機體系的入門書-《深入理解計算機系統》.直接買的最新的第三版，從第三章開始看的，第二章接下來有心情再看(看了幾眼全是

深入理解計算機系統(第二版) 家庭作業第八章

#include "csapp.h"#define N 2int main() { int status, i; pid_t pid; char errorInfo[128]; /* Parent creates N children */ for(i=0;i<N

[第五章] 深入理解計算機系統第三版家庭作業參考答案

5.13 A. 畫圖：關鍵路徑為第三幅圖加粗部分 B. 下界為浮點加法的延遲界限，CPE 為 3.00 C. 整數加法的延遲界限，CPE 為 1.00 D. 關鍵路徑上只有浮點加法 5.14 v

[第八章] 深入理解計算機系統第三版家庭作業參考答案

8.9 程序對併發麼？ AB × AC √ AD √ BC √ BD √ CD √ 8.10 A. fork B. longjmp execve C. setjmp 8.11 4次，畫畫程序圖就行了 8.12 8次

深入理解計算機系統第三版家庭作業答案-第二章

2.55-2.57答案：show_bytes 原始碼：#include<stdio.h> typedef unsigned char* byte_pointer; void show_bytes(byte_pointer ch, int len){ prin

深入理解計算機系統(第二版) 家庭作業第三章

根據簡單的推測，我們可以知道，imull的兩個物件是 ebx和edx，最後edx移動到了(eax)中，所以ebx和edx一個是 *s1.p，一個是s1.v，並且word_sum的12行的eax是result的prod的地址，也就是result的地址。而eax只在第5行賦值，所以result的地址是在8(%eb

深入理解計算機系統家庭作業第六章

相關推薦