北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)

上傳人：r*** IP屬地：貴州上傳時間：2022-03-08 格式：DOCX 頁數(shù)：16 大?。?02.25KB 積分：20 舉報 版權(quán)申訴

北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第2頁

北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第3頁

北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第4頁

北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第5頁

已閱讀5頁，還剩11頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上一、名詞解釋1、Cache 2:1 經(jīng)驗規(guī)則：大小為N的直接映像Cache的失效率約等于大小為N/2的兩路組相聯(lián)Cache的失效率。2、計算機(jī)體系結(jié)構(gòu)：指那些對程序員可見的系統(tǒng)屬性，還包括設(shè)計思想與體系結(jié)構(gòu)。3、同構(gòu)型多處理機(jī)：由多個同類型，至少擔(dān)負(fù)同等功能的處理機(jī)組成，同時處理同一作業(yè)中能并行執(zhí)行的多個任務(wù)。4、通道處理機(jī)：能夠執(zhí)行有限I/O指令，并且能夠被多臺外圍設(shè)備共享的小型DMA專用處理機(jī)。5、堆棧型機(jī)器：其CPU中存儲操作數(shù)的主要單元是堆棧。6、Victim Cache：在Cache與下一級存儲器的數(shù)據(jù)通路之間增設(shè)一個全相聯(lián)的小Cache，用來存放由于失效而

2、被丟棄（替換）的那些塊。7、RAID：廉價磁盤冗余陣列或獨立磁盤冗余陣列8、累加器型機(jī)器：其CPU中存儲操作數(shù)的主要單元是累加器9、透明性：在計算機(jī)技術(shù)中，對本來存在的事物或?qū)傩?，但從某種角度看又好象不存在的概念稱為透明性。10、向量處理機(jī)：面向向量型并行計算，以流水線結(jié)構(gòu)為主的并行處理計算機(jī)。11、通用寄存器型機(jī)器：CPU中存儲操作數(shù)的主要單元是通用寄存器。12、虛擬Cache：訪問Cache的索引和標(biāo)識都是虛擬地址的一部分。13、機(jī)群：機(jī)群是一種價格低廉、易于構(gòu)建、可擴(kuò)放性極強(qiáng)的并行計算機(jī)系統(tǒng)。它由多臺同構(gòu)或異構(gòu)的獨立計算機(jī)通過高性能網(wǎng)絡(luò)或局域網(wǎng)互連在一起，協(xié)同完成特定的并行計算任務(wù)。從用

3、戶的角度來看，機(jī)群就是一個單一、集中的計算資源。14、定向技術(shù)：當(dāng)流水線中出現(xiàn)數(shù)據(jù)沖突時，可以將計算結(jié)果從其產(chǎn)生的地方直接送到其他指令中需要它的地方，或所有需要它的功能單元，避免暫停。15、系列機(jī)：由同一廠家生產(chǎn)的具有相同的系統(tǒng)結(jié)構(gòu)，但具有不同組成和實現(xiàn)的一系列不同型號的機(jī)器。16、強(qiáng)制性失效：當(dāng)?shù)谝淮卧L問一個塊時，該塊不在Cache中，需從下一級存儲器中調(diào)入Cache，這就是強(qiáng)制性失效。17、失效率：CPU在第一級存儲器中找不到所需數(shù)據(jù)的概率。18、數(shù)據(jù)相關(guān)：對于兩條指令i（在前）和j（在后），如果下述條件之一成立，則稱指令j與指令i數(shù)據(jù)相關(guān)：（1）指令j使用指令i產(chǎn)生的結(jié)果；（2）指令j

4、與指令k數(shù)據(jù)相關(guān)，而指令k又與指令i數(shù)據(jù)相關(guān)。19、失效開銷：CPU向第二級存儲器發(fā)出訪問請求到把這個數(shù)據(jù)塊調(diào)入第一級存儲器所需的時間。20、容量失效：如果程序執(zhí)行時所需的塊不能全部調(diào)入Cache中，則當(dāng)某些塊被替換后，若又重新被訪問，就會發(fā)生失效。這種失效稱為容量失效。21、通道：傳輸信息的數(shù)據(jù)通路。計算機(jī)系統(tǒng)中傳送信息和數(shù)據(jù)的裝置。22、指令級并行：并行執(zhí)行兩條或兩條以上的指令。二、填空題：1、Cache失效可以分為（強(qiáng)制失效）、（沖突失效）和（容量失效）三種。2、說出三種對計算機(jī)發(fā)展非常關(guān)鍵的實現(xiàn)技術(shù):(邏輯電路) 、(磁盤)和(網(wǎng)絡(luò)) 。3、2:1 Cache經(jīng)驗規(guī)則是指大小為N的（直

5、接映象）Cache的失效率約等于大小為N/2的（兩路組相聯(lián)）Cache的失效率。4、單機(jī)和多機(jī)系統(tǒng)中并行性發(fā)展的技術(shù)途徑有：（時間重疊）、（資源重復(fù)）、（資源共享)。5、通道分為（字節(jié)多路）通道、（選擇）通道和（數(shù)組多路）通道三種類型6、流水線中的相關(guān)有（名）相關(guān)、（數(shù)據(jù)）相關(guān)和（控制）相關(guān)三種。7、在處理機(jī)中，若指令序列完成的順序總是與它們開始執(zhí)行的順序保持一致，則只可能出現(xiàn)（名）相關(guān),否則就有可能出現(xiàn)（名相關(guān)）、（數(shù)據(jù)相關(guān)）和（控制）相關(guān)。8、輸入/輸出系統(tǒng)包括（外部設(shè)備(I/O設(shè)備，輔助存儲器)）和（其與主機(jī)之間的控制部分）9、設(shè)計I/O系統(tǒng)的三個標(biāo)準(zhǔn)是（成本）、（性能）和（容量）。

6、10、存儲器層次結(jié)構(gòu)設(shè)計技術(shù)的基本依據(jù)是程序的（訪問的局部性原理）。11、相聯(lián)度越高，（沖突）失效就越少；（強(qiáng)制性）失效不受Cache容量的影響，但（容量）失效卻隨著容量的增加而減少。12、在虛擬存儲器中，一般采用（全相連）地址映象方法和（LRU）更新策略。13、計算機(jī)系統(tǒng)中提高并行性的技術(shù)途徑有（時間重疊）、（資源重復(fù)）、（資源共享)三種。在高性能單處理機(jī)的發(fā)展中，起主導(dǎo)作用的是（時間重疊原理）。14、對向量的處理有（水平處理）方式、（垂直處理）方式和（分組處理）方式。15、同構(gòu)型多處理機(jī)和異構(gòu)型多處理機(jī)所采用的提高并行性的技術(shù)途徑分別是（時間重疊）和（資源重復(fù)）。16、地址映象方法

7、有(全相聯(lián))、(組相聯(lián))和(直接相聯(lián))三種，其中(全相聯(lián))的沖突率最低。17、軟件兼容有（向上兼容）、（向下兼容）、（向前兼容）和（向后兼容）四種。其中（向后兼容）是軟件兼容的根本特征。18、流水線數(shù)據(jù)相關(guān)(沖突)有三種，分別是：（寫后讀相關(guān)(WAR)）、（讀后寫相關(guān)(RAW)）和（寫后寫相關(guān)(WAW)）。 19、從處理數(shù)據(jù)的角度，并行性等級可以分為字串位串、（字串位并）、（字并位串）和全并行。20、從執(zhí)行程序的角度看，并行性等級可以分為：(指令內(nèi)部并行)、（指令級并行）、（線程級并行）、（任務(wù)級或過程級并行）和作業(yè)或程序級并行。21、在存儲層次中，常用的替換算法有（隨機(jī)法）、（FIFO）和（

8、LRU）。22、設(shè)有一個“Cache-主存”層次，Cache為4塊，主存為8塊；試分別對于以下2種情況，計算訪存塊地址為5時的索引（index）。(1)組相聯(lián)，每組兩塊；索引為（1）。5%2=1(2)直接映象；索引為（1）。5%423、根據(jù)CPU內(nèi)部存儲單元類型，可將指令集結(jié)構(gòu)分為（堆棧）型指令集結(jié)構(gòu)、（累加器）型指令集結(jié)構(gòu)和（通用寄存器）型指令集結(jié)構(gòu)。三、簡答題1、簡述使用物理地址進(jìn)行DMA存在的問題，及其解決辦法。1）對于超過一頁的數(shù)據(jù)緩沖區(qū)，由于緩沖區(qū)使用的頁面在物理存儲器中不一定是連續(xù)的，所以傳輸可能會發(fā)生問題。2）如果DMA正在存儲器和緩沖區(qū)之間傳輸數(shù)據(jù)時，操作系統(tǒng)從存儲器中移出（或

9、重定位）一些頁面，那么，DMA將會在存儲器中錯誤的物理頁面上進(jìn)行數(shù)據(jù)傳輸。解決方法：使操作系統(tǒng)在I/O的傳輸過程中確保DMA設(shè)備所訪問的頁面都位于物理存儲器中，這些頁面被稱為是釘在了主存中。利用“虛擬DMA”技術(shù)，允許DMA設(shè)備直接使用虛擬地址，并在DMA期間由硬件將虛擬地址轉(zhuǎn)換為物理地址。在采用虛擬DMA的情況下，如果進(jìn)程在內(nèi)存中被移動，操作系統(tǒng)應(yīng)該能夠及時地修改相應(yīng)的DMA地址表。2、從目的、技術(shù)途徑、組成、分工方式、工作方式等5個方面對同構(gòu)型多處理機(jī)和異構(gòu)型多處理機(jī)做一比較（列表）。同構(gòu)型多處理機(jī)異構(gòu)型多處理機(jī)目的提高系統(tǒng)性能(可靠性、速度)提高系統(tǒng)使用效率技術(shù)途徑資源重復(fù)（機(jī)間互連）

10、時間重疊（功能專用化）組成同類型（同等功能）不同類項（不同功能）分工方式任務(wù)分布功能分布工作方式一個作業(yè)由多機(jī)協(xié)同并行完成一個作業(yè)由多機(jī)協(xié)同串行完成3、在指令集結(jié)構(gòu)設(shè)計中，應(yīng)該考慮哪些主要問題？1）指令集功能設(shè)計：主要有RISC和CISC兩種技術(shù)發(fā)展方向；尋址方式的設(shè)計：設(shè)置尋址方式可以通過對基準(zhǔn)程序進(jìn)行測試統(tǒng)計，察看各種尋址方式的使用頻度，根據(jù)適用頻度設(shè)置相應(yīng)必要的尋址方式；操作數(shù)表示和操作數(shù)類型：主要的操作數(shù)類型和操作數(shù)表示的選擇有，浮點數(shù)據(jù)類型（可以采用IEEE 754標(biāo)準(zhǔn)）、整型數(shù)據(jù)類型（8位、16位、32位的表示方法）、字符型（8位）、十進(jìn)制數(shù)據(jù)類型（壓縮十進(jìn)制和非壓縮十進(jìn)制數(shù)據(jù)表示

11、）等等。2）尋址方式的表示：可以將尋址方式編碼與操作碼中，也可將尋址方式作為一個單獨的域來表示。3）指令集格式的設(shè)計：有固定長度編碼方式、可變長編碼方式和混合編碼方式三種選擇。4、試以系列機(jī)為例，說明計算機(jī)體系結(jié)構(gòu)、計算機(jī)組成和計算機(jī)實現(xiàn)三者之間的關(guān)系。1）如在設(shè)計主存系統(tǒng)時，i）確定主存容量、編址方式、尋址范圍屬于計算機(jī)系統(tǒng)結(jié)構(gòu)。ii）確定主存周期、邏輯上是否采用并行主存、邏輯設(shè)計等屬于計算機(jī)組成。iii）選擇存儲芯片類型、微組裝技術(shù)、線路設(shè)計等屬于計算機(jī)實現(xiàn)。2）計算機(jī)組成是計算機(jī)系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn)。計算機(jī)實現(xiàn)是計算機(jī)組成的物理實現(xiàn)。一種體系結(jié)構(gòu)可以有多種組成。一種組成可以有多種實現(xiàn)。5、

12、任寫出五種降低Cache失效開銷的方法（Cache的優(yōu)化技術(shù)），并簡述其基本思想。1）讓讀失效優(yōu)先于寫：Cache中的寫緩沖器導(dǎo)致對存儲器訪問的復(fù)雜化，所以推遲對讀失效的處理并檢查寫緩沖器的內(nèi)容。2）寫緩沖合并：如果寫緩沖器中已經(jīng)有了待寫入的數(shù)據(jù)，就要把這次的寫入地址與寫緩沖器中已有的所有地址進(jìn)行比較，看是否有匹配的項。如果有地址匹配而對應(yīng)的位置又是空閑的，就把這次要寫入的數(shù)據(jù)與該項合并。3）請求字處理技術(shù)：從下一級存儲器調(diào)入Cache的塊中，只有請求字是立即需要的。所以應(yīng)盡早把請求字發(fā)送給CPU。4）非阻塞Cache技術(shù)：Cache失效時仍允許CPU進(jìn)行其他的命中訪問。5）采用二級Cache

13、：第一級Cache小而快，第二級Cache容量大，即快和容量二者兼顧6、指令集結(jié)構(gòu)設(shè)計中表示尋址方式的主要方法有哪些？簡述這些方法的優(yōu)缺點。1）將尋址方式編于操作碼中，由操作碼在描述指令的同時也描述了相應(yīng)的尋址方式。優(yōu)缺點：這種方式譯碼快，但操作碼和尋址方式的結(jié)合不僅增加了指令的條數(shù)，導(dǎo)致了指令的多樣性，而且增加了CPU對指令譯碼的難度。2）為每個操作數(shù)設(shè)置一個地址描述符，由該地址描述符表示相應(yīng)操作數(shù)的尋址方式。優(yōu)缺點：這種方式譯碼較慢，但操作碼和尋址獨立，易于指令擴(kuò)展。7、軟件兼容有幾種？其中哪一種是軟件兼容的根本特征？1）軟件兼容：一個軟件可以不經(jīng)修改或者只需少量修改就可以由一臺計算機(jī)移植

14、到另一臺計算機(jī)上運(yùn)行。分為：向上、下、前、后兼容四種。2）上（下）：按某檔計算機(jī)編制的程序，不加修改就能運(yùn)行于比它高（低）檔的計算機(jī)。 3）后（前）兼容：按某個時期投入市場的某種型號計算機(jī)編制的程序，不加修改地就能運(yùn)行于在它之后（前）投入市場的計算機(jī)。4）向后兼容是一定要保證的，它是軟件兼容的根本特征，是系列機(jī)的根本特征。8、造成流水線“斷流”的主要原因是哪三種相關(guān)？簡述三種相關(guān)的基本思想。1）數(shù)據(jù)相關(guān)：指令j使用指令i產(chǎn)生的結(jié)果，或者指令j與指令k數(shù)據(jù)相關(guān)，指令k又與指令i數(shù)據(jù)相關(guān)。2）名相關(guān)：兩條指令使用相同的名，但他們之間并沒有數(shù)據(jù)流動。3）控制相關(guān)：由分支指令引起，需要根據(jù)分支指令的

15、執(zhí)行結(jié)果來確定后續(xù)指令是否執(zhí)行9、計算機(jī)體系結(jié)構(gòu)設(shè)計和分析中最經(jīng)常使用的三條基本原則是什么？并說出它們的含義。1）以經(jīng)常性事件為重點：對經(jīng)常發(fā)生的情況進(jìn)行優(yōu)化，使分配更多的資源，達(dá)到更高的性能或者分配更多的電能。2）Amdahl定律：加快某部件執(zhí)行速度所能獲得的系統(tǒng)性能加速比，受限于該部件的執(zhí)行事件占系統(tǒng)中總執(zhí)行事件的百分比。3）程序的局部性原理：程序執(zhí)行時所訪問的存儲器地址分布不是隨機(jī)的，而是相對的簇聚。10、通道分為哪三種類型？它們分別適合為哪種外圍設(shè)備服務(wù)？1）字節(jié)多路通道。一種簡單的共享通道，主要為多臺低速或中速的外圍設(shè)備服務(wù)。2）數(shù)組多路通道。適于為高速設(shè)備服務(wù)。3）選擇通道。為

16、多臺高速外圍設(shè)備（如磁盤存儲器等）服務(wù)的。11、調(diào)度分支延遲指令有哪三種常用方法？它們各有什么優(yōu)缺點。1）從前調(diào)度：可以有效提高流水線性能，但分支必須不依賴于被調(diào)度的指令。 2）從目標(biāo)處調(diào)度：分支轉(zhuǎn)移成功時，可以提高流水線性能，但由于復(fù)制指令，可能加大程序空間。 3）從失敗處調(diào)度：分支轉(zhuǎn)移失敗時，可以提高流水線性能。但如果分支轉(zhuǎn)移成功，必須保證被調(diào)度的指令對程序的執(zhí)行沒有影響。12、表示尋址方式的主要方法有哪些？簡述它們的優(yōu)缺點。1）將尋址方式編于操作碼中，由操作碼在描述指令的同時也描述了相應(yīng)的尋址方式。這種方式譯碼快，但操作碼和尋址方式的結(jié)合不僅增加了指令的條數(shù)，導(dǎo)致了指令的多樣性，而且

17、增加了CPU對指令譯碼的難度。2）為每個操作數(shù)設(shè)置一個地址描述符，由該地址描述符表示相應(yīng)操作數(shù)的尋址方式。這種方式譯碼較慢，但操作碼和尋址獨立，易于指令擴(kuò)展。13、簡述“Cache主存”層次與“主存輔存”層次的區(qū)別。Cache-主存層次主存-輔存層次目的為了彌補(bǔ)主存速度的不足為了彌補(bǔ)主存容量的不足存儲管理的實現(xiàn)全部由專用硬件實現(xiàn)主要由軟件實現(xiàn)訪問速度的比值（1級：2級）幾比一幾萬比一典型的塊（頁）大小幾十個字節(jié)幾百到幾千個字節(jié)CPU對第二級訪問方式可直接訪問均通過第一級不命中的CPU是否切換不切換切換到其它進(jìn)程14、試從3C失效的關(guān)系分析增加塊大小對Cache性能的影響。降低失效率最簡單的方法

18、是增加塊大小。（1）對于給定的 Cache 容量，當(dāng)塊大小增加（從16字節(jié)開始）時，失效率開始是下降，后來反而上升了。 (2) Cache 容量越大，使失效率達(dá)到最低的塊大小就越大。導(dǎo)致上述失效率先下降后上升的原因，在于增加塊大小會產(chǎn)生雙重作用。一方面它減少了強(qiáng)制性失效，因為局部性原理有兩方面的含義：時間局部性和空間局部性，增加塊大小利用了空間局部性；另一方面，由于增加塊大小會減少 Cache 中塊的數(shù)目，所以有可能會增加沖突失效。在 Cache 容量較小時，甚至還會增加容量失效。剛開始增加塊大小時，由于塊大小還不是很大，上述的第一種作用超過第二種作用，從而使失效率下降。但等到塊大小較大

19、時，第二種作用超過第一種作用，使失效率上升。 0簡述減小Cache失效開銷的幾種方法答：讓讀失效優(yōu)先于寫、寫緩沖合并、請求字處理技術(shù)、非阻塞Cache或非鎖定Cache技術(shù)、采用二級Cache。15、寫出三級Cache的平均訪問時間的公式。平均訪存時間命中時間失效率 × 失效開銷只有第I層失效時才會訪問第I1。設(shè)三級Cache的命中率分別為HL1、Hl2、HL3，失效率分別為Ml1、Ml2、ML3，第三級Cache的失效開銷為PL3.則平均訪問時間TA HL1Ml1Hl2Ml2(HL3ML3×PL3)16、有哪幾種向量處理方式？它們對向量處理機(jī)的結(jié)構(gòu)要求有何不同？1) 水

20、平處理方式：不適合對向量進(jìn)行流水處理。2) 垂直處理方式：適合對向量進(jìn)行流水處理，向量運(yùn)算指令的源/目向量都放在存儲器內(nèi)，使得流水線運(yùn)算部件的輸入、輸出端直接與存儲器相聯(lián)，構(gòu)成MM型的運(yùn)算流水線。3) 分組處理方式：適合流水處理?？稍O(shè)長度為n的向量寄存器，使每組向量運(yùn)算的源/目向量都在向量寄存器中，流水線的運(yùn)算部件輸入、輸出端與向量寄存器相聯(lián)，構(gòu)成RR型運(yùn)算流水線。17、在進(jìn)行計算機(jī)系統(tǒng)設(shè)計時，一個設(shè)計者應(yīng)該考慮哪些因素對設(shè)計的影響？技術(shù)的發(fā)展趨勢； l 計算機(jī)使用的發(fā)展趨勢； l 計算機(jī)價格的發(fā)展趨勢。18、流水線數(shù)據(jù)相關(guān)有哪幾種？解釋它們的含義，并用

21、代碼舉例說明。解決數(shù)據(jù)相關(guān)有哪些主要方法？首先，流水線有三種相關(guān)：名相關(guān)，數(shù)據(jù)相關(guān)和控制相關(guān)。而數(shù)據(jù)相關(guān)分為：RAW讀后寫、WAR寫后讀和WAW寫后寫相關(guān)。1）其中WAR相關(guān)是由于流水線數(shù)據(jù)相關(guān)引起的，即j 的執(zhí)行要用到 i 的計算結(jié)果，當(dāng)它們在流水線中重疊執(zhí)行時，j 可能在 i 寫入其計算結(jié)果之前就先行對保存該結(jié)果的寄存器進(jìn)行讀操作，從而得到錯誤的值。2）WAW相關(guān)是由于名相關(guān)的輸出相關(guān)引起的，即j和i的目的寄存器相同，當(dāng)它們在流水線中重疊執(zhí)行時，j可能在i寫入其計算結(jié)果之前就先行對該結(jié)果寄存器進(jìn)行寫操作，從而導(dǎo)致寫入順序錯誤，在目

22、的寄存器中留下的是 i 寫入的值，而不是 j 寫入的值。3）RAW相關(guān)是由于名相關(guān)的反相關(guān)引起的，即j可能在i讀取某個源寄存器的內(nèi)容之前就先對該寄存器進(jìn)行寫操作，導(dǎo)致 i 后來讀取到的值是錯誤的。如下列代碼：F0，F(xiàn)4和R1都存在數(shù)據(jù)相關(guān)，執(zhí)行將出現(xiàn)錯誤。但為了保證下述指令序列的正確執(zhí)行，流水線只好暫停。Loop： L.D F0，0（R1）/ F0為數(shù)組元素 ADD.D F4，F(xiàn)0，F(xiàn)2/ 加上F2中的值 S.D F4，0（R1）/ 保存結(jié)果 DADDIU R1，R1，8/ 數(shù)組指針遞減8個字節(jié) BNE R1，R2，Loop/ 如果R1R2，則分支采用定向技術(shù)可以消除相關(guān)，思想是：在某條指令產(chǎn)

23、生計算結(jié)果之前，其他指令并不真正立即需要該計算結(jié)果，如果能夠?qū)⒃撚嬎憬Y(jié)果從其產(chǎn)生的地方直接送到其他指令需要它的地方，那么就可以避免停頓。19、試舉例說明DLX流水線中存在不能依靠定向技術(shù)解決的數(shù)據(jù)相關(guān)及其解決方法。不是所有數(shù)據(jù)相關(guān)帶來的暫停都可以通過定向技術(shù)消除，如下面的例子：LW R1,0(R2)SUB R4,R1,R5AND R6,R1,R7OR R8,R1,R9這是LW指令不能將結(jié)果定向到SUB指令，就需要設(shè)置一個稱為流水線互鎖的功能部件。一旦流水線互鎖檢測到上述數(shù)據(jù)相關(guān)，流水線暫停執(zhí)行LW指令之后的所有指令，直到能夠通過定向解決該數(shù)據(jù)相關(guān)為止。四、計算題1、給定以下的假設(shè)，試計算直接映

24、象Cache和兩路組相聯(lián)Cache的平均訪問時間以及CPU的性能。由計算結(jié)果能得出什么結(jié)論？(考試的時候數(shù)肯定不一樣！)（1）理想Cache情況下的CPI為2.0，時鐘周期為2 ns，平均每條指令訪存1.3次。（2）兩者Cache容量均為64 KB，塊大小都是32字節(jié)。（3）組相聯(lián)Cache中的多路選擇器使CPU的時鐘周期增加了10%。（4）這兩種Cache的失效開銷都是70 ns。（5）命中時間為1個時鐘周期。（6）64 KB直接映象Cache的失效率為1.4%，64 KB兩路組相聯(lián)Cache的失效率為1.0%。平均訪存時間為：平均訪存時間命中時間失效率×失效開銷平均訪存時間1路2

25、.0（0.014×70）2.98 ns平均訪存時間2路2.0×1.10（0.010×70）2.90 ns2路組相聯(lián)Cache的平均訪存時間比較低。CPU 時間IC×(CPIexe每條指令的平均存儲器停頓周期數(shù))×時鐘周期時間= IC ×(CPIexe×時鐘周期時間每條指令的平均存儲器停頓時間)CPU時間1路 IC×(2.0×2(1.3×0.014×70) 5.27×ICCPU時間2路 IC×(2.0×2×1.10(1.3×0.010&#

26、215;70) 5.31×IC所以直接映象Cache的平均性能好一些。2、計算機(jī)系統(tǒng)字長64位，包含三個選擇通道和一個多路通道，每個選擇通道上連接了兩臺磁盤機(jī)和三臺磁帶機(jī)，多路通道上連接了了兩臺行式打印機(jī)，兩臺讀卡機(jī)、10臺終端，假定各設(shè)備的傳輸率如下：磁盤機(jī)：600 KBps，磁帶機(jī)：200 KBps，行打機(jī)：6.6 KBps，讀卡機(jī)：1.2 KBps，終端：1 KBps。計算該計算機(jī)系統(tǒng)的最大I/O數(shù)據(jù)傳輸率。多路通道最大數(shù)據(jù)傳輸率：選擇通道最大數(shù)據(jù)傳輸率：TS：設(shè)備選擇時間。從通道響應(yīng)設(shè)備發(fā)出的數(shù)據(jù)傳送請求開始，到通道實際為這臺設(shè)備傳送數(shù)據(jù)所需要的時間。TD：傳送一個字節(jié)所用的

27、時間。p：在一個通道上連接的設(shè)備臺數(shù)，且這些設(shè)備同時都在工作。n：每臺設(shè)備傳送的字節(jié)數(shù)，這里假設(shè)每臺設(shè)備傳送的字節(jié)數(shù)都相同。k：數(shù)組多路通道傳輸?shù)囊粋€數(shù)據(jù)塊中包含的字節(jié)數(shù)。在一般情況下，k<n。對于磁盤、磁帶等磁表面存儲器，通常k=512。選擇通道和數(shù)組多路通道的實際流量就是連接在這個通道上的所有設(shè)備中數(shù)據(jù)流量最大的那一個。因此，多路通道最大傳輸率是6.6 KBps，選擇通道最大傳輸率是600KBps，系統(tǒng)的最大I/O傳輸率應(yīng)為二者之和606.6KBps3、某計算機(jī)系統(tǒng)采用浮點運(yùn)算部件后使浮點運(yùn)算速度提高到原來的20倍，而系統(tǒng)運(yùn)行一程序的整體性能提高到原來的10倍，試計算該程序中浮點操

28、作所占的比例。設(shè)比例為x，根據(jù)Amdahl定律知：求解得x=0.0956，即占比9.56%4、動態(tài)多功能流水線由6個功能段組成，如下圖所示：其中，s1、s4、s5、s6組成乘法流水線，s1、s2、s3、s6組成加法流水線，各個功能段時間為t，假設(shè)該流水線的輸出結(jié)果可以直接返回輸入端，而且設(shè)置有足夠地緩沖寄存器，若以最快的方式用該流水計算：（AiBi）（其中i1.4，為連乘符號）（1）畫出其處理過程的時空圖。（2）計算其實際的吞吐率、加速比和效率。1) 先計算A1+B1、A2+B2、A3+B3和A4+B4；再計算(A1+B1)×(A2+B2)和(A3+B3)×(A4+B4)；

29、然后求總的乘積結(jié)果。時空圖：流水線實際吞吐率(n個連續(xù)任務(wù)，k段線性流水線)效率：流水線各段時間相等時的加速比：流水線的各段時間不完全相等時，一條k段流水線完成n個連續(xù)任務(wù)的實際加速比為：所以上述在18個t時間中，給出了7個結(jié)果。吞吐率為：不用流水線，由于一次求和需6t，一次求積需4t，則產(chǎn)生上述7個結(jié)果共需（4×6+3×4）t = 36t，所以加速比為流水線的效率為：5、在偽相聯(lián)中，假設(shè)在按直接映象找到的位置處沒有發(fā)現(xiàn)匹配，而在另一個位置才找到數(shù)據(jù)（偽命中）需要2個額外的周期；直接映象的命中時間為1個時鐘周期，兩路組相聯(lián)的命中時間為1.2個時鐘周期，直接映象情況下失效開銷

30、為50個時鐘周期，當(dāng)Cache容量為64 KB時，直接映象的失效率為1.4%，兩路組相聯(lián)的失效率為1%，問：直接映象、兩路組相聯(lián)和偽相聯(lián)這三種組織結(jié)構(gòu)中，哪一種速度最快？解：首先考慮標(biāo)準(zhǔn)的平均訪存時間公式：平均訪存時間偽相聯(lián) 命中時間偽相聯(lián)失效率偽相聯(lián)×失效開銷偽相聯(lián)由于：失效率偽相聯(lián)失效率2路命中時間偽相聯(lián)命中時間1路偽命中率偽相聯(lián)×2偽相聯(lián)查找的命中率等于2路組相聯(lián)Cache的命中率和直接映象Cache命中率之差。所以，偽命中率偽相聯(lián) 命中率2路命中率1路（1失效率2路）（1失效率1路）失效率1路失效率2路平均訪存時間偽相聯(lián)命中時間1路（失效率1路失效率2路）

31、15;2 失效率2路×失效開銷1路所以：平均訪存時間偽相聯(lián)64 KB 1（0.0140.01）×2（0.01×50）1.508個時鐘而正常的平均訪存時間命中時間失效率×失效開銷對于64KB Cache，可得：平均訪存時間1路 1 + 0.014 × 50 = 1.7個時鐘平均訪存時間2路 1.2 + 0.01 × 50 = 1.7 個時鐘所以，偽相聯(lián)Cache都是速度最快的。6、假定Cache的失效開銷為50個時鐘周期，當(dāng)不考慮存儲器停頓時，所有指令的執(zhí)行時間都是2.0個時鐘周期，訪問Cache失效率為2%，平均每條指令訪存1.3

32、3次。求沒有Cache和有Cache兩種情況下的平均指令執(zhí)行時間。平均訪存時間有Cache2 + 0.02 × 50 = 3個時鐘平均指令執(zhí)行時間有Cache= 1.33 × 3 = 3.99個時鐘平均訪存時間無Cache2 + 1 × 50 = 52個時鐘平均指令執(zhí)行時間無Cache= 1.33 × 52= 69.69個時鐘顯然有Cache快得多。7、在三級Cache中，第一級Cache、第二級Cache和第三級Cache的局部失效率分別為4%、30%和50%。它們的全局失效率各是多少？第一級Cache、第二級Cache和第三級Cache的局部失效

33、率分別為4%、30%和50%指假設(shè)訪問存儲器1000次，則第一級失效40次，第二級失效x2/40 = 0.3，即12次，第三級失效x3/12 = 0.5，即6次。所以全局失效率為：第一級4%，第二級12/1000=1.2%，第三級6/1000=0.6%。8、計算機(jī)A和計算機(jī)B具有相同的指令系統(tǒng)。執(zhí)行同一個程序時，計算機(jī)A的時鐘周期為1.1 ns，CPI為2.0，計算機(jī)B的時鐘周期為2 ns，CPI為1.3。請問執(zhí)行這個程序時，哪臺計算機(jī)更快？CPI表示每條計算機(jī)指令執(zhí)行所需的時鐘周期數(shù)A需要2個，即2×1.1=2.2ns 一條指令；B需要1.3個，即1.3×2=2.6ns一

34、條指令。顯然A更快。9、（1）根據(jù)Amdahl定律寫出系統(tǒng)加速比的公式。（2）某計算機(jī)系統(tǒng)有兩個部件可以改進(jìn)，這兩個部件的加速比為：部件加速比130；部件加速比220；如果部件1和部件2的可改進(jìn)比例分別為30和40，求整個系統(tǒng)的加速比。所以：系統(tǒng)加速比=系統(tǒng)加速比1×系統(tǒng)加速比2 = 2.2716所以整個系統(tǒng)的性能提高到原來的2.2716倍。10、將計算機(jī)系統(tǒng)中某一功能的處理速度加快10倍，但該功能的處理時間僅為整個系統(tǒng)運(yùn)行時間的40%，則采用此增強(qiáng)功能方法后，能使整個系統(tǒng)的性能提高多少？由題可知：可改進(jìn)比例 = 40% = 0.4 部件加速比 = 10根據(jù)Amdahl定律可知：采用此增強(qiáng)功能方法后，能使整個系統(tǒng)的性能提高到原來的1.5625倍。11、在Tomasulo算法中，進(jìn)入“流出”段的條件是什么？對于浮點操作來說，要進(jìn)行哪些動作和記錄工作？進(jìn)入“流出”段的條件：有空閑保留站r動作和記錄工作：（1）判斷第一操作數(shù)是否就緒；如果是，就把操作數(shù)讀到保留站，否則就把寄存器狀態(tài)表中的標(biāo)識送給保留站。（2）判斷第二操作數(shù)是否就緒；如果是，就把操作數(shù)讀到保留站，否則就把寄存器狀態(tài)表中的標(biāo)識送給保

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)

文檔簡介

溫馨提示

最新文檔

評論

北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔