北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第1頁
北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第2頁
北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第3頁
北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第4頁
北京科技大學(xué)計算機(jī)體系結(jié)構(gòu)總復(fù)習(xí)匯總(無重復(fù)帶計算)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上一、名詞解釋1、Cache 2:1 經(jīng)驗規(guī)則:大小為N的直接映像Cache的失效率約等于大小為N/2的兩路組相聯(lián)Cache的失效率。2、計算機(jī)體系結(jié)構(gòu):指那些對程序員可見的系統(tǒng)屬性,還包括設(shè)計思想與體系結(jié)構(gòu)。3、同構(gòu)型多處理機(jī):由多個同類型,至少擔(dān)負(fù)同等功能的處理機(jī)組成,同時處理同一作業(yè)中能并行執(zhí)行的多個任務(wù)。4、通道處理機(jī):能夠執(zhí)行有限I/O指令,并且能夠被多臺外圍設(shè)備共享的小型DMA專用處理機(jī)。5、堆棧型機(jī)器:其CPU中存儲操作數(shù)的主要單元是堆棧。6、Victim Cache:在Cache與下一級存儲器的數(shù)據(jù)通路之間增設(shè)一個全相聯(lián)的小Cache,用來存放由于失效而

2、被丟棄(替換)的那些塊。7、RAID:廉價磁盤冗余陣列或獨立磁盤冗余陣列8、累加器型機(jī)器:其CPU中存儲操作數(shù)的主要單元是累加器9、透明性:在計算機(jī)技術(shù)中,對本來存在的事物或?qū)傩?,但從某種角度看又好象不存在的概念稱為透明性。10、向量處理機(jī):面向向量型并行計算,以流水線結(jié)構(gòu)為主的并行處理計算機(jī)。11、通用寄存器型機(jī)器:CPU中存儲操作數(shù)的主要單元是通用寄存器。12、虛擬Cache:訪問Cache的索引和標(biāo)識都是虛擬地址的一部分。13、機(jī)群:機(jī)群是一種價格低廉、易于構(gòu)建、可擴(kuò)放性極強(qiáng)的并行計算機(jī)系統(tǒng)。它由多臺同構(gòu)或異構(gòu)的獨立計算機(jī)通過高性能網(wǎng)絡(luò)或局域網(wǎng)互連在一起,協(xié)同完成特定的并行計算任務(wù)。從用

3、戶的角度來看,機(jī)群就是一個單一、集中的計算資源。14、定向技術(shù):當(dāng)流水線中出現(xiàn)數(shù)據(jù)沖突時,可以將計算結(jié)果從其產(chǎn)生的地方直接送到其他指令中需要它的地方,或所有需要它的功能單元,避免暫停。15、系列機(jī):由同一廠家生產(chǎn)的具有相同的系統(tǒng)結(jié)構(gòu),但具有不同組成和實現(xiàn)的一系列不同型號的機(jī)器。16、強(qiáng)制性失效:當(dāng)?shù)谝淮卧L問一個塊時,該塊不在Cache中,需從下一級存儲器中調(diào)入Cache,這就是強(qiáng)制性失效。17、失效率:CPU在第一級存儲器中找不到所需數(shù)據(jù)的概率。18、數(shù)據(jù)相關(guān):對于兩條指令i(在前)和j(在后),如果下述條件之一成立,則稱指令j與指令i數(shù)據(jù)相關(guān): (1)指令j使用指令i產(chǎn)生的結(jié)果;(2)指令j

4、與指令k數(shù)據(jù)相關(guān),而指令k又與指令i數(shù)據(jù)相關(guān)。19、失效開銷:CPU向第二級存儲器發(fā)出訪問請求到把這個數(shù)據(jù)塊調(diào)入第一級存儲器所需的時間。20、容量失效:如果程序執(zhí)行時所需的塊不能全部調(diào)入Cache中,則當(dāng)某些塊被替換后,若又重新被訪問,就會發(fā)生失效。這種失效稱為容量失效。21、通道:傳輸信息的數(shù)據(jù)通路。計算機(jī)系統(tǒng)中傳送信息和數(shù)據(jù)的裝置。22、指令級并行:并行執(zhí)行兩條或兩條以上的指令。二、填空題:1、Cache失效可以分為(強(qiáng)制失效)、(沖突失效)和(容量失效)三種。2、說出三種對計算機(jī)發(fā)展非常關(guān)鍵的實現(xiàn)技術(shù):(邏輯電路) 、(磁盤)和(網(wǎng)絡(luò)) 。3、2:1 Cache經(jīng)驗規(guī)則是指大小為N的(直

5、接映象)Cache的失效率約等于大小為N/2的(兩路組相聯(lián))Cache的失效率。4、單機(jī)和多機(jī)系統(tǒng)中并行性發(fā)展的技術(shù)途徑有:(時間重疊)、(資源重復(fù))、(資源共享)。5、通道分為(字節(jié)多路)通道、(選擇)通道和(數(shù)組多路)通道三種類型6、流水線中的相關(guān)有(名)相關(guān)、(數(shù)據(jù))相關(guān)和(控制)相關(guān)三種。7、在處理機(jī)中,若指令序列完成的順序總是與它們開始執(zhí)行的順序保持一致,則只可能出現(xiàn)(名)相關(guān),否則就有可能出現(xiàn)(名相關(guān))、(數(shù)據(jù)相關(guān))和(控制)相關(guān)。8、輸入/輸出系統(tǒng)包括(外部設(shè)備(I/O設(shè)備,輔助存儲器))和(其與主機(jī)之間的控制部分)9、設(shè)計I/O系統(tǒng)的三個標(biāo)準(zhǔn)是(成本)、(性能)和 (容量)。

6、10、存儲器層次結(jié)構(gòu)設(shè)計技術(shù)的基本依據(jù)是程序的(訪問的局部性原理)。11、相聯(lián)度越高,(沖突)失效就越少;(強(qiáng)制性)失效不受Cache容量的影響,但(容量)失效卻隨著容量的增加而減少。12、在虛擬存儲器中,一般采用(全相連)地址映象方法和(LRU)更新策略。13、計算機(jī)系統(tǒng)中提高并行性的技術(shù)途徑有(時間重疊)、(資源重復(fù))、(資源共享)三種。在高性能單處理機(jī)的發(fā)展中,起主導(dǎo)作用的是(時間重疊原理)。14、對向量的處理有(水平處理 )方式、( 垂直處理 )方式和( 分組處理)方式。15、同構(gòu)型多處理機(jī)和異構(gòu)型多處理機(jī)所采用的提高并行性的技術(shù)途徑分別是(時間重疊)和(資源重復(fù))。16、地址映象方法

7、有(全相聯(lián))、(組相聯(lián))和(直接相聯(lián))三種,其中(全相聯(lián))的沖突率最低。17、軟件兼容有(向上兼容)、(向下兼容)、(向前兼容)和(向后兼容)四種。其中(向后兼容)是軟件兼容的根本特征。18、流水線數(shù)據(jù)相關(guān)(沖突)有三種,分別是:(寫后讀相關(guān)(WAR))、(讀后寫相關(guān)(RAW))和(寫后寫相關(guān)(WAW))。 19、從處理數(shù)據(jù)的角度,并行性等級可以分為字串位串、(字串位并)、(字并位串)和全并行。20、從執(zhí)行程序的角度看,并行性等級可以分為:(指令內(nèi)部并行)、(指令級并行)、(線程級并行)、(任務(wù)級或過程級并行)和作業(yè)或程序級并行。21、在存儲層次中,常用的替換算法有(隨機(jī)法)、(FIFO)和(

8、LRU)。22、設(shè)有一個“Cache-主存”層次,Cache為4塊,主存為8塊;試分別對于以下2種情況,計算訪存塊地址為5時的索引(index)。(1)組相聯(lián),每組兩塊;索引為(1)。5%2=1(2)直接映象;索引為(1)。5%423、根據(jù)CPU內(nèi)部存儲單元類型,可將指令集結(jié)構(gòu)分為(堆棧)型指令集結(jié)構(gòu)、(累加器)型指令集結(jié)構(gòu)和(通用寄存器)型指令集結(jié)構(gòu)。三、簡答題1、簡述使用物理地址進(jìn)行DMA存在的問題,及其解決辦法。1)對于超過一頁的數(shù)據(jù)緩沖區(qū),由于緩沖區(qū)使用的頁面在物理存儲器中不一定是連續(xù)的,所以傳輸可能會發(fā)生問題。2)如果DMA正在存儲器和緩沖區(qū)之間傳輸數(shù)據(jù)時,操作系統(tǒng)從存儲器中移出(或

9、重定位)一些頁面,那么,DMA將會在存儲器中錯誤的物理頁面上進(jìn)行數(shù)據(jù)傳輸。解決方法:使操作系統(tǒng)在I/O的傳輸過程中確保DMA設(shè)備所訪問的頁面都位于物理存儲器中,這些頁面被稱為是釘在了主存中。利用“虛擬DMA”技術(shù),允許DMA設(shè)備直接使用虛擬地址,并在DMA期間由硬件將虛擬地址轉(zhuǎn)換為物理地址。 在采用虛擬DMA的情況下,如果進(jìn)程在內(nèi)存中被移動,操作系統(tǒng)應(yīng)該能夠及時地修改相應(yīng)的DMA地址表。2、從目的、技術(shù)途徑、組成、分工方式、工作方式等5個方面對同構(gòu)型多處理機(jī)和異構(gòu)型多處理機(jī)做一比較(列表)。同構(gòu)型多處理機(jī)異構(gòu)型多處理機(jī)目的提高系統(tǒng)性能(可靠性、速度)提高系統(tǒng)使用效率技術(shù)途徑資源重復(fù)(機(jī)間互連)

10、時間重疊(功能專用化)組成同類型(同等功能)不同類項(不同功能)分工方式任務(wù)分布功能分布工作方式一個作業(yè)由多機(jī)協(xié)同并行完成一個作業(yè)由多機(jī)協(xié)同串行完成3、在指令集結(jié)構(gòu)設(shè)計中,應(yīng)該考慮哪些主要問題?1)指令集功能設(shè)計:主要有RISC和CISC兩種技術(shù)發(fā)展方向;尋址方式的設(shè)計:設(shè)置尋址方式可以通過對基準(zhǔn)程序進(jìn)行測試統(tǒng)計,察看各種尋址方式的使用頻度,根據(jù)適用頻度設(shè)置相應(yīng)必要的尋址方式;操作數(shù)表示和操作數(shù)類型:主要的操作數(shù)類型和操作數(shù)表示的選擇有,浮點數(shù)據(jù)類型(可以采用IEEE 754標(biāo)準(zhǔn))、整型數(shù)據(jù)類型(8位、16位、32位的表示方法)、字符型(8位)、十進(jìn)制數(shù)據(jù)類型(壓縮十進(jìn)制和非壓縮十進(jìn)制數(shù)據(jù)表示

11、)等等。2)尋址方式的表示:可以將尋址方式編碼與操作碼中,也可將尋址方式作為一個單獨的域來表示。3)指令集格式的設(shè)計:有固定長度編碼方式、可變長編碼方式和混合編碼方式三種選擇。4、試以系列機(jī)為例,說明計算機(jī)體系結(jié)構(gòu)、計算機(jī)組成和計算機(jī)實現(xiàn)三者之間的關(guān)系。1)如在設(shè)計主存系統(tǒng)時,i)確定主存容量、編址方式、尋址范圍屬于計算機(jī)系統(tǒng)結(jié)構(gòu)。ii)確定主存周期、邏輯上是否采用并行主存、邏輯設(shè)計等屬于計算機(jī)組成。iii)選擇存儲芯片類型、微組裝技術(shù)、線路設(shè)計等屬于計算機(jī)實現(xiàn)。2)計算機(jī)組成是計算機(jī)系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn)。計算機(jī)實現(xiàn)是計算機(jī)組成的物理實現(xiàn)。一種體系結(jié)構(gòu)可以有多種組成。一種組成可以有多種實現(xiàn)。5、

12、任寫出五種降低Cache失效開銷的方法(Cache的優(yōu)化技術(shù)),并簡述其基本思想。1)讓讀失效優(yōu)先于寫:Cache中的寫緩沖器導(dǎo)致對存儲器訪問的復(fù)雜化,所以推遲對讀失效的處理并檢查寫緩沖器的內(nèi)容。2)寫緩沖合并:如果寫緩沖器中已經(jīng)有了待寫入的數(shù)據(jù),就要把這次的寫入地址與寫緩沖器中已有的所有地址進(jìn)行比較,看是否有匹配的項。如果有地址匹配而對應(yīng)的位置又是空閑的,就把這次要寫入的數(shù)據(jù)與該項合并。3)請求字處理技術(shù):從下一級存儲器調(diào)入Cache的塊中,只有請求字是立即需要的。所以應(yīng)盡早把請求字發(fā)送給CPU。4)非阻塞Cache技術(shù):Cache失效時仍允許CPU進(jìn)行其他的命中訪問。5)采用二級Cache

13、:第一級Cache小而快,第二級Cache容量大,即快和容量二者兼顧6、指令集結(jié)構(gòu)設(shè)計中表示尋址方式的主要方法有哪些?簡述這些方法的優(yōu)缺點。1)將尋址方式編于操作碼中,由操作碼在描述指令的同時也描述了相應(yīng)的尋址方式。優(yōu)缺點:這種方式譯碼快,但操作碼和尋址方式的結(jié)合不僅增加了指令的條數(shù),導(dǎo)致了指令的多樣性,而且增加了CPU對指令譯碼的難度。2)為每個操作數(shù)設(shè)置一個地址描述符,由該地址描述符表示相應(yīng)操作數(shù)的尋址方式。優(yōu)缺點:這種方式譯碼較慢,但操作碼和尋址獨立,易于指令擴(kuò)展。7、軟件兼容有幾種?其中哪一種是軟件兼容的根本特征?1)軟件兼容:一個軟件可以不經(jīng)修改或者只需少量修改就可以由一臺計算機(jī)移植

14、到另一臺計算機(jī)上運(yùn)行。分為:向上、下、前、后兼容四種。2)上(下):按某檔計算機(jī)編制的程序,不加修改就能運(yùn)行于比它高(低)檔的計算機(jī)。 3)后(前)兼容:按某個時期投入市場的某種型號計算機(jī)編制的程序,不加修改地就能運(yùn)行于在它之后(前)投入市場的計算機(jī)。4)向后兼容是一定要保證的,它是軟件兼容的根本特征,是系列機(jī)的根本特征。8、造成流水線“斷流”的主要原因是哪三種相關(guān)?簡述三種相關(guān)的基本思想。1)數(shù)據(jù)相關(guān):指令j使用指令i產(chǎn)生的結(jié)果,或者指令j與指令k數(shù)據(jù)相關(guān), 指令k又與指令i數(shù)據(jù)相關(guān)。2)名相關(guān):兩條指令使用相同的名,但他們之間并沒有數(shù)據(jù)流動。3)控制相關(guān):由分支指令引起,需要根據(jù)分支指令的

15、執(zhí)行結(jié)果來確定后續(xù)指令是否執(zhí)行9、計算機(jī)體系結(jié)構(gòu)設(shè)計和分析中最經(jīng)常使用的三條基本原則是什么?并說出它們的含義。1)以經(jīng)常性事件為重點:對經(jīng)常發(fā)生的情況進(jìn)行優(yōu)化,使分配更多的資源,達(dá)到更高的性能或者分配更多的電能。2)Amdahl定律:加快某部件執(zhí)行速度所能獲得的系統(tǒng)性能加速比,受限于該部 件的執(zhí)行事件占系統(tǒng)中總執(zhí)行事件的百分比。3)程序的局部性原理:程序執(zhí)行時所訪問的存儲器地址分布不是隨機(jī)的,而是 相對的簇聚。10、通道分為哪三種類型?它們分別適合為哪種外圍設(shè)備服務(wù)?1)字節(jié)多路通道。一種簡單的共享通道,主要為多臺低速或中速的外圍設(shè)備服務(wù)。2)數(shù)組多路通道。適于為高速設(shè)備服務(wù)。3)選擇通道。為

16、多臺高速外圍設(shè)備(如磁盤存儲器等)服務(wù)的。11、調(diào)度分支延遲指令有哪三種常用方法?它們各有什么優(yōu)缺點。1)從前調(diào)度:可以有效提高流水線性能,但分支必須不依賴于被調(diào)度的指令。 2)從目標(biāo)處調(diào)度:分支轉(zhuǎn)移成功時,可以提高流水線性能,但由于復(fù)制指令, 可能加大程序空間。 3)從失敗處調(diào)度:分支轉(zhuǎn)移失敗時,可以提高流水線性能。但如果分支轉(zhuǎn)移成 功,必須保證被調(diào)度的指令對程序的執(zhí)行沒有影響。12、表示尋址方式的主要方法有哪些?簡述它們的優(yōu)缺點。1)將尋址方式編于操作碼中,由操作碼在描述指令的同時也描述了相應(yīng)的尋址方式。這種方式譯碼快,但操作碼和尋址方式的結(jié)合不僅增加了指令的條數(shù),導(dǎo)致了指令的多樣性,而且

17、增加了CPU對指令譯碼的難度。2)為每個操作數(shù)設(shè)置一個地址描述符,由該地址描述符表示相應(yīng)操作數(shù)的尋址方式。這種方式譯碼較慢,但操作碼和尋址獨立,易于指令擴(kuò)展。13、簡述“Cache主存”層次與“主存輔存”層次的區(qū)別。Cache-主存層次主存-輔存層次目的為了彌補(bǔ)主存速度的不足為了彌補(bǔ)主存容量的不足存儲管理的實現(xiàn)全部由專用硬件實現(xiàn)主要由軟件實現(xiàn)訪問速度的比值(1級:2級)幾比一幾萬比一典型的塊(頁)大小幾十個字節(jié)幾百到幾千個字節(jié)CPU對第二級訪問方式可直接訪問均通過第一級不命中的CPU是否切換不切換切換到其它進(jìn)程14、試從3C失效的關(guān)系分析增加塊大小對Cache性能的影響。降低失效率最簡單的方法

18、是增加塊大小 。(1)對于給定的 Cache 容量,當(dāng)塊大小增加( 從16字節(jié)開始)時,失效率開始是下降,后來反而上升了。 (2) Cache 容量越大,使失效率達(dá)到最低的塊大小就越大。 導(dǎo)致上述失效率先下降后上升的原因,在于增加塊大小會產(chǎn)生雙重作用。一方面它減少了強(qiáng)制性失效,因為局部性原理有兩方面的含義:時間局部性和空間局部性,增加塊大小利用了空間局部性;另一方面,由于增加塊大小會減少 Cache 中塊的數(shù)目,所以有可能會增加沖突失效。在 Cache 容量較小時,甚至還會增加容量失效。剛開始增加塊大小時,由于塊大小還不是很大,上述的第一種作用超過第二種作用,從而使失效率下降。但等到塊大小較大

19、時,第二種作用超過第一種作用,使失效率上升。 0簡述減小Cache失效開銷的幾種方法答:讓讀失效優(yōu)先于寫、寫緩沖合并、請求字處理技術(shù)、非阻塞Cache或非鎖定Cache技術(shù)、采用二級Cache。15、寫出三級Cache的平均訪問時間的公式。平均訪存時間 命中時間失效率 × 失效開銷只有第I層失效時才會訪問第I1。設(shè)三級Cache的命中率分別為HL1、Hl2、HL3,失效率分別為Ml1、Ml2、ML3,第三級Cache的失效開銷為PL3.則平均訪問時間TA HL1Ml1Hl2Ml2(HL3ML3×PL3)16、有哪幾種向量處理方式?它們對向量處理機(jī)的結(jié)構(gòu)要求有何不同?1) 水

20、平處理方式:不適合對向量進(jìn)行流水處理。2) 垂直處理方式:適合對向量進(jìn)行流水處理,向量運(yùn)算指令的源/目向量都放在存儲器內(nèi),使得流水線運(yùn)算部件的輸入、輸出端直接與存儲器相聯(lián),構(gòu)成MM型的運(yùn)算流水線。3) 分組處理方式:適合流水處理??稍O(shè)長度為n的向量寄存器,使每組向量運(yùn)算的源/目向量都在向量寄存器中,流水線的運(yùn)算部件輸入、輸出端與向量寄存器相聯(lián),構(gòu)成RR型運(yùn)算流水線。17、在進(jìn)行計算機(jī)系統(tǒng)設(shè)計時,一個設(shè)計者應(yīng)該考慮哪些因素對設(shè)計的影響?技術(shù)的發(fā)展趨勢; l 計算機(jī)使用的發(fā)展趨勢; l 計算機(jī)價格的發(fā)展趨勢。18、流水線數(shù)據(jù)相關(guān)有哪幾種?解釋它們的含義,并用

21、代碼舉例說明。解決數(shù)據(jù)相關(guān)有哪些主要方法?首先,流水線有三種相關(guān):名相關(guān),數(shù)據(jù)相關(guān)和控制相關(guān)。而數(shù)據(jù)相關(guān)分為:RAW讀后寫、WAR寫后讀和WAW寫后寫相關(guān)。1)其中WAR相關(guān)是由于流水線數(shù)據(jù)相關(guān)引起的,即j 的執(zhí)行要用到 i 的計算結(jié)果,當(dāng)它們在流水線中重疊執(zhí)行時,j 可能在 i 寫入其計算結(jié)果之前就先行對保存該結(jié)果的寄存器進(jìn)行讀操作,從而得到錯誤的值。2)WAW相關(guān)是由于名相關(guān)的輸出相關(guān)引起的,即j和i的目的寄存器相同,當(dāng)它們在流水線中重疊執(zhí)行時,j可能在i寫入其計算結(jié)果之前就先行對該結(jié)果寄存器進(jìn)行寫操作,從而導(dǎo)致寫入順序錯誤,在目

22、的寄存器中留下的是 i 寫入的值,而不是 j 寫入的值。3)RAW相關(guān)是由于名相關(guān)的反相關(guān)引起的,即j可能在i讀取某個源寄存器的內(nèi)容之前就先對該寄存器進(jìn)行寫操作,導(dǎo)致 i 后來讀取到的值是錯誤的。如下列代碼:F0,F(xiàn)4和R1都存在數(shù)據(jù)相關(guān),執(zhí)行將出現(xiàn)錯誤。但為了保證下述指令序列的正確執(zhí)行,流水線只好暫停。Loop: L.D F0,0(R1)/ F0為數(shù)組元素 ADD.D F4,F(xiàn)0,F(xiàn)2/ 加上F2中的值 S.D F4,0(R1)/ 保存結(jié)果 DADDIU R1,R1,8/ 數(shù)組指針遞減8個字節(jié) BNE R1,R2,Loop/ 如果R1R2,則分支采用定向技術(shù)可以消除相關(guān),思想是:在某條指令產(chǎn)

23、生計算結(jié)果之前,其他指令并不真正立即需要該計算結(jié)果,如果能夠?qū)⒃撚嬎憬Y(jié)果從其產(chǎn)生的地方直接送到其他指令需要它的地方,那么就可以避免停頓。19、試舉例說明DLX流水線中存在不能依靠定向技術(shù)解決的數(shù)據(jù)相關(guān)及其解決方法。不是所有數(shù)據(jù)相關(guān)帶來的暫停都可以通過定向技術(shù)消除,如下面的例子:LW R1,0(R2)SUB R4,R1,R5AND R6,R1,R7OR R8,R1,R9這是LW指令不能將結(jié)果定向到SUB指令,就需要設(shè)置一個稱為流水線互鎖的功能部件。一旦流水線互鎖檢測到上述數(shù)據(jù)相關(guān),流水線暫停執(zhí)行LW指令之后的所有指令,直到能夠通過定向解決該數(shù)據(jù)相關(guān)為止。四、計算題1、給定以下的假設(shè),試計算直接映

24、象Cache和兩路組相聯(lián)Cache的平均訪問時間以及CPU的性能。由計算結(jié)果能得出什么結(jié)論?(考試的時候數(shù)肯定不一樣!)(1)理想Cache情況下的CPI為2.0,時鐘周期為2 ns,平均每條指令訪存1.3次。(2)兩者Cache容量均為64 KB,塊大小都是32字節(jié)。(3)組相聯(lián)Cache中的多路選擇器使CPU的時鐘周期增加了10%。(4)這兩種Cache的失效開銷都是70 ns。(5)命中時間為1個時鐘周期。(6)64 KB直接映象Cache的失效率為1.4%,64 KB兩路組相聯(lián)Cache的失效率為1.0%。平均訪存時間為:平均訪存時間命中時間失效率×失效開銷平均訪存時間1路2

25、.0(0.014×70)2.98 ns平均訪存時間2路2.0×1.10(0.010×70)2.90 ns2路組相聯(lián)Cache的平均訪存時間比較低。CPU 時間IC×(CPIexe每條指令的平均存儲器停頓周期數(shù))×時鐘周期時間= IC ×(CPIexe×時鐘周期時間每條指令的平均存儲器停頓時間)CPU時間1路 IC×(2.0×2(1.3×0.014×70) 5.27×ICCPU時間2路 IC×(2.0×2×1.10(1.3×0.010&#

26、215;70) 5.31×IC所以直接映象Cache的平均性能好一些。2、計算機(jī)系統(tǒng)字長64位,包含三個選擇通道和一個多路通道,每個選擇通道上連接了兩臺磁盤機(jī)和三臺磁帶機(jī),多路通道上連接了了兩臺行式打印機(jī),兩臺讀卡機(jī)、10臺終端,假定各設(shè)備的傳輸率如下:磁盤機(jī):600 KBps,磁帶機(jī):200 KBps,行打機(jī):6.6 KBps,讀卡機(jī):1.2 KBps,終端:1 KBps。計算該計算機(jī)系統(tǒng)的最大I/O數(shù)據(jù)傳輸率。多路通道最大數(shù)據(jù)傳輸率:選擇通道最大數(shù)據(jù)傳輸率:TS:設(shè)備選擇時間。從通道響應(yīng)設(shè)備發(fā)出的數(shù)據(jù)傳送請求開始,到通道實際為這臺設(shè)備傳送數(shù)據(jù)所需要的時間。TD:傳送一個字節(jié)所用的

27、時間。p:在一個通道上連接的設(shè)備臺數(shù),且這些設(shè)備同時都在工作。n:每臺設(shè)備傳送的字節(jié)數(shù),這里假設(shè)每臺設(shè)備傳送的字節(jié)數(shù)都相同。k:數(shù)組多路通道傳輸?shù)囊粋€數(shù)據(jù)塊中包含的字節(jié)數(shù)。在一般情況下,k<n。對于磁盤、磁帶等磁表面存儲器,通常k=512。選擇通道和數(shù)組多路通道的實際流量就是連接在這個通道上的所有設(shè)備中數(shù)據(jù)流量最大的那一個 。因此,多路通道最大傳輸率是6.6 KBps,選擇通道最大傳輸率是600KBps,系統(tǒng)的最大I/O傳輸率應(yīng)為二者之和606.6KBps3、某計算機(jī)系統(tǒng)采用浮點運(yùn)算部件后使浮點運(yùn)算速度提高到原來的20倍,而系統(tǒng)運(yùn)行一程序的整體性能提高到原來的10倍,試計算該程序中浮點操

28、作所占的比例。設(shè)比例為x,根據(jù)Amdahl定律知:求解得x=0.0956,即占比9.56%4、動態(tài)多功能流水線由6個功能段組成,如下圖所示:其中,s1、s4、s5、s6組成乘法流水線,s1、s2、s3、s6組成加法流水線,各個功能段時間為t,假設(shè)該流水線的輸出結(jié)果可以直接返回輸入端,而且設(shè)置有足夠地緩沖寄存器,若以最快的方式用該流水計算:(AiBi)(其中i1.4,為連乘符號)(1)畫出其處理過程的時空圖。(2)計算其實際的吞吐率、加速比和效率。1) 先計算A1+B1、A2+B2、A3+B3和A4+B4;再計算(A1+B1)×(A2+B2)和(A3+B3)×(A4+B4);

29、然后求總的乘積結(jié)果。時空圖:流水線實際吞吐率(n個連續(xù)任務(wù),k段線性流水線)效率:流水線各段時間相等時的加速比:流水線的各段時間不完全相等時,一條k段流水線完成n個連續(xù)任務(wù)的實際加速比為:所以上述在18個t時間中,給出了7個結(jié)果。吞吐率為:不用流水線,由于一次求和需6t,一次求積需4t,則產(chǎn)生上述7個結(jié)果共需(4×6+3×4)t = 36t,所以加速比為流水線的效率為:5、在偽相聯(lián)中,假設(shè)在按直接映象找到的位置處沒有發(fā)現(xiàn)匹配,而在另一個位置才找到數(shù)據(jù)(偽命中)需要2個額外的周期;直接映象的命中時間為1個時鐘周期,兩路組相聯(lián)的命中時間為1.2個時鐘周期,直接映象情況下失效開銷

30、為50個時鐘周期,當(dāng)Cache容量為64 KB時,直接映象的失效率為1.4%,兩路組相聯(lián)的失效率為1%,問:直接映象、兩路組相聯(lián)和偽相聯(lián)這三種組織結(jié)構(gòu)中,哪一種速度最快?解:首先考慮標(biāo)準(zhǔn)的平均訪存時間公式:平均訪存時間偽相聯(lián) 命中時間偽相聯(lián)失效率偽相聯(lián)×失效開銷偽相聯(lián)由于:失效率偽相聯(lián)失效率2路命中時間偽相聯(lián)命中時間1路偽命中率偽相聯(lián)×2偽相聯(lián)查找的命中率等于2路組相聯(lián)Cache的命中率和直接映象Cache命中率之差。所以,偽命中率偽相聯(lián) 命中率2路命中率1路 (1失效率2路)(1失效率1路) 失效率1路失效率2路平均訪存時間偽相聯(lián)命中時間1路(失效率1路失效率2路)

31、15;2 失效率2路×失效開銷1路所以:平均訪存時間偽相聯(lián)64 KB 1(0.0140.01)×2(0.01×50)1.508個時鐘而正常的平均訪存時間命中時間失效率×失效開銷對于64KB Cache,可得: 平均訪存時間1路 1 + 0.014 × 50 = 1.7個時鐘 平均訪存時間2路 1.2 + 0.01 × 50 = 1.7 個時鐘所以,偽相聯(lián)Cache都是速度最快的。6、假定Cache的失效開銷為50個時鐘周期,當(dāng)不考慮存儲器停頓時,所有指令的執(zhí)行時間都是2.0個時鐘周期,訪問Cache失效率為2%,平均每條指令訪存1.3

32、3次。求沒有Cache和有Cache兩種情況下的平均指令執(zhí)行時間。平均訪存時間有Cache2 + 0.02 × 50 = 3個時鐘平均指令執(zhí)行時間 有Cache= 1.33 × 3 = 3.99個時鐘平均訪存時間無Cache2 + 1 × 50 = 52個時鐘平均指令執(zhí)行時間 無Cache= 1.33 × 52= 69.69個時鐘顯然有Cache快得多。7、在三級Cache中,第一級Cache、第二級Cache和第三級Cache的局部失效率分別為4%、30%和50%。它們的全局失效率各是多少?第一級Cache、第二級Cache和第三級Cache的局部失效

33、率分別為4%、30%和50%指假設(shè)訪問存儲器1000次,則第一級失效40次,第二級失效x2/40 = 0.3,即12次,第三級失效x3/12 = 0.5,即6次。所以全局失效率為:第一級4%,第二級12/1000=1.2%,第三級6/1000=0.6%。8、計算機(jī)A和計算機(jī)B具有相同的指令系統(tǒng)。執(zhí)行同一個程序時,計算機(jī)A的時鐘周期為1.1 ns,CPI為2.0,計算機(jī)B的時鐘周期為2 ns,CPI為1.3。請問執(zhí)行這個程序時,哪臺計算機(jī)更快?CPI表示每條計算機(jī)指令執(zhí)行所需的時鐘周期數(shù)A需要2個,即2×1.1=2.2ns 一條指令;B需要1.3個,即1.3×2=2.6ns一

34、條指令。顯然A更快。9、 (1)根據(jù)Amdahl定律寫出系統(tǒng)加速比的公式。(2)某計算機(jī)系統(tǒng)有兩個部件可以改進(jìn),這兩個部件的加速比為:部件加速比130; 部件加速比220;如果部件1和部件2的可改進(jìn)比例分別為30和40,求整個系統(tǒng)的加速比。所以:系統(tǒng)加速比=系統(tǒng)加速比1×系統(tǒng)加速比2 = 2.2716所以整個系統(tǒng)的性能提高到原來的2.2716倍。10、將計算機(jī)系統(tǒng)中某一功能的處理速度加快10倍,但該功能的處理時間僅為整個系統(tǒng)運(yùn)行時間的40%,則采用此增強(qiáng)功能方法后,能使整個系統(tǒng)的性能提高多少?由題可知: 可改進(jìn)比例 = 40% = 0.4 部件加速比 = 10根據(jù)Amdahl定律可知:采用此增強(qiáng)功能方法后,能使整個系統(tǒng)的性能提高到原來的1.5625倍。11、在Tomasulo算法中,進(jìn)入“流出”段的條件是什么?對于浮點操作來說,要進(jìn)行哪些動作和記錄工作?進(jìn)入“流出”段的條件:有空閑保留站r動作和記錄工作:(1)判斷第一操作數(shù)是否就緒;如果是,就把操作數(shù)讀到保留站,否則就把寄存器狀態(tài)表中的標(biāo)識送給保留站。 (2)判斷第二操作數(shù)是否就緒;如果是,就把操作數(shù)讀到保留站,否則就把寄存器狀態(tài)表中的標(biāo)識送給保

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論