




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
摩爾定律集成電路芯片上所集成的電路的數(shù)目,
每隔18個(gè)月就翻一番,同時(shí)性能也提升
一倍經(jīng)驗(yàn)總結(jié),12個(gè)月-18個(gè)月-24個(gè)月并行計(jì)算基礎(chǔ)GordonMoore摩爾定律正在走向終結(jié)…單芯片容納晶體管的增加,對(duì)制造工藝提出要求CPU制造18nm技術(shù),電子泄漏問(wèn)題CPU主頻已達(dá)3GHz時(shí)代,難以繼續(xù)提高散熱問(wèn)題(發(fā)熱太大,且難以驅(qū)散)功耗太高并行計(jì)算基礎(chǔ)未來(lái)的發(fā)展:多核在多核時(shí)代生存,必須考慮并發(fā)問(wèn)題不存在解決多核編程問(wèn)題的銀彈,
不存在可以簡(jiǎn)單地將并發(fā)編程問(wèn)題化
解掉的工具,開(kāi)發(fā)高性能的并行程序
必須要求開(kāi)發(fā)者從根本上改變其編程
方法從某種意義上來(lái)說(shuō),這不僅僅是要改
變50年來(lái)順序程序設(shè)計(jì)的工藝傳統(tǒng),
而且是要改變數(shù)百萬(wàn)年來(lái)人類(lèi)順序化思考問(wèn)題的習(xí)慣并行計(jì)算基礎(chǔ)Herb
Sutter串行編程早期的計(jì)算里,程序一般是被串行執(zhí)行的程序是指令的序列,在單處理器的機(jī)器里,程序從開(kāi)始到結(jié)束,這些指令一條接一條的執(zhí)行并行編程一道處理可以被劃分為幾部分,然后它們可以并發(fā)地執(zhí)行各部分的指令分別在不同的CPU上同時(shí)運(yùn)行,這些CPU可以存在于單臺(tái)機(jī)器中,也可以存在于多臺(tái)機(jī)器上,它們通過(guò)連接起來(lái)共同運(yùn)作并行計(jì)算基礎(chǔ)什么樣的問(wèn)題適合并行計(jì)算?如果有大量結(jié)構(gòu)一致的數(shù)據(jù)要處理,且數(shù)據(jù)可以分解成相同大小的部分,那我們就可以設(shè)法使這道處理變成并行并行計(jì)算基礎(chǔ)計(jì)算問(wèn)題簡(jiǎn)單,但求解困難待處理數(shù)據(jù)量巨大(PB級(jí)),只有分布在成百上千個(gè)節(jié)點(diǎn)上并行計(jì)算才能在可接受的時(shí)間內(nèi)完成如何進(jìn)行并行分布式計(jì)算?如何分發(fā)待處理數(shù)據(jù)?如何處理分布式計(jì)算中的錯(cuò)誤?為什么需要MapReduce?簡(jiǎn)單的問(wèn)題,計(jì)算并不簡(jiǎn)單!為什么需要MapReduce?GoogleMapReduce架構(gòu)設(shè)計(jì)師JeffreyDeanJefferyDean設(shè)計(jì)一個(gè)新的抽象模型,使我們只要執(zhí)行的簡(jiǎn)單計(jì)算,而將并行化、容錯(cuò)、數(shù)據(jù)分布、負(fù)載均衡的等雜亂細(xì)節(jié)放在一個(gè)庫(kù)里,使并行編程時(shí)不必關(guān)心它們這就是MapReduce一個(gè)軟件架構(gòu),是一種處理海量數(shù)據(jù)的并行編程模式用于大規(guī)模數(shù)據(jù)集(通常大于1TB)的并行運(yùn)算MapReduce實(shí)現(xiàn)了Map和Reduce兩個(gè)功能Map把一個(gè)函數(shù)應(yīng)用于集合中的所有成員,然后返回一個(gè)基于這個(gè)處理的結(jié)果集Reduce對(duì)結(jié)果集進(jìn)行分類(lèi)和歸納Map()和Reduce()兩個(gè)函數(shù)可能會(huì)并行運(yùn)行,即使不是在同一的系統(tǒng)的同一時(shí)刻MapReduceMapReduce示例:?jiǎn)卧~計(jì)數(shù)案例:?jiǎn)卧~記數(shù)問(wèn)題(WordCount)給定一個(gè)巨大的文本(如1TB),如何計(jì)算單詞出現(xiàn)的數(shù)目?MapReduce示例:?jiǎn)卧~計(jì)數(shù)使用MapReduce求解該問(wèn)題定義Map和Reduce函數(shù)MapReduce示例:?jiǎn)卧~計(jì)數(shù)使用MapReduce求解該問(wèn)題Step1:自動(dòng)對(duì)文本進(jìn)行分割MapReduce示例:?jiǎn)卧~計(jì)數(shù)使用MapReduce求解該問(wèn)題Step2:在分割之后的每一對(duì)<key,value>進(jìn)行用戶(hù)定義的Map進(jìn)行處理,再生成新的<key,value>對(duì)MapReduce示例:?jiǎn)卧~計(jì)數(shù)使用MapReduce求解該問(wèn)題Step3:對(duì)輸出的結(jié)果集歸攏、排序(系統(tǒng)自動(dòng)完成)MapReduce示例:?jiǎn)卧~計(jì)數(shù)使用MapReduce求解該問(wèn)題Step4:通過(guò)Reduce操作生成最后結(jié)果Worker故障Master周期性的ping每個(gè)worker。如果master在一個(gè)確定的時(shí)間段內(nèi)沒(méi)有收到worker返回的信息,那么它將把這個(gè)worker標(biāo)記成失效重新執(zhí)行該節(jié)點(diǎn)上已經(jīng)執(zhí)行或尚未執(zhí)行的Map任務(wù)重新執(zhí)行該節(jié)點(diǎn)上未完成的Reduce任務(wù),已完成的不再執(zhí)行Master故障定期寫(xiě)入檢查點(diǎn)數(shù)據(jù)從檢查點(diǎn)恢復(fù)MapReduce的容錯(cuò)WHY?任務(wù)備份機(jī)制慢的workers會(huì)嚴(yán)重地拖延整個(gè)執(zhí)行完成的時(shí)間由于其他的任務(wù)占用了資源磁盤(pán)損壞解決方案:在臨近結(jié)束的時(shí)候,啟動(dòng)多個(gè)進(jìn)程來(lái)執(zhí)行尚未完成的任務(wù)誰(shuí)先完成,就算誰(shuí)可以十分顯著地提高執(zhí)行效率MapReduce的優(yōu)化本地處理Master調(diào)度策略:
向GFS詢(xún)問(wèn)獲得輸入文件blocks副本的位置信息Maptasks的輸入數(shù)據(jù)通常按64MB來(lái)劃分(GFSblock大小)按照blocks所在的機(jī)器或機(jī)器所在機(jī)架的范圍進(jìn)行調(diào)度效果絕大部分機(jī)器從本地讀取文件作為輸入,節(jié)省大量帶寬MapReduce的優(yōu)化跳過(guò)有問(wèn)題的記錄一些特定的輸入數(shù)據(jù)常導(dǎo)致Map/Reduce無(wú)法運(yùn)行最好的解決方法是調(diào)試或者修改不一定可行~可能需要第三方庫(kù)或源碼在每個(gè)worker里運(yùn)行一個(gè)信號(hào)處理程序,捕獲map或red
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川電力職業(yè)技術(shù)學(xué)院《衛(wèi)生法4》2023-2024學(xué)年第二學(xué)期期末試卷
- 商丘職業(yè)技術(shù)學(xué)院《計(jì)算機(jī)視覺(jué)基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東體育學(xué)院《數(shù)字測(cè)圖原理與方法A》2023-2024學(xué)年第二學(xué)期期末試卷
- 大連大學(xué)《臨床中藥學(xué)2》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖北民族大學(xué)《特殊教育管理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧波幼兒師范高等專(zhuān)科學(xué)校《機(jī)械制造工藝基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 成都醫(yī)學(xué)院《聚合物基復(fù)合材料》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶工貿(mào)職業(yè)技術(shù)學(xué)院《物理課程標(biāo)準(zhǔn)與教材研讀》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川藝術(shù)職業(yè)學(xué)院《教育改革》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津理工大學(xué)中環(huán)信息學(xué)院《雷達(dá)原理與系統(tǒng)》2023-2024學(xué)年第二學(xué)期期末試卷
- 省級(jí)一網(wǎng)統(tǒng)管網(wǎng)格化社會(huì)治理指揮手冊(cè)(含事項(xiàng)清單)
- 四川省成都市青羊區(qū)2024年四年級(jí)數(shù)學(xué)第二學(xué)期期末調(diào)研試題含解析
- 輸液反應(yīng)的應(yīng)急預(yù)案及處理流程課件
- 水稻工廠(chǎng)化育秧技術(shù)規(guī)程
- 污水處理設(shè)備運(yùn)行記錄臺(tái)賬
- 2024年合肥市蜀山區(qū)中考二模英語(yǔ)試題含答案
- 抖音團(tuán)購(gòu)培訓(xùn)
- (古詩(shī)對(duì)比閱讀)《登幽州臺(tái)歌》與《登飛來(lái)峰》聯(lián)讀設(shè)計(jì)2022
- 影視特效與欄目包裝智慧樹(shù)知到期末考試答案2024年
- 如何有效地開(kāi)展集體備課
- MOOC 工程經(jīng)濟(jì)學(xué)原理-東南大學(xué) 中國(guó)大學(xué)慕課答案
評(píng)論
0/150
提交評(píng)論