版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、GPU 異構(gòu)編程研究綜述摘 要近年來,異構(gòu)系統(tǒng)硬件飛速發(fā)展。為了解決相應(yīng)的編程和執(zhí)行效率問題,GPU 異構(gòu)并行編程已被廣泛使用和研究。本文從異構(gòu)并行編程接口與編譯/運(yùn)行時(shí)支持系統(tǒng)的角度總結(jié)了異構(gòu)并行編程模型最新的研究進(jìn)展,簡單介紹現(xiàn)在為異構(gòu)架構(gòu)和上層應(yīng)用帶來的技術(shù)挑戰(zhàn)提供的相應(yīng)的解決方案。最后結(jié)合目前的研究現(xiàn)狀以及異構(gòu)系統(tǒng)的發(fā)展,提出了對異構(gòu)并行編程的未來發(fā)展方向的看法。關(guān)鍵詞:異構(gòu)系統(tǒng),編程,上層應(yīng)用, 關(guān)鍵詞:異構(gòu)系統(tǒng),編程,
2、上層應(yīng)用,GPU GPU一 、 緒論 緒論(一)前沿發(fā)展介紹 )前沿發(fā)展介紹近年來,處理器從單核轉(zhuǎn)變到多核,芯片的并行計(jì)算能力得到增強(qiáng),性能顯著提高[1]。然而由于結(jié)構(gòu)復(fù)雜,傳統(tǒng)處理器遭遇了嚴(yán)重的功耗瓶頸,無法通過增加核數(shù)繼續(xù)帶來性能提升。在這樣的背景下,出現(xiàn)了 CPU 與一個或多個加速設(shè)備在片上或主板上相互連接組成的異構(gòu)系統(tǒng),以進(jìn)一步增強(qiáng)計(jì)算能力:CPU 作為控制設(shè)備,負(fù)責(zé)復(fù)雜的控制、調(diào)度等工作;而加速設(shè)備則負(fù)責(zé)大規(guī)模的并行計(jì)算或?qū)I(yè)
3、領(lǐng)域的計(jì)算任務(wù)。加速設(shè)備通常在指令集、微結(jié)構(gòu)、功能或計(jì)算能力等方面與 CPU 有很大區(qū)別,GPU 是目前最為常見的加速設(shè)備之一。GPU 在片上集成了幾十甚至上百個每指令耗能(energy per instruction 簡稱 EPI)較低的簡單核,它不包含分支預(yù)測、亂序執(zhí)行等耗費(fèi)資源的模塊,借助高度的并行性隱藏單個任務(wù)的延遲,達(dá)到遠(yuǎn)高于 CPU 的計(jì)算吞吐量。除 GPU 外,可重構(gòu)硬件如(FPGA)也常作為加速設(shè)備。目前,異構(gòu)系統(tǒng)已十分
4、普遍,遍布于服務(wù)器、個人電腦、嵌入式終端中,異構(gòu)系統(tǒng)通過高速互聯(lián)相互連接可構(gòu)成異構(gòu)集群,而異構(gòu)集群通過互聯(lián)網(wǎng)絡(luò)連接在一起可構(gòu)成大規(guī)模的云服務(wù)環(huán)。在 2013 聯(lián)架構(gòu)兩方面都更加復(fù)雜化和多樣化,這使得異構(gòu)并行編程模型在建立平臺抽象方面遇到了巨大的困難,在任務(wù)劃分、任務(wù)映射、數(shù)據(jù)分布、同步、通信等方面都面臨著新的技術(shù)挑戰(zhàn)。任務(wù)劃分與任務(wù)映射面臨的新問題:異構(gòu)系統(tǒng)中設(shè)備之間并行計(jì)算能力不同。同構(gòu)系統(tǒng)中的計(jì)算設(shè)備為完全相同的多核 CPU,盡管同
5、一 CPU 不同核之間、同一核內(nèi)的 SIMD 部件等可承擔(dān)粒度不同的并行計(jì)算任務(wù),但是不同設(shè)備具有相同的微結(jié)構(gòu),其并行計(jì)算能力是完全相同的。而在異構(gòu)系統(tǒng)中,不同設(shè)備(如 CPU GPU,F(xiàn)PGA)的微結(jié)構(gòu)具有本質(zhì)差異,其并行計(jì)算模式與并行計(jì)算能力完全不同,設(shè)備的特長也完全不同,這種設(shè)備間并行計(jì)算能力的差異,使得任務(wù)映射與任務(wù)劃分不再是均一的,而是具有顯著特異性的,這也更利于表達(dá)實(shí)際應(yīng)用的特點(diǎn)。數(shù)據(jù)分布與通信面臨的新問題:異構(gòu)系統(tǒng)中加
6、速設(shè)備內(nèi)數(shù)據(jù)分布可配置、設(shè)備間數(shù)據(jù)通信渠道多樣。從編程模型的角度看,同構(gòu)系統(tǒng)中,CPU 片內(nèi)存儲是軟件透明的 cache 結(jié)構(gòu),片外存儲則遵從共享內(nèi)存模型,除訪問延遲可能不同(例如 NUMA 架構(gòu))之外,不存在其他的差異性。因此在同構(gòu)系統(tǒng)中,數(shù)據(jù)僅可分配在片外內(nèi)存中,具有存儲位置單一的特點(diǎn),也不需要進(jìn)行顯式通信。但在異構(gòu)系統(tǒng)中,加速設(shè)備片內(nèi)通常包含軟件可分配的快速局部存儲(如 SPM);而設(shè)備間的連接方式則差異很大,目前,CPU 與一
7、個或多個加速設(shè)備多數(shù)通過PCIe 連接,也有將它們集成在一個芯片內(nèi)的嘗試,例如 AMD 提出的HSA(heterogeneous system architecture),這使得加速設(shè)備可能無法采用與 CPU 相同的方式完成地址映射,導(dǎo)致它們的虛存空間分立,存在某一設(shè)備無法訪問另一設(shè)備片外存儲的問題。因此在異構(gòu)系統(tǒng)中,數(shù)據(jù)可以被分配在 CPU 和加速設(shè)備片外內(nèi)存、加速設(shè)備片內(nèi)多層次局部存儲等多個位置,數(shù)據(jù)分布問題變得十分復(fù)雜;設(shè)備間的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 異構(gòu)GPU集群的并行編程模型及實(shí)現(xiàn).pdf
- 面向多核CPU-眾核GPU異構(gòu)集群的數(shù)據(jù)流編程模型研究.pdf
- CPU-GPU異構(gòu)系統(tǒng)上的高層編程模型及其編譯優(yōu)化技術(shù).pdf
- 基于CPU-GPU異構(gòu)平臺的性能優(yōu)化及多核并行編程模型的研究.pdf
- 單GPU及GPU異構(gòu)集群的若干關(guān)鍵技術(shù)研究.pdf
- GPU集群的并行編程通信接口研究.pdf
- 基于MapReduce模型的GPU編程優(yōu)化機(jī)制研究.pdf
- 面向千萬億次CPU-GPU異構(gòu)系統(tǒng)的編程模型與性能優(yōu)化關(guān)鍵技術(shù)研究.pdf
- 結(jié)構(gòu)分析的GPU異構(gòu)平臺前后處理研究.pdf
- 基于GPU集群系統(tǒng)的MapReduce編程模型研究.pdf
- 基于異構(gòu)多核平臺的優(yōu)化編程研究.pdf
- 基于GPU編程的體繪制算法研究及應(yīng)用.pdf
- CPU-GPU異構(gòu)體系任務(wù)調(diào)度框架的研究.pdf
- 基于CPU-GPU異構(gòu)集群的矩量法研究.pdf
- 外文翻譯--gpu集群的混合并行編程
- 基于CPU-GPU異構(gòu)平臺的圖像處理的加速研究.pdf
- 基于CPU+GPU的圖像處理異構(gòu)并行計(jì)算研究.pdf
- 基于可編程GPU的雨天特效繪制.pdf
- 基于CPU-GPU異構(gòu)平臺的空間殼單元研究與應(yīng)用.pdf
- 基于CPU+GPU異構(gòu)集群的量子計(jì)算仿真方法的研究.pdf
評論
0/150
提交評論