2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、現(xiàn)代電子技術(shù)ModernElectronicsTechnique2013年2月15日第36卷第4期Jan.2013Vol.36No.4圖形處理器(GraphicProcessingUnit,GPU)是一種專(zhuān)用圖形渲染部件,存在于現(xiàn)今每臺(tái)PC、嵌入式系統(tǒng)、手機(jī)和游戲設(shè)備中,它可以分擔(dān)CPU的二維或三維圖像處理任務(wù)。GPU最初被用作紋理映射和多邊形著色等計(jì)算量大的計(jì)算機(jī)圖形基本任務(wù),近年來(lái)由于GPU擁有了可編程著色器(Shaders),可以

2、像CPU一樣處理頂點(diǎn)以及紋理。因?yàn)橛?jì)算機(jī)圖形學(xué)的計(jì)算涉及到一些通用計(jì)算,比如矩陣和向量運(yùn)算,且GPU具有天生的適合大量數(shù)據(jù)處理的并行計(jì)算架構(gòu),于是科研人員開(kāi)始嘗試?yán)肎PU來(lái)進(jìn)行非圖形學(xué)的通用計(jì)算。這種技術(shù)被稱(chēng)為GPGPU(GeneralPurposeComputingonGraphicsProcessingUnit)技術(shù)。1GPU通用計(jì)算技術(shù)1.1GPGPU技術(shù)簡(jiǎn)介GPU在PC中與CPU使用PCIe或者AGP總線連接并交換數(shù)據(jù),其輸出

3、端連接顯示器,如圖1所示。現(xiàn)代GPU的工作流程包含下列幾個(gè)步驟:先從CPU處獲得三維模型,這些模型是用頂點(diǎn)坐標(biāo)和色彩信息組成;GPU對(duì)這些頂點(diǎn)位置進(jìn)行一系列的變換,然后投影到幀緩存中;同時(shí),GPU再對(duì)投影結(jié)果進(jìn)行剪裁、光柵化等一系列的處理;隨后每個(gè)幀緩存里的像素經(jīng)過(guò)GPU的一系列變換最后被輸出到顯示器上[1]。這一連串的圖形處理任務(wù)通常稱(chēng)為圖形流水線(GraphicPipe?line)。圖1GPU在計(jì)算機(jī)中的位置圖形流水線有不同的應(yīng)用程

4、序接口(API)來(lái)定義它們的功能,最主要的是OpenGL和Direct3D。本文主要討論使用OpenGL來(lái)實(shí)現(xiàn)GPU的通用計(jì)算功能。OpenGL盡可能提供對(duì)GPU更底層的硬件訪問(wèn),同時(shí)保證接口的平臺(tái)無(wú)關(guān)性[2]。其定義的圖形流水線符合前述的圖形流水線模型。圖2表示了一個(gè)簡(jiǎn)化的OpenGL圖形流水線,其中略去了與經(jīng)典GPGPU方法無(wú)關(guān)的模塊。圖中的紋理緩存模塊是GPU通用計(jì)算的關(guān)鍵,主基于圖形處理器的通用計(jì)算技術(shù)的研究戴長(zhǎng)江,張尤賽(江蘇

5、科技大學(xué),江蘇鎮(zhèn)江212003)摘要:為了研究基于PC的圖形處理器(GPU)的通用計(jì)算技術(shù),采用了基于紋理映射的經(jīng)典GPU通用計(jì)算方法,進(jìn)行了二維圖像離散卷積和三維紋理映射體繪制的實(shí)驗(yàn)。實(shí)驗(yàn)證明了經(jīng)典GPU通用計(jì)算技術(shù)在合適的算法設(shè)計(jì)基礎(chǔ)上能夠顯著提升程序的運(yùn)算速度,得出了基于CPUGPU的異構(gòu)計(jì)算模式可以成為高性能計(jì)算的一種選擇的結(jié)論,展望了基于圖形處理器的通用計(jì)算技術(shù)在未來(lái)的發(fā)展。關(guān)鍵詞:圖形處理器;GPGPU;紋理映射;并行計(jì)算;

6、異構(gòu)計(jì)算中圖分類(lèi)號(hào):TN911?34;TP368.3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1004?373X(2013)04?0157?05ResearchofgeneralpurposecomputingtechnologybasedongraphicprocessingunitDAIChang?jiang,ZHANGYou?sai(SchoolofElectronicsInfmation,JiangsuUniversityofScienceTec

7、hnology,Zhenjiang212003,China)Abstract:IndertoresearchthegeneralpurposecomputingtechnologyofGPUbasedonPC,theclassicGPUgeneralpur?posecomputingmethodbaseontexturemappingtechnologywasadopted,theexperimentsofdiscreteconvolu

8、tionof2Dimagesvolumerenderingbasedon3Dtexturemappingwerecarriedout.Theexperimentresultindicatesthat,onthebasisofasuitablealgithmdesign,theclassicGPUgeneralpurposecomputingtechnologycansignificantlyenhancetheprogramrun?ni

9、ngperfmance.Inthisarticle,itisconcludedthattheCPUGPUheterogeneouscomputingmodewillbecomeachoicefhigh?perfmancecomputation,thefurtherdevelopmentofthegeneralpurposecomputingtechnologybasedonGPUisprospected.Keywds:GPU;GPGPU

10、;texturemapping;parallelcomputation;heterogeneouscomputation收稿日期:2012?10?15157157第4期戴長(zhǎng)江,等:基于圖形處理器的通用計(jì)算技術(shù)的研究算資源占有率,不會(huì)因?yàn)轭l繁的顯存訪問(wèn)降低計(jì)算效率。這種高帶寬的特點(diǎn)使得GPU以大量線程實(shí)現(xiàn)面向大吞吐量的數(shù)據(jù)并行計(jì)算,適合于處理計(jì)算密度高、邏輯分支簡(jiǎn)單的大規(guī)模數(shù)據(jù)并行負(fù)載。圖3給出了GPU和CPU在各個(gè)時(shí)期關(guān)于計(jì)算能力的比較

11、,使用的測(cè)量單位是FLOPS,可以看到同一時(shí)期的GPU的計(jì)算能力幾乎一直強(qiáng)于CPU,而這樣的差距正呈現(xiàn)出不斷擴(kuò)大的趨勢(shì)。圖3GPU和CPU間關(guān)于計(jì)算能力的比較憑借GPU并行計(jì)算架構(gòu)的優(yōu)勢(shì),利用GPU通用計(jì)算技術(shù)來(lái)提高計(jì)算性能的例子不勝枚舉。例如:某神經(jīng)建模過(guò)程如果只用CPU進(jìn)行數(shù)據(jù)處理,大概需要花2.7天的時(shí)間,用GPU只需要30min;某電磁場(chǎng)模擬實(shí)驗(yàn),一個(gè)雙核3.2GHz的CPU需要15h,而一個(gè)GPU只需要15min。以往使用CT

12、或核磁共振進(jìn)行醫(yī)療成像時(shí),病人往往需要數(shù)日才能拿到診斷結(jié)果,在使用GPGPU技術(shù)的成像軟件后,病人當(dāng)場(chǎng)就能得到診斷結(jié)果[1]。如今,幾乎所有密集型數(shù)據(jù)處理行業(yè)都有GPGPU的身影。CUDAZone主頁(yè)列舉了各個(gè)領(lǐng)域使用CUDA取得性能優(yōu)化的實(shí)例[7]。如觀看高清視頻用的暴風(fēng)影音就使用了CUDA的高清加速能力,以幫助用戶(hù)在觀看高清視頻時(shí)能有效提升視頻流處理速度,運(yùn)行的視頻和游戲更加清晰流暢,系統(tǒng)所占資源也大大減少,GPU通用計(jì)算技術(shù)正越來(lái)

13、越受到歡迎。1.3GPGPU技術(shù)的使用范圍并行計(jì)算即同一時(shí)刻存在多于一個(gè)計(jì)算任務(wù)被執(zhí)行。GPU的并行計(jì)算模型和CPU的多核并行計(jì)算模型有很大的區(qū)別。清楚認(rèn)識(shí)到哪些應(yīng)用可以移植到GPU上進(jìn)行處理,哪些應(yīng)用無(wú)法移植,對(duì)于如何使用GPGPU技術(shù)并應(yīng)用到實(shí)際中是極其重要的。對(duì)并行計(jì)算模式進(jìn)行分類(lèi)是了解CPU和GPU并行計(jì)算區(qū)別的有效方式。可以從數(shù)據(jù)流和指令的角度把計(jì)算模型分為4類(lèi)[1]:(1)單指令單數(shù)據(jù)流(SISD):CPU的計(jì)算模型;(2)

14、單指令多數(shù)據(jù)流(SIMD):GPU的計(jì)算模型;(3)多指令單數(shù)據(jù)流(MISD):這類(lèi)系統(tǒng)實(shí)際上很少見(jiàn)到;(4)多指令多數(shù)據(jù)流(MIMD):多核CPU的計(jì)算模型。GPU使用的是SIMD并行計(jì)算模式,SIMD的思路是讓不同的線程處理自己所對(duì)應(yīng)的那部分?jǐn)?shù)據(jù)。當(dāng)線程數(shù)大于或等于數(shù)據(jù)個(gè)數(shù)時(shí),理論計(jì)算時(shí)間相當(dāng)于處理一個(gè)數(shù)據(jù)的時(shí)間。所以,GPU的一個(gè)重要的性能指標(biāo)就是它的處理器個(gè)數(shù)和同時(shí)可激活的線程數(shù)。但需要注意的是,SIMD處理數(shù)據(jù)的次序是不確定的

15、。這個(gè)就需要對(duì)每個(gè)數(shù)據(jù)的處理是不相關(guān)的。在通用計(jì)算中,由于數(shù)據(jù)關(guān)聯(lián)性的限制,通常的做法是把算法分割成若干個(gè)SIMD段,盡可能地達(dá)到算法的局部無(wú)關(guān)性。綜上所述,使用GPU進(jìn)行并行計(jì)算,必須滿(mǎn)足以下兩點(diǎn)要求:(1)每個(gè)線程的任務(wù)互不相關(guān);(2)每個(gè)線程執(zhí)行相同的指令。但是,要使一個(gè)程序充分利用并行計(jì)算模型進(jìn)行計(jì)算,必須要合理運(yùn)用CPU和GPU的異構(gòu)特性,結(jié)合他們的特點(diǎn)以及算法的特性,將算法復(fù)雜的,要求精度高的和數(shù)據(jù)量小的部分交給CPU,而將

16、算法枯燥的、精度要求不高、數(shù)據(jù)量龐大的部分交給GPU來(lái)完成。設(shè)計(jì)分工合理是GPGPU技術(shù)順利完成的關(guān)鍵。1.4GPGPU技術(shù)的性能瓶頸GPGPU的處理器資源中包括CPU和GPU,所以計(jì)算的效率視整個(gè)計(jì)算網(wǎng)絡(luò)的全局效率而定。在注重GPU上代碼運(yùn)行效率的同時(shí),還必須關(guān)注CPU的運(yùn)行效率,以及CPU和GPU的通信速率。由于提升CPU的運(yùn)行效率涵蓋面太廣,本文主要關(guān)注CPU和GPU之間的通信效率。如圖4所示,CPU和GPU的通信是由內(nèi)存和顯存完

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論