版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、GPGPU的主要目標(biāo)是利用GPU強大的并行計算能力進行通用目的的計算。為了支持通用計算,GPU的結(jié)構(gòu)也開始針對通用計算優(yōu)化,但GPU固有的SIMD工作方式依然是限制其性能發(fā)揮的巨大障礙。其主要的問題是SIMD及其類似結(jié)構(gòu)所面臨的控制分離和存儲分離問題。而目前在控制分離上的研究往往沒有考慮其對存儲系統(tǒng)造成的影響,從而可能導(dǎo)致其性能不穩(wěn)定,甚至出現(xiàn)性能下降。
本文總結(jié)了GPGPU線程調(diào)度的研究現(xiàn)狀,指出了其中存在的問題。其中,
2、PDOM機制不能調(diào)度其所有分支路徑;DWS的分支機制雖然能調(diào)度所有的分支路徑卻存在則由于缺少子恢復(fù)點信息而面臨warp過度細分的問題。針對PDOM機制和DWS機制的優(yōu)缺點,本文提出了一種子恢復(fù)點感知的混合棧式機制,該棧式機制通過增加葉子節(jié)點表和附加的數(shù)據(jù)通道。該混合棧式機制能對任意路徑的節(jié)點進行正常的PDOM機制的恢復(fù)操作,且具備DWS機制的所有分支路徑的調(diào)度能力,在這基礎(chǔ)上還能防止DWS過度細分,具備了更強的調(diào)度靈活性。
3、 為了充分發(fā)揮本文混合棧式機制的延遲覆蓋潛力,本文通過分析發(fā)現(xiàn),如果能讓一部分warp先于其他warp先行執(zhí)行,就能讓后續(xù)的warp利用其計算周期覆蓋前面先跑warp的計算周期,強化GPGPU的延遲覆蓋能力。由此出發(fā)本文提出了一種基于窗口的調(diào)度機制,該機制通過引入調(diào)度窗口和等待隊列,讓調(diào)度窗口中的warp先于等待隊列中的warp先運行,并在調(diào)度窗口內(nèi)的warp遇到長周期存儲訪問時切換warp,并通過先行發(fā)射混合棧式機制中存在存儲指令的分
4、支來進一步強化存儲延遲覆蓋能力。本文對調(diào)度器窗口的大小、子warp調(diào)度優(yōu)先級以及存儲節(jié)流等調(diào)度策略和實現(xiàn)細節(jié)進行了討論。
本文通過GPGPU-SIM模擬器對該棧式機制及基于窗口的調(diào)度算法進行了驗證。通過對12種組合進行性能對比測試和敏感性測試,其結(jié)果表明,最佳的性能是在本文提出的兩種機制的組合下取得的,其相對于基準(zhǔn)測試平臺平均性能提高10.5%,相對于DWS平均性能提高6.8%,相對于PDOM和基于窗口調(diào)度機制的最佳性能提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于棧的GPGPU調(diào)度器設(shè)計研究.pdf
- 基于運行特性的GPGPU節(jié)能研究.pdf
- 基于GPGPU的軟陰影算法研究.pdf
- 基于GPGPU的SILK語音Codec優(yōu)化.pdf
- 基于GPGPU加速的鐵軌扣件識別研究.pdf
- 基于GPGPU的快速體繪制算法研究.pdf
- 基于網(wǎng)絡(luò)處理器的雙棧路由器的設(shè)計與實現(xiàn).pdf
- 基于嵌入式Linux路由器網(wǎng)絡(luò)協(xié)議棧的研究與設(shè)計.pdf
- 基于μC-OS-Ⅱ的調(diào)度算法改進及LwIP協(xié)議棧移植.pdf
- 基于混合集群節(jié)能調(diào)度器的研究與設(shè)計.pdf
- 基于ZigBee的無線傳感器網(wǎng)絡(luò)協(xié)議棧的設(shè)計與實現(xiàn).pdf
- 眾核結(jié)構(gòu)的基于塊的硬件調(diào)度器設(shè)計研究.pdf
- 基于GPGPU-Sim模擬的GPU功耗研究.pdf
- 基于GPGPU視頻編解碼技術(shù)研究.pdf
- 基于構(gòu)件思想的ZigBee協(xié)議棧研究與設(shè)計.pdf
- 基于GPGPU的復(fù)雜網(wǎng)絡(luò)分析算法的設(shè)計與實現(xiàn).pdf
- 棧的課程設(shè)計--- 棧的類設(shè)計
- 基于msstatePAN協(xié)議棧的監(jiān)控系統(tǒng)的研究與設(shè)計.pdf
- 基于GPGPU的快速白光干涉測量系統(tǒng)研究.pdf
- 基于GT的動態(tài)網(wǎng)格資源調(diào)度器的研究與設(shè)計.pdf
評論
0/150
提交評論