基于運行特性的GPGPU節(jié)能研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著GPGPU在通用計算領域的廣泛推廣,實際應用對GPGPU的計算能力提出了更高的要求。為了滿足應用的需求,GPGPU集成的處理單元的數量不斷增加,處理器的工作頻率也在不斷提升。雖然GPGPU的計算能力得到了一定的提高,然而付出的代價是GPGPU的能耗急劇增加。日益嚴重的能耗問題已經成為限制GPGPU應用到更多領域的主要障礙。
   只有針對計算指令比較多的程序,GPGPU多線程并行的優(yōu)勢才能得到體現(xiàn)。對于訪存指令比較多的程序,

2、SIMD流水線經常會因訪存延遲而停頓,GPGPU計算能力并不能得到充分發(fā)揮。當大量流水線出現(xiàn)停頓時,降低核的頻率來匹配訪存的速度,可以在保證程序性能的前提下實現(xiàn)節(jié)能。
   本文觀察到GPGPU在運行時,不同程序的性能有較大的差異。通過將程序指令分為訪存指令和計算指令兩類,本文分析了兩類指令對程序性能的影響。為了描述程序在運行過程中因訪存延遲而出現(xiàn)的流水線停頓,本文提出了warp發(fā)射率作為描述程序運行特性的統(tǒng)一指標,具體為平均每

3、個SM在每個時鐘周期中發(fā)射warp的數量。該指標能對GPGPU程序的性能進行指令級的評估。
   其次本文根據能耗與頻率的關系模型,基于GPGPU程序的運行特性,提出了對GPGPU進行調頻以達到平衡性能和能耗的目的。當warp發(fā)射率比較高的時候,以較高頻率運行程序,保證程序的性能;當warp發(fā)射率比較低的時候,以較低頻率運行程序,減少GPGPU的能耗。本文具體提出了靜態(tài)調頻和動態(tài)調頻兩種策略,前者根據程序的離線分析確定合適頻率,

4、后者根據程序的運行時特性在線調整頻率。同時,本文對兩種調頻策略的優(yōu)勢和劣勢進行了分析,并指出了它們各自比較適合的應用場景。
   處理器能耗模擬器Wattch能夠計算處理器器件的功耗,目前主要用于模擬CPU功耗。本文對其進行了大量分析和修改,并與一個時鐘精確的GPU模擬器GPGPU-Sim進行整合,實現(xiàn)了GPGPU能耗的模擬。同時模擬了部分程序的能耗,并與它們在真實GPGPU上的能耗進行對比,驗證了Wattch模擬GPGPU能耗

5、具有較好的準確性。
   為了驗證本文提出的兩種調頻策略的節(jié)能效果,在Wattch和GPGPU-Sim整合的實驗平臺上,實現(xiàn)了本文提出的兩種調頻策略。測試了6個具有代表性的測試程序,并與基準測試數據進行了比較。實驗數據表明,靜態(tài)調頻策略平均可以節(jié)省19.7%的能耗,而平均執(zhí)行時間只增加13.1%左右;動態(tài)調頻策略平均可以節(jié)省18%的能耗,而平均執(zhí)行時間只增加13.4%左右。對于部分應用程序,兩種調頻策略最多可以節(jié)省40%左右的能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論