2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩128頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著計算能力和可編程性的不斷增強,GPU被越來越多的應用開發(fā)人員用作性能加速器以提高程序性能。然而,如果沒有經(jīng)過精心優(yōu)化,很難在GPU上實現(xiàn)理想性能。這是因為GPU程序的優(yōu)化工作已經(jīng)從硬件設計者轉移到應用開發(fā)人員手中。而GPU程序的性能優(yōu)化是一個非常困難的過程,其實質是實現(xiàn)算法特性向底層硬件特征的高效映射。一方面這個過程需要對GPU底層硬件有著深入的認識,而現(xiàn)代GPU架構的日益多樣性,無疑加劇了本已困難的優(yōu)化工作;另一方面,移植到GPU

2、上的應用的程序特性也日益多樣化,從整體上看,這些應用可分為規(guī)則應用和非規(guī)則應用兩大類。不同的程序特性在不同硬件架構上具有不同的優(yōu)化方法和策略。為簡化GPU程序的性能優(yōu)化工作,使應用開發(fā)人員能夠更加容易的實現(xiàn)高性能GPU程序。針對不同的應用特點,本文的主要工作可分為兩部分:
  針對規(guī)則應用,我們提出性能優(yōu)化鏈的概念,并根據(jù)GPU計算和訪存的特點,將性能優(yōu)化鏈劃分為絕對性能優(yōu)化鏈和相對性能優(yōu)化鏈兩類。通過引入Roof line模型,

3、實現(xiàn)了性能優(yōu)化鏈的可視化,建立了針對特定硬件平臺的可視化GPU程序性能優(yōu)化指導模型:GPURoofline。該模型可通過提供性能信息來確定GPU程序在特定硬件平臺上的性能瓶頸以及應選擇的優(yōu)化策略和方法,以此來指導應用開發(fā)人員特別是對GPU底層架構不熟悉的應用開發(fā)人員更加容易的實現(xiàn)高性能GPU程序。本文通過三個具有不同計算密度和程序特性的典型應用驗證了GPURoofline模型的可用性和正確性。
  針對非規(guī)則應用,以Viola-J

4、ones人臉檢測算法為例,引入了非規(guī)則應用在GPU上實現(xiàn)和優(yōu)化的五大關鍵技術:粗粒度并行、Uberkernel、Persistent Kernel、本地隊列和全局隊列。并通過性能特征參數(shù)的定義和抽取,完成了可調優(yōu)GPUkernel的初步實現(xiàn),并以此實現(xiàn)了Viola-Jones人臉檢測算法在不同GPU平臺上的性能移植。實驗表明,經(jīng)過優(yōu)化的Viola-Jones人臉檢測算法比OpenCV庫中同樣經(jīng)過精心優(yōu)化的CPU版本在AMD HD5850

5、 GPU、AMD HD7970 GPU和NVlDIA C2050 GPU三個GPU平臺上分別達到了5.19~27.724、6.468~35.080和5.850~28.768的性能提升。
  本文的創(chuàng)新點如下:
  (1)分析和比較當前主流GPU架構的異同,提出了GPU程序性能優(yōu)化的三大有效途徑:提高片外帶寬利用率,提高計算資源利用率和數(shù)據(jù)本地化。
  (2)提出算法計算密度和硬件計算密度兩個概念,并通過這兩個概念的比較

6、將GPU kernel分為訪存密集型和計算密集型兩大類。提出并構建針對特定硬件平臺的性能優(yōu)化鏈。并根據(jù)訪存和計算優(yōu)化的特點,將性能優(yōu)化鏈劃分為絕對性能優(yōu)化鏈和相對性能優(yōu)化鏈兩類。
  (3)構建完成了一個可視化的GPU性能指導模型:GPURoofline。通過引入Roofline模型實現(xiàn)了性能優(yōu)化鏈的可視化,以一種更加直觀的形式指導GPU程序的優(yōu)化。
  (4)引入非規(guī)則應用在GPU實現(xiàn)和優(yōu)化的五大方法和策略:粗粒度并行、U

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論