2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,隨著GPGPU在生物計算、金融分析、天氣預測等高性能計算領域發(fā)揮著越來越重要的作用,有關GPGPU的相關研究逐漸成為研究的熱點。在模擬器設計方面,一個高性能的模擬器對GPGPU的研究而言至關重要,而當前GPGPU模擬器大多為串行模擬器,模擬速度極慢,極大制約了模擬器在GPGPU體系結構研究中的應用。在GPGPU體系結構設計方面,隨著GPGPU計算能力的不斷增加,GPGPU中越來越多的計算節(jié)點需要通過片上網(wǎng)絡與存儲節(jié)點進行通信。隨

2、著片上網(wǎng)絡在片上多核系統(tǒng)設計中所占的開銷不斷增大,如何在保持性能不變的前提下設計低開銷的片上網(wǎng)絡對于GPGPU的發(fā)展至關重要。
  針對于第一個問題,本文提出了GPGPU并行模擬的方案,充分利用現(xiàn)有宿主平臺多機多核的計算優(yōu)勢加速GPGPU程序的模擬速度;針對第二個問題,本文提出了GPGPU低開銷片上網(wǎng)絡設計的方案,首先通過一系列的設計避免了網(wǎng)絡中報文的沖突,然后通過簡化路由器微體系結構設計降低了片上網(wǎng)絡的開銷。
  本文的研

3、究工作和成果有:
 ?。?)提出了GPGPU在多核多機平臺下的并行模擬方案
  在多核宿主平臺下,本文提出了Kernel內部的并行模擬,一方面使用多個模擬線程同時對多個Cluster進行模擬,并要求多個模擬線程在每個時鐘周期進行同步以保持模擬精度,另一方面并行化執(zhí)行驅動中的功能模擬和性能模擬以彌補時鐘同步帶來的性能損失。在多機宿主平臺下,本文提出了Kernel之間并行模擬的方案,將Kernel函數(shù)進行分組后利用多機平臺并行的

4、對各組進行模擬以獲得性能的提升。在GPGPU模擬器對程序進行模擬的過程中,它會依賴功能模擬提供的結果,因此功能模擬在一定程度上會制約GPGPU模擬器的模擬速度,本文針對CUDA編程模型的特點提出了一種并行化功能模擬的方法,并就它應用到了Kernel內部、Kernel之間并行模擬中。
 ?。?)提出了GPGPU低開銷片上網(wǎng)絡設計方案
  本文針對GPGPU中Request網(wǎng)絡的通信特點提出了低開銷的片上網(wǎng)絡設計。將計算節(jié)點分為

5、若干組,通過向各組分配專屬子網(wǎng)避免了不同組之間的報文沖突;設計了令牌發(fā)射機制以及令牌傳輸網(wǎng)絡,徹底避免了組內的報文沖突,并對網(wǎng)絡不存在任何沖突進行了證明;設計了低開銷的路由器微體系結構,實現(xiàn)了報文在相鄰路由器之間的單周期傳輸;設計了狀態(tài)回傳網(wǎng)絡,使計算節(jié)點可以感知存儲節(jié)點中報文緩存隊列的狀態(tài)變化,從而進行相應的發(fā)包調整。
  本文對上述方案進行實現(xiàn),并針對多個CUDA測試集中的測試程序對系統(tǒng)性能進行了詳細的測試與分析。實驗結果表明

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論