版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、分片式處理器能夠很好地應(yīng)對納米工藝代芯片設(shè)計(jì)中存在的功耗、線延遲和設(shè)計(jì)復(fù)雜性問題,充分地利用日益增長的片上晶體管資源以提升應(yīng)用的性能,但對其上的Cache設(shè)計(jì)提出了新的要求。一方面,需要有分片式的Cache結(jié)構(gòu)以滿足大量執(zhí)行單元的并發(fā)訪存需求;另一方面,需要有分布式內(nèi)存依賴解析機(jī)制以保證分布式的訪存順序。與傳統(tǒng)的全局控制的Cache結(jié)構(gòu)相比,非均勻一致Cache結(jié)構(gòu)(NUCA,Non-Uniform Cache Architecture
2、)能夠滿足上述要求,更好地適應(yīng)分片式處理器體系結(jié)構(gòu)。本文設(shè)計(jì)了分片式處理器上的非均勻一致的二級和一級Cache結(jié)構(gòu),并根據(jù)分片式處理器中特有的訪存特征對非均勻一致的一級Cache的結(jié)構(gòu)進(jìn)行優(yōu)化,提出了Load本地化執(zhí)行模型,最終評估了模型的性能和開銷。該研究工作對分片式處理器上Cache結(jié)構(gòu)的設(shè)計(jì)具有一定的指導(dǎo)意義。 本文對非均勻一致二級和一級Cache的設(shè)計(jì)和優(yōu)化均基于實(shí)驗(yàn)室所研究的分片式處理器-指令級并行核(TPA-PI,T
3、iled Processor Architecture-Processor For ILP)。主要研究成果包括:(1)為TPA-PI設(shè)計(jì)了非均勻一致二級Cache,設(shè)計(jì)包括:靜態(tài)數(shù)據(jù)映射方式,片上網(wǎng)絡(luò)互連,Cache Bank內(nèi)部結(jié)構(gòu),Cache事務(wù)處理邏輯,以及Cache流水線。并使用C語言編寫了面向硬件實(shí)現(xiàn)的TPA-PI的二級Cache模擬器。該部分亦可以作為普適的靜態(tài)非均勻一致Cache的設(shè)計(jì)實(shí)例。(2)針對TPA-PI上非均勻一
4、致一級Cache中存在的Load指令的長路由延遲問題,進(jìn)行了相關(guān)的設(shè)計(jì)優(yōu)化。首先剖析了結(jié)構(gòu)中的訪存行為特征,并根據(jù)Load指令數(shù)據(jù)端和發(fā)射端不一致的情況,分析其中可能獲得的性能提升潛力,據(jù)此設(shè)計(jì)了Load本地化執(zhí)行的優(yōu)化模型,并設(shè)計(jì)了多種拷貝策略和一致性維護(hù)策略以控制拷貝和Store廣播的開銷。(3)從功能和時(shí)序模擬兩個(gè)方面評估了Load本地化執(zhí)行模型的性能和開銷。經(jīng)實(shí)驗(yàn)觀測,基本模型可以獲得平均5.72%的性能提升,拷貝開銷對于Cac
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 分片式處理器上指令調(diào)度器的設(shè)計(jì)與優(yōu)化.pdf
- 分片式處理器上指令調(diào)度器的設(shè)計(jì)及優(yōu)化.pdf
- 分片式處理器上謂詞執(zhí)行技術(shù)的實(shí)現(xiàn)與優(yōu)化.pdf
- 多核處理器Cache一致性研究與設(shè)計(jì).pdf
- 分片式處理器一級數(shù)據(jù)緩存的設(shè)計(jì)與優(yōu)化.pdf
- 分片式處理器體系結(jié)構(gòu)上的超塊優(yōu)化技術(shù).pdf
- 分片式處理器上激進(jìn)執(zhí)行模型分析.pdf
- 對稱多核處理器中Cache一致性的研究與實(shí)現(xiàn).pdf
- 分片式流處理器體系結(jié)構(gòu).pdf
- 類數(shù)據(jù)流驅(qū)動(dòng)的分片式處理器上一種超塊優(yōu)化技術(shù).pdf
- 面向大數(shù)據(jù)處理的多核處理器Cache一致性協(xié)議.pdf
- 類數(shù)據(jù)流驅(qū)動(dòng)的分片式處理器上的編譯及優(yōu)化技術(shù).pdf
- 片上多處理器體系結(jié)構(gòu)中Cache一致性模型研究.pdf
- 一種維護(hù)Cache一致性的多核處理器建模研究.pdf
- 分片式處理器上超塊生成器的設(shè)計(jì)與研究.pdf
- 眾核處理器中Cache一致性機(jī)制的動(dòng)態(tài)可重構(gòu)設(shè)計(jì).pdf
- 分片式流處理器數(shù)據(jù)并行存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- RISC處理器指令Cache設(shè)計(jì)及其優(yōu)化.pdf
- 眾核處理器中動(dòng)態(tài)可重構(gòu)Cache一致性協(xié)議的研究與實(shí)現(xiàn).pdf
- 片上多核處理器末級cache優(yōu)化技術(shù)研究
評論
0/150
提交評論