版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、在過去的十幾年中,隨著工藝尺寸的進步,單芯片集成處理器核數(shù)逐步增加,眾核處理器成為微處理器發(fā)展的趨勢之一。傳統(tǒng)的總線互連結(jié)構(gòu)已無法適應(yīng)眾核處理器的需求,因此具有高并發(fā)特性的片上互連網(wǎng)絡(luò)(NoC)等非順序互連結(jié)構(gòu)逐漸成為眾核處理器中片上互連結(jié)構(gòu)的主流趨勢。非順序互連結(jié)構(gòu)的使用,增加了Cache一致性協(xié)議機制的設(shè)計復(fù)雜度和硬件開銷,其高昂的代價限制了眾核處理器的性能,即Cache一致性墻(Coherence Wall)的問題。
為
2、提高眾核處理器中基于Cache一致性協(xié)議的核間通信性能,本文基于Cache一致性分區(qū)機制,在以下方面進行了研究:
1)動態(tài)可擴展的Cache一致性分區(qū)機制。隨著眾核處理器中NoC規(guī)模的增加,Cache一致性協(xié)議通常會帶來巨大的廣播和多播通信代價。當前的Cache一致性協(xié)議性能提升通常通過降低通信次數(shù)完成,但是其硬件代價較高;靜態(tài)分區(qū)機制可以較低硬件開銷避免NoC規(guī)模上升帶來的核間通信性能下降,但是其靈活度較低;而動態(tài)分區(qū)機制中
3、Cache一致性協(xié)議設(shè)計較為復(fù)雜。由于并行應(yīng)用程序在使用超過16個處理器核時加速比有限,為應(yīng)對未來大規(guī)模眾核處理器的應(yīng)用場景,本文結(jié)合動態(tài)可擴展的子網(wǎng)劃分機制,提出了動態(tài)可擴展的Cache一致性分區(qū)(SCCP)機制?;贕em5的仿真測試表明,相較Token協(xié)議0.98%的額外硬件資源開銷,SCCP機制以1.67%的硬件開銷,提升平均18.8%的Cache系統(tǒng)性能和9%的系統(tǒng)總體性能。同時,與額外硬件開銷為3.30%的DiCo協(xié)議相比,
4、SCCP機制具有相近的性能。
2)針對支持動態(tài)可擴展 Cache一致性分區(qū)的不規(guī)則拓撲的子網(wǎng)劃分機制。子網(wǎng)劃分機制能夠有效限制眾核處理器中廣播和多播的范圍,降低并行應(yīng)用程序之間的通信干擾,提高數(shù)據(jù)共享和核間通信的性能。傳統(tǒng)的子網(wǎng)劃分機制通常采用最佳適配的拓撲結(jié)構(gòu)覆蓋子網(wǎng);該機制雖然能夠減少廣播范圍和網(wǎng)絡(luò)中數(shù)據(jù)包的數(shù)量,但是由于可用路由鏈路的減少會帶來網(wǎng)絡(luò)擁塞,從而增加了子網(wǎng)內(nèi)數(shù)據(jù)包的平均網(wǎng)絡(luò)延時。在本文提出的支持不規(guī)則拓撲結(jié)構(gòu)
5、的子網(wǎng)劃分機制中,采用多個矩形子網(wǎng)嵌套的物理子網(wǎng)覆蓋邏輯子網(wǎng),可提供更多可用的路由路徑。仿真測試表明,針對眾核處理器中 Cache一致性協(xié)議常見的5~10%的廣播率,較當前已有的子網(wǎng)劃分機制相比,可獲得10%左右的性能提升。子網(wǎng)嵌套的子網(wǎng)劃分機制可有效降低無死鎖路由的設(shè)計復(fù)雜度,同時每個路由節(jié)點僅需添加兩位寄存器,具有較低硬件代價。
3)兼容消息傳遞機制的動態(tài)可重構(gòu)Cache結(jié)構(gòu)設(shè)計。為解決眾核處理器中Cache一致性協(xié)議帶來
6、的核間通信的延時,現(xiàn)有的眾核處理器及研究中提出了片內(nèi)硬件支持的消息傳遞機制,提升了約13%的系統(tǒng)性能。然而在大規(guī)模眾核處理器的設(shè)計中,通常采用輕量級核心運行單線程,因此在運算時獨立的消息傳遞緩存(MPB)處于閑置狀態(tài);同時,運算時的Cache訪問延時對獨立MPB機制的整體性能也有重要的影響。因此,本文基于現(xiàn)有的Cache一致性協(xié)議,提出了可重構(gòu)為 MPB的動態(tài)可重構(gòu) Cache結(jié)構(gòu)(RMCC),可按需將片上SRAM存儲重構(gòu)為Cache或
7、MPB使用;RMCC機制通過復(fù)用邏輯電路對基礎(chǔ)Cache協(xié)議的狀態(tài)進行擴展,在重構(gòu)的Cache存儲上實現(xiàn)了消息傳遞機制。仿真實驗表明,相較硬件額外開銷為5.26%的獨立MPB機制,RMCC機制可以在相同的硬件開銷下降低8%的Cache缺失率,在當前獨立MPB實現(xiàn)機制基礎(chǔ)上,提升約11.4%的性能;另外,在避免MPB的5.26%額外開銷的情況下,可以帶來與獨立MPB機制相近的總體系統(tǒng)性能。
本文針對眾核處理器設(shè)計中面臨的Cach
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 眾核處理器中動態(tài)可重構(gòu)Cache一致性協(xié)議的研究與實現(xiàn).pdf
- 多核處理器Cache一致性研究與設(shè)計.pdf
- 對稱多核處理器中Cache一致性的研究與實現(xiàn).pdf
- 眾核系統(tǒng)動態(tài)分區(qū)Cache一致性協(xié)議與分區(qū)內(nèi)負載感知廣播機制研究.pdf
- 面向大數(shù)據(jù)處理的多核處理器Cache一致性協(xié)議.pdf
- 一種維護Cache一致性的多核處理器建模研究.pdf
- 邏輯核動態(tài)可重構(gòu)的眾核處理器體系結(jié)構(gòu).pdf
- 片上多處理器體系結(jié)構(gòu)中Cache一致性模型研究.pdf
- 面向可重構(gòu)眾核處理器的子網(wǎng)劃分與廣播機制研究.pdf
- 分片式處理器上非均勻一致Cache的設(shè)計與優(yōu)化.pdf
- 多核環(huán)境Cache——一致性協(xié)議研究.pdf
- 可重構(gòu)眾核流處理器上的編譯與程序優(yōu)化技術(shù).pdf
- 多內(nèi)核cache一致性研究與實現(xiàn).pdf
- 多維度可重構(gòu)協(xié)議一致性測試系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 動態(tài)對策中解的時間一致性.pdf
- 多內(nèi)核cache一致性協(xié)議研究與實現(xiàn).pdf
- 動態(tài)可重構(gòu)協(xié)處理器研究.pdf
- cache(高速緩存)與主存一致性初探
- 眾核處理器核級冗余拓撲重構(gòu)算法研究.pdf
- 面向多核處理器的令牌一致性協(xié)議優(yōu)化技術(shù)研究.pdf
評論
0/150
提交評論