版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著嵌入式應用的飛速發(fā)展以及芯片設(shè)計技術(shù)的不斷進步,處理器結(jié)構(gòu)專注于采用更多的并行計算資源開發(fā)并行性,而不再依賴于更復雜的串行硬件設(shè)計和更高的時鐘頻率。以超長指令字技術(shù)為主體,融合變長指令集、單指令流多數(shù)據(jù)流(SIMD)以及多核等技術(shù)的數(shù)字信號處理器(DSP)體系結(jié)構(gòu),已經(jīng)成為DSP體系結(jié)構(gòu)技術(shù)發(fā)展的主流。盡管這些體系結(jié)構(gòu)技術(shù)能以較低的硬件開銷,充分開發(fā)應用程序并行性,從而大幅提高處理器性能,但隨著指令發(fā)射復雜度和SIMD寬度的增加,這
2、些技術(shù)越來越受到數(shù)據(jù)通路利用率和可擴展性問題的困擾。本文研究面向性能的SIMD DSP指令流調(diào)度技術(shù),主要從指令流分布、指令流取指發(fā)射和指令流執(zhí)行三個部分展開。首先,分析和研究SIMD寬度、VLIW長度和多核數(shù)目在內(nèi)的體系結(jié)構(gòu)參數(shù)之間的關(guān)聯(lián),考察負載工作量的特征值,包括線程級并行(TLP),指令級并行(ILP),以及數(shù)據(jù)級并行(DLP)發(fā)生變化時,資源分配對系統(tǒng)效能造成的影響,以解釋結(jié)構(gòu)中的性能瓶頸,實現(xiàn)數(shù)據(jù)通路利用率和可擴展性的高效權(quán)
3、衡;其次,變長VLIW處理器的取指發(fā)射流水效率,能夠顯著影響整個數(shù)據(jù)通路的利用率,研究取指和發(fā)射的關(guān)鍵問題,以減少取指和發(fā)射導致的流水線停頓,能夠顯著提升DSP性能。再次,對于廣泛應用于高性能DSP中的SIMD技術(shù)而言,增大SIMD寬度并不一定能夠提高程序執(zhí)行性能,不同算法對SIMD寬度和程序流控制的需求有著顯著不同,提高 SIMD資源利用率對于提高系統(tǒng)性能有顯著影響。
本研究主要內(nèi)容包括:⑴借鑒近年來在通用多核芯片上的對性能
4、和功耗的相關(guān)分析與研究,構(gòu)建了一個新型的參數(shù)化性能功耗綜合分析模型,來評估層次化片上大規(guī)模并行結(jié)構(gòu)的性能和功耗。該模型抽象出參數(shù)諸如多核數(shù)量、超節(jié)點尺寸、處理單元數(shù)目、功能單元數(shù)目等,在滿足一定性能約束和功耗約束的前提下,考察負載工作量的特征值TLP、ILP和DLP發(fā)生變化時,資源分配對系統(tǒng)效能造成的影響。解析結(jié)果提供了對于設(shè)計超高性能DSP結(jié)構(gòu)的合理的選擇,以及使得系統(tǒng)具有更好可擴展性的理論基礎(chǔ),進一步揭示結(jié)構(gòu)中的性能瓶頸。⑵為提高變
5、長VLIW處理器的取指發(fā)射流水效率,減少和消除現(xiàn)有單線程取指發(fā)射流水線效率提升機制的弊端,提出了一種基于變長指令 VLIW結(jié)構(gòu)的高效取指發(fā)射流水架構(gòu)。該架構(gòu)引入了無效指令的檢測作廢機制,來消除無效的取指訪問帶來的開銷;引入了缺失指令旁路機制,來減少缺失指令引發(fā)的流水線停頓;引入了變長指令發(fā)射窗機制,解決分離指令字帶來的發(fā)射問題,從而為結(jié)構(gòu)提供高效連續(xù)的指令流。這一研究進一步揭示了基于VLIW架構(gòu)的取指發(fā)射流水線架構(gòu)的加速機理,使得單線程
6、流控加速技術(shù)變得清晰,這對指導高效流控機制設(shè)計具有重要意義。這種取指發(fā)射流水線能夠很好地在任意基于VLIW結(jié)構(gòu)的處理器中進行應用。⑶提出了向量分支線程壓縮機制(DBTC),來解決因應用中沒有包含充足的DLP,如應用中往往存在循環(huán)遍數(shù)低,控制流復雜,執(zhí)行行為不均勻的情況,而導致的SIMD資源空轉(zhuǎn)問題。將 SIMD硬件并行資源轉(zhuǎn)換成實際的應用性能,才是發(fā)揮 SIMD結(jié)構(gòu)處理器性能的關(guān)鍵所在。試驗結(jié)果表明:向量分支線程壓縮機制相較于基準 SI
7、MD結(jié)構(gòu),能夠獲取很好的加速。⑷提出一種稱為解耦的迭代映射(DIM)的方法,來解決因應用中包含迭代間相關(guān)的循環(huán)而導致的SIMD低效問題,開發(fā)了潛伏在算法中的中粒度的流水線線程并行,獲取了類似于多核線程級并行的執(zhí)行模式。它通過軟硬件的協(xié)同配合,動態(tài)的映射包含迭代間相關(guān)的循環(huán)到改進的SIMD結(jié)構(gòu)上,每一個處理單元(PE)能夠解耦的執(zhí)行循環(huán)體的一個片段的不同迭代,lane間的數(shù)據(jù)傳遞通過專用數(shù)據(jù)緩沖鏈(DBC)完成,從而自動榨取之前無法在SI
8、MD結(jié)構(gòu)上并行執(zhí)行的線程。DIM維護線程的局部性,隱藏了關(guān)鍵路徑延遲。實驗結(jié)果表明,DIM能夠保持SIMD結(jié)構(gòu)的關(guān)鍵優(yōu)勢,并且大大提升SIMD結(jié)構(gòu)處理含有迭代間相關(guān)應用的效率。⑸提出硬件支持軟流水機制(HSSP),來加速包含規(guī)整控制流的數(shù)據(jù)級并行循環(huán)體的執(zhí)行。繼而,提出多模式指令流出思想,它將解決非規(guī)整條件分支控制流的DBTC技術(shù),提升體間相關(guān)循環(huán)的DIM技術(shù),與優(yōu)化規(guī)整控制流的HSSP技術(shù)有機結(jié)合起來,從而提升SIMD結(jié)構(gòu)的綜合實力,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向VLIW處理器的指令調(diào)度技術(shù)研究.pdf
- 向量SIMD DSP上高效矩陣運算技術(shù)研究.pdf
- 面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實現(xiàn).pdf
- 面向SIMD的自動并行化關(guān)鍵技術(shù)研究.pdf
- 面向性能優(yōu)化的虛擬機熱遷移技術(shù)研究.pdf
- 匯率決定的微觀市場結(jié)構(gòu)理論——基于指令流的分析.pdf
- 生產(chǎn)指令流轉(zhuǎn)管理規(guī)程
- SIMD編譯優(yōu)化技術(shù)研究.pdf
- 面向SDN的流量調(diào)度技術(shù)研究.pdf
- 外匯指令流,中央銀行干預與人民幣匯率的形成
- 高性能X-DSP指令流水線部件設(shè)計實現(xiàn)與軟硬件協(xié)同驗證.pdf
- 面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究.pdf
- 面向多核的多層次實時網(wǎng)絡(luò)數(shù)據(jù)流調(diào)度技術(shù)研究.pdf
- 面向性能優(yōu)化的產(chǎn)品結(jié)構(gòu)定制關(guān)鍵技術(shù)研究及其應用.pdf
- 面向ASIC處理器的指令多發(fā)射技術(shù)研究.pdf
- 面向MapReduce計算模型的調(diào)度技術(shù)研究.pdf
- 面向注塑企業(yè)的車間生產(chǎn)調(diào)度技術(shù)研究.pdf
- 數(shù)據(jù)偏斜條件下面向性能與能耗的任務(wù)調(diào)度算法研究.pdf
- 面向GIS的工作流技術(shù)研究.pdf
- 面向COTS DSP軟錯誤的故障恢復技術(shù)研究.pdf
評論
0/150
提交評論