版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著半導(dǎo)體制造工藝的進(jìn)步,可編程門陣列(Field-Programmable Gate Array,FPGA)迅速發(fā)展,單芯片上可供快速實(shí)現(xiàn)的邏輯功能越來越多,基于FPGA的可重構(gòu)計(jì)算在高性能計(jì)算甚至是超級(jí)計(jì)算領(lǐng)域中的巨大潛力逐漸被挖掘出來。當(dāng)前主流的FPGA芯片上往往具有高密度的可編程邏輯、大量存儲(chǔ)資源與計(jì)算資源,并通過集成DSP硬核以支持高性能浮點(diǎn)運(yùn)算部件的實(shí)現(xiàn)。這些特點(diǎn)使得可重構(gòu)計(jì)算系統(tǒng)成為加速計(jì)算密集型應(yīng)用的一種非常重要的選擇。
2、在眾多受到關(guān)注的計(jì)算密集型問題中,矩陣分解尤其是矩陣三角化分解作為典型的基礎(chǔ)類應(yīng)用始終處于研究的核心地位,在求解線性方程組、求矩陣特征值等科學(xué)與工程問題中有重要的研究價(jià)值。
縱觀國內(nèi)外研究現(xiàn)狀,在矩陣三角化分解及應(yīng)用領(lǐng)域已經(jīng)取得了很多研究成果,但仍存在許多亟待解決的問題。根據(jù)可重構(gòu)計(jì)算并行結(jié)構(gòu)的特征構(gòu)建矩陣三角化分解并行計(jì)算模型,進(jìn)一步改善三角化分解硬件結(jié)構(gòu)計(jì)算性能及關(guān)鍵技術(shù)成為當(dāng)前該領(lǐng)域關(guān)注的課題。針對(duì)該課題,本文面向矩陣三
3、角化分解中共有的三角化計(jì)算過程,提出具有一般性的矩陣三角化計(jì)算FPGA并行結(jié)構(gòu)時(shí)空模型以及一種計(jì)算復(fù)雜度較低的矩陣三角化計(jì)算并行結(jié)構(gòu)模板。并圍繞三種具體的矩陣三角化分解:Cholesky分解、LU分解和QR分解在并行結(jié)構(gòu)模板上的高性能實(shí)現(xiàn)及優(yōu)化方法開展研究,取得的研究成果包括:
1、提出具有一般性的三角化計(jì)算FPGA并行結(jié)構(gòu)時(shí)空模型構(gòu)建方法和一種計(jì)算復(fù)雜度較低的矩陣三角化計(jì)算并行結(jié)構(gòu)模板。(1)對(duì)三角化計(jì)算線性變換的一般過程進(jìn)
4、行分析,以子矩陣更新過程為粗粒度計(jì)算任務(wù)來開發(fā)任務(wù)間的流水并行;(2)在任務(wù)中以列計(jì)算為細(xì)粒度單位開發(fā)數(shù)據(jù)并行;(3)以求解有限域GF(p)上線性方程組的三角化計(jì)算問題為示例,面向三角化計(jì)算中子矩陣更新過程中提出適合硬件實(shí)現(xiàn)的子矩陣更新同一化算法并向FPGA上映射實(shí)現(xiàn)。
2、在三角化計(jì)算并行結(jié)構(gòu)模板上實(shí)現(xiàn)實(shí)數(shù)矩陣Cholesky分解,由此提出該算法的高性能FPGA并行結(jié)構(gòu)。分析Cholesky分解的求解特征,引入求解矩陣L的轉(zhuǎn)
5、置LT的LT-SC(LT-Submatrix-Cholesky),從而簡化問題的求解。從對(duì)比驗(yàn)證的角度,給出兩種LT-SC的并行結(jié)構(gòu)實(shí)現(xiàn)方案。其中,方案二針對(duì)Cholesky分解特有的三角子矩陣更新過程對(duì)子矩陣更新同一化算法進(jìn)行了改進(jìn),并在實(shí)現(xiàn)時(shí)通過增加PE陣列的使能信號(hào)向量以支持改進(jìn)后的算法。提出的Cholesky分解FPGA并行結(jié)構(gòu)采用方案二的實(shí)現(xiàn),實(shí)驗(yàn)結(jié)果表明該結(jié)構(gòu)與對(duì)比方案(方案一)相比具有更高的單位面積性能,且優(yōu)于相關(guān)工作和通
6、用處理器的軟件實(shí)現(xiàn)。
3、在三角化計(jì)算并行結(jié)構(gòu)模板上實(shí)現(xiàn)列選主元的實(shí)數(shù)矩陣LU分解,由此提出該算法的高性能FPGA并行結(jié)構(gòu)。分析LU分解的求解特征,對(duì)子矩陣更新同一化算法進(jìn)行了擴(kuò)展與改進(jìn)以支持LU分解的列選主元,并在實(shí)現(xiàn)的并行結(jié)構(gòu)中增加與之匹配的硬件通路。提出的并行結(jié)構(gòu)在求解線性方程組完成同時(shí)支持前向三角回代及后向回代過程的LU分解,相當(dāng)于實(shí)現(xiàn)了求解實(shí)系數(shù)增廣矩陣的高斯-約當(dāng)消元算法。同時(shí),針對(duì)大矩陣問題提出基于非遞歸和遞歸方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于圖計(jì)算模型的矩陣分解并行化研究.pdf
- 基于矩陣分解的壓縮感知重構(gòu)算法研究.pdf
- 基于矩陣分解的并行協(xié)同過濾算法研究.pdf
- 領(lǐng)域?qū)S每芍貥?gòu)計(jì)算結(jié)構(gòu)研究.pdf
- 可重構(gòu)配置的并行計(jì)算機(jī)設(shè)計(jì).pdf
- 基于lp范數(shù)的非負(fù)矩陣分解并行優(yōu)化算法
- 基于異構(gòu)系統(tǒng)的多對(duì)角矩陣并行計(jì)算研究.pdf
- 矩陣特征問題并行計(jì)算的研究.pdf
- 結(jié)構(gòu)矩陣的并行算法.pdf
- 基于FPGA的矩陣特征值并行計(jì)算研究.pdf
- 基于可重構(gòu)處理器的并行視覺處理算法研究.pdf
- 面向圖像處理的可重構(gòu)計(jì)算系統(tǒng)結(jié)構(gòu).pdf
- 可重構(gòu)計(jì)算體系結(jié)構(gòu)及應(yīng)用研究.pdf
- 可重構(gòu)計(jì)算系統(tǒng)體系結(jié)構(gòu)研究與實(shí)現(xiàn).pdf
- 基于譜矩陣分解重構(gòu)的波束形成聲源識(shí)別方法.pdf
- 動(dòng)態(tài)部分可重構(gòu)系統(tǒng)的設(shè)計(jì)方法及可重構(gòu)計(jì)算研究.pdf
- Soc可重構(gòu)計(jì)算部件之異步可重構(gòu)計(jì)算陣列設(shè)計(jì).pdf
- 基于流水線可重構(gòu)結(jié)構(gòu)的可重構(gòu)算法研究及AES算法實(shí)現(xiàn).pdf
- 可重構(gòu)并行小衛(wèi)星星載計(jì)算機(jī)體系結(jié)構(gòu)設(shè)計(jì).pdf
- 可重構(gòu)造網(wǎng)孔機(jī)器上的并行計(jì)算幾何算法及應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論