版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、高性能計(jì)算廣泛運(yùn)用在科學(xué)計(jì)算、可視化處理、商業(yè)數(shù)據(jù)模型分析等領(lǐng)域。程序性能與平臺(tái)架構(gòu)息息相關(guān)。龍芯作為具有自主知識(shí)產(chǎn)權(quán)的國(guó)產(chǎn)芯片的代表,它的3B系列芯片被廣泛運(yùn)用在航天、生物信息、氣象等領(lǐng)域。但由于它的軟件生態(tài)環(huán)境不健全,許多軟件沒有針對(duì)它的架構(gòu)進(jìn)行優(yōu)化。龍芯普通訪存速度慢,加上軟件移植過程中龍芯編譯器無法充分發(fā)揮硬件計(jì)算與訪存分離的特性,軟件與平臺(tái)架構(gòu)耦合性低,容易導(dǎo)致部分科學(xué)計(jì)算軟件的運(yùn)行性能低,不能滿足用戶的計(jì)算需求,這制約著龍芯
2、的市場(chǎng)化推廣。如何優(yōu)化龍芯平臺(tái)的軟件性能成為龍芯亟需解決的問題。
因此,本文圍繞龍芯平臺(tái)上高性能計(jì)算的訪存和計(jì)算優(yōu)化關(guān)鍵問題展開研究。主要的研究?jī)?nèi)容和貢獻(xiàn)如下:
(1)針對(duì)科學(xué)傳播網(wǎng)站用戶持續(xù)使用行為影響因素實(shí)證研究與龍芯硬件架構(gòu)耦合性低的問題,以BLAS庫中矩陣矩陣乘函數(shù)GEMM為研究對(duì)象,提出了一種加速計(jì)算密集型應(yīng)用的異步計(jì)算訪存優(yōu)化方法。該優(yōu)化方法根據(jù)龍芯計(jì)算與訪存分離的特性,通過對(duì)任務(wù)進(jìn)行分組和流水化處理;然
3、后在計(jì)算過程中,利用多通道DMA訪存方法實(shí)現(xiàn)數(shù)據(jù)的預(yù)取或讀寫,從而將大量的訪存開銷隱藏到計(jì)算中;最后,使用SIMD指令向量化提升核心的計(jì)算性能。此外,通過分析計(jì)算與訪存分離的特征,給出了一種龍芯平臺(tái)上計(jì)算密集型應(yīng)用的性能評(píng)估方法。
(2)針對(duì)普通訪存方法不能滿足龍芯平臺(tái)中應(yīng)用訪存速度需求的問題,以FFTW核心算法為研究對(duì)象,提出一種面向計(jì)算密集型應(yīng)用的多層數(shù)據(jù)劃分優(yōu)化方法。該優(yōu)化方法以龍芯3B1500處理器為研究平臺(tái),根據(jù)FF
4、T中數(shù)據(jù)的訪存規(guī)律,利用龍芯鎖cache機(jī)制保證緩存中數(shù)據(jù)不會(huì)被替換,進(jìn)而采用多層數(shù)據(jù)劃分以提升緩存中數(shù)據(jù)的利用率,通過增加迭代層數(shù)提升寄存器堆數(shù)據(jù)的重用率,并且使用特殊向量指令加速核心運(yùn)算;與此同時(shí),通過使用CPU和DMA協(xié)同訪存方法來提高數(shù)據(jù)讀寫速度。
(3)針對(duì)CC-NUMA架構(gòu)中易由數(shù)據(jù)部署不合理而導(dǎo)致計(jì)算密集型應(yīng)用并行效率低的問題,以KD-90為研究平臺(tái),在PCAM并行框架的基礎(chǔ)上,提出了一個(gè)面向計(jì)算密集型應(yīng)用的并行
5、框架HPFCA。根據(jù)應(yīng)用的數(shù)據(jù)訪存規(guī)律,對(duì)框架中的任務(wù)劃分、節(jié)點(diǎn)間任務(wù)并行、數(shù)據(jù)重新部署、節(jié)點(diǎn)內(nèi)多核并行和單核程序優(yōu)化五個(gè)部分進(jìn)行設(shè)計(jì),利用訪存數(shù)據(jù)局部性完成訪存的性能優(yōu)化。并且根據(jù)該框架,在KD-90上實(shí)現(xiàn)了GEMM和FFT的高效并行算法。
(4)針對(duì)多核異構(gòu)平臺(tái)中應(yīng)用程序難以并發(fā)執(zhí)行的問題,以三維泊松方程求解算法為研究對(duì)象,提出了一種異構(gòu)平臺(tái)下多種計(jì)算資源負(fù)載均衡的高效算法。該算法通過使用多重網(wǎng)格法對(duì)三維泊松方程進(jìn)行離散,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高性能計(jì)算機(jī)若干關(guān)鍵問題研究.pdf
- 龍芯多核平臺(tái)上性能分析工具的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 混合異構(gòu)眾核平臺(tái)上的高性能計(jì)算金融算法研究.pdf
- 面向高性能計(jì)算平臺(tái)的Hadoop框架研究及優(yōu)化.pdf
- MPI高性能云計(jì)算平臺(tái)關(guān)鍵技術(shù)研究.pdf
- 電工裝備性能分析的云計(jì)算關(guān)鍵問題研究.pdf
- 云計(jì)算中虛擬機(jī)實(shí)時(shí)遷移性能優(yōu)化關(guān)鍵問題研究.pdf
- 龍芯3號(hào)多核平臺(tái)上性能調(diào)優(yōu)環(huán)境的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 高性能計(jì)算平臺(tái)的設(shè)計(jì)與應(yīng)用.pdf
- DSP算法不同平臺(tái)上的實(shí)現(xiàn)、性能研究與優(yōu)化.pdf
- 圖像哈希性能分析的若干關(guān)鍵問題研究.pdf
- 基于MPI的多層容錯(cuò)高性能云計(jì)算平臺(tái)關(guān)鍵技術(shù)研究.pdf
- 群智能算法高性能計(jì)算平臺(tái)的研究.pdf
- 大型火電機(jī)組性能監(jiān)測(cè)與優(yōu)化中的關(guān)鍵問題研究.pdf
- Android虛擬機(jī)Dalvik在龍芯平臺(tái)上的移植與優(yōu)化.pdf
- 基于國(guó)產(chǎn)高性能計(jì)算機(jī)的GRAPES性能優(yōu)化研究.pdf
- 大型異型結(jié)構(gòu)抗震性能的關(guān)鍵問題研究.pdf
- 紅外成像系統(tǒng)性能評(píng)估關(guān)鍵問題研究.pdf
- CBTC測(cè)試平臺(tái)關(guān)鍵問題研究.pdf
- ibm platform高性能計(jì)算平臺(tái)在研究云中的應(yīng)用
評(píng)論
0/150
提交評(píng)論