基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)并行結(jié)構(gòu)研究.pdf_第1頁
已閱讀1頁,還剩122頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著集成電路設(shè)計(jì)和制造工藝的進(jìn)步,具有高速、高密度可編程邏輯資源的現(xiàn)場可編程門陣列(Field Programmable Gate Array,FPGA)得到了快速發(fā)展,單芯片的集成度越來越高。當(dāng)前主流的FPGA芯片中包含了大量的可編程邏輯資源、可編程互聯(lián)資源、存儲資源,并通過集成DSP硬核支持高性能乘法部件的實(shí)現(xiàn),這些特點(diǎn)使得FPGA成為實(shí)現(xiàn)計(jì)算密集型應(yīng)用加速的一種非常重要的選擇。在眾多的計(jì)算密集型應(yīng)用中,卷積神經(jīng)網(wǎng)絡(luò)(Convolu

2、tional Neural Network,CNN)作為典型的多層神經(jīng)網(wǎng)絡(luò)始終處于研究的核心地位,對其進(jìn)行深入的研究,在模式識別、科學(xué)計(jì)算等領(lǐng)域具有重要的理論意義和應(yīng)用價(jià)值。
  卷積神經(jīng)網(wǎng)絡(luò)的并行體系結(jié)構(gòu)是CNN整體計(jì)算架構(gòu)的基礎(chǔ)和核心。本文在現(xiàn)有工作的基礎(chǔ)上,系統(tǒng)地研究了卷積神經(jīng)網(wǎng)絡(luò)并行結(jié)構(gòu),主要的研究內(nèi)容包括以下幾個方面:
  卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算具有多種并行特征,如何根據(jù)不同的并行計(jì)算特征設(shè)計(jì)相應(yīng)的并行結(jié)構(gòu),充分開發(fā)和

3、利用CNN計(jì)算的并行性是卷積神經(jīng)網(wǎng)絡(luò)并行計(jì)算的一個關(guān)鍵問題。本文基于“主機(jī)+FPGA”的計(jì)算架構(gòu),確定卷積神經(jīng)網(wǎng)絡(luò)并行計(jì)算單元在整個CNN計(jì)算架構(gòu)中的地位以及與其他部件的接口,設(shè)計(jì)了一種可配置的CNN計(jì)算單元并行結(jié)構(gòu),該結(jié)構(gòu)采用交叉互聯(lián)開關(guān)控制輸入和輸出特征映射圖與CNN計(jì)算單元的連接。應(yīng)用示例表明該結(jié)構(gòu)能夠根據(jù)卷積神經(jīng)網(wǎng)絡(luò)層內(nèi)計(jì)算的不同特征配置相應(yīng)的計(jì)算結(jié)構(gòu),有利于充分開發(fā)卷積神經(jīng)網(wǎng)絡(luò)層內(nèi)計(jì)算的并行性,提高卷積神經(jīng)網(wǎng)絡(luò)計(jì)算性能。

4、>  由于FPGA硬件資源的限制,完全并行的CNN計(jì)算結(jié)構(gòu)無法在FPGA上實(shí)現(xiàn),只能對部分卷積核進(jìn)行并行計(jì)算,如何把大量的卷積核循環(huán)語句映射到數(shù)量有限的計(jì)算單元仍然是一個需要解決的問題。通過給出CNN層內(nèi)計(jì)算模型的循環(huán)表示,然后根據(jù)不同的并行計(jì)算結(jié)構(gòu)對層內(nèi)計(jì)算進(jìn)行劃分,實(shí)現(xiàn)對多個循環(huán)迭代的卷積核循環(huán)語句調(diào)度執(zhí)行;通過給出不同劃分方法的代價(jià)函數(shù),能夠在資源約束的條件下,獲取不同并行計(jì)算結(jié)構(gòu)的執(zhí)行性能,進(jìn)而為卷積神經(jīng)網(wǎng)絡(luò)并行計(jì)算結(jié)構(gòu)的選擇提

5、供全面和精確的信息。
  卷積核計(jì)算單元的執(zhí)行效率在很大程度上決定著整個卷積神經(jīng)網(wǎng)絡(luò)的性能,其中數(shù)據(jù)緩存結(jié)構(gòu)的設(shè)計(jì)是二維卷積計(jì)算單元設(shè)計(jì)中的一個關(guān)鍵問題,緩存結(jié)構(gòu)設(shè)計(jì)的優(yōu)劣決定著卷積計(jì)算單元的硬件實(shí)現(xiàn)代價(jià)和性能。現(xiàn)有的二維卷積計(jì)算單元的內(nèi)部緩存結(jié)構(gòu)在實(shí)際應(yīng)用中存在各種不足。本文針對如何提高片上存儲資源使用效率的問題,提出了一種存儲面積優(yōu)化的數(shù)據(jù)緩存結(jié)構(gòu),采用寄存器輪轉(zhuǎn)策略充分開發(fā)卷積計(jì)算中的數(shù)據(jù)重用,實(shí)驗(yàn)結(jié)果表明該結(jié)構(gòu)提高了對片外

6、存儲器帶寬和片上存儲資源的利用率;針對如何在存儲帶寬受限條件下,充分開發(fā)卷積計(jì)算內(nèi)在并行性和提高輸出數(shù)據(jù)吞吐率的問題,提出了帶寬優(yōu)化的數(shù)據(jù)緩存結(jié)構(gòu),該結(jié)構(gòu)通過采用固定帶寬的數(shù)據(jù)廣播策略和單數(shù)據(jù)流驅(qū)動的流水線方式,充分利用了片上移位寄存器資源,實(shí)驗(yàn)結(jié)果表明該結(jié)構(gòu)在滿足輸出數(shù)據(jù)吞吐率最大化的條件下,減少了對片外存儲帶寬的需求。
  如何確定卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用不同層中特征映射圖的數(shù)量是卷積神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)中的一個關(guān)鍵問題,本文在對現(xiàn)有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論