2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于基于TMS320C6678的語種識別并行算法設(shè)計(jì)與實(shí)現(xiàn)的語種識別并行算法設(shè)計(jì)與實(shí)現(xiàn)吉立新,劉偉偉,李邵梅時(shí)間:2012年12月03日來源:電子技術(shù)應(yīng)用2012年第10期摘要:要:針對語種識別在實(shí)際應(yīng)用中的實(shí)時(shí)性需求,在分析語種識別算法原理和多核DSP任務(wù)并行的基礎(chǔ)上,設(shè)計(jì)了一種基于TMS320C6678的語種識別算法并行實(shí)現(xiàn)方法。該方法實(shí)現(xiàn)了任務(wù)級并行流水和核間高效通信。實(shí)驗(yàn)結(jié)果表明,該方法可靠、有效,并且使該系統(tǒng)至少能夠完成132

2、路的實(shí)時(shí)識別任務(wù)。關(guān)鍵詞:關(guān)鍵詞:語種識別;多核DSP;TMS320C6678;并行處理語種識別是計(jì)算機(jī)通過分析處理一個(gè)語音片段,判別其所屬語言種類的過程[1]。語種識別的任務(wù)在于快速準(zhǔn)確地識別出語言的種類,自上世紀(jì)90年代以來,已經(jīng)成為通信和信息領(lǐng)域一個(gè)新的學(xué)科增長點(diǎn),在多語種信息服務(wù)、機(jī)器翻譯及軍事安全等領(lǐng)域都有著廣泛的應(yīng)用前景[2]。語種識別走向?qū)嵱没粌H要有令人滿意的識別性能,其實(shí)時(shí)處理的效率也是必須要考慮的因素。因此,設(shè)計(jì)能

3、夠?qū)崿F(xiàn)多路實(shí)時(shí)處理的語種識別系統(tǒng)是語種識別邁出實(shí)用化的關(guān)鍵一步。本文針對語種識別系統(tǒng)算法的特點(diǎn),設(shè)計(jì)了一種基于TI多核處理器TMS320C6678的語種識別并行實(shí)現(xiàn)方法,實(shí)現(xiàn)了任務(wù)級的并行流水處理和核間的高效通信。1平臺(tái)介紹平臺(tái)介紹TMS320C6678是基于TI公司最新DSP系列器件TMS320C66x、采用8個(gè)1.25GHzDSP內(nèi)核構(gòu)建而成的業(yè)界首款10GHzDSP,可在10W功耗下實(shí)現(xiàn)160GFLOP(GigaFloatingP

4、ointOperationsperSecond)浮點(diǎn)計(jì)算性能[3]。不僅能整合多個(gè)DSP以縮小板級空間并降低成本,同時(shí)還能減少整體的功耗要求,充分滿足現(xiàn)代數(shù)字信號處理日益增長的需求。本文語種識別系統(tǒng)的開發(fā)在TI公司的最新DSP集成開發(fā)環(huán)境CCSv5(CodeComposerStudio)中基于浮點(diǎn)運(yùn)算設(shè)計(jì)完成。2基于基于TMS320C6678TMS320C6678的語種識別算法優(yōu)化的語種識別算法優(yōu)化2.12.1語種識別算法分解語種識別算

5、法分解本文的語種識別系統(tǒng)是基于區(qū)分性ModelPushing算法[4]進(jìn)行構(gòu)建的,并且對特征參數(shù)進(jìn)行了fDWNAP[56]處理,因此系統(tǒng)的測試階段由特征提取模塊、fDWNAP模塊及對數(shù)似然得分模塊3個(gè)模塊構(gòu)成,如圖1所示。(1)特征提取模塊特征提取模塊的任務(wù)包括語音信號預(yù)處理、MFCC提取、RASTA濾波、SDC擴(kuò)展、VAD檢測、CMS處理、高斯化等過程,該模塊結(jié)束即輸出56維的特征參數(shù),其需要存儲(chǔ)的參數(shù)包括漢明窗和梅爾濾波器組總共不到

6、2KB。(2)fDWNAP模塊該模塊的工作是對所提取的56維特征參數(shù)進(jìn)行處理,以去除與語種無關(guān)的各種干擾信息,達(dá)到凈化語種特征參數(shù)的目的。如參考文獻(xiàn)[6]介紹,該模塊首先將特征參數(shù)映射至SVM的高維空間,然后利用訓(xùn)練得到的投影矩陣計(jì)算映射后的參數(shù)中所包含的干擾信息,再將干擾信息映射至特征空間,從而進(jìn)行去除。該模塊中事先訓(xùn)練得到的投影矩陣P=IwwT,wwT是對稱矩陣,因此存儲(chǔ)wwT需要7MB的存儲(chǔ)空間。另外,KL變換矩陣D是對角矩陣,需

7、要112KB的存儲(chǔ)空間。(3)對數(shù)似然得分模塊如參考文獻(xiàn)[4]所述,本模塊主要任務(wù)是利用訓(xùn)練得到的各語種GMM模型對語音特征參數(shù)計(jì)算對數(shù)似然得分進(jìn)行輸出的判決。本模塊需要存儲(chǔ)訓(xùn)練階段得到的各目標(biāo)語種的GMM模型及非目標(biāo)語種的GMM模型,即針對每個(gè)語種需要存儲(chǔ)2個(gè)GMM模型。所有的GMM模型只是均值矢量不同,高斯混元權(quán)重及協(xié)方差矩陣都是共享UBM模型的。以L個(gè)語種為例,需要存儲(chǔ)2L個(gè)均值矢量,即需要224LKB的存儲(chǔ)空間,共享的高斯混元權(quán)

8、重需要2KB的存儲(chǔ)空間,協(xié)方差矩陣由于是對角化的只需要112KB的存儲(chǔ)空間。2.22.2算法實(shí)時(shí)性分析算法實(shí)時(shí)性分析由以上分析可以看到,算法優(yōu)化后的系統(tǒng)耗時(shí)由22.3s減少至1.36s,下降非常明顯,其中下降最多的是fDWNAP模塊和對數(shù)似然得分模塊。在整個(gè)系統(tǒng)中,經(jīng)過算法優(yōu)化,fDWNAP模塊耗時(shí)所占比例依舊最大,因此在多核任務(wù)并行設(shè)計(jì)時(shí),需要將該模塊的任務(wù)進(jìn)行分解。3基于基于TMS320C6678TMS320C6678的語種識別算法

9、并行設(shè)計(jì)的語種識別算法并行設(shè)計(jì)3.13.1模塊間通信分析模塊間通信分析根據(jù)語種識別的系統(tǒng)結(jié)構(gòu),測試過程分為3個(gè)模塊,各模塊的算法都已經(jīng)進(jìn)行了相應(yīng)的優(yōu)化。這些模塊相互配合,通過控制信號完成數(shù)據(jù)流的交互。任務(wù)的控制流程主要是模塊的執(zhí)行次序,任務(wù)分配在不同核上的模塊之間以傳遞消息的方式實(shí)現(xiàn)同步。模塊間數(shù)據(jù)的傳遞會(huì)造成相應(yīng)的時(shí)間延遲,因此,控制流程的設(shè)計(jì)準(zhǔn)則為最大化系統(tǒng)的處理能力。模塊間的數(shù)據(jù)流程主要是數(shù)據(jù)的傳輸方向,描述模塊與外部數(shù)據(jù)間的相互

10、關(guān)系。相反,最小化模塊間的數(shù)據(jù)通信量則是數(shù)據(jù)流程的設(shè)計(jì)準(zhǔn)則。語種識別系統(tǒng)算法各模塊間控制流程和數(shù)據(jù)流程的通信示意圖如圖2所示。該圖由數(shù)據(jù)層和控制層兩部分構(gòu)成,控制信號的傳輸由虛線箭頭表示,數(shù)據(jù)的傳輸由實(shí)線箭頭表示。3.23.2模塊任務(wù)的核映射模塊任務(wù)的核映射為了充分利用所有內(nèi)核CPU的計(jì)算資源以最大限度地提高系統(tǒng)處理速度,根據(jù)算法優(yōu)化前后的系統(tǒng)實(shí)時(shí)性測試結(jié)果及各模塊運(yùn)算量分析,將fDWNAP模塊的矩陣乘法任務(wù)分配到多個(gè)核并行執(zhí)行。因本文

11、的語種識別系統(tǒng)適合于數(shù)據(jù)流模式的任務(wù)并行方式,將整個(gè)系統(tǒng)的運(yùn)算任務(wù)適當(dāng)?shù)胤峙浣o各個(gè)內(nèi)核,實(shí)現(xiàn)任務(wù)級的并行流水。由于fDWNAP模塊計(jì)算復(fù)雜度大,制約了整個(gè)系統(tǒng)任務(wù)級流水的處理速度。為了充分發(fā)揮TMS320C6678的性能優(yōu)勢,將該模塊任務(wù)映射到多個(gè)核進(jìn)行處理。該模塊首先需要計(jì)算特征矢量對應(yīng)的自適應(yīng)GSV;然后通過投影矩陣計(jì)算SVM特征域的干擾空間,這一部分的大矩陣乘法占據(jù)了整個(gè)模塊的絕大部分運(yùn)算量;最后還需要將干擾空間返回映射到特征域,

12、并在特征域去除干擾。整個(gè)模塊80%以上的運(yùn)算量都集中在大矩陣的乘法上,故采用將大矩陣拆為小矩陣分配到多個(gè)核上并行運(yùn)算,將其他任務(wù)集中在一個(gè)核上進(jìn)行處理。在該模塊內(nèi)還是一個(gè)任務(wù)級的流水處理方式,矩陣相乘部分是核級相同的并行流水處理方式。4基于基于TMS320C6678TMS320C6678的語種識別算法實(shí)現(xiàn)的語種識別算法實(shí)現(xiàn)4.14.1語種識別算法在語種識別算法在TMS320C6678TMS320C6678中的實(shí)現(xiàn)中的實(shí)現(xiàn)根據(jù)設(shè)計(jì)思路,將

13、本文提出的語種識別算法在CCSv5上進(jìn)行軟件仿真。其中,利用SYSBIOS[8]提供核間任務(wù)調(diào)度,利用IPC[9]實(shí)現(xiàn)核間同步和通信。啟動(dòng)系統(tǒng),完成所有核的初始化后,首先調(diào)用IPC_start函數(shù)讓各核進(jìn)入同步等待狀態(tài),然后各核上的程序才能開始執(zhí)行。從共享存儲(chǔ)器劃出MSM_IN和MSM_OUT2塊存儲(chǔ)區(qū),MSM_IN存儲(chǔ)KL變換矩陣和各語種GMM模型,MSM_OUT存儲(chǔ)判決輸出結(jié)果。投影矩陣數(shù)據(jù)存儲(chǔ)在外接DDR3存儲(chǔ)器中的位置信息事先存

14、在Ce1中。Ce1將投影矩陣數(shù)據(jù)分成5份,通過Notify_sendEvent函數(shù)將5份數(shù)據(jù)的地址發(fā)送到Ce2、Ce3、Ce4、Ce5和Ce6。Ce2、Ce3、Ce4、Ce5和Ce6上的子矩陣乘法任務(wù)一直處于懸掛狀態(tài),直到Ce1發(fā)送過來數(shù)據(jù)地址,矩陣乘法任務(wù)才開始并行執(zhí)行。各核分別根據(jù)數(shù)據(jù)地址從外接DDR3讀取數(shù)據(jù)與Ce1傳遞的數(shù)據(jù)計(jì)算干擾因子向量,計(jì)算完畢再利用MessageQ_put函數(shù)將干擾因子向量數(shù)據(jù)的Message寫入到Ce1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論