視頻中文字檢測技術(shù)研究與實(shí)現(xiàn).pdf_第1頁
已閱讀1頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字化圖像和視頻增長非常快。隨著移動數(shù)碼相機(jī)以及手機(jī)等的普及,各種拍攝來的自然場景的數(shù)字圖像也是到處可見。為了方便管理海量的視頻和圖像信息,使用戶能夠快速得定位自己感興趣的視頻和圖像內(nèi)容。產(chǎn)生了許多視頻和圖像處理及理解的實(shí)際需求,進(jìn)而推動了人們對視頻和圖像內(nèi)容的分析和研究。在視頻內(nèi)容分析方面,研究者主要對視頻內(nèi)容的結(jié)構(gòu)化分析和檢索技術(shù)比較關(guān)注;在圖像內(nèi)容分析方面,研究者對場景中獲取內(nèi)容的分析、監(jiān)控尤為關(guān)注。在上述兩個(gè)

2、領(lǐng)域中,文字作為一種重要的高層語意信息而顯示出其重要的作用。此外,還可將提取出的文字從原圖像中去除,同時(shí)修復(fù)被文字所遮擋的背景區(qū)域,進(jìn)而添加上多語種的文字,這對于不同語種間的視頻及圖像交流和視頻及圖像的再次使用也是很有意義的。
   文字行檢測實(shí)際上也是一種模式識別。不同于其它的典型模式,例如單個(gè)漢字的模式,文字行的大小、形狀、顏色等都沒有固定的模式。而且在很多情況下,文字所處的背景非常復(fù)雜。這些都給文字檢測帶來非常大的困難。所

3、以傳統(tǒng)的直接檢測圖像模式的方法是不能用來檢測文字的。本文在對國內(nèi)外研究現(xiàn)狀和所涉及的基本技術(shù)綜述的基礎(chǔ)上,就視頻中文字檢測算法做出深入探討,并提出了兩種文字檢測的方法,第一種文字檢測方法是利用邊緣檢測和局部直方圖來定位文字區(qū)域。首先,用邊緣檢測的方法粗略定位可能的文字區(qū)域。然后用局部直方圖對提取出來的粗略文字區(qū)域進(jìn)行精確的定位,最后利用文字行的結(jié)構(gòu)信息進(jìn)行過濾,去除似文本的“假”文字區(qū)域。這個(gè)算法對于背景不是很復(fù)雜的視頻有比較好的檢測效

4、果。第二種文字檢測方法運(yùn)用了文字的內(nèi)在結(jié)構(gòu)屬性和視頻幀的時(shí)間冗余信息來檢測文字區(qū)域。首先,根據(jù)文字的內(nèi)在屬性設(shè)計(jì)幾個(gè)文字檢測器,文字有橫筆畫、豎筆畫、對角筆畫,相應(yīng)的文字檢測器也有橫筆畫文字檢測器、豎筆畫文字檢測器、對角筆畫文字檢測器等。這些文字檢測器能夠比較精確得將文字像素提取出來,然后將提取出來的文字像素連接成侯選文字區(qū)域。不同于以往的文字檢測方法,在本算法中,視頻幀的冗余信息被用于文字檢測階段,而非文字增強(qiáng)階段。最后通過基于密度的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論