面向字符識(shí)別的圖像壓縮和語義質(zhì)量評(píng)估.pdf_第1頁(yè)
已閱讀1頁(yè),還剩60頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著移動(dòng)多媒體應(yīng)用的興起,人們對(duì)互聯(lián)網(wǎng)的需求已經(jīng)不再僅限于信息交流、圖片共享等,而是利用互聯(lián)網(wǎng)的豐富資源(比如計(jì)算能力、存儲(chǔ)資源以及數(shù)據(jù)資源等)去獲取更多有用的信息,比如通過移動(dòng)端采集圖像,發(fā)送到云端做圖像檢索、目標(biāo)識(shí)別等計(jì)算機(jī)視覺任務(wù)。然而,由于網(wǎng)絡(luò)傳輸帶寬有限,為了降低在諸如此類移動(dòng)-云計(jì)算系統(tǒng)中圖像的傳輸碼率,我們需要重新定義基于多媒體應(yīng)用的圖像編碼以及圖像質(zhì)量評(píng)價(jià)。與傳統(tǒng)的圖像編碼和圖像質(zhì)量評(píng)價(jià)不同,本文提出了以下兩種新型方案來

2、節(jié)約碼率。
  首先,我們從編碼本身入手。由于壓縮圖像是用于自動(dòng)識(shí)別等任務(wù)而不是供人眼欣賞,因此在壓縮時(shí)我們不再關(guān)注視覺質(zhì)量,而是假定與識(shí)別目標(biāo)相關(guān)的語義特征的質(zhì)量更為重要。據(jù)了解,尺度不變特征變換(Scale InvariantFeature Transform,SIFT)特征已廣泛應(yīng)用于各種目標(biāo)識(shí)別場(chǎng)景,最近也已經(jīng)有很多關(guān)于保留SIFT的壓縮編碼方法的工作。本文中,我們首次研究了保留SIFT特征的新型圖像編碼方案,這一方案主要

3、針對(duì)信宿是計(jì)算機(jī)視覺算法而不是人眼視覺。我們根據(jù)提取的SIFT特征,將圖像劃分成SIFT編碼單元(目標(biāo)區(qū)域)和非SIFT編碼單元(非目標(biāo)區(qū)域),并用修改后的JPEG對(duì)圖像進(jìn)行壓縮編碼,壓縮時(shí)對(duì)不同的編碼單元設(shè)置不同的質(zhì)量參數(shù)。實(shí)驗(yàn)結(jié)果表明,在不影響識(shí)別精度的前提下,我們的壓縮方法平均比標(biāo)準(zhǔn)JPEG節(jié)約14%左右的碼率。
  另一方面,我們通過設(shè)計(jì)可靠的圖像語義質(zhì)量評(píng)價(jià)(Image Semantic QualityAssessmen

4、t,ISQA)指標(biāo)來指導(dǎo)編碼,最優(yōu)化編碼效率。基于上述信宿是計(jì)算機(jī)視覺算法而不是人眼的應(yīng)用場(chǎng)景,我們假定壓縮圖像的質(zhì)量應(yīng)該由圖像壓縮后保留的相關(guān)語義特征的質(zhì)量來衡量,而不是像素保真度(例如Peak Signal-to-Noise Ratio,PSNR)或者視覺質(zhì)量(例如Structural Similarity Index Measure,SSIM)。本文中,我們研究了基于SIFT特征的ISQA方法,首先提取壓縮前后圖像的特征(SIFT

5、特征和稠密SIFT特征),并結(jié)合統(tǒng)計(jì)學(xué)習(xí)的方法對(duì)壓縮前后特征的失真進(jìn)行建模,建立特征失真度與壓縮圖像質(zhì)量之間的映射關(guān)系,根據(jù)模型的兩種誤判類型的代價(jià)不同定義傳輸代價(jià)函數(shù),求解在給定預(yù)測(cè)精度前提下,壓縮時(shí)的最佳操作點(diǎn),并統(tǒng)計(jì)在不同操作點(diǎn)下壓縮圖像的平均碼率。實(shí)驗(yàn)結(jié)果表明,我們提出的ISQA方法在評(píng)估壓縮的車牌圖像(或路標(biāo)圖像)能否被識(shí)別這方面要比PSNR和SSIM的性能高很多,將我們的壓縮方法應(yīng)用到車牌(或路標(biāo))壓縮系統(tǒng)中,比PSNR或S

6、SIM至少提高58%(37%)的壓縮性能。此外,我們還研究了在路標(biāo)圖像能否識(shí)別上,我們提出的ISQA方法與人眼是否一致。實(shí)驗(yàn)結(jié)果顯示,我們的ISQA算法與人眼主觀評(píng)價(jià)之間的皮爾森線性相關(guān)系數(shù)(Pearson Linear Correlation Coefficient,PLCC)達(dá)到0.8401,而均方根誤差(Root Mean Squared Error,RMSE)低至0.5325,表明我們提出的ISQA算法在文本圖像識(shí)別上與人眼有高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論