用定點DSP實現(xiàn)MPEG-4標(biāo)準(zhǔn)中DCT系數(shù)快速量化的方法分析
出處:電子技術(shù)應(yīng)用 發(fā)布于:2011-06-17 22:50:57
離散余弦變換(DCT)是N.Ahmed等人在1974年提出的正交變換方法。它常被認(rèn)為是對語音和圖像信號進(jìn)行變換的方法。為了工程上實現(xiàn)的需要,國內(nèi)外許多學(xué)者花費了很大精力去尋找或改進(jìn)離散余弦變換的快速算法。由于近年來數(shù)字信號處理芯片(DSP)的發(fā)展,加上專用集成電路設(shè)計上的優(yōu)勢,這就牢固地確立離散余弦變換(DCT)在目前圖像編碼中的重要地位,成為H.261、JPEG、MPEG 等國際上公用的編碼標(biāo)準(zhǔn)的重要環(huán)節(jié)。在視頻壓縮中,常用的變換方法是DCT,DCT被認(rèn)為是性能接近K-L變換的準(zhǔn)變換。
在基于DCT變換的圖像壓縮編碼方法中,對DCT系數(shù)必須做量化處理。量化過程是一個多對一的映射,例如對一個8×8塊的64個DCT變換系數(shù)分別除以量化步長后取整。由于大多數(shù)DCT變換系數(shù)量化后變?yōu)榱?,因而達(dá)到壓縮的目的。由于在量化過程中用到除法,因此通常需要進(jìn)行浮點運算。
但是,可進(jìn)行浮點運算的數(shù)字信號處理器(DSP)芯片結(jié)構(gòu)比定點DSP芯片復(fù)雜,價格一般也比定點DSP芯片高很多。所以數(shù)字圖像處理系統(tǒng)中通常采用定點DSP芯片來完成圖像壓縮運算,這種方法已經(jīng)成為數(shù)字圖像處理技術(shù)的的一個趨勢。
TMS320C6200系列是德州儀器的新一代高性能定點DSP芯片。它具有VLIW(Very Long Instruction Word)結(jié)構(gòu),由8個可并行運行的執(zhí)行單元構(gòu)成。這些單元使得該系列芯片在單周期內(nèi)可以并行執(zhí)行多條指令,例如在單周期內(nèi)并行完成2個16位×16位乘法和2個移位操作。它還具有流水線結(jié)構(gòu),使得若干條指令的不同執(zhí)行階段可以并行執(zhí)行。這些設(shè)計使得TMS320C6200系列芯片程序執(zhí)行速度更快、性能更高。
定點DSP完成的是整數(shù)運算或小數(shù)運算,數(shù)值格式中不包含階碼,通常定點 DSP是16位或24位數(shù)據(jù)寬度。在定點DSP上完成除法,通常的辦法是調(diào)用庫函數(shù)。但是調(diào)用庫函數(shù),勢必會打破循環(huán)中的流水線操作,嚴(yán)重影響量化的完成速度。所以提高量化過程速度的關(guān)鍵就在于避免任何函數(shù)調(diào)用、跳轉(zhuǎn)等操作。
本文以TMS320C6200系列定點DSP為例,提出一種用定點乘法和移位運算來代替量化過程中除法和飽和運算的方法,從而極大地提高了量化過程的運行速度。該方法也同樣適用于其它各種定點微處理器。
1 MPEG-4標(biāo)準(zhǔn)中采用的量化技術(shù)及程序優(yōu)化
MPEG-4標(biāo)準(zhǔn)中定義了兩種量化方式:H.263量化方式和MPEG-4量化方式。這里為簡單起見,只介紹TMN2.0編碼器所用到的一種量化策略:AC系數(shù)和幀間宏塊的DC系數(shù)用H.263量化方式,而幀內(nèi)宏塊的DC系數(shù)用MPEG-4量化方式中的DC系數(shù)非線性量化方式。
1.1 H.263量化方式
量化參數(shù)QP可以取值[1,3],量化步長為2QP.則量化公式為:
對于幀內(nèi)宏塊,LEVEL=|COF|/(2QP)
對于幀間宏塊,LEVEL=(|COF|-QP/2)/(2QP)式中,COF表示即將被量化的DCT變換系數(shù),LEVEL表示量化結(jié)果的。
1.2 MPEG-4DC系數(shù)非線性量化方法
量化公式為:LEVEL=DC_COF//dc_scaler
式中,DC_COF表示即將被量化的DCT變換DC系數(shù);LEVEL表示量化結(jié)果;//表示先進(jìn)行除法運算,然后對結(jié)果四舍五入取整。
在內(nèi)部宏塊內(nèi),定義亮度塊為類型 1塊,色差塊為類型2塊,類型1塊的C系數(shù)由類型1的非線性標(biāo)尺量化;類型2的DC系數(shù)由類型2的非線性標(biāo)尺量化。
表1為定義DC非線性量化標(biāo)尺dc_scaler.
表1 幀內(nèi)宏塊DC系數(shù)標(biāo)尺

從表1中可以看到亮度塊和色差塊的DC系數(shù)有獨立的量化標(biāo)尺,亮度塊具有較大的標(biāo)尺而色度塊具有較小的標(biāo)尺。這種分段線性的非線性量化策略是一種高效的量化方式,它在保證圖像質(zhì)量的基礎(chǔ)上提高了壓縮效率。
1.3 將量化除法改定點乘法的方式
以內(nèi)部宏塊的AC系數(shù)量化公式為例,將其改寫為:
LEVEL=|COF|/2QP=|COF|(2 n/2QP)/2 n
定義量化參數(shù)ac_cocff=[2n/2QP],[x]表示對x截尾取整,則:
LEVEL=|COF|×ac_coeff/2n
在QP的取值都范圍[1,31]內(nèi),要使截尾取整后的每一個2 n/2QP的值都能夠用量化參數(shù)ac_coeff一一對應(yīng)地表示,n必須足夠大。通過計算得出:當(dāng)n≥11時滿足要求。
取n=11得到ac_coeff的計算公式為:
ac_coeff=[2 11/2QP]
其實質(zhì)就是用一個字(32 bit)的低11位(0Q11)來表示1/2QP的小數(shù)部分。
由于QP在[1,31]之間,可以用上述公式計算出對應(yīng)于幀內(nèi)宏塊AC系數(shù)量化的量化系數(shù)的查找表:ac_coeff=AcQConff[QP].用C語言表示為(假設(shè)QP=0時ac_coeff=0):

計算表明,AC系數(shù)量化系數(shù)、亮度塊DC系數(shù)量化系數(shù)和色差塊DC量化系數(shù)都可以統(tǒng)一用一個字的低11位(0Q11)來表示。這樣就可以分別計算出它們的量化系數(shù)的查找表,從而實現(xiàn)用乘法運算代替除法運算。
而除以2 n的操作可以用右移n位的辦法來完成。
對于8bit無符號二進(jìn)制數(shù)表示的象素值,在經(jīng)過DCT變換后,其DCT變換系數(shù)的值域為[-2048,2047],有12位二進(jìn)制數(shù)。同時,由上述分析可知量化系數(shù)有11位。所以用本文方法計算出的量化系數(shù)與DCT變換系數(shù)相乘后,結(jié)果不會溢出。
根據(jù)MPEG-4 Visual標(biāo)準(zhǔn)TMN 2.0的要求,量化后AC系數(shù)值要飽和到[-2048,2047]之間??衫肨MS320C62x芯片指令集中的飽和左移指令SSHL來實現(xiàn),只需要兩條指令即可完成飽和運算,無需使用比較指令與跳轉(zhuǎn)指令。
下面給出內(nèi)部宏塊量化的TMS320C62x線性匯編程序:

由該程序可以看到,程序中沒有任何會影響流水線的的跳轉(zhuǎn)語句及函數(shù)調(diào)用。因此將該程序編譯后會發(fā)現(xiàn),此循環(huán)被優(yōu)化構(gòu)成軟件流水。如果再使用其它一些優(yōu)化手段,比如合并程序中的移位指令,合作字訪問指令處理兩個短型數(shù)據(jù)等,該程序的效率將會更高。我們用TMS320C62x軟件仿真器測試表明,原來使用除法的量化函數(shù)需要4871個周期,而運用上述優(yōu)化辦法進(jìn)行優(yōu)化后的量化函數(shù)只需275個周期即可完成,效率提高約18倍。
DCT/IDCT變換及量化過程是視頻圖像壓縮系統(tǒng)中的關(guān)鍵模塊。該模塊的執(zhí)行速率對整個系統(tǒng)的處理流度影響很大,因此將量化過程中的浮點運算轉(zhuǎn)換為定點運行,提高該模塊在定點DSP芯片上的執(zhí)行速度,其意義顯得尤為重要。同時由于目前絕大多數(shù)數(shù)字通訊系統(tǒng)都基于定點DSP芯片,如果用定點芯片完成視頻圖像處理將會有易于與數(shù)字通訊系統(tǒng)集成的優(yōu)點。我們的這一方法為在定點芯片上完成圖像處理進(jìn)行了有益的嘗試,為后續(xù)的研發(fā)工作打下了一個良好的基礎(chǔ)。
版權(quán)與免責(zé)聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://m.58mhw.cn,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 掌握 DSP:原理剖析與應(yīng)用實踐2025/5/8 14:03:24
- 模糊邏輯在 DSP 上實時執(zhí)行2023/7/25 17:13:30
- 多速率DSP及其在數(shù)模轉(zhuǎn)換中的應(yīng)用2023/6/12 15:28:52
- 使用 DSP 加速 CORDIC 算法2023/3/29 15:46:30
- 高速DSP系統(tǒng)的信號完整性2022/9/26 16:45:38









