自適應計算顯著減少QCELP功率
出處:電子產品世界 發(fā)布于:2011-06-18 21:02:59
自適應計算機( ACM,Adaptive Computing Machine)是一類新穎的數字式IC,可以作為未來移動裝置和無線電手機的計算平臺。QuickSilver Technology公司(位于加州的San Jose),是一家移動通信系統(tǒng)公司。該公司正在推出一種用'硅CMOS器件的新穎的結構。這種結構可以提高器件的性能,減少其功率消耗,并縮小其芯片面積。這種結構方法被命名為'自適應計算機',是一種新類型的數字式集成電路,可以作為計算平臺,廣泛應用于未來的移動裝置,和無線電手機。
QCELP,即QualComm Code Excited Linear Predictive(QualComm受激線性預測編碼),它的8個內編碼環(huán)路,消耗了QCELP算法中絕大部分的功率。一個QCELP算法,如果運行在DSP芯核上,大約消耗84 mW.此項數據取自一個0.25μm CMOS的SOC芯片的試驗結果,此SOC嵌入有DSP功能塊與存儲器,芯片面積約為4mm2.
編碼器的任務是確定描述話音音頻段的小的參量組,話音音頻段可以的位數表示。編碼器發(fā)送參量到譯碼器,譯碼器用這些參量重建音頻段。一旦重建完成,音頻段便在揚聲器系統(tǒng)播放。話音產生系統(tǒng)可模擬為聲束、聲調、周期激勵器(聲卡)或剩余噪聲源。聲束用線性預示編碼模擬。聲調和剩余噪聲激勵聲束并用碼簿(codebook)編碼。
用碼簿索引選擇來自碼簿的高斯向量(見圖1)。向量也稱之為激勵信號,向量與增益值相乘并經2個線性濾波器濾波。第1個濾波器之為長項濾波器,它重建激勵信號中語音的長項聲調周期數。第2個濾波器(短項濾波器)模擬話音的譜形。短項濾波器的輸出是合成語音。

LPC(線性預示編碼)濾波器的頻譜是語音信號的譜線包絡。所以,濾波器產生話音幅度。合成器產生向量或話音取樣N長度的子幀(在8KHz取樣率時,N為10~40)。合成器參量以幀或子幀速率更新,一般1幀是4個子幀長。
通常,碼簿索引(碼)、碼簿增益和長項預示參量以子幀速率更新。對于IS-96A WCELP-13,碼簿參量以到16倍幀或4倍子幀速率更新,短項濾波器系數以幀速率傳送到合成器,但通常以子幀速率線性內插。
合成分析
CELP編解采用人聲音產生系統(tǒng)的模型,它由聲束、聲卡、送話器嘴和語音組成。此系統(tǒng)可用一個噪聲源、一個音調合成濾波器和聲束或共振峰合成濾波器進行模擬。話音合成器或解壓縮單元的數據流激勵音調濾波器(圖2)。然后,信號由共振峰合成器或LPC濾波器處理,是后濾波。

合成器和分析器把話音分解為段(幀)。在8KHz取樣率時(160個取樣),幀長度是20ms話音長。對于每幀,分析器確定在多大數據率下可地表示幀。速率為全,半,1/4和1/8四種。噪聲源依刺于幀速率。1/4和1/8速率用于偽隨機噪聲源,全和半速率用于碼簿。
分析器的工作是為當前話音幀確定全成器模型參量的匹配。分析器或壓縮單元用合成器的簡化型式搜尋一幀話音的參量。在數據流框圖(圖2)中表示為逆向工作過程。
用合成分析方法(有時稱之為向量量化器)求得音調和碼簿參量(見圖3)。此過程包括為音調確定或搜索算法選擇延遲參量和為碼簿搜索選擇索引。思想是測量與相關函數匹配的特性,相關函數與目標話音段比較時再現(xiàn)合成信號的誤差。根據延遲或索引產生的誤差信號選擇是佳延遲或碼簿索引。

對每個延遲和碼簿索引,都必須執(zhí)行通過合成器的數據處理和信號關聯(lián)。用可編程DSP實現(xiàn)這兩種搜索會占用大部分的計算時間和功耗。QCELP算法也需要用32位運算做絕大部分相關測量。
功率消耗程序
有8個主要的內部碼環(huán)路或程序消耗絕大部分的QCELP功率。它們是碼簿和聲調搜索,線頻譜對(LSP)計算,遞歸卷積和4個不同的濾波器。在QCELP的分析器/壓縮器側用DSP實現(xiàn),3個內部碼環(huán)路占總功耗的80%.其中聲調和碼簿搜索占49%;LSP和余弦占16%;各種濾波器占其余14%.在合成器/解壓縮器側,各種濾波器占功耗的56%左右,而其他功能(如正弦,余弦和除法)占別外5%.這兩種QCELP函數總計占功耗的61%.
隨著QCELP算法日益普及和應用(如蜂窩電話所需功能的增加),傳統(tǒng)的DSP/微處理器和ASIC方法開始失去它們的優(yōu)執(zhí)。但自適應計算機(ACM)技術對各種便攜設計(包括蜂窩電話)是一種更有效且功耗更低的大有前途的方法。
更多性能
隨著要求低功耗而同時保持高性能的發(fā)展趨勢。便攜系統(tǒng)設計人員花精力分析當今技術是值得的。這樣做的一種方法是比較計算效率(CPE-computational power efficiency),CPE是比較當今設計技術優(yōu)缺點的量度。CPE定義為在一個時鐘周期內能解決問題的有效工作門數與器件總門數之比。
一個典型的DSP芯片或嵌入式芯核的CPE是10%左右(見圖4)。這意味著在一個DSP芯核或芯片中一般只有10%的門在任一時間內執(zhí)行真正的工作,表明處理器只有一小部分正在真正在執(zhí)行有用的工作,其余部分是額外消耗,用以維持處理器中有效工作的那一部分。

ASIC的平均CPE是25%左右,是DSP方案的2.5倍,這些增益可提高性能或降低功耗,是以犧牲靈活性來實現(xiàn)。ASIC設計周期中的任何不可預見的變化都會導致整個ASIC的重新設計。
ACM的CPE是60%,比ASIC好2.5倍。ACM器件也具有算法可編程的優(yōu)點,這種技術允許一種算法以短的時間運行在有效的硬件中。這使得便攜無線系統(tǒng)在支行時間能隨時適應任務。這意味著不需要改變算法來適應預先確定的處理器硬件。一個算法所需的硬件產生算法運行所需的少時間。
QCELP功率分析
如果將 ACM直接嵌入到下一代系統(tǒng)裝置中去,它可以迅速地使其結構(其變換速度是如此之快,可以在一秒鐘內變換數千次),適應多種算法的需要,使一臺單純的移動/無線電裝置,能夠執(zhí)行并完成多種多樣的功能與協(xié)議。ACM可以實現(xiàn)并形成,真正符合某一種算法所要求的硬件,不論要求的時間是長還是短,如果需要的話,可以按照時鐘周期,以周期來實現(xiàn)。ACM與傳統(tǒng)的IC技術(ASIC,DSP,微處理器,以及FPGA)相比,性能可以提高10倍到100倍,而功率消耗只需要一半,甚至僅為其十分之一。
這項技術可以達到的速度足夠快,可以支持空分與時分的分段 (SATS, spatial and temporal segmentation),進一步顯示出比傳統(tǒng)IC技術的優(yōu)越性。SATS技術,可以使動態(tài)的硬件資源,快速地執(zhí)行某種算法的不同時間(temporal)段部分;和ACM自適應線路陣列(matrix)中,處于不同地域(spatial )的部分。一個由 SATS驅動的ACM,可以顯著地減少QCELP語音壓縮算法的功率消耗。
在DSP芯核上運行QCELP算法消耗大約84mW功率(圖5)。這是根據0.25μm CMOS基具有DSP功能和存儲器的片上系統(tǒng)大約占據4mm2,功耗84mW.相反,把8個功耗的QCELP算法放到ASIC邏輯芯核,其功耗只有19mW,即ASIC芯核功耗3mW,DSP芯核16mW.但這種設計方法占23mm2硅片。其中ASIC芯核運行8個內部碼環(huán)路,而DSP芯核運行其余QCELP碼。

當便攜系統(tǒng)設計人員把ACM加到DSP引擎以運行QCELP算法時,可大大減少功耗,這樣做只增加5mm2 ACM芯片。在該設計實例中,8個功耗的程序從DSP運算中去掉,而加入功耗小的ACM引擎,只消耗3mW功率。采取這種設計步驟,節(jié)省了DSP運算的68mW(前面提及功耗為84mW)。現(xiàn)在,DSP/ACM基QCELP聲碼器總功耗只有19mW.
算法可編程ACM器件具有ASIC的功率特性,而大小可與DSP相比。ACM被列舉進行任何時候特殊算法所需的硬件中,如本例中的8個內部碼環(huán)路。每20ms,數據進入QCELP話音編解碼器,所以每個內部碼環(huán)路必須運行50次/秒。實質上,ACM是一片小的時限硅片,看起來像一個ASIC.結果以每秒運行400次,ACM形成運行這些算法所需的硬件。
版權與免責聲明
凡本網注明“出處:維庫電子市場網”的所有作品,版權均屬于維庫電子市場網,轉載請必須注明維庫電子市場網,http://m.58mhw.cn,違反者本網將追究相關法律責任。
本網轉載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品出處,并自負版權等法律責任。
如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網聯(lián)系,否則視為放棄相關權利。
- 掌握 DSP:原理剖析與應用實踐2025/5/8 14:03:24
- 模糊邏輯在 DSP 上實時執(zhí)行2023/7/25 17:13:30
- 多速率DSP及其在數模轉換中的應用2023/6/12 15:28:52
- 使用 DSP 加速 CORDIC 算法2023/3/29 15:46:30
- 高速DSP系統(tǒng)的信號完整性2022/9/26 16:45:38









