音影先锋亚洲天堂网|电影世界尽头的爱完整版播放|国产 熟女 91|高清无码免费观看欧美日韩|韩国一区二区三区黄色录像|美女亚洲加勒比在线|亚洲综合网 开心五月|7x成人在线入口|成人网站免费日韩毛片区|国产黄片?一级?二级?三级

低端DSP芯片的語(yǔ)音處理算法研究

出處:SHIYE 發(fā)布于:2011-05-31 09:20:32

     摘 要: 介紹了一種利用TI 公司的TMS320VC5402 定點(diǎn)DSP 芯片實(shí)現(xiàn)的基于語(yǔ)音能量、短時(shí)平均幅度差和過(guò)零率的語(yǔ)音檢測(cè)器, 給出了算法的詳細(xì)設(shè)計(jì)過(guò)程和DSP 硬件實(shí)現(xiàn)方案, 該方案在專用通信系統(tǒng)中, 用以對(duì)接收到的電臺(tái)信號(hào)進(jìn)行分析, 判斷其中是否有語(yǔ)音信號(hào), 從而控制半雙工電臺(tái)的發(fā)射開(kāi)關(guān), 使其處于接收或發(fā)射狀態(tài)。實(shí)驗(yàn)表明, 該算法能在較低的信噪比情況下準(zhǔn)確地檢測(cè)出語(yǔ)音信號(hào), 而且計(jì)算方法簡(jiǎn)單, 硬件處理容易, 可靠性高, 能夠滿足實(shí)時(shí)系統(tǒng)的需要, 在對(duì)DSP 在其他方面的應(yīng)用也有一定的參考價(jià)值。

  0  引言

  語(yǔ)音信號(hào)檢測(cè)(Voice Acess Detect, VAD) 技術(shù),目的是為正確區(qū)分語(yǔ)音與各種背景噪聲。在語(yǔ)音信號(hào)處理和通信等領(lǐng)域, 它有著十分重要的意義。本套算法集成了短時(shí)能量、過(guò)零率與短時(shí)平均幅度差(AMDF) 檢測(cè)等算法的組合。

  1  算法介紹

  1.1  幀和窗的概念

  短時(shí)分析將語(yǔ)音流分幀處理, 為減小語(yǔ)音幀的截?cái)嘈?yīng), 需要加窗處理; 窗口的形狀和長(zhǎng)度對(duì)分析影響很大, 不同的分析方法對(duì)窗函數(shù)的要求不盡一樣; 可分為矩形窗、漢明窗和漢寧窗等。

  通常認(rèn)為一個(gè)語(yǔ)音幀內(nèi)含有1~ 7 個(gè)基調(diào)周期比較理想, 但人的語(yǔ)音的基調(diào)周期值是變化的, 從女性和兒童2 ms 到老年男子的14 ms( 即基調(diào)頻率為500Hz~ 70 Hz) , 所以N 的選擇是比較困難的, 折衷的選擇N 為100~ 300 點(diǎn)比較合適。

  1.2  短時(shí)能量

  一段短語(yǔ)音信號(hào)的能量稱為短時(shí)能量, 第n 段的短時(shí)能量由En 表示, 它等于該短段語(yǔ)音取樣的平方和, 設(shè)第n 幀語(yǔ)音信號(hào)x n ( m) 的短時(shí)能量用En表示, 則其計(jì)算公式如下:

  算法中使用短時(shí)能量的主要目的是: 去除背景語(yǔ)音對(duì)VAD 效果的影響, 去除幅度較小的噪聲對(duì)VAD 效果的影響。

  1.3  短時(shí)過(guò)零率

  過(guò)零表示信號(hào)通過(guò)零值, 過(guò)零率即每秒內(nèi)信號(hào)值通過(guò)零值的次數(shù)。對(duì)于離散時(shí)間序列, 過(guò)零則是指序列取樣值改變符號(hào), 過(guò)零率則是每個(gè)樣本改變符號(hào)的次數(shù)。對(duì)于語(yǔ)音信號(hào), 則是指在一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過(guò)橫軸( 零電平) 的次數(shù), 可以用相鄰2 個(gè)取樣改變符號(hào)的次數(shù)來(lái)計(jì)算。

  1.4  短時(shí)平均幅度差(AMDF)

  對(duì)于完全的周期信號(hào), 則相距為周期的整數(shù)倍的采樣點(diǎn)上幅值相等, 差值為0。實(shí)際的語(yǔ)音信號(hào)是一個(gè)準(zhǔn)周期信號(hào), 差值不為0, 但很小, 這些極小值將出現(xiàn)在整數(shù)倍周期的位置上。定義短時(shí)平均幅度差函數(shù):

  AMDF 函數(shù)在濁音基音周期上出現(xiàn)極小值, 在清音語(yǔ)音時(shí)無(wú)明顯極小值。在此基礎(chǔ)上, 為避免由于信號(hào)強(qiáng)弱帶來(lái)的誤差, 需要對(duì)AMDF 函數(shù)進(jìn)行歸一化處理。

  2  算法實(shí)現(xiàn)

  語(yǔ)音信號(hào)是一種時(shí)變的、非平穩(wěn)的隨機(jī)過(guò)程, 從整體來(lái)看其特征及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間變化的。但是, 語(yǔ)音的形成過(guò)程與發(fā)聲器官的運(yùn)動(dòng)密切相關(guān), 這種物理運(yùn)動(dòng)比起聲音振動(dòng)速度來(lái)要緩慢得多, 因此語(yǔ)音信號(hào)可以認(rèn)為在一個(gè)較短的時(shí)間段內(nèi)是平穩(wěn)的, 即具有短時(shí)平穩(wěn)性。

  根據(jù)語(yǔ)音信號(hào)的這一特點(diǎn), 結(jié)合所采用的算法的需要, 語(yǔ)音幀的長(zhǎng)度定為16 ms, 下文將詳細(xì)介紹算法的實(shí)現(xiàn)。

  A、短時(shí)能量檢測(cè)函數(shù): power proc( ) , 輸入?yún)?shù)為存放采集一幀數(shù)據(jù)的地址, 算法流程圖如圖1 所示。

短時(shí)能量算法流程圖

圖1 短時(shí)能量算法流程圖

  B、短時(shí)過(guò)零率函數(shù): zero proc( ) , 輸入?yún)?shù)為存放采集一幀數(shù)據(jù)的地址, 算法流程圖如圖2 所示。

短時(shí)過(guò)零率算法流程圖

圖2 短時(shí)過(guò)零率算法流程圖

  C、短時(shí)平均幅度差函數(shù): amdf proc( ) , 輸入?yún)?shù)為存放采集一幀數(shù)據(jù)的地址。其中D(N ) 存放的是不同Z( 基音周期) 得到的幅度差, 算法流程圖如圖3 所示。

短時(shí)平均幅度差算法流程圖

圖3  短時(shí)平均幅度差算法流程圖

  語(yǔ)音檢測(cè)時(shí), 為保證檢測(cè)的準(zhǔn)確性, 連續(xù)10 幀檢測(cè)有效時(shí)才認(rèn)為確實(shí)有語(yǔ)音, 連續(xù)20 幀檢測(cè)無(wú)效時(shí)才認(rèn)為確實(shí)無(wú)語(yǔ)音。為了滿足多幀檢測(cè)需求, 又不至于出現(xiàn)掉字情況, 同時(shí)還要保證檢測(cè)信號(hào)和語(yǔ)音信號(hào)的同步性, 設(shè)計(jì)了一個(gè)環(huán)形緩沖區(qū), 模擬語(yǔ)音通道1 和通道2 各有一個(gè)對(duì)應(yīng)的環(huán)形緩沖區(qū)delay1和delay2, 每一個(gè)環(huán)形緩沖區(qū)都有3 個(gè)指針: 接收指針、處理指針和發(fā)送指針, 分別供DMA 通道0 中斷服務(wù)程序、短時(shí)能量子函數(shù)和短時(shí)平均幅度差子函數(shù)、DMA 通道1 中斷服務(wù)程序使用。

  3  硬件實(shí)現(xiàn)

  系統(tǒng)的硬件實(shí)現(xiàn), 器件為TI 公司的低端DSP 芯片TMS320VC5402 ( 以下簡(jiǎn)稱C5402) , 片內(nèi)DARAM 僅有16Kbyte, 地址有效范圍0x0080H ~0x3FFFH, 其中配置地址有效范圍為0x0000H ~0x005FH。

  除算法外, 在具體研制過(guò)程中遇到了雙通道A/ D采樣時(shí)通道無(wú)法有效控制、擴(kuò)展片外RAM 后程序不能正常加載、系統(tǒng)因負(fù)荷過(guò)大不能正確啟動(dòng)等難題, 通過(guò)長(zhǎng)期的探索和嘗試, 這些問(wèn)題都得到了妥善的解決, 并掌握了實(shí)現(xiàn)2 路A/ D 同時(shí)采樣的狀態(tài)控制字配置方法, 為算法的實(shí)施打下了堅(jiān)實(shí)的基礎(chǔ)。

  大致的配置方法如下:

  A、所有保留位控制字, 采用缺省設(shè)置

  B、接收寄存器接收幀長(zhǎng)度設(shè)置成每幀1 個(gè)字;

  C、接收寄存器接收字長(zhǎng)度設(shè)置成32 位;

  D、發(fā)送寄存器發(fā)送幀長(zhǎng)度設(shè)置成每幀1 個(gè)字;

  E、發(fā)送寄存器發(fā)送字長(zhǎng)度設(shè)置成32 位。

  McBSP0 引腳控制寄存器配置如下:

  A、DX 等引腳設(shè)置為串口;

  B、DR 等引腳設(shè)置為串口;

  C、幀同步發(fā)送位設(shè)置成內(nèi)部發(fā)送模式;

  D、幀同步接收位設(shè)置成外部發(fā)送模式;

  E、時(shí)鐘發(fā)送位設(shè)置成外部發(fā)送模式;

  F、時(shí)鐘接收位設(shè)置成內(nèi)部發(fā)送模式;

  G、幀同步發(fā)送設(shè)置高電平有效;

  H、幀同步接收設(shè)置高電平有效;

  I、發(fā)送時(shí)鐘設(shè)置成為上升沿觸發(fā);

  J、接收時(shí)鐘設(shè)置成為上升沿觸發(fā)。

  McBSP1 引腳控制寄存器相關(guān)配置與McBSP0相似, 額外配置如下: 發(fā)送時(shí)鐘設(shè)置為內(nèi)部模式; 接收時(shí)鐘設(shè)置為外部模式; 發(fā)送時(shí)鐘設(shè)置為下降沿觸發(fā)。

  4  結(jié)束語(yǔ)

  提出了采用平均幅度、過(guò)零率和短時(shí)能量等系列算法進(jìn)行語(yǔ)音處理的原理及具體實(shí)現(xiàn)方法, 并介紹了承載該算法的硬件組成, 該套語(yǔ)音處理模塊基于低端的DSP 處理芯片, 綜合考慮了性能價(jià)格比,在實(shí)現(xiàn)所有功能及性能的前提下, 地節(jié)省了成本, 提高了產(chǎn)品的市場(chǎng)競(jìng)爭(zhēng)力, 算法的實(shí)現(xiàn), 凝聚了團(tuán)隊(duì)的心血, 在行業(yè)內(nèi)處于地位。實(shí)踐證明該語(yǔ)音處理模塊硬件小巧, 語(yǔ)音質(zhì)量好, 易于實(shí)現(xiàn), 性價(jià)比較高, 可推廣至各類需要語(yǔ)音處理的通信產(chǎn)品中。

關(guān)鍵詞:低端DSP芯片的語(yǔ)音處理算法研究

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“出處:維庫(kù)電子市場(chǎng)網(wǎng)”的所有作品,版權(quán)均屬于維庫(kù)電子市場(chǎng)網(wǎng),轉(zhuǎn)載請(qǐng)必須注明維庫(kù)電子市場(chǎng)網(wǎng),http://m.58mhw.cn,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

廣告
OEM清單文件: OEM清單文件
*公司名:
*聯(lián)系人:
*手機(jī)號(hào)碼:
QQ:
有效期:

掃碼下載APP,
一鍵連接廣大的電子世界。

在線人工客服

買家服務(wù):
賣家服務(wù):
技術(shù)客服:

0571-85317607

網(wǎng)站技術(shù)支持

13606545031

客服在線時(shí)間周一至周五
9:00-17:30

關(guān)注官方微信號(hào),
第一時(shí)間獲取資訊。

建議反饋

聯(lián)系人:

聯(lián)系方式:

按住滑塊,拖拽到最右邊
>>
感謝您向阿庫(kù)提出的寶貴意見(jiàn),您的參與是維庫(kù)提升服務(wù)的動(dòng)力!意見(jiàn)一經(jīng)采納,將有感恩紅包奉上哦!