音影先锋亚洲天堂网|电影世界尽头的爱完整版播放|国产 熟女 91|高清无码免费观看欧美日韩|韩国一区二区三区黄色录像|美女亚洲加勒比在线|亚洲综合网 开心五月|7x成人在线入口|成人网站免费日韩毛片区|国产黄片?一级?二级?三级

基于DSP的孤立詞語音識(shí)別系統(tǒng)的設(shè)計(jì)方案

出處:電子產(chǎn)品世界 發(fā)布于:2011-06-11 20:04:57

  1 引言

  隨著電子技術(shù)的高速發(fā)展,現(xiàn)代普通民用計(jì)算器在保留基本的加減乘除等運(yùn)算外,加入了大量如三角函數(shù)、冪函數(shù)等比較復(fù)雜的運(yùn)算。但是其基本的操作沒有發(fā)生變化,依然是運(yùn)用手指操作,對(duì)于需要進(jìn)行實(shí)時(shí)數(shù)字計(jì)算的一些特殊人群(殘疾人士)或是在一些特殊場合在無法手動(dòng)操作計(jì)算器的情況下,用加入了語音識(shí)別模塊的計(jì)算器來進(jìn)行實(shí)時(shí)數(shù)字計(jì)算就有相當(dāng)?shù)谋匾?/P>

  語音識(shí)別技術(shù)是人機(jī)自然、簡潔的交流方式,它就是讓機(jī)器能夠自動(dòng)識(shí)別并理解說話人要表達(dá)的意思,將語音信號(hào)轉(zhuǎn)變?yōu)檎_的文本或者命令的高科技技術(shù)。根據(jù)實(shí)際的應(yīng)用,語音識(shí)別可以分為:特定人與非特定人的識(shí)別、孤立詞與連續(xù)詞的識(shí)別、中小詞匯量與無限詞匯量的識(shí)別。本文介紹基于TMS320VC5402配合TLC320AD50C和AT89S52的實(shí)驗(yàn)室用機(jī)器人的孤立詞語音識(shí)別系統(tǒng)。

  2 語音識(shí)別系統(tǒng)的基本介紹

  2.1 語音識(shí)別系統(tǒng)的組成

  計(jì)算機(jī)語音識(shí)別過程與人對(duì)語音識(shí)別處理過程基本上是一致的。語音信號(hào)本身的特點(diǎn)造成了語音識(shí)別的困難。這些特點(diǎn)包括多變性,動(dòng)態(tài)性,瞬時(shí)性和連續(xù)性等。目前主流的語音識(shí)別技術(shù)是基于統(tǒng)計(jì)模式識(shí)別的基本理論。一個(gè)完整的語音識(shí)別系統(tǒng)可如圖1所示。

  2.2 語音識(shí)別系統(tǒng)的分類

  根據(jù)對(duì)說話人說話方式的要求,可以分為孤立詞語音識(shí)別系統(tǒng),連續(xù)字語音識(shí)別系統(tǒng)和連續(xù)語音識(shí)別系統(tǒng);根據(jù)對(duì)說話人的依賴程度可以分為特定人和非特定人語音識(shí)別系統(tǒng);根據(jù)詞匯量大小,可以分為小詞匯量、中等詞匯量、大詞匯量以及無限詞匯量語音識(shí)別系統(tǒng)。

  3 硬件系統(tǒng)設(shè)計(jì)

  此語音識(shí)別系統(tǒng)的目的讓機(jī)器人能聽懂我們所發(fā)出的簡單的命令,首先由TLC320AD50C采集計(jì)算機(jī)聲卡的語音,經(jīng)過轉(zhuǎn)換后送給TMS320VC5402, TMS320VC5402完成語音信號(hào)處理,即識(shí)別出所發(fā)出的語音,然后把結(jié)果送給AT89S52顯示,同時(shí)通過串行通訊送給機(jī)器人(PC-104),以使機(jī)器人能夠控制自己的行動(dòng)。其結(jié)構(gòu)框圖如圖2所示。

  該系統(tǒng)以TMS320VC5402為電路,對(duì)孤立詞語音信號(hào)進(jìn)行采集和處理,AIC為TMS320VC5402的模擬接口電路,包括放大、濾波、和A/D轉(zhuǎn)換的電路,把由話筒采集進(jìn)來的模擬語音信號(hào),轉(zhuǎn)換成數(shù)字語音信號(hào)。鍵盤和顯示部分則由AT89S52來控制,AT89S52把鍵盤操作轉(zhuǎn)換為控制信號(hào)再傳送給TMS320VC5402,控制系統(tǒng)的工作是訓(xùn)練還是識(shí)別,TMS320VC5402把要顯示的系統(tǒng)狀態(tài)通訊給AT89S52,以實(shí)現(xiàn)LCD顯示。這些硬件工作過程如圖3所示。

  3.1 TMS320VC5402與TLC320AD50C的接口設(shè)計(jì)

  TMS320VC5402提供了兩個(gè)增強(qiáng)型的高速、全雙工多通道緩存串行口McBSP, McBSP具有全雙工的通信機(jī)制以及雙緩存的發(fā)送寄存器和三緩存的接收寄存器,允許連續(xù)的數(shù)據(jù)流傳輸,數(shù)據(jù)長度可以為8,12,16,20,24,32;同時(shí)還提供了A-律和μ律壓擴(kuò),多達(dá)128個(gè)通道的發(fā)送與接收。McBSP通過7個(gè)引腳使得一個(gè)數(shù)據(jù)通路和一個(gè)控制通路與外部設(shè)備相連。McBSP的引腳如下:

 ?、?DX:發(fā)送引腳,與McBSP相連發(fā)送數(shù)據(jù);

 ?、?DR:接收引腳,與接收數(shù)據(jù)總線相連;

 ?、?CLKX:發(fā)送時(shí)鐘引腳;

  ⑷ CLKR:接收時(shí)鐘引腳;

  ⑸ FSX:發(fā)送幀同步引腳;

 ?、?FSR:接收幀同步引腳。

  TLC320AD50C集成了16位A/D,D/A轉(zhuǎn)換器,采樣速率可達(dá)80kHz。在TLC320AD50C內(nèi)部DAC之前有插值濾波器,ADC之后有抽樣濾波器。幀同步信號(hào)從內(nèi)部產(chǎn)生,其頻率由控制寄存器4設(shè)定。SCLK時(shí)鐘可以由內(nèi)部產(chǎn)生也可由外部插入,在內(nèi)部產(chǎn)生時(shí),其頻率為幀同步信號(hào)頻率的256倍。其特點(diǎn)如下:

 ?、?可采用單5V電源供電也可以采用5V模擬、3.3V數(shù)字雙電源供電;

  ⑵ 內(nèi)含16位的Σ-△ADC和DAC;

 ?、?器件中的ADC為64倍過采樣,DAC為256倍過采樣;

 ?、?具有85dB的信噪比;

  ⑸ 帶有內(nèi)建抗混疊濾波器和sinx/x補(bǔ)償;

 ?、?可配置成主機(jī)或從機(jī)方式,一個(gè)串行接口可支持4個(gè)TLC320AD50器件。

  TLC320AD50C與TMS320VC5402串行通信可以分為首次通信和二次通信。在首次通信中,有兩種數(shù)據(jù)傳送模式,16位傳送模式和15+1位傳送模式,可以通過控制寄存器設(shè)定。省卻情況下為15+1位傳送模式。

  TMS320VC5402與TLC320AD50C的硬件接口電路如圖4所示。

  3.2 TMS320VC5402與AT89S52的通信

  AT89S52和TMS320VC5402各自獨(dú)立工作,其信息和數(shù)據(jù)交換通過共享一片外部存儲(chǔ)器來實(shí)現(xiàn),它們之間信號(hào)聯(lián)絡(luò)通過硬連接和軟件判斷來實(shí)現(xiàn)。

  外部存儲(chǔ)器采用的是CY7C133,它是高速的2K X 16bit的靜態(tài)異步雙端口RAM,其存儲(chǔ)速度為25ns。該雙端口RAM允許兩個(gè)控制器同時(shí)讀取任何存儲(chǔ)單元,但不允許同時(shí)寫或者一讀一寫統(tǒng)一地址單元。

  對(duì)于TMS320VC5402,數(shù)據(jù)存儲(chǔ)器CY7C133的對(duì)應(yīng)地址為4000H~47FFH。

  對(duì)于AT89S52,數(shù)據(jù)存儲(chǔ)器CY7C133的對(duì)應(yīng)地址為2000H~27FFH。

  4 軟件系統(tǒng)設(shè)計(jì)

  由圖1可知,軟件系統(tǒng)的設(shè)計(jì)主要包括端點(diǎn)檢測、特征量提取和模式匹配。

  4.1 端點(diǎn)檢測

  從背景噪聲中找出語音的開始和終止,這在很多語音處理領(lǐng)域中是基本的問題。本語音識(shí)別系統(tǒng)實(shí)時(shí)、的端點(diǎn)檢測可以排除無聲段的噪聲干擾,使后面的識(shí)別性能得以較大的提高。

  漢語的音節(jié)末尾都是濁音,只用短時(shí)能量就能較好地判斷一個(gè)詞語的末點(diǎn)。而漢語詞語的起點(diǎn)檢測不僅有一定的難度,而且檢測是否準(zhǔn)確對(duì)語音識(shí)別性能影響頗大,因?yàn)榇蠖鄶?shù)聲母都是清聲母,還有送氣與不送氣的塞音和塞擦音,將它們與環(huán)境噪聲分辨是比較困難的。這里用短時(shí)相對(duì)能頻積的方法對(duì)語音信號(hào)的端點(diǎn)進(jìn)行檢測。

  在系統(tǒng)剛啟動(dòng)時(shí),正常情況下語音信號(hào)的前100ms是無聲段,所以我們可以提取這段語音信號(hào)的平均能量、平均過零率、它們的乘積作為進(jìn)行判斷的特征參數(shù)。

  4.2 特征量提取

  原始語音信號(hào)不能直接用于模板訓(xùn)練和模式匹配,這是因?yàn)椋?)原始語音信號(hào)數(shù)據(jù)量太大,系統(tǒng)的運(yùn)算和存貯負(fù)擔(dān)過重;(2)原始語音信號(hào)包含太多的隨機(jī)因素,極大的影響了系統(tǒng)的識(shí)別率。

  語音識(shí)別系統(tǒng)進(jìn)行模板訓(xùn)練和模式匹配的數(shù)據(jù)是從預(yù)處理后語音信號(hào)中提取的特征參數(shù)。通過預(yù)處理和特征參數(shù)提取技術(shù),一方面使得進(jìn)行模板訓(xùn)練和模式匹配的數(shù)據(jù)特征明顯,提高了系統(tǒng)的識(shí)別率;另一方面進(jìn)行了信息壓縮,降低了系統(tǒng)的運(yùn)算量和存貯量。

  特征參數(shù)提取就是從語音信號(hào)中提取有代表性的、合適的特征參數(shù),進(jìn)行適當(dāng)?shù)臄?shù)據(jù)壓縮。時(shí)域參數(shù)的優(yōu)點(diǎn)是計(jì)算量比較少,對(duì)于區(qū)別語音段和靜音段及清/濁音段比較方便,效果也比較明顯。但由于人耳對(duì)聲音的頻域特性比較敏感,時(shí)域參數(shù)不能恰當(dāng)?shù)胤从尺@種特征。

  線性預(yù)測分析法是有效的語音分析技術(shù)之一。線性頂測分析所包括的基本概念是,一個(gè)語音抽樣能夠用過去若干個(gè)語音抽樣的線性組合來逼近。通過使實(shí)際語音抽樣和線性預(yù)測抽樣之間差值的平方和達(dá)到值,能夠決定的一組預(yù)測器系數(shù)。

  4.3 模式匹配

  模板匹配法是多維模式識(shí)別系統(tǒng)中常用的一種相似度計(jì)算方法。在訓(xùn)練過程中,經(jīng)過特征提取和特征維數(shù)的壓縮,并采用聚類方法,針對(duì)每個(gè)模式類各產(chǎn)生一個(gè)或幾個(gè)模板,識(shí)別階段將待識(shí)別模式的特征矢量與各模板進(jìn)行相似度計(jì)算,然后判別它屬于哪個(gè)類。因此在匹配時(shí)如果只對(duì)特征矢量序列進(jìn)行線性時(shí)間規(guī)整,其中的音素或類音素就可能對(duì)不準(zhǔn)。而應(yīng)該采用某種非線性時(shí)間對(duì)準(zhǔn)算法。動(dòng)態(tài)時(shí)間規(guī)整(DTW)就是效果的一種非線性時(shí)間規(guī)整模板匹配算法。

  不同的人所發(fā)的語音信號(hào),其模式有很大的差異,即使是同一個(gè)人,在不同的時(shí)間由于方法不同,其語音特征參數(shù)也有變化。為了提高識(shí)別率,首先要把語音信號(hào)的起始點(diǎn)檢測出來;其次,為了克服兩次同樣的語音而發(fā)音時(shí)間長短的不同,采用對(duì)標(biāo)準(zhǔn)模式的語音信號(hào)均勻地伸長或縮短直到它與未知語音信號(hào)長度相一致。這種方法能達(dá)到的識(shí)別完全取決于端點(diǎn)檢測的。

  5 結(jié)語

  本系統(tǒng)主要工作是服務(wù)于實(shí)驗(yàn)室智能機(jī)器人的孤立詞語音控制。實(shí)踐證明,本系統(tǒng)能夠?qū)C(jī)器人常用的一些命令詞進(jìn)行識(shí)別,并且比實(shí)驗(yàn)室的傳統(tǒng)機(jī)器人的控制方式方便得多,經(jīng)過改進(jìn)可以用到工業(yè)機(jī)器人的控制系統(tǒng)中去。

  參考文獻(xiàn):

  [1] TMS320VC5402 Fixed-Point Digital Signal Processor Datasheet. 2000

  [2] TLC320ADSOCII data manuals. 1998

  [3] 易克初,田斌,付強(qiáng)。語音信號(hào)處理。北京:國防工業(yè)出版社,2000

  [4] 黃海波,蔣偉榮,程登良。通用語音處理系統(tǒng)的DSP實(shí)現(xiàn)[J]微計(jì)算機(jī)信息2006,5:173-175

  [5] TMS320VC5402 datasheet http://m.58mhw.cn/datasheet/TMS320VC5402_688959.html.

  [6] TLC320AD50C datasheet http://m.58mhw.cn/datasheet/TLC320AD50C_9077.html.

  [7] AT89S52 datasheet http://m.58mhw.cn/datasheet/AT89S52_970343.html.

  [8] FSX datasheet http://m.58mhw.cn/datasheet/FSX_2346448.html.

  [9] FSR datasheet http://m.58mhw.cn/datasheet/FSR_2346447.html.

  [10] TLC320AD50 datasheet http://m.58mhw.cn/datasheet/TLC320AD50_9076.html.

  [11] CY7C133 datasheet http://m.58mhw.cn/datasheet/CY7C133_1067429.html.

關(guān)鍵詞:基于DSP的孤立詞語音識(shí)別系統(tǒng)的設(shè)計(jì)方案

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請(qǐng)必須注明維庫電子市場網(wǎng),http://m.58mhw.cn,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

廣告
OEM清單文件: OEM清單文件
*公司名:
*聯(lián)系人:
*手機(jī)號(hào)碼:
QQ:
有效期:

掃碼下載APP,
一鍵連接廣大的電子世界。

在線人工客服

買家服務(wù):
賣家服務(wù):
技術(shù)客服:

0571-85317607

網(wǎng)站技術(shù)支持

13606545031

客服在線時(shí)間周一至周五
9:00-17:30

關(guān)注官方微信號(hào),
第一時(shí)間獲取資訊。

建議反饋

聯(lián)系人:

聯(lián)系方式:

按住滑塊,拖拽到最右邊
>>
感謝您向阿庫提出的寶貴意見,您的參與是維庫提升服務(wù)的動(dòng)力!意見一經(jīng)采納,將有感恩紅包奉上哦!