|
|||||||||||
| 技術交流 | 電路欣賞 | 工控天地 | 數(shù)字廣電 | 通信技術 | 電源技術 | 測控之家 | EMC技術 | ARM技術 | EDA技術 | PCB技術 | 嵌入式系統(tǒng) 驅(qū)動編程 | 集成電路 | 器件替換 | 模擬技術 | 新手園地 | 單 片 機 | DSP技術 | MCU技術 | IC 設計 | IC 產(chǎn)業(yè) | CAN-bus/DeviceNe |
語音識別技術 |
| 作者:creative 欄目:電路欣賞 |
論壇里有沒有誰搞過語音識別技術,可以在次商討一下,比如對于中文由于使用隱馬爾科夫算法,對多音字的識別有了很大進展,但依舊存在對多音字識別的問題,目前主要的識別錯誤基本都來自此類問題。 |
| 2樓: | >>參與討論 |
| 作者: kingman2006 于 2006/12/25 11:21:59 發(fā)布:
拿登子來聽聽 |
|
| 3樓: | >>參與討論 |
| 作者: wujing198 于 2006/12/25 22:13:18 發(fā)布:
這個東西比較麻煩……還是請高人出來吧,幫你頂下。 |
|
| 4樓: | >>參與討論 |
| 作者: 蕭臺基 于 2006/12/26 9:57:54 發(fā)布:
幫頂! 隱馬爾科夫算法你介紹介紹, |
|
| 5樓: | >>參與討論 |
| 作者: luo123 于 2006/12/26 13:20:25 發(fā)布:
樓主介紹一下這個隱馬爾科夫算法. |
|
| 6樓: | >>參與討論 |
| 作者: LB 于 2006/12/26 21:55:32 發(fā)布:
語音識別技術的軟件我是用過,很方便的 |
|
| 7樓: | >>參與討論 |
| 作者: cby806 于 2007/1/10 19:37:38 發(fā)布:
一、使用Microsoft語音識別引擎 二、安裝語音識別系統(tǒng) (二)、從Microsoft Word 2002安裝語音識別 1.安裝語音輸入法 |
|
| 8樓: | >>參與討論 |
| 作者: cby806 于 2007/1/10 19:40:31 發(fā)布:
語音識別技術就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳奈谋净蛎畹母呒夹g。語音識別有兩種含意,第一種是將口述語言逐字逐句地轉(zhuǎn)換為相應的書面語言(即文字),第二種則是對口述語言所包含的要求或詢問作出正確地響應,而不拘泥于將所有詞正確轉(zhuǎn)換為書面文字。作為專門的研究領域,語音識別又是一門交叉學科,它與聲學、語音學、語言學、數(shù)字信號處理理論、信息論、計算機科學等眾多學科緊密相連。 發(fā)展背景 語音識別技術萌芽于50年代機器翻譯研究時期,但真正取得實質(zhì)性進展,并將其作為一個重要的課題開展研究則是在60年代末70年代初。這一方面要歸功于計算機的計算能力有了迅速的提高,能夠提供實現(xiàn)復雜算法的軟、硬件環(huán)境;另一方面,數(shù)字信號處理理論和算法在當時有了蓬勃發(fā)展,從而自60年代末開始引起了語音識別的研究熱潮。 語音識別系統(tǒng)結構 由于對語音識別的需要來自不同的領域和部門,因此對語音識別系統(tǒng)應具有的性能和指標提出了差異極大的要求,語音識別系統(tǒng)要根據(jù)一定的指標、要求設計,主要考慮到服務對象、詞表大小、工作環(huán)境、發(fā)音方式、語音的質(zhì)量、工作性質(zhì)等因素。 |
|
| 9樓: | >>參與討論 |
| 作者: cby806 于 2007/1/10 19:41:36 發(fā)布:
語音識別的步驟分為三步。第一步是根據(jù)識別系統(tǒng)的類型選擇一種識別方法,采用語音分析方法分析出這種識別方法所要求的語音特征參數(shù),這些參數(shù)作為標準模式由機器存儲起來,形成參考模式庫。第二步是語音識別的核心,采用選擇的語音識別方法進行模式匹配。語音識別核心部分又分別表現(xiàn)為模型的建立、訓練和識別三個部分。第三步,語音識別可以進行后處理,后處理通常是一個音字轉(zhuǎn)換過程,有可能包括更高層次的詞法、句法和文法處理,另外也有可能作為某個具體的任務語法的輸入。 語音識別的關鍵技術包括特征參數(shù)提取技術、模式匹配準則及模型訓練技術、語音技術單元選取。 進行特征參數(shù)提取前,先要對語音信號進行采樣和預處理,預處理一般包括分幀處理、預加重、和加窗處理幾個部分。然后進行特征提取,目前比較有效的識別特征有MEL頻率倒譜系數(shù)(MFCC), 另外由線性預測系數(shù)(LPC)導出的倒譜系數(shù)也是一種常用的語音識別參數(shù)。接下來進行的是語音識別算法的實現(xiàn),核心是實現(xiàn)參數(shù)化的語音特征矢量到語音文字符號的映射,一般包括模型訓練和模式匹配技術。目前主流的模型訓練和模板匹配方法有:動態(tài)時間規(guī)整(Dynamic Time Warping)、隱馬爾可夫模型(Hidden Markov Models,簡稱HMM)、人工神經(jīng)網(wǎng)絡。 |
|
| 10樓: | >>參與討論 |
| 作者: cby806 于 2007/1/10 19:45:53 發(fā)布:
其他的方面,你自己最好到圖書館察看一下書 原理一時半會也是講不明白的 |
|
| 11樓: | >>參與討論 |
| 作者: frank2356 于 2007/3/8 22:59:55 發(fā)布:
你好,我現(xiàn)在也在學這個,有空交流一下! qq: 23488593 |
|
| 12樓: | >>參與討論 |
| 作者: olderzzy 于 2007/3/12 15:09:56 發(fā)布:
幫頂下 |
|
|
|
| 免費注冊為維庫電子開發(fā)網(wǎng)會員,參與電子工程師社區(qū)討論,點此進入 |
Copyright © 1998-2006 m.58mhw.cn 浙ICP證030469號 |