音影先锋亚洲天堂网|电影世界尽头的爱完整版播放|国产熟女 91|高清无码免费观看欧美日韩|韩国一区二区三区黄色录像|美女亚洲加勒比在线|亚洲综合网开心五月|7x成人在线入口|成人网站免费日韩毛片区|国产黄片?一级?二级?三级

<fieldset id="kopyi"></fieldset>

首頁 | 行業(yè)黑名單 | 幫助

電子元器件

電子資訊

技術資料

語音識別技術

作者：creative　欄目：電路欣賞

論壇里有沒有誰搞過語音識別技術，可以在次商討一下，比如對于中文由于使用隱馬爾科夫算法，對多音字的識別有了很大進展，但依舊存在對多音字識別的問題，目前主要的識別錯誤基本都來自此類問題。

2樓：	>>參與討論
作者： kingman2006 于 2006/12/25 11:21:59 發(fā)布：拿登子來聽聽

3樓：	>>參與討論
作者： wujing198 于 2006/12/25 22:13:18 發(fā)布：這個東西比較麻煩……還是請高人出來吧，幫你頂下。

4樓：

>>參與討論

作者：蕭臺基于 2006/12/26 9:57:54 發(fā)布：

幫頂！

隱馬爾科夫算法你介紹介紹，

5樓：	>>參與討論
作者： luo123 于 2006/12/26 13:20:25 發(fā)布：樓主介紹一下這個隱馬爾科夫算法.

6樓：	>>參與討論
作者： LB 于 2006/12/26 21:55:32 發(fā)布：語音識別技術的軟件我是用過，很方便的

7樓：

>>參與討論

作者： cby806 于 2007/1/10 19:37:38 發(fā)布：

    語音識別技術的原理是將人的話音轉(zhuǎn)換成聲音信號，經(jīng)過特殊處理，與計算機中已存儲的已有聲音信號進行比較，然后反饋出識別的結果。其關鍵在于將人的話音轉(zhuǎn)換成聲音信號的準確性，以及與原有聲音信號比較時的智能化程度。語音識別技術是人工智能的有機組成部分。
    這種輸入法的好處是不再用手去輸入，把雙手解放出來，只要會讀出漢字的讀音即可，但是受每個人漢字發(fā)音的限制，不可能都滿足語音識別軟件的要求，因此在實際應用中錯誤率較鍵盤輸入高。特別是一些專業(yè)技術方面的語言，識別系統(tǒng)幾乎不能確認，錯誤率較高. 還記得一兩年前曾經(jīng)流行過一段時間語音輸入軟件（如IBM ViaVioce)，其中大多數(shù)都是以IBM語音錄入軟件為內(nèi)核的，不過由于當時計算機的處理速度還沒有達到很高的水平，所以并沒有形成氣候�，F(xiàn)在隨著計算機主頻不斷提高，就連Windows XP也內(nèi)置了語音錄入軟件，它用起來如何呢？讓我們一起來感受一下吧。

    語音識別是操作系統(tǒng)將口頭語言轉(zhuǎn)換為書面文字的能力。內(nèi)部驅(qū)動程序(稱為SR引擎) 識別這些語言并能夠?qū)⑺鼈冝D(zhuǎn)換為文字。Windows XP語音識別系統(tǒng)需要揚聲器或其他聲音輸入設備來接收聲音。通常，揚聲器應該是帶有集成噪音過濾器的高質(zhì)量設備。語音識別率直接與輸入質(zhì)量相關。劣質(zhì)擴音器的識別率非常低，有的甚至無法接收。

    Microsoft語音識別訓練向?qū)?語音訓練向?qū)?會指導您完成所需步驟，并且推薦放置擴音器的最佳位置(由您進行測試，獲得最佳效果)。

一、使用Microsoft語音識別引擎
    我們可以在任何Microsoft Office XP程序、Internet Explorer 5.0和Outlook Express 5.0中口述文本。其它軟件可能最終將支持Microsoft語音識別引擎，此時不能在寫字板中口述文本。就像語音引擎都有特定的語言一樣，它們可能還有特定的地區(qū)要求。例如，“Microsoft English ASR Version 5引擎”是供美國、英國、澳大利亞人使用，而由于發(fā)音不同，其他不講美國英語的人使用時很費勁。
    要使用語音識別，需要有高質(zhì)量近距離的麥克風以及聲卡或USB端口。您可以使用“麥克風向?qū)А迸渲名溈孙L的位置。

    培訓語音識別引擎熟悉您的聲音非常重要。當大聲朗讀訓練文本時，引擎就會找到適合您講話的模式，以便幫助它解釋您所說的話。訓練可以為每個講話者創(chuàng)建語音配置文件。

二、安裝語音識別系統(tǒng)

（一）、確定是否已安裝語音識別引擎。

1、單擊“開始”，指向“設置”，依次單擊“控制面板”、“聲音、語音和音頻設備”，然后單擊“語音”。2、如果“語音屬性”中的“語音識別”選項卡可用，則表明已安裝了語音識別引擎。否則，手寫識別引擎尚未安裝。

（二）、從Microsoft Word 2002安裝語音識別

1.安裝語音輸入法

　　先打開Word XP程序，然后點擊菜單命令“工具→語音”。如果您以前沒有安裝過語音識別組件，那么系統(tǒng)會要求你插入Office XP安裝光盤，之后，系統(tǒng)就開始自動安裝了。（注意：安裝了語音識別之后，您可以在所有的Office XP組件中使用，并不只局限于Word。）

　　安裝結束之后，單擊“下一步”就可以開始進行語音適應訓練了。

2.調(diào)整麥克風

　　首先，注意不要直接把麥克風放在嘴的前方，并且不要直接對著麥克風呼吸，應該把麥克風放在距嘴側(cè)約一拇指寬的地方。其次，保持一個安靜的環(huán)境也是非常重要的。先測試一下麥克風，我們只需要根據(jù)提示用平常的語調(diào)朗讀句子，然后看音量儀的計數(shù)是否穩(wěn)定在綠色區(qū)域內(nèi)就可以了

8樓：

>>參與討論

作者： cby806 于 2007/1/10 19:40:31 發(fā)布：

語音識別技術就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳奈谋净蛎畹母呒夹g。語音識別有兩種含意，第一種是將口述語言逐字逐句地轉(zhuǎn)換為相應的書面語言(即文字)，第二種則是對口述語言所包含的要求或詢問作出正確地響應，而不拘泥于將所有詞正確轉(zhuǎn)換為書面文字。作為專門的研究領域，語音識別又是一門交叉學科，它與聲學、語音學、語言學、數(shù)字信號處理理論、信息論、計算機科學等眾多學科緊密相連。
發(fā)展背景語音識別技術萌芽于50年代機器翻譯研究時期，但真正取得實質(zhì)性進展，并將其作為一個重要的課題開展研究則是在60年代末70年代初。這一方面要歸功于計算機的計算能力有了迅速的提高，能夠提供實現(xiàn)復雜算法的軟、硬件環(huán)境;另一方面，數(shù)字信號處理理論和算法在當時有了蓬勃發(fā)展，從而自60年代末開始引起了語音識別的研究熱潮。
語音識別系統(tǒng)結構由于對語音識別的需要來自不同的領域和部門，因此對語音識別系統(tǒng)應具有的性能和指標提出了差異極大的要求，語音識別系統(tǒng)要根據(jù)一定的指標、要求設計，主要考慮到服務對象、詞表大小、工作環(huán)境、發(fā)音方式、語音的質(zhì)量、工作性質(zhì)等因素。

9樓：

>>參與討論

作者： cby806 于 2007/1/10 19:41:36 發(fā)布：

語音識別的步驟分為三步。第一步是根據(jù)識別系統(tǒng)的類型選擇一種識別方法，采用語音分析方法分析出這種識別方法所要求的語音特征參數(shù)，這些參數(shù)作為標準模式由機器存儲起來，形成參考模式庫。第二步是語音識別的核心，采用選擇的語音識別方法進行模式匹配。語音識別核心部分又分別表現(xiàn)為模型的建立、訓練和識別三個部分。第三步，語音識別可以進行后處理，后處理通常是一個音字轉(zhuǎn)換過程，有可能包括更高層次的詞法、句法和文法處理，另外也有可能作為某個具體的任務語法的輸入。
語音識別的關鍵技術包括特征參數(shù)提取技術、模式匹配準則及模型訓練技術、語音技術單元選取。
進行特征參數(shù)提取前，先要對語音信號進行采樣和預處理，預處理一般包括分幀處理、預加重、和加窗處理幾個部分。然后進行特征提取，目前比較有效的識別特征有MEL頻率倒譜系數(shù)(MFCC), 另外由線性預測系數(shù)(LPC)導出的倒譜系數(shù)也是一種常用的語音識別參數(shù)。接下來進行的是語音識別算法的實現(xiàn)，核心是實現(xiàn)參數(shù)化的語音特征矢量到語音文字符號的映射，一般包括模型訓練和模式匹配技術。目前主流的模型訓練和模板匹配方法有：動態(tài)時間規(guī)整(Dynamic Time Warping)、隱馬爾可夫模型(Hidden Markov Models，簡稱HMM)、人工神經(jīng)網(wǎng)絡。

10樓：

>>參與討論

作者： cby806 于 2007/1/10 19:45:53 發(fā)布：

其他的方面，你自己最好到圖書館察看一下書

原理一時半會也是講不明白的

11樓：

>>參與討論

作者： frank2356 于 2007/3/8 22:59:55 發(fā)布：

你好，我現(xiàn)在也在學這個，有空交流一下！

hui2356@sina.com

qq: 23488593