音影先锋亚洲天堂网|电影世界尽头的爱完整版播放|国产 熟女 91|高清无码免费观看欧美日韩|韩国一区二区三区黄色录像|美女亚洲加勒比在线|亚洲综合网 开心五月|7x成人在线入口|成人网站免费日韩毛片区|国产黄片?一级?二级?三级

登錄 免費注冊 首頁 | 行業(yè)黑名單 | 幫助
維庫電子市場網(wǎng)
技術交流 | 電路欣賞 | 工控天地 | 數(shù)字廣電 | 通信技術 | 電源技術 | 測控之家 | EMC技術 | ARM技術 | EDA技術 | PCB技術 | 嵌入式系統(tǒng)
驅(qū)動編程 | 集成電路 | 器件替換 | 模擬技術 | 新手園地 | 單 片 機 | DSP技術 | MCU技術 | IC 設計 | IC 產(chǎn)業(yè) | CAN-bus/DeviceNe

語音識別技術

作者:creative 欄目:電路欣賞

論壇里有沒有誰搞過語音識別技術,可以在次商討一下,比如對于中文由于使用隱馬爾科夫算法,對多音字的識別有了很大進展,但依舊存在對多音字識別的問題,目前主要的識別錯誤基本都來自此類問題。

2樓: >>參與討論
kingman2006
拿登子來聽聽
3樓: >>參與討論
wujing198
這個東西比較麻煩……還是請高人出來吧,幫你頂下。
4樓: >>參與討論
蕭臺基

幫頂!

隱馬爾科夫算法你介紹介紹,


5樓: >>參與討論
luo123

樓主介紹一下這個隱馬爾科夫算法.

6樓: >>參與討論
LB
語音識別技術的軟件我是用過,很方便的
7樓: >>參與討論
cby806


    語音識別技術的原理是將人的話音轉(zhuǎn)換成聲音信號,經(jīng)過特殊處理,與計算機中已存儲的已有聲音信號進行比較,然后反饋出識別的結果。其關鍵在于將人的話音轉(zhuǎn)換成聲音信號的準確性,以及與原有聲音信號比較時的智能化程度。語音識別技術是人工智能的有機組成部分。
    這種輸入法的好處是不再用手去輸入,把雙手解放出來,只要會讀出漢字的讀音即可,但是受每個人漢字發(fā)音的限制,不可能都滿足語音識別軟件的要求,因此在實際應用中錯誤率較鍵盤輸入高。特別是一些專業(yè)技術方面的語言,識別系統(tǒng)幾乎不能確認,錯誤率較高. 還記得一兩年前曾經(jīng)流行過一段時間語音輸入軟件(如IBM ViaVioce),其中大多數(shù)都是以IBM語音錄入軟件為內(nèi)核的,不過由于當時計算機的處理速度還沒有達到很高的水平,所以并沒有形成氣候,F(xiàn)在隨著計算機主頻不斷提高,就連Windows XP也內(nèi)置了語音錄入軟件,它用起來如何呢?讓我們一起來感受一下吧。

    語音識別是操作系統(tǒng)將口頭語言轉(zhuǎn)換為書面文字的能力。內(nèi)部驅(qū)動程序(稱為SR引擎) 識別這些語言并能夠?qū)⑺鼈冝D(zhuǎn)換為文字。Windows XP語音識別系統(tǒng)需要揚聲器或其他聲音輸入設備來接收聲音。通常,揚聲器應該是帶有集成噪音過濾器的高質(zhì)量設備。語音識別率直接與輸入質(zhì)量相關。劣質(zhì)擴音器的識別率非常低,有的甚至無法接收。

    Microsoft語音識別訓練向?qū)?語音訓練向?qū)?會指導您完成所需步驟,并且推薦放置擴音器的最佳位置(由您進行測試,獲得最佳效果)。

一、使用Microsoft語音識別引擎
    我們可以在任何Microsoft Office XP程序、Internet Explorer 5.0和Outlook Express 5.0中口述文本。其它軟件可能最終將支持Microsoft語音識別引擎,此時不能在寫字板中口述文本。就像語音引擎都有特定的語言一樣,它們可能還有特定的地區(qū)要求。例如,“Microsoft English ASR Version 5引擎”是供美國、英國、澳大利亞人使用,而由于發(fā)音不同,其他不講美國英語的人使用時很費勁。
    要使用語音識別,需要有高質(zhì)量近距離的麥克風以及聲卡或USB端口。您可以使用“麥克風向?qū)А迸渲名溈孙L的位置。

    培訓語音識別引擎熟悉您的聲音非常重要。當大聲朗讀訓練文本時,引擎就會找到適合您講話的模式,以便幫助它解釋您所說的話。訓練可以為每個講話者創(chuàng)建語音配置文件。

二、安裝語音識別系統(tǒng)

(一)、確定是否已安裝語音識別引擎。

    1、單擊“開始”,指向“設置”,依次單擊“控制面板”、“聲音、語音和音頻設備”,然后單擊“語音”。2、如果“語音屬性”中的“語音識別”選項卡可用,則表明已安裝了語音識別引擎。否則,手寫識別引擎尚未安裝。

(二)、從Microsoft Word 2002安裝語音識別

1.安裝語音輸入法

  先打開Word XP程序,然后點擊菜單命令“工具→語音”。如果您以前沒有安裝過語音識別組件,那么系統(tǒng)會要求你插入Office XP安裝光盤,之后,系統(tǒng)就開始自動安裝了。(注意:安裝了語音識別之后,您可以在所有的Office XP組件中使用,并不只局限于Word。)

  安裝結束之后,單擊“下一步”就可以開始進行語音適應訓練了。

2.調(diào)整麥克風

  首先,注意不要直接把麥克風放在嘴的前方,并且不要直接對著麥克風呼吸,應該把麥克風放在距嘴側(cè)約一拇指寬的地方。其次,保持一個安靜的環(huán)境也是非常重要的。先測試一下麥克風,我們只需要根據(jù)提示用平常的語調(diào)朗讀句子,然后看音量儀的計數(shù)是否穩(wěn)定在綠色區(qū)域內(nèi)就可以了

8樓: >>參與討論
cby806
語音識別技術就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳奈谋净蛎畹母呒夹g。語音識別有兩種含意,第一種是將口述語言逐字逐句地轉(zhuǎn)換為相應的書面語言(即文字),第二種則是對口述語言所包含的要求或詢問作出正確地響應,而不拘泥于將所有詞正確轉(zhuǎn)換為書面文字。作為專門的研究領域,語音識別又是一門交叉學科,它與聲學、語音學、語言學、數(shù)字信號處理理論、信息論、計算機科學等眾多學科緊密相連。
發(fā)展背景  語音識別技術萌芽于50年代機器翻譯研究時期,但真正取得實質(zhì)性進展,并將其作為一個重要的課題開展研究則是在60年代末70年代初。這一方面要歸功于計算機的計算能力有了迅速的提高,能夠提供實現(xiàn)復雜算法的軟、硬件環(huán)境;另一方面,數(shù)字信號處理理論和算法在當時有了蓬勃發(fā)展,從而自60年代末開始引起了語音識別的研究熱潮。
語音識別系統(tǒng)結構    由于對語音識別的需要來自不同的領域和部門,因此對語音識別系統(tǒng)應具有的性能和指標提出了差異極大的要求,語音識別系統(tǒng)要根據(jù)一定的指標、要求設計,主要考慮到服務對象、詞表大小、工作環(huán)境、發(fā)音方式、語音的質(zhì)量、工作性質(zhì)等因素。
9樓: >>參與討論
cby806

語音識別的步驟分為三步。第一步是根據(jù)識別系統(tǒng)的類型選擇一種識別方法,采用語音分析方法分析出這種識別方法所要求的語音特征參數(shù),這些參數(shù)作為標準模式由機器存儲起來,形成參考模式庫。第二步是語音識別的核心,采用選擇的語音識別方法進行模式匹配。語音識別核心部分又分別表現(xiàn)為模型的建立、訓練和識別三個部分。第三步,語音識別可以進行后處理,后處理通常是一個音字轉(zhuǎn)換過程,有可能包括更高層次的詞法、句法和文法處理,另外也有可能作為某個具體的任務語法的輸入。
語音識別的關鍵技術包括特征參數(shù)提取技術、模式匹配準則及模型訓練技術、語音技術單元選取。
進行特征參數(shù)提取前,先要對語音信號進行采樣和預處理,預處理一般包括分幀處理、預加重、和加窗處理幾個部分。然后進行特征提取,目前比較有效的識別特征有MEL頻率倒譜系數(shù)(MFCC), 另外由線性預測系數(shù)(LPC)導出的倒譜系數(shù)也是一種常用的語音識別參數(shù)。接下來進行的是語音識別算法的實現(xiàn),核心是實現(xiàn)參數(shù)化的語音特征矢量到語音文字符號的映射,一般包括模型訓練和模式匹配技術。目前主流的模型訓練和模板匹配方法有:動態(tài)時間規(guī)整(Dynamic Time Warping)、隱馬爾可夫模型(Hidden Markov Models,簡稱HMM)、人工神經(jīng)網(wǎng)絡。
10樓: >>參與討論
cby806

其他的方面,你自己最好到圖書館察看一下書

原理一時半會也是講不明白的

11樓: >>參與討論
frank2356

你好,我現(xiàn)在也在學這個,有空交流一下!

hui2356@sina.com

qq: 23488593

12樓: >>參與討論
olderzzy

幫頂下

參與討論
昵稱:
討論內(nèi)容:
 
 
相關帖子
新款USB音箱方案MK909D,每聲道1W的輸出功率
分壓電路你能做到多便宜??
一款過流保護電路
大家請幫忙!誰有PADS2005的軟件!
求助:哪位有創(chuàng)維2929A的電路圖啊?(5T20)
免費注冊為維庫電子開發(fā)網(wǎng)會員,參與電子工程師社區(qū)討論,點此進入


Copyright © 1998-2006 m.58mhw.cn 浙ICP證030469號