摘要:摘要現(xiàn)代通信正向著數(shù)字化、寬帶化、綜合化、智能化和個人化方向發(fā)展,由此對通信終端的高性能、智能化、多媒體化、微型化和移動化等提出了更高的要求。本文主要論述了通信終端智能化的智能語音接口;語音的合成、識別及門戶;網(wǎng)絡(luò)的自適應(yīng)等關(guān)鍵技術(shù)。顧名思義,智能通信終端是指具有智能特征的通信終端,其根本特點應(yīng)是具有視、聽、說
摘要 現(xiàn)代通信正向著數(shù)字化、寬帶化、綜合化、智能化和個人化方向發(fā)展,由此對通信終端的高性能、智能化、多媒體化、微型化和移動化等提出了更高的要求。本文主要論述了通信終端智能化的智能語音接口;語音的合成、識別及門戶;網(wǎng)絡(luò)的自適應(yīng)等關(guān)鍵技術(shù)。
顧名思義,智能通信終端是指具有智能特征的通信終端,其根本特點應(yīng)是具有視、聽、說、理解和自學習、推理的能力,表現(xiàn)在具有擬人化的人機接口和友好的操作界面,應(yīng)用語音識別和合成、文字識別、自然語言理解等語音及語言處理關(guān)鍵技術(shù)。
1智能語音接口技術(shù)
智能接口,也稱人機接口,是在智能通信終端上建立的一種擬人化的人機交互環(huán)境。智能接口技術(shù)除涉及人工智能和計算機科學外,與信號處理、電子技術(shù)、語言學、認知科學,乃至現(xiàn)代心理學、神經(jīng)生理學等都有密切的關(guān)系。目前,在該領(lǐng)域中的主要研究課題有多媒體與虛擬現(xiàn)實、語音識別和合成、文字識別、計算機視覺和圖像識別、自然語言處理、自動摘要及機器翻譯等。由于語音是人類最自然的通信手段,人們的信息交互有60%是通過語音通信來完成的,因此目前通信終端的主體也基于語音通信。
1.1語音識別
語音識別是對智能通信終端最具影響的技術(shù)之一。由于早期的語音識別是采用“模板法”來實現(xiàn)的,而這種基于模板匹配的語音識別,只能滿足小詞匯量、特定人、非連續(xù)語音識別的需求,無法提供人們對大詞匯量、非特定人、連續(xù)語音識別的需要。智能通信的需求反過來又對語音識別技術(shù)提出了更高的要求。
①電話語音識別在高速數(shù)據(jù)信道和便攜數(shù)據(jù)終端普及前,我們最先利用的仍是傳統(tǒng)語音電話信道和一般意義上的電話終端,這就意味著需要識別經(jīng)過整個電話信道而產(chǎn)生了某種畸變的語音信號。打電話時用戶可能會處于各種嘈雜的環(huán)境,因此噪聲背景下的語音識別也是要解決的問題。電話語音識別具有最迫切的市場需求,目前已成為國內(nèi)外研究和開發(fā)的重點。
[1] [2]
通信工程師備考資料免費領(lǐng)取
去領(lǐng)取