智能語音交互對人們生活的影響正在潛移默化地發(fā)生。以前,人們還習慣于通過鍵盤和觸控屏操控智能設備,而三到五年內,科學家認為人們或許可以隨時給身邊智能設備、機器人下達指令,幫助訂餐、訂票,乃至端茶遞水。
過去,機器對語音識別度不高,對自然語言的語義更難以理解,阻礙了語音交互的應用。
但僅僅在一兩年內,隨著降噪技術、方言識別、“雙工多輪交互”技術、機器學習技術的發(fā)展、對語音的準確識別,乃至對語義的準確理解,讓機器準確理解并執(zhí)行人類指令成為可能。
“以語音和語言為入口的認知革命,將推動人工智能夢想成真。這是一條人工智能走認知計算的必由之路?!庇煽拼笥嶏w研發(fā)的最新技術,實時文字同傳了科大訊飛董事長劉慶峰的演講。
“(原來)我問一次北京明天天氣,然后可以再問上海明天天氣。而現在我可以問北京明天天氣,然后直接問‘上海的呢?’,它馬上就知道上下文相關?!眲c峰說。
同時,在機器回答問題時,人類今后也可以隨時打斷,插入新的指令和話題。
方言、環(huán)境噪音,都可能影響語音識別準確度,而劉慶峰表示,最新的科技,結合了方言、降噪、“雙工多輪”等技術,2015年將語音識別準確度由40%已提升至90%。
讓機器執(zhí)行人類語音指令,識別是首要前提,但接下來另一個重要課題是如何讓機器理解自然語言語義,而這也涉及更深層次“人工智能”。
過去60年中,人工智能掀起過兩波浪潮,從證明數學原理,到大規(guī)模神經網絡出現。直到2006年,機器“深度學習”正式提出,并被證明可用于大規(guī)模神經網絡的學習訓練,海量的數據給予機器學習資源,卷積神經網絡、遞歸神經網絡等機器學習技術,在語音交互方面逐步獲得應用。
本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。