《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 业界动态 > 新型语音识别电路AP7003及其应用

新型语音识别电路AP7003及其应用

2009-01-20
作者:吴少军 张维平 沈永福

  摘 要: 介紹了新型、低成本語音識別電路AP7003的性能、引腳、指令等內(nèi)容,并給出了應(yīng)用電路原理圖及詳細的應(yīng)用方法。

  關(guān)鍵詞: 語音識別 鍵盤控制 CPU控制 存儲體

?

1 AP7003簡介

??? AP7003是一款新型、低成本語音識別專用集成電路,內(nèi)置有麥克風放大器、A/D轉(zhuǎn)換器、語音處理器和I/O控制器,經(jīng)預處理后可識別12組不同的字詞,每組1.5秒時長,可連詞或單詞識別。AP7003包括AP7003-01(由CPU串行控制)和AP7003-02(由按鍵直接控制)兩種型號,且具有高度的I/O可編程性,使用簡單方便,可廣泛應(yīng)用于玩具、識別轉(zhuǎn)控、自動答錄等領(lǐng)域。

  AP7003的功能框圖如圖1所示。其主要特性如下:

  · 內(nèi)置麥克風放大器;

  · 內(nèi)置A/D轉(zhuǎn)換器;

  · DIP40雙列直插式封裝;

  · 識別12組1.5秒時長字詞;

  · I/O口具有2個普通輸入、4個觸發(fā)輸入、2個輸出口(分別有4個和12個輸出)、2個LED驅(qū)動;

  · 指令優(yōu)化以方便用戶使用;

  · 2.4V~4.5V工作電壓,且具備低功耗模式。

?

2 AP7003功能說明

  AP7003具有兩種工作模式,即錄音模式和識別模式。在使用識別模式之前,應(yīng)先將目標詞錄入芯片內(nèi)。AP7003內(nèi)有12個存儲體用于存儲12組不同的字句,每個存儲體可存儲1.5秒時長的字詞,可通過鍵盤或按程序編制的順序選擇存儲體錄入及存放目標詞。語音可通過外部麥克風或其它媒體錄入芯片內(nèi),經(jīng)內(nèi)部處理后以不同的數(shù)字特征信號保存于存儲體中。

目標詞錄入芯片內(nèi)后即可將工作模式轉(zhuǎn)換到識別模式,工作時芯片將當前語音與事先已錄入存儲體的目標詞語音相比較,如果有語音特征相匹配,則在芯片的相應(yīng)輸出端口輸出高電平或低電平。需要時可以將芯片編程為省電模式以節(jié)省電能,當有按鍵信號時芯片將被喚醒。

  AP7003采用DIP40封裝,引腳功能如表1所示,其典型應(yīng)用電路如圖2所示。

?

?

?

3 AP7003-01的應(yīng)用

  AP7003-01可通過串行口與微控制器連接,應(yīng)用圖如圖3所示。AP7003-01共有22個輸入指令和15個輸出指令,如表2所示。AP7003-01工作時序及時間定義如圖4所示。

?

?

?

?

  系統(tǒng)上電后必須先給AP7003-01發(fā)清除指令Clear Word以清除12個存儲體內(nèi)的內(nèi)容,然后發(fā)出一個存儲指令(Store Word1~Store Word12之一)將目標詞錄入芯片相應(yīng)的存儲體內(nèi)。當LED1有效時,表示芯片準備好錄入目標詞。通過指令Set R_Mode1或Set R_Mode2可選擇兩種識別模式:Set R_Mode1為單詞識別模式,該模式下識別操作完成后,芯片進入省電狀態(tài)以等待新的指令;Set R_Mode2為連詞識別模式,該模式下識別操作完成后芯片返回語音錄入狀態(tài)。

  進入語音識別狀態(tài)前必須通過指令Set R_Level1~Set R_Level4設(shè)置識別時要求的匹配度,Set R_Level4要求匹配程度最高,而Set R_Level1最低,可以根據(jù)經(jīng)驗設(shè)定為中間某一個值。跟在一個Store Word1~12指令之后的Store Flag指令將前面錄入的語音存入指定的存儲體以作為目標詞。Clear Outputs指令用于清除A端口輸出狀態(tài)(POA1~POA12)。Shut Down指令將芯片轉(zhuǎn)入關(guān)閉模式以節(jié)省電能。

  當數(shù)據(jù)格式或時序出現(xiàn)在串行數(shù)據(jù)(SERIAL DATA)輸入口PIT3、PIT2、PIT1時,芯片將發(fā)送錯誤代碼到串行數(shù)據(jù)輸出口POB4,同時將數(shù)據(jù)、時鐘發(fā)送到串行數(shù)據(jù)輸出口POB2、POB3。

  指令Store Word1~12、Store Flag、Clear Word、Set R_Level1~4和Clear Outputs執(zhí)行完成后,芯片將輸出一個Done代碼。芯片每次執(zhí)行完語音識別后,輸出一個匹配指示代碼(Match Word1~Match Word12或NO Match)。當有一個語音匹配時,LED2有效,如果PIM2被拉高(端口A使能),則A端口相應(yīng)的引腳變?yōu)橛行АH绻鸓IM1引腳被拉低,芯片的語音識別功能被禁止。

4 AP7003-02的應(yīng)用

  AP7003-02可以單獨使用,無需控制器,適合于用鍵盤直接控制。芯片有8鍵控制和12鍵控制兩種鍵盤操作模式,如圖5所示。各鍵及其功能見表3(a)、(b)。

?

?

?

  上電后POB1~POB4均被置成低電平。當有鍵按下時,芯片按POB1→POB2→POB3→POB4的順序依次發(fā)出鍵盤掃描信號,掃描信號為16ms低脈沖加64ms間隔,且循環(huán)進行,按鍵信號從PIT1~PIT4輸入芯片。鍵盤陣列如表3(c)所示。

?

?

  上電后12個存儲體在錄入目標詞之前必須首先清空。開始錄入目標詞時LED1及POA1~POA12之一(與所選擇的存儲體相對應(yīng)的一個)有效,目標詞錄入到存儲體后芯片進入識別模式。

  在識別模式初始狀態(tài),只有LED1是有效的。識別完成后,如果沒有詞相匹配,LED1閃爍3秒鐘后回到識別模式初始狀態(tài);如果有詞相匹配,LED2有效,與匹配詞所在存儲體相對應(yīng)的POA輸出端口也有效。如果芯片被設(shè)置成自動模式(PIM2=0),則LED2及POA的輸出將在3分鐘后被清除,之后回到識別模式初始狀態(tài)。當PIM2=0時,如果連續(xù)8分鐘沒有語音輸入芯片,將自動進入省電模式。

5 應(yīng)注意的問題

  (1)語音識別電路對外部麥克風(MIC)的分貝值有一定的要求。使用經(jīng)驗表明,本語音識別電路中選用56dB的麥克風可達到最佳效果。

  (2)語音識別前設(shè)置的匹配度是一個影響識別率高低的重要因素,在實驗過程中需要根據(jù)使用環(huán)境、使用要求等情況多次實驗才能確定最佳值。

  (3)AP7003的工作電壓為2.4V~4.5V。對于3V的應(yīng)用系統(tǒng),可直接使用;如果您的應(yīng)用系統(tǒng)是5V工作電壓,建議通過一個二極管給AP7003供電,以保證系統(tǒng)長期穩(wěn)定可靠地工作,也有利于降低系統(tǒng)功耗。

  應(yīng)用表明,AP7003使用簡單方便,具有較高的識別率,一般可達80%以上,是一款較好的語音識別芯片。

?

參考文獻

1 AP7003 DATA SHEET.API,2000.9

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。

相關(guān)內(nèi)容