摘 要: 基于新型的低成本低功耗語音識別" title="語音識別">語音識別芯片AP7003開發(fā)了一種簡單實(shí)用、能供普通房屋使用的家電語音控制器。介紹了該家電語音控制器的設(shè)計原理、基本功能及其操作說明,使用中識別率達(dá)到75%以上。
關(guān)鍵詞: 語音識別 家電語音控制? 特定人識別? 智能房屋
?
AP7003是功能比較簡單的語音識別芯片" title="識別芯片">識別芯片,其芯片電路中僅集成了MCU、A/D、D/A、ROM,并在MCU中固化語音識別程序,方便使用。基于該芯片開發(fā)了一種低成本的家電智能語音控制器,使用戶能通過語音實(shí)現(xiàn)對家用電器的控制。
1 語音識別芯片AP7003
1.1 語音識別芯片AP7003簡介
AP7003是一款新型、低成本語音識別專用芯片,經(jīng)預(yù)處理后可識別12組不同的字詞,每組時長1.5秒,可連詞或單詞識別。其I/O口有2個普通輸入、4個觸發(fā)輸入、12個輸出、2個LED驅(qū)動。采用2.4~2.5V的工作電壓,具備低功耗模式,指令優(yōu)化,方便用戶使用。
AP7003包括AP7003-1(由CPU串行控制)和AP7003-2(由按鍵直接控制)兩種型號。它具有高度的可編程性,使用簡單方便,可廣泛應(yīng)用于語音控制的家電、玩具、自動答錄等領(lǐng)域。其中用AP7003-2構(gòu)成的語音識別電路,結(jié)構(gòu)簡單、外圍元器件少,設(shè)計、制作、調(diào)試及操作十分容易。因此選用AP7003-2為家電語音控制器的核心。
1.2 AP7003的結(jié)構(gòu)
AP7003內(nèi)置有麥克風(fēng)放大器、A/D轉(zhuǎn)換器、語音處理器和I/O控制器等電路,其功能框圖如圖1所示。AP7003-2為雙列直插40腳封裝,引腳功能見表1。
?
表1 AP7003-2引腳功能
引腳名稱
功能描述
GNDD
LED1
LED2
POB1~POB4
PIT1~PIT4
VDDD
CAPV
OSC1
PIM1~2
TEST
POSL
GNDA
TREF
A2OUT
A1IN
A1OUT
MICP
VDDA
POA1~POA12
PORES數(shù)字地
低電平LED1驅(qū)動端
低電平LED2驅(qū)動端
輸出端口" title="輸出端口">輸出端口B
低電平觸發(fā)輸入端,帶上拉電阻
正電源
與地之間必須連接一電容以調(diào)整內(nèi)部電壓
振蕩器頻率控制端
模式控制輸入端
測試端
輸出端口A的輸出模式選擇器
模擬地
語音輸入的臨界控制端
第二個放大器輸出端
第一個" title="第一個">第一個放大器的負(fù)極輸入端
第一個放大器輸出端
麥克風(fēng)的正極電源
模擬電壓端
輸出端口A1~A12
高電平" title="高電平">高電平輸入端
1.3 AP7003-2典型應(yīng)用電路
AP7003-2有兩種按鍵模式,PIM1接高電平,為12 鍵模式;PIM1接低電平,為8鍵模式。這里采用12鍵控制模式,其典型應(yīng)用電路如圖2所示。POSL接低電平,POA1~POA12輸出為低電平有效;POSL接高電平,POA1~POA12輸出為高電平有效。

語音識別電路的操作分為兩大部分,首先必須將標(biāo)準(zhǔn)字句錄入,其次才進(jìn)入識別操作模式。在需要做識別操作時,目標(biāo)字句必須已存入內(nèi)部的12 個存儲區(qū),可以用鍵盤來選擇存儲區(qū)或用適當(dāng)?shù)拿羁刂茖⒆志滗浫耄總€存儲區(qū)可以存放長達(dá)1.5s的字句。
2 家電語音識別控制器的系統(tǒng)設(shè)計
根據(jù)AP7003-2的性能和特點(diǎn),設(shè)計了一個低成本的家電語音識別控制器,可以實(shí)現(xiàn)電燈、電視機(jī)等電器的語音控制??紤]到市場上購買的電器都為成品,無法進(jìn)行二次開發(fā),很難對這些電器進(jìn)行改造,因此只能通過語音控制開關(guān)或電源插座來間接實(shí)現(xiàn)對這些電器的語音控制。該套語音控制系統(tǒng)與原來的手動開關(guān)并用,在不影響原有功能和可靠性的基礎(chǔ)上,增加語音控制功能,以方便用戶,提高生活水平。
2.1 家庭語音識別控制器的功能
AP7003-2具有12個輸出口,每2個輸出口控制一種電器(一個控制開,一個控制關(guān)),因此一片AP7003-2可以控制6種不同的電器。當(dāng)所需控制電器多于6種時,增加語音識別芯片數(shù)量即可。根據(jù)用戶需求和所用硬件的性能,設(shè)計的家庭語音識別控制器具有以下功能:
(1)語音識別控制器安裝在房屋的墻壁上,通過雙絞線與所控電器如走廊燈、客廳燈、電視等相連。對語音識別控制器發(fā)出語音指令便可以控制這些電器的動作;
(2)語音識別控制器可以準(zhǔn)確識別出“走廊燈開”、“走廊燈關(guān)”、“電視開”、“電視關(guān)”等語音指令,并有相應(yīng)的控制信號輸出,準(zhǔn)確地控制各種電器的開關(guān);
(3)根據(jù)使用場合和所控對象的不同,可設(shè)置不同的語音命令進(jìn)行識別。
2.2 家庭語音識別控制器的結(jié)構(gòu)
家庭語音控制電路的核心是AP7003-2語音識別集成電路。外圍電路由語音輸入電路、狀態(tài)轉(zhuǎn)換控制電路、鍵盤控制電路和輸出控制電路等組成。語音控制電路原理圖如圖3所示。
語音輸入電路的功能是采集說話者的聲音并濾波后送入控制芯片進(jìn)行處理。參照AP7003-2的典型應(yīng)用電路圖進(jìn)行設(shè)計,語音輸入電路由麥克風(fēng)MIC,電阻R5、R6、R7,電容C4、C5等組成。
狀態(tài)轉(zhuǎn)換控制電路的功能是控制按鍵個數(shù)、輸出口輸出電平、輸出后是否清零以及狀態(tài)燈等,由三極管T1,發(fā)光二極管D1、D2,電阻R1、R2、R3、R4,電容C1、C2、C3等組成。
鍵盤控制電路的功能是用戶在訓(xùn)練語音控制器時輸入相應(yīng)的指令,各按鍵功能在后面會詳細(xì)介紹。采用薄膜小鍵盤,與端口PIT1~3和POB1~4相連,其設(shè)計參照AP7003-2的典型應(yīng)用電路。
輸出控制電路的功能是根據(jù)語音控制芯片的輸出信號控制電器的動作。由三極管T2~T7、繼電器J1~J6和RS觸發(fā)器RS1~RS6等組成。
2.3 語音控制電路的工作原理
標(biāo)準(zhǔn)語音控制命令事先可用按鍵控制,通過用戶的訓(xùn)練,由外部的麥克風(fēng)MIC錄入,存儲在內(nèi)部的存儲器中。
正常使用時,AP7003-2處于識別操作模式,用戶發(fā)出的語音命令由MIC轉(zhuǎn)換成模擬電信號送至AP7003-2內(nèi)部,經(jīng)MIC放大器放大及A/D轉(zhuǎn)換器后變?yōu)閿?shù)字信號。輸入的語音被聲音處理器特征抽樣,同存儲在內(nèi)部的目標(biāo)字句的抽樣特征進(jìn)行比較,必須與所選擇的識別目標(biāo)字匹配,才會將輸出信號送至相應(yīng)的PA口(POA1~POA12),否則芯片不會有輸出。
因?yàn)镻OSL端接高電平,所以相應(yīng)的PA口輸出為高電平。同時,LED2端由高電平變?yōu)榈碗娖剑òl(fā)光二極管D2點(diǎn)亮指示識別成功),晶體管T1導(dǎo)通,PORES端變?yōu)楦唠娖?,PA口復(fù)位為低電平,等待下一命令的輸入。
由此可見,當(dāng)語音識別成功后,PA端實(shí)際輸出一個高電平脈沖。若控制“開”的端口(POA1)輸入脈沖至RS觸發(fā)器的R端,此時控制“關(guān)”的端口(POA2)仍為低電平,因此觸發(fā)器的Q端輸出高電平,晶體管T2導(dǎo)通,繼電器J1的觸點(diǎn)閉合,電燈點(diǎn)亮。若POA2輸入脈沖至RS觸發(fā)器的S端,此時POA1仍為低電平,因此觸發(fā)器的Q端輸出低電平,晶體管T2截至,繼電器J1的觸點(diǎn)斷開,電燈關(guān)閉。
3 家庭語音識別控制器操作說明
3.1 按鍵設(shè)置功能說明
該語音控制器采用12鍵控制模式。語音控制器上電后,POB1~POB4均被置成低電平。當(dāng)有鍵按下時,芯片按POB1→POB2→POB3→POB4的順序依次發(fā)出鍵盤掃描信號,掃描信號為16ms低脈沖加64ms間隔,且循環(huán)進(jìn)行,按鍵信號從PIT1~PIT4輸入芯片。鍵盤陣列如表2所示,各按鍵功能如表3所示。
?
表2 AP7003-2鍵盤陣列
| 端口 | POB1 | POB2 | POB3 | POB4 |
| PIT1 PIT2 PIT3 |
KEY1 KEY5 KEY9 |
KEY2 KEY6 KEY10 |
KEY3 KEY7 KEY11 |
KEY4 KEY8 KEY12 |
表3 AP7003-2鍵盤功能
| 鍵號 | 鍵名 | 按鍵功能 |
| 1 2 3 4 5 6 7 8 9 10 11 12 C |
存儲語句1 存儲語句2 存儲語句3 存儲語句4 存儲語句5 存儲語句6 存儲語句7 存儲語句8 設(shè)置級別1 設(shè)置級別2 清零 待機(jī) 清空內(nèi)存 |
選擇第一個存儲體存儲錄入的語音 選擇第二個存儲體存儲錄入的語音 選擇第三個存儲體存儲錄入的語音 選擇第四個存儲體存儲錄入的語音 選擇第五個存儲體存儲錄入的語音 選擇第六個存儲體存儲錄入的語音 選擇第七個存儲體存儲錄入的語音 選擇第八個存儲體存儲錄入的語音 設(shè)置語音識別的匹配度,進(jìn)入語音識別初始狀態(tài) 清除POA1~POA12和LED2的狀態(tài),進(jìn)入語音識別初始狀態(tài) 將芯片轉(zhuǎn)入省電模式 清除12個存儲體內(nèi)容,進(jìn)入存儲目標(biāo)詞狀態(tài) |
3.2 使用說明
(1)本家庭語音識別控制器采用5V直流電,使用前需裝入2節(jié)5#電池。經(jīng)過改造,也可采用直流變壓器供電。
(2)在使用語音控制器之前,用戶應(yīng)先對語音控制器進(jìn)行訓(xùn)練,輸入標(biāo)準(zhǔn)語音。另外,本語音控制器采用特定人識別方式,如果發(fā)出指令的用戶更換,需重新進(jìn)行訓(xùn)練。具體做法為;先按下C鍵,清空內(nèi)存,進(jìn)入存儲目標(biāo)詞狀態(tài),此時LED1點(diǎn)亮。然后按下1鍵,此時LED1和POA1有效,輸入標(biāo)準(zhǔn)語音,如“走廊燈開”,存儲到第一個存儲器。依次按下其他按鍵,存入新的標(biāo)準(zhǔn)語音。
(3)校核訓(xùn)練情況。標(biāo)準(zhǔn)語音存儲后,系統(tǒng)進(jìn)入識別狀態(tài),LED1亮。依次說出剛才訓(xùn)練的語句,看相應(yīng)動作能否執(zhí)行。若能執(zhí)行,則說明訓(xùn)練成功;否則說明相應(yīng)語句訓(xùn)練不成功,需重新按下對應(yīng)鍵進(jìn)入訓(xùn)練狀態(tài),直到識別成功。
(4)訓(xùn)練成功后,即可進(jìn)入識別模式狀態(tài)進(jìn)行工作。當(dāng)需要進(jìn)行語音控制時,說出相應(yīng)語句,如“走廊燈開”等。若識別成功,則LED2點(diǎn)亮,執(zhí)行相應(yīng)動作,打開走廊燈。
(5)語音控制其對外部麥克風(fēng)(MID)的分貝值有一定的要求。使用經(jīng)驗(yàn)表明,本語音控制器選用55dB的麥克風(fēng)時效果較好。經(jīng)多次驗(yàn)證,本語音控制器具有較高的識別率,一般可達(dá)75%以上。
參考文獻(xiàn)
[1] 李勝.語音控制應(yīng)用系統(tǒng)設(shè)計.機(jī)械工程學(xué)報,2002,(S1).
[2] Aplus Integrated Circuits INC.AP7003-2(Voice Recognition IC)Application Note.2000,9.
[3] 吳少軍,張維平,沈永福.新型語音識別電路AP7003及其應(yīng)用.電子技術(shù)應(yīng)用,2001,(7).
[4] 李文聯(lián).語音識別集成電路AP7003及其應(yīng)用.電子技術(shù)應(yīng)用,2003,(8).


