文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2013)01-0072-04
基于動(dòng)作傳感器的人機(jī)交互不受光線遮擋和角度限制,測(cè)量單元易于嵌入片上系統(tǒng),并且更接近于自然交互方式,基于動(dòng)作傳感器的人機(jī)交互已成為當(dāng)前該領(lǐng)域的研究熱點(diǎn)[1-2]。業(yè)界對(duì)基于加速度傳感器的動(dòng)作識(shí)別方法開(kāi)展了大量的研究,基于隱馬爾可夫模型[3]、模糊神經(jīng)網(wǎng)絡(luò)[4]、模版匹配[2,5]等識(shí)別方法被廣為關(guān)注和研究。但因這些識(shí)別方法的算法復(fù)雜度偏高,手勢(shì)識(shí)別的動(dòng)態(tài)實(shí)時(shí)性和識(shí)別率不理想,這些方法難以滿足手勢(shì)在線識(shí)別的要求。
本文提出一種基于區(qū)間分布概率矩陣模型的在線快速手勢(shì)識(shí)別方法,其主要優(yōu)點(diǎn)是:(1)把大量工作轉(zhuǎn)移到模型建立和模型優(yōu)化上面,而這些工作完全可以在PC機(jī)上完成。(2)在線識(shí)別系統(tǒng)中沒(méi)有大量復(fù)雜計(jì)算公式、遞歸運(yùn)算和模版庫(kù)的存儲(chǔ),極大地提高了動(dòng)態(tài)實(shí)時(shí)性;(3)識(shí)別率高,實(shí)用性強(qiáng)。通過(guò)對(duì)日常生活中常做的12種單筆畫(huà)手勢(shì)[6]動(dòng)作的在線識(shí)別,驗(yàn)證了該識(shí)別方法具有很高的人機(jī)交互實(shí)時(shí)性和較強(qiáng)的實(shí)用性。
1 手勢(shì)識(shí)別系統(tǒng)整體架構(gòu)
手勢(shì)識(shí)別系統(tǒng)流程如圖1所示,首先利用樣本數(shù)據(jù)在PC機(jī)上建立和優(yōu)化區(qū)間分布概率矩陣模型。利用戴在手指上的可穿戴數(shù)據(jù)采集和發(fā)送模塊采集手勢(shì)動(dòng)作的三維加速度信號(hào),由接收、處理和識(shí)別模塊對(duì)信號(hào)進(jìn)行預(yù)處理、提取和檢測(cè)X、Y和Z軸的觀測(cè)點(diǎn)數(shù)據(jù)、輸出觀測(cè)序列,然后利用建立好的區(qū)間分布概率矩陣模型進(jìn)行手勢(shì)識(shí)別,顯示識(shí)別結(jié)果。

2 信號(hào)預(yù)處理
2.1 動(dòng)作數(shù)據(jù)自動(dòng)檢測(cè)和歸一化處理
通常用戶完成一個(gè)動(dòng)態(tài)的手勢(shì)動(dòng)作會(huì)經(jīng)歷三個(gè)階段:開(kāi)始階段、動(dòng)作階段和停止階段。利用此特點(diǎn)可在連續(xù)的加速度數(shù)據(jù)流中檢測(cè)出手勢(shì)識(shí)別過(guò)程所需要的動(dòng)作階段加速度數(shù)據(jù)流。
本文設(shè)計(jì)了一個(gè)可通過(guò)設(shè)置門限閾值自動(dòng)檢測(cè)手勢(shì)動(dòng)作階段加速度數(shù)據(jù)流的滑動(dòng)窗口。在手勢(shì)的開(kāi)始和停止階段,加速度數(shù)據(jù)流可用常量表示。在手勢(shì)的動(dòng)作階段,加速度數(shù)據(jù)流會(huì)產(chǎn)生明顯的變化。設(shè)A(t)=[ax(t), ay(t),az(t)]為t時(shí)刻采集的三軸加速度數(shù)值。Threshold為設(shè)置的門限閾值。將A(t)和前n個(gè)采樣點(diǎn)逐個(gè)進(jìn)行比較, 若‖A(t)-A(t-n)‖≥threshold,則可判斷t時(shí)刻的采樣點(diǎn)A(t)為動(dòng)作階段的數(shù)據(jù)點(diǎn),這樣即可檢測(cè)包含運(yùn)動(dòng)信息的動(dòng)作階段的數(shù)據(jù)點(diǎn)。
在實(shí)際數(shù)據(jù)檢測(cè)中,設(shè)置2個(gè)閾值(開(kāi)始閾值和結(jié)束閾值),較大的開(kāi)始閾值有利于濾除噪聲數(shù)據(jù),較小的結(jié)束閾值可以確保動(dòng)作階段數(shù)據(jù)傳輸?shù)耐暾訹7]。
由于人的手勢(shì)動(dòng)作幅度不固定,尤其是不同人做同一個(gè)手勢(shì)動(dòng)作時(shí),加速度數(shù)據(jù)幅度相差比較大,所以必須對(duì)采集的手勢(shì)動(dòng)作加速度數(shù)據(jù)進(jìn)行歸一化處理,以降低手勢(shì)動(dòng)作加速度數(shù)據(jù)幅度變化差異對(duì)識(shí)別結(jié)果的影響,從而可以降低識(shí)別難度,提高識(shí)別精度。本文采用的是線性函數(shù)轉(zhuǎn)換法,yi=(xi-MinValue)/(MaxValue-MinValue)其中xi、yi分別為樣本中第i個(gè)點(diǎn)處轉(zhuǎn)換前、后的值,MaxValue、MinValue分別為樣本中的最大值和最小值。
2.2 插值法歸整數(shù)據(jù)采樣頻率
由于不同人完成同一種手勢(shì)動(dòng)作的快慢不同,而且同一個(gè)人完成同一種手勢(shì)動(dòng)作的快慢也不盡相同,而系統(tǒng)的采樣頻率是固定的,相同的手勢(shì)動(dòng)作如果完成快,則采集的數(shù)據(jù)點(diǎn)較少;反之,如果完成速度慢,則采集的數(shù)據(jù)點(diǎn)較多。這樣就增加了識(shí)別難度,但是,對(duì)于同一種手勢(shì)動(dòng)作,無(wú)論采集到的數(shù)據(jù)點(diǎn)多少,它的整體變化規(guī)律是相似的。為了簡(jiǎn)化識(shí)別過(guò)程,降低識(shí)別難度,本文通過(guò)插值法把一個(gè)完整手勢(shì)動(dòng)作數(shù)據(jù)點(diǎn)擴(kuò)充到同一長(zhǎng)度來(lái)消除人為速度干擾因素對(duì)識(shí)別率的影響。
本文采用三次樣條插值法[8](簡(jiǎn)稱spline插值)對(duì)手勢(shì)動(dòng)作數(shù)據(jù)點(diǎn)進(jìn)行擴(kuò)充。三次插值法既保留了分段低次插值多項(xiàng)式的簡(jiǎn)單、穩(wěn)定和收斂等優(yōu)點(diǎn),又提高了插值函數(shù)的光滑性,從而不會(huì)造成原始數(shù)據(jù)失真。插值效果如圖2所示。

3 PC機(jī)建立區(qū)間分布概率矩陣初始模型
3.1特征區(qū)間提取
3.1.1觀測(cè)點(diǎn)的選擇
在經(jīng)過(guò)本文上述數(shù)據(jù)預(yù)處理之后,所有手勢(shì)動(dòng)作加速度數(shù)據(jù)長(zhǎng)度標(biāo)準(zhǔn)化為H0=50。本文選擇加速度值作為特征量,所以需要確定一些特定的觀測(cè)點(diǎn)(即需要確定一些特定的采樣點(diǎn))來(lái)提取不同手勢(shì)的加速度信息。在選擇觀測(cè)點(diǎn)時(shí),盡量做到在同一個(gè)觀測(cè)點(diǎn)處,相同手勢(shì)動(dòng)作的加速度數(shù)值變化幅度較小。以X軸為例,根據(jù)手勢(shì)在X軸上加速度數(shù)據(jù)的特征分布,選取K個(gè)觀測(cè)點(diǎn):O1,O2,…,Ok。
3.1.2 特征區(qū)間的定義
設(shè)有M個(gè)手勢(shì),共N個(gè)樣本(每種手勢(shì)有N/M個(gè)樣本),那么在觀測(cè)點(diǎn)Ok處,由N/M個(gè)觀測(cè)值構(gòu)成每個(gè)手勢(shì)的分布區(qū)間?贅。統(tǒng)計(jì)M個(gè)手勢(shì)的區(qū)間的分布情況后,確定M個(gè)手勢(shì)的觀測(cè)值的分布區(qū)間?孜,將?孜劃分成S個(gè)子區(qū)間(左閉右開(kāi)型):R1,R2,…,Rs。子區(qū)間就稱為M個(gè)手勢(shì)在觀測(cè)點(diǎn)Ok處的特征區(qū)間。
3.1.3 提取特征區(qū)間
以本文的12種手勢(shì)為例,闡述提取過(guò)程。隨機(jī)為每個(gè)手勢(shì)選取了10個(gè)樣本,在X軸上觀測(cè)點(diǎn)O1=10處,12種手勢(shì)的觀測(cè)值分布如圖3所示。根據(jù)這個(gè)分布統(tǒng)計(jì)出加速度最大值和最小值,就可以知道此時(shí)所有樣本觀測(cè)值的集中分布的范圍。然后再把這個(gè)分布區(qū)間范圍等間隔分為了5個(gè)子區(qū)間(即特征區(qū)間),則12種手勢(shì)的所有樣本(120個(gè))在觀測(cè)點(diǎn)處的加速度值都會(huì)落入這些子區(qū)間:R1,R2,R3,R4,R5。
3.1.4 區(qū)間分布概率矩陣及模型的定義
同一種手勢(shì)的不同樣本,在同一個(gè)觀測(cè)點(diǎn)處的觀測(cè)值可能會(huì)落入不同的特征區(qū)間。以圖3為例,在觀測(cè)點(diǎn)O1=10處,手勢(shì)11的10個(gè)樣本觀測(cè)值落入了R2,R3,R4 3個(gè)特征區(qū)間,但是有的區(qū)間落入的觀測(cè)值多(如R2,7個(gè)),有的區(qū)間落入的觀測(cè)值少(如R4,1個(gè)),從統(tǒng)計(jì)學(xué)的角度講,手勢(shì)11的10個(gè)樣本在觀測(cè)點(diǎn)處的觀測(cè)值落入R2,R3,R4 3個(gè)特征區(qū)間的概率不同。不同的手勢(shì)在觀測(cè)點(diǎn)O1=10處又有不同的情況。能夠表示不同手勢(shì)和不同樣本在同一個(gè)觀測(cè)點(diǎn)處的觀測(cè)值落入不同特征區(qū)間的概率分布情況(下文有詳細(xì)建立過(guò)程)的矩陣稱之為區(qū)間分布概率矩陣。在X、Y和Z軸上的所有觀測(cè)點(diǎn)處的區(qū)間分布概率矩陣構(gòu)成了本文手勢(shì)識(shí)別方法的區(qū)間分布概率矩陣模型。


(3)用以上步驟分別為X、Y和Z軸上各觀測(cè)點(diǎn)建立區(qū)間分布概率矩陣,這些矩陣構(gòu)成了區(qū)間分布概率矩陣初始模型(在X、Y和Z軸上選取的觀測(cè)點(diǎn)可以不一樣)。
3.3 模型優(yōu)化
為了提高識(shí)別率,還需要對(duì)各觀測(cè)點(diǎn)對(duì)應(yīng)的區(qū)間分布概率矩陣進(jìn)行優(yōu)化訓(xùn)練。在區(qū)間分布概率矩陣初始模型已有的N個(gè)樣本中繼續(xù)添加新的訓(xùn)練樣本。每添加一個(gè)新的訓(xùn)練樣本,在各觀測(cè)點(diǎn)處就會(huì)生成一個(gè)新的區(qū)間分布概率矩陣。例如,在X軸上第k個(gè)觀測(cè)點(diǎn)處會(huì)生成一個(gè)新的區(qū)間分布概率矩陣Ak1[i,j]。隨著訓(xùn)練樣本的添加,各觀測(cè)點(diǎn)處的區(qū)間分布概率矩陣會(huì)趨于一個(gè)常數(shù)矩陣,這時(shí)達(dá)到了最優(yōu)模型,此時(shí)的區(qū)間分布概率矩陣模型可以用到手勢(shì)的在線識(shí)別中。
4 在線識(shí)別
在線識(shí)別過(guò)程如下:
(1) 信號(hào)預(yù)處理和檢測(cè)各觀測(cè)點(diǎn)處對(duì)應(yīng)的特征區(qū)間。以X軸為例,當(dāng)某一手勢(shì)數(shù)據(jù)輸入時(shí),首先經(jīng)過(guò)信號(hào)預(yù)處理,然后檢測(cè)X軸上各觀測(cè)點(diǎn)處觀測(cè)值對(duì)應(yīng)的特征區(qū)間,輸出觀測(cè)序列O={O1,O2,…,Ok}。例如,在第一個(gè)觀測(cè)點(diǎn)處觀測(cè)值對(duì)應(yīng)的特征區(qū)間為R2,則O1=R2。
(3) 將以上識(shí)別過(guò)程在X、Y、Z軸上分別實(shí)現(xiàn)。
5 實(shí)驗(yàn)結(jié)果與評(píng)價(jià)
為了使傳感器與測(cè)量點(diǎn)之間盡可能地相對(duì)穩(wěn)定,避免因手勢(shì)的變化引起傳感器偏離原始測(cè)量位置,使識(shí)別結(jié)果產(chǎn)生較大誤差,本系統(tǒng)中,把數(shù)據(jù)采集和發(fā)送模塊做成了一個(gè)小巧的戒指,通過(guò)無(wú)線的方式將采集到的數(shù)據(jù)實(shí)時(shí)地發(fā)送給微處理器進(jìn)行處理和識(shí)別。實(shí)驗(yàn)時(shí),將戒指模塊戴到左手或右手食指的第二節(jié),這樣,MMA7361L加速度傳感器相對(duì)于手指的位置是固定的。
實(shí)驗(yàn)中選用了30名志愿者,每個(gè)志愿者在自己習(xí)慣和放松的狀態(tài)下,以正常的速度勻速執(zhí)行預(yù)定義的12種手勢(shì),每種手勢(shì)重復(fù)做10次,實(shí)驗(yàn)中隨機(jī)選取了5次動(dòng)作進(jìn)行訓(xùn)練優(yōu)化模型,其余的5次動(dòng)作進(jìn)行測(cè)試,共采集了3 600組樣本數(shù)據(jù)。
實(shí)驗(yàn)結(jié)果如表2所示。平均識(shí)別率為97.94%,手腕向下、手腕向上和右旋轉(zhuǎn)的識(shí)別率最高為100%,手腕向右的識(shí)別率最低為94.7%。為了更好地說(shuō)明本文的識(shí)別方法在識(shí)別率和實(shí)時(shí)效果上比其他算法更具有優(yōu)勢(shì),實(shí)驗(yàn)中同時(shí)用HMM和DTW算法對(duì)這12中手勢(shì)進(jìn)行了識(shí)別,平均識(shí)別率分別為79.08%和85.2%,并且延時(shí)比較明顯?;诒疚淖R(shí)別方法對(duì)手勢(shì)動(dòng)作的整體識(shí)別率較高,實(shí)施效果好,說(shuō)明本文的識(shí)別方法能有效實(shí)時(shí)地完成人機(jī)動(dòng)態(tài)交互。

本文通過(guò)對(duì)加速度傳感器MMA7361L采集到的手勢(shì)動(dòng)作加速度數(shù)據(jù)的分析,經(jīng)過(guò)動(dòng)作數(shù)據(jù)自動(dòng)檢測(cè)、歸一化和三次樣條插值預(yù)處理,最后根據(jù)完成相同手勢(shì)動(dòng)作得到的三維加速度數(shù)據(jù)變化規(guī)律的相似性,提出一種基于區(qū)間分布概率矩陣模型的動(dòng)態(tài)手勢(shì)識(shí)別方法,簡(jiǎn)化了傳統(tǒng)算法識(shí)別過(guò)程的復(fù)雜度,成功地降低了手勢(shì)識(shí)別難度,從而提高了基于加速度傳感器手勢(shì)識(shí)別的人機(jī)交互實(shí)時(shí)性,在一定程度上解決了動(dòng)態(tài)實(shí)時(shí)性與識(shí)別率的相互矛盾性。
參考文獻(xiàn)
[1] 荊雷,馬文君,常丹華.基于動(dòng)態(tài)時(shí)間規(guī)整的手勢(shì)加速度信號(hào)識(shí)別[J].傳感技術(shù)學(xué)報(bào),2012,25(1):72-76.
[2] 楊先軍,王昌喜,潘磊,等.基于三維加速度信息的上肢動(dòng)作質(zhì)量評(píng)價(jià)的研究[J].傳感技術(shù)學(xué)報(bào),2010,23(12):1709-1712.
[3] CARIDAKIS G, KARPOUZIS K. SOM: self organizing markov map for gesture recognition[J]. Pattern recognition letters, 2010,31(1):52-59.
[4] CHOWHAN S S, KULKARNI U V, SHINDE G N, et al. Iris recognition using modified fuzzy hypersphere neural network with different distance measures[J]. International Journal of Advanced Computer Sciences and Applications, 2011,2(6):130-134.
[5] ZHANG S Q,YUAN C, et al. Self-defined gesture recognition on keyless handheld devices using MEMS 3D acce lerometer[C].In Proceedings of International Conference on Natural Computation. IEEE. 2008(4):237-241.
[6] JING L, ZHOU Y, et al. A recognition method for onestroke finger gestures using a MEMS 3D accelerometer[C]. IEICE Tran on Information, 2011,E94-D(5):1062-1072.
[7] 劉蓉,劉明. 基于三軸加速度傳感器的手勢(shì)識(shí)別[J].計(jì)算機(jī)工程,2012,37(24):141-143.
[8] 劉為,高尚. 一種新條件下的三次樣條插值[J]. 信息技術(shù),2011(8):23-28.
