《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技术 > 设计应用 > 基于区间分布概率矩阵模型的动态手势识别方法
基于区间分布概率矩阵模型的动态手势识别方法
来源:电子技术应用2013年第1期
张建忠, 常丹华
燕山大学 信息科学与工程学院, 河北 秦皇岛066004
摘要: 针对目前基于加速度传感器的手势识别算法的动态实时性与识别率的相互矛盾性,提出一种区间分布概率矩阵模型及动态手势识别方法。将手势动作的三维加速度信号进行动作数据自动检测、归一化和三次样条插值预处理,再根据信号分布特征,确定数据观测点,构造各观测点处的区间分布概率矩阵,优化矩阵,实现在线快速手势识别。该方法对手指可穿戴设备得到的真实数据集中进行了评估。结果显示其实时效果好,识别率高,实用性强。
中圖分類號(hào): TP391.4
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2013)01-0072-04
Dynamic gesture recognition method based on probability matrix model of interval distribution
Zhang Jianzhong, Chang Danhua
Institute of Information Science and Technology, Yanshan University, Qinhuangdao 066004, China
Abstract: For the present, gesture recognition algorithms based on the accelerometer have contradiction between dynamic real-time and recognition rate. Aiming at this problem, a probability matrix model of interval distribution and dynamic gesture recognition method is proposed. The gestural signal from the three dimension accelerometer is preprocessed through a series of methods including automatically action data detection algorithm, normalization, and cubic spline interpolation. Moreover, according to the characteristics on signal distribution, the observation points in each axis are determined and get the probability matrix of interval distribution on each observation point. Further, the on-line and fast gesture discrimination algorithm is realized on the optimized matrixes. The method is evaluated on real data set from a finger-mount wearable device. The result shows that it has good real time effect and high recognition rate.
Key words : accelerometer; signal preprocessing; probability matrix of interval distribution; dynamic gesture recognition

    基于動(dòng)作傳感器的人機(jī)交互不受光線遮擋和角度限制,測(cè)量單元易于嵌入片上系統(tǒng),并且更接近于自然交互方式,基于動(dòng)作傳感器的人機(jī)交互已成為當(dāng)前該領(lǐng)域的研究熱點(diǎn)[1-2]。業(yè)界對(duì)基于加速度傳感器的動(dòng)作識(shí)別方法開(kāi)展了大量的研究,基于隱馬爾可夫模型[3]、模糊神經(jīng)網(wǎng)絡(luò)[4]、模版匹配[2,5]等識(shí)別方法被廣為關(guān)注和研究。但因這些識(shí)別方法的算法復(fù)雜度偏高,手勢(shì)識(shí)別的動(dòng)態(tài)實(shí)時(shí)性和識(shí)別率不理想,這些方法難以滿足手勢(shì)在線識(shí)別的要求。

    本文提出一種基于區(qū)間分布概率矩陣模型的在線快速手勢(shì)識(shí)別方法,其主要優(yōu)點(diǎn)是:(1)把大量工作轉(zhuǎn)移到模型建立和模型優(yōu)化上面,而這些工作完全可以在PC機(jī)上完成。(2)在線識(shí)別系統(tǒng)中沒(méi)有大量復(fù)雜計(jì)算公式、遞歸運(yùn)算和模版庫(kù)的存儲(chǔ),極大地提高了動(dòng)態(tài)實(shí)時(shí)性;(3)識(shí)別率高,實(shí)用性強(qiáng)。通過(guò)對(duì)日常生活中常做的12種單筆畫(huà)手勢(shì)[6]動(dòng)作的在線識(shí)別,驗(yàn)證了該識(shí)別方法具有很高的人機(jī)交互實(shí)時(shí)性和較強(qiáng)的實(shí)用性。
1 手勢(shì)識(shí)別系統(tǒng)整體架構(gòu)
    手勢(shì)識(shí)別系統(tǒng)流程如圖1所示,首先利用樣本數(shù)據(jù)在PC機(jī)上建立和優(yōu)化區(qū)間分布概率矩陣模型。利用戴在手指上的可穿戴數(shù)據(jù)采集和發(fā)送模塊采集手勢(shì)動(dòng)作的三維加速度信號(hào),由接收、處理和識(shí)別模塊對(duì)信號(hào)進(jìn)行預(yù)處理、提取和檢測(cè)X、Y和Z軸的觀測(cè)點(diǎn)數(shù)據(jù)、輸出觀測(cè)序列,然后利用建立好的區(qū)間分布概率矩陣模型進(jìn)行手勢(shì)識(shí)別,顯示識(shí)別結(jié)果。

2 信號(hào)預(yù)處理
2.1 動(dòng)作數(shù)據(jù)自動(dòng)檢測(cè)和歸一化處理

  通常用戶完成一個(gè)動(dòng)態(tài)的手勢(shì)動(dòng)作會(huì)經(jīng)歷三個(gè)階段:開(kāi)始階段、動(dòng)作階段和停止階段。利用此特點(diǎn)可在連續(xù)的加速度數(shù)據(jù)流中檢測(cè)出手勢(shì)識(shí)別過(guò)程所需要的動(dòng)作階段加速度數(shù)據(jù)流。
 本文設(shè)計(jì)了一個(gè)可通過(guò)設(shè)置門限閾值自動(dòng)檢測(cè)手勢(shì)動(dòng)作階段加速度數(shù)據(jù)流的滑動(dòng)窗口。在手勢(shì)的開(kāi)始和停止階段,加速度數(shù)據(jù)流可用常量表示。在手勢(shì)的動(dòng)作階段,加速度數(shù)據(jù)流會(huì)產(chǎn)生明顯的變化。設(shè)A(t)=[ax(t), ay(t),az(t)]為t時(shí)刻采集的三軸加速度數(shù)值。Threshold為設(shè)置的門限閾值。將A(t)和前n個(gè)采樣點(diǎn)逐個(gè)進(jìn)行比較, 若‖A(t)-A(t-n)‖≥threshold,則可判斷t時(shí)刻的采樣點(diǎn)A(t)為動(dòng)作階段的數(shù)據(jù)點(diǎn),這樣即可檢測(cè)包含運(yùn)動(dòng)信息的動(dòng)作階段的數(shù)據(jù)點(diǎn)。
    在實(shí)際數(shù)據(jù)檢測(cè)中,設(shè)置2個(gè)閾值(開(kāi)始閾值和結(jié)束閾值),較大的開(kāi)始閾值有利于濾除噪聲數(shù)據(jù),較小的結(jié)束閾值可以確保動(dòng)作階段數(shù)據(jù)傳輸?shù)耐暾訹7]。
    由于人的手勢(shì)動(dòng)作幅度不固定,尤其是不同人做同一個(gè)手勢(shì)動(dòng)作時(shí),加速度數(shù)據(jù)幅度相差比較大,所以必須對(duì)采集的手勢(shì)動(dòng)作加速度數(shù)據(jù)進(jìn)行歸一化處理,以降低手勢(shì)動(dòng)作加速度數(shù)據(jù)幅度變化差異對(duì)識(shí)別結(jié)果的影響,從而可以降低識(shí)別難度,提高識(shí)別精度。本文采用的是線性函數(shù)轉(zhuǎn)換法,yi=(xi-MinValue)/(MaxValue-MinValue)其中xi、yi分別為樣本中第i個(gè)點(diǎn)處轉(zhuǎn)換前、后的值,MaxValue、MinValue分別為樣本中的最大值和最小值。
2.2 插值法歸整數(shù)據(jù)采樣頻率
 由于不同人完成同一種手勢(shì)動(dòng)作的快慢不同,而且同一個(gè)人完成同一種手勢(shì)動(dòng)作的快慢也不盡相同,而系統(tǒng)的采樣頻率是固定的,相同的手勢(shì)動(dòng)作如果完成快,則采集的數(shù)據(jù)點(diǎn)較少;反之,如果完成速度慢,則采集的數(shù)據(jù)點(diǎn)較多。這樣就增加了識(shí)別難度,但是,對(duì)于同一種手勢(shì)動(dòng)作,無(wú)論采集到的數(shù)據(jù)點(diǎn)多少,它的整體變化規(guī)律是相似的。為了簡(jiǎn)化識(shí)別過(guò)程,降低識(shí)別難度,本文通過(guò)插值法把一個(gè)完整手勢(shì)動(dòng)作數(shù)據(jù)點(diǎn)擴(kuò)充到同一長(zhǎng)度來(lái)消除人為速度干擾因素對(duì)識(shí)別率的影響。
    本文采用三次樣條插值法[8](簡(jiǎn)稱spline插值)對(duì)手勢(shì)動(dòng)作數(shù)據(jù)點(diǎn)進(jìn)行擴(kuò)充。三次插值法既保留了分段低次插值多項(xiàng)式的簡(jiǎn)單、穩(wěn)定和收斂等優(yōu)點(diǎn),又提高了插值函數(shù)的光滑性,從而不會(huì)造成原始數(shù)據(jù)失真。插值效果如圖2所示。

3 PC機(jī)建立區(qū)間分布概率矩陣初始模型
3.1特征區(qū)間提取
3.1.1觀測(cè)點(diǎn)的選擇

    在經(jīng)過(guò)本文上述數(shù)據(jù)預(yù)處理之后,所有手勢(shì)動(dòng)作加速度數(shù)據(jù)長(zhǎng)度標(biāo)準(zhǔn)化為H0=50。本文選擇加速度值作為特征量,所以需要確定一些特定的觀測(cè)點(diǎn)(即需要確定一些特定的采樣點(diǎn))來(lái)提取不同手勢(shì)的加速度信息。在選擇觀測(cè)點(diǎn)時(shí),盡量做到在同一個(gè)觀測(cè)點(diǎn)處,相同手勢(shì)動(dòng)作的加速度數(shù)值變化幅度較小。以X軸為例,根據(jù)手勢(shì)在X軸上加速度數(shù)據(jù)的特征分布,選取K個(gè)觀測(cè)點(diǎn):O1,O2,…,Ok。
3.1.2 特征區(qū)間的定義
    設(shè)有M個(gè)手勢(shì),共N個(gè)樣本(每種手勢(shì)有N/M個(gè)樣本),那么在觀測(cè)點(diǎn)Ok處,由N/M個(gè)觀測(cè)值構(gòu)成每個(gè)手勢(shì)的分布區(qū)間?贅。統(tǒng)計(jì)M個(gè)手勢(shì)的區(qū)間的分布情況后,確定M個(gè)手勢(shì)的觀測(cè)值的分布區(qū)間?孜,將?孜劃分成S個(gè)子區(qū)間(左閉右開(kāi)型):R1,R2,…,Rs。子區(qū)間就稱為M個(gè)手勢(shì)在觀測(cè)點(diǎn)Ok處的特征區(qū)間。
3.1.3 提取特征區(qū)間
    以本文的12種手勢(shì)為例,闡述提取過(guò)程。隨機(jī)為每個(gè)手勢(shì)選取了10個(gè)樣本,在X軸上觀測(cè)點(diǎn)O1=10處,12種手勢(shì)的觀測(cè)值分布如圖3所示。根據(jù)這個(gè)分布統(tǒng)計(jì)出加速度最大值和最小值,就可以知道此時(shí)所有樣本觀測(cè)值的集中分布的范圍。然后再把這個(gè)分布區(qū)間范圍等間隔分為了5個(gè)子區(qū)間(即特征區(qū)間),則12種手勢(shì)的所有樣本(120個(gè))在觀測(cè)點(diǎn)處的加速度值都會(huì)落入這些子區(qū)間:R1,R2,R3,R4,R5。
3.1.4 區(qū)間分布概率矩陣及模型的定義
    同一種手勢(shì)的不同樣本,在同一個(gè)觀測(cè)點(diǎn)處的觀測(cè)值可能會(huì)落入不同的特征區(qū)間。以圖3為例,在觀測(cè)點(diǎn)O1=10處,手勢(shì)11的10個(gè)樣本觀測(cè)值落入了R2,R3,R4 3個(gè)特征區(qū)間,但是有的區(qū)間落入的觀測(cè)值多(如R2,7個(gè)),有的區(qū)間落入的觀測(cè)值少(如R4,1個(gè)),從統(tǒng)計(jì)學(xué)的角度講,手勢(shì)11的10個(gè)樣本在觀測(cè)點(diǎn)處的觀測(cè)值落入R2,R3,R4 3個(gè)特征區(qū)間的概率不同。不同的手勢(shì)在觀測(cè)點(diǎn)O1=10處又有不同的情況。能夠表示不同手勢(shì)和不同樣本在同一個(gè)觀測(cè)點(diǎn)處的觀測(cè)值落入不同特征區(qū)間的概率分布情況(下文有詳細(xì)建立過(guò)程)的矩陣稱之為區(qū)間分布概率矩陣。在X、Y和Z軸上的所有觀測(cè)點(diǎn)處的區(qū)間分布概率矩陣構(gòu)成了本文手勢(shì)識(shí)別方法的區(qū)間分布概率矩陣模型。



    (3)用以上步驟分別為X、Y和Z軸上各觀測(cè)點(diǎn)建立區(qū)間分布概率矩陣,這些矩陣構(gòu)成了區(qū)間分布概率矩陣初始模型(在X、Y和Z軸上選取的觀測(cè)點(diǎn)可以不一樣)。
3.3 模型優(yōu)化
  為了提高識(shí)別率,還需要對(duì)各觀測(cè)點(diǎn)對(duì)應(yīng)的區(qū)間分布概率矩陣進(jìn)行優(yōu)化訓(xùn)練。在區(qū)間分布概率矩陣初始模型已有的N個(gè)樣本中繼續(xù)添加新的訓(xùn)練樣本。每添加一個(gè)新的訓(xùn)練樣本,在各觀測(cè)點(diǎn)處就會(huì)生成一個(gè)新的區(qū)間分布概率矩陣。例如,在X軸上第k個(gè)觀測(cè)點(diǎn)處會(huì)生成一個(gè)新的區(qū)間分布概率矩陣Ak1[i,j]。隨著訓(xùn)練樣本的添加,各觀測(cè)點(diǎn)處的區(qū)間分布概率矩陣會(huì)趨于一個(gè)常數(shù)矩陣,這時(shí)達(dá)到了最優(yōu)模型,此時(shí)的區(qū)間分布概率矩陣模型可以用到手勢(shì)的在線識(shí)別中。
4 在線識(shí)別
    在線識(shí)別過(guò)程如下:
    (1) 信號(hào)預(yù)處理和檢測(cè)各觀測(cè)點(diǎn)處對(duì)應(yīng)的特征區(qū)間。以X軸為例,當(dāng)某一手勢(shì)數(shù)據(jù)輸入時(shí),首先經(jīng)過(guò)信號(hào)預(yù)處理,然后檢測(cè)X軸上各觀測(cè)點(diǎn)處觀測(cè)值對(duì)應(yīng)的特征區(qū)間,輸出觀測(cè)序列O={O1,O2,…,Ok}。例如,在第一個(gè)觀測(cè)點(diǎn)處觀測(cè)值對(duì)應(yīng)的特征區(qū)間為R2,則O1=R2。

 


    (3) 將以上識(shí)別過(guò)程在X、Y、Z軸上分別實(shí)現(xiàn)。
5 實(shí)驗(yàn)結(jié)果與評(píng)價(jià)
    為了使傳感器與測(cè)量點(diǎn)之間盡可能地相對(duì)穩(wěn)定,避免因手勢(shì)的變化引起傳感器偏離原始測(cè)量位置,使識(shí)別結(jié)果產(chǎn)生較大誤差,本系統(tǒng)中,把數(shù)據(jù)采集和發(fā)送模塊做成了一個(gè)小巧的戒指,通過(guò)無(wú)線的方式將采集到的數(shù)據(jù)實(shí)時(shí)地發(fā)送給微處理器進(jìn)行處理和識(shí)別。實(shí)驗(yàn)時(shí),將戒指模塊戴到左手或右手食指的第二節(jié),這樣,MMA7361L加速度傳感器相對(duì)于手指的位置是固定的。
    實(shí)驗(yàn)中選用了30名志愿者,每個(gè)志愿者在自己習(xí)慣和放松的狀態(tài)下,以正常的速度勻速執(zhí)行預(yù)定義的12種手勢(shì),每種手勢(shì)重復(fù)做10次,實(shí)驗(yàn)中隨機(jī)選取了5次動(dòng)作進(jìn)行訓(xùn)練優(yōu)化模型,其余的5次動(dòng)作進(jìn)行測(cè)試,共采集了3 600組樣本數(shù)據(jù)。
    實(shí)驗(yàn)結(jié)果如表2所示。平均識(shí)別率為97.94%,手腕向下、手腕向上和右旋轉(zhuǎn)的識(shí)別率最高為100%,手腕向右的識(shí)別率最低為94.7%。為了更好地說(shuō)明本文的識(shí)別方法在識(shí)別率和實(shí)時(shí)效果上比其他算法更具有優(yōu)勢(shì),實(shí)驗(yàn)中同時(shí)用HMM和DTW算法對(duì)這12中手勢(shì)進(jìn)行了識(shí)別,平均識(shí)別率分別為79.08%和85.2%,并且延時(shí)比較明顯?;诒疚淖R(shí)別方法對(duì)手勢(shì)動(dòng)作的整體識(shí)別率較高,實(shí)施效果好,說(shuō)明本文的識(shí)別方法能有效實(shí)時(shí)地完成人機(jī)動(dòng)態(tài)交互。

    本文通過(guò)對(duì)加速度傳感器MMA7361L采集到的手勢(shì)動(dòng)作加速度數(shù)據(jù)的分析,經(jīng)過(guò)動(dòng)作數(shù)據(jù)自動(dòng)檢測(cè)、歸一化和三次樣條插值預(yù)處理,最后根據(jù)完成相同手勢(shì)動(dòng)作得到的三維加速度數(shù)據(jù)變化規(guī)律的相似性,提出一種基于區(qū)間分布概率矩陣模型的動(dòng)態(tài)手勢(shì)識(shí)別方法,簡(jiǎn)化了傳統(tǒng)算法識(shí)別過(guò)程的復(fù)雜度,成功地降低了手勢(shì)識(shí)別難度,從而提高了基于加速度傳感器手勢(shì)識(shí)別的人機(jī)交互實(shí)時(shí)性,在一定程度上解決了動(dòng)態(tài)實(shí)時(shí)性與識(shí)別率的相互矛盾性。
參考文獻(xiàn)
[1] 荊雷,馬文君,常丹華.基于動(dòng)態(tài)時(shí)間規(guī)整的手勢(shì)加速度信號(hào)識(shí)別[J].傳感技術(shù)學(xué)報(bào),2012,25(1):72-76.
[2] 楊先軍,王昌喜,潘磊,等.基于三維加速度信息的上肢動(dòng)作質(zhì)量評(píng)價(jià)的研究[J].傳感技術(shù)學(xué)報(bào),2010,23(12):1709-1712.
[3] CARIDAKIS G, KARPOUZIS K. SOM: self organizing markov map for gesture recognition[J]. Pattern recognition letters, 2010,31(1):52-59.
[4] CHOWHAN S S, KULKARNI U V, SHINDE G N, et al. Iris recognition using modified fuzzy hypersphere neural network with different distance measures[J]. International  Journal of Advanced Computer Sciences and Applications, 2011,2(6):130-134.
[5] ZHANG S Q,YUAN C, et al. Self-defined gesture recognition on keyless handheld devices using MEMS 3D acce  lerometer[C].In Proceedings of International Conference on  Natural Computation. IEEE. 2008(4):237-241.
[6] JING L, ZHOU Y, et al. A recognition method for onestroke finger gestures using a MEMS 3D accelerometer[C]. IEICE Tran on Information, 2011,E94-D(5):1062-1072.
[7] 劉蓉,劉明. 基于三軸加速度傳感器的手勢(shì)識(shí)別[J].計(jì)算機(jī)工程,2012,37(24):141-143.
[8] 劉為,高尚. 一種新條件下的三次樣條插值[J]. 信息技術(shù),2011(8):23-28.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容