《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信与网络 > 设计应用 > 地铁运营岗位应急处置培训的语音识别研究
地铁运营岗位应急处置培训的语音识别研究
信息技术与网络安全 6期
周 杨,钱雪军
(同济大学 电子与信息工程学院,上海 201804)
摘要: 地铁交通运营是一种整体性活动,离不开各部门间的协调配合,地铁运营岗位应急处置培训系统应用于多个岗位的联合培训。该系统通过语音识别来实现模拟岗位间语音交互及对培训过程智能评价的功能。提出的语音识别方法可实现离线网络下对地铁培训专业术语的高识别精度,利用深度全序列卷积神经网络(DFCNN)和链接时序分类(CTC)构建声学模型,对应急处置培训用语进行整理并构建专业术语库,基于统计学构建语言模型。实验结果表明,该语音识别方法能够有效识别地铁应急处置培训用语,为地铁运营岗位人员的培训和考核提供更全面的评价指标。
中圖分類號: U231.92;TP39
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.06.012
引用格式: 周楊,錢雪軍. 地鐵運(yùn)營崗位應(yīng)急處置培訓(xùn)的語音識別研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(6):73-76,93.
Speech recognition research on emergency disposal training for subway operation positions
Zhou Yang,Qian Xuejun
(School of Electronic and Information Engineering, Tongji University, Shanghai 201804, China)
Abstract: Metro transportation operation is a holistic activity, and it is inseparable from the coordination and cooperation between various departments. The subway operation post emergency response training system is used for joint training of multiple posts. The system needs voice recognition to simulate the function of voice interaction between posts and intelligent evaluation of the training process. The speech recognition method proposed in this paper realizes high recognition accuracy of subway training terminology under offline network. Using deep fully convolutional neural network (DFCNN) and connectionist temporal classification (CTC) technology to build acoustic models, collating and constructing professional terminology bases for emergency disposal training terms, and building language models based on statistics and terminology banks. Experimental results show that the speech recognition technology can effectively identify training terms and provide more comprehensive evaluation indicators for the training and assessment of personnel in operational positions.
Key words : metro emergency disposal training; speech recognition; convolutional neural networks

0 引言

地鐵行車事故和突發(fā)事件嚴(yán)重影響了地鐵的正常運(yùn)營并威脅到了人民群眾的生命財(cái)產(chǎn)安全[1]。對于相應(yīng)的應(yīng)急預(yù)案而言,應(yīng)急預(yù)案演練的效果直接決定了應(yīng)急響應(yīng)的速度和應(yīng)急處置實(shí)施的有效性,其中應(yīng)急處置培訓(xùn)是應(yīng)急預(yù)案演練的重點(diǎn)。

目前的聯(lián)合培訓(xùn)系統(tǒng)需要所有培訓(xùn)崗位均為在崗狀態(tài),無法實(shí)現(xiàn)在聯(lián)合培訓(xùn)中的單崗位培訓(xùn)功能。因此在對各個(gè)崗位進(jìn)行應(yīng)急處置培訓(xùn)過程中需要模擬各個(gè)崗位之間的語音交互,實(shí)現(xiàn)單個(gè)崗位獨(dú)立培訓(xùn)時(shí)的智能互動(dòng),同時(shí)實(shí)現(xiàn)對培訓(xùn)過程的記錄與智能評價(jià)。語音識別是語音交互的基礎(chǔ)。目前,國內(nèi)外語音識別技術(shù)已經(jīng)趨于成熟,走向真正實(shí)用化[2],在日常對話等常見領(lǐng)域已達(dá)到實(shí)用要求,但是在地鐵等專業(yè)應(yīng)用領(lǐng)域的識別效果不佳[3]。

本文基于DFCNN-CTC框架提出新的語音識別聲學(xué)模型結(jié)構(gòu),以實(shí)現(xiàn)對應(yīng)急處置培訓(xùn)術(shù)語的高精度識別。實(shí)驗(yàn)表明,該語音識別模型可應(yīng)用于應(yīng)急處置培訓(xùn)系統(tǒng)中。




本文詳細(xì)內(nèi)容請下載http://m.ihrv.cn/resource/share/2000004538





作者信息:

周  楊,錢雪軍

(同濟(jì)大學(xué) 電子與信息工程學(xué)院,上海 201804)




微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容