Pedestrian motion recognition via Conv-VLAD integrated spatial-temporal-relational network

Peng Shiyu; Su Tingli; Jin Xuebo; Kong Jianlei; Bai Yuting

首页> 外文期刊>Intelligent Transport Systems, IET >Pedestrian motion recognition via Conv-VLAD integrated spatial-temporal-relational network

【24h】

Pedestrian motion recognition via Conv-VLAD integrated spatial-temporal-relational network

机译：通过Conv-VLAD集成空间 - 时间 - 关系网络行人运动识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Pedestrian motion recognition is one of the important components of an intelligent transportation system. Since commonly used spatial-temporal features are still not sufficient for mining deep information in frames, this study proposes a three-stream neural network called a spatial-temporal-relational network (STRN), where the static spatial information, dynamic motion and differences between adjunct keyframes are comprehensively considered as features of the video records. In addition, an optimised pooling layer called convolutional vector of locally aggregated descriptors layer (Conv-VLAD) is employed before the final classification step in each stream to better aggregate the extracted features and reduce the inter-class differences. To accomplish this, the original video records are required to be processed into RGB images, optical flow images and RGB difference images to deliver the respective information for each stream. After the classification result is obtained from each stream, a decision-level fusion mechanism is introduced to improve the network's overall accuracy via combining the partial understandings together. Experimental results on two public data sets UCF101 (94.7%) and HMDB51 (69.0%), show that the proposed method achieves significantly improved performance. The results of STRN have far-reaching significance for the application of deep learning in intelligent transportation systems to ensure pedestrian safety.

机译：行人运动识别是智能运输系统的重要组成部分之一。由于常用的空间 - 时间特征仍然不足以在帧中挖掘深深信息，因此提出了一种称为空间 - 时间 - 关系网络（Strn）的三流神经网络，其中静态空间信息，动态运动和差异附件密钥帧被全面被认为是视频记录的特征。另外，在每个流中的最终分类步骤之前，采用称为局部聚合描述符层（CONV-VLAD）的卷积矢量的优化池层，以更好地聚合提取的特征并降低级别的差异。为了实现这一点，要求原始视频记录被处理到RGB图像，光学流量图像和RGB差图像中以为每个流提供各个信息。在从每个流获得分类结果之后，引入了决策级融合机制，以通过将部分理解在一起来提高网络的整体精度。两种公共数据的实验结果集UCF101（94.7％）和HMDB51（69.0％），表明该方法实现了显着提高的性能。对智能交通系统中深度学习的应用具有深远的重要性，以确保行人安全性具有深远的意义。

著录项

来源
《Intelligent Transport Systems, IET》 |2020年第5期|392-400|共9页
作者
Peng Shiyu; Su Tingli; Jin Xuebo; Kong Jianlei; Bai Yuting;
展开▼
作者单位

Beijing Technol & Business Univ Sch Comp & Informat Engn Beijing Peoples R China|Beijing Technol & Business Univ Beijing Key Lab Big Data Technol Food Safety Beijing Peoples R China;

Beijing Technol & Business Univ Sch Comp & Informat Engn Beijing Peoples R China|Beijing Technol & Business Univ Beijing Key Lab Big Data Technol Food Safety Beijing Peoples R China;

Beijing Technol & Business Univ Sch Comp & Informat Engn Beijing Peoples R China|Beijing Technol & Business Univ Beijing Key Lab Big Data Technol Food Safety Beijing Peoples R China;

Beijing Technol & Business Univ Sch Comp & Informat Engn Beijing Peoples R China|Beijing Technol & Business Univ Beijing Key Lab Big Data Technol Food Safety Beijing Peoples R China;

Beijing Technol & Business Univ Sch Comp & Informat Engn Beijing Peoples R China|Beijing Technol & Business Univ Beijing Key Lab Big Data Technol Food Safety Beijing Peoples R China;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
feature extraction; object detection; optimisation; learning (artificial intelligence); image representation; neural nets; pedestrians; image motion analysis; image sequences; video signal processing; image classification; intelligent transportation systems; pedestrian motion recognition; intelligent transportation system; spatial-temporal features; deep information; three-stream neural network; spatial-temporal-relational network; static spatial information; inter-class differences; video records; RGB difference images; UCF101 dataset; HMDB51 dataset;

机译：特征提取;物体检测;优化;学习（人工智能）;图像表示;行人;图像运动分析;图像序列;视频信号处理;图像分类;行人运动识别;智能运输系统;空间 - 时间特征;深入信息;三流神经网络;空间 - 时间 - 关系网络;静态空间信息;级别差异;视频记录;RGB差异图像;UCF101数据集;HMDB51数据集;HMDB51数据集;

相似文献

外文文献
中文文献
专利

1. Automatic Recognition of Workers' Motions in Highway Construction by Using Motion Sensors and Long Short-Term Memory Networks [J] . Kim Kinam, Cho Yong K. Journal of Construction Engineering and Management . 2021,第3期

机译：使用运动传感器和长短期内存网络自动识别公路施工中的工人运动
2. Pedestrian Recognition Using Cross-Modality Learning in Convolutional Neural Networks [J] . Pop Danut Ovidiu, Rogozan Alexandrina, Nashashibi Fawzi, Intelligent Transportation Systems Magazine, IEEE . 2021,第1期

机译：在卷积神经网络中使用跨模型学习的行人识别
3. Safety for pedestrian recognition in sensor networks based on visual compressive sensing and adaptive prediction clustering [J] . Jin Peifen, Liu Peixue, Cheng Xiaofei Safety science . 2019,第期

机译：基于视觉压缩传感和自适应预测聚类的传感器网络中的行人识别安全
4. Proposed architecture of a fully integrated modular neural network-based automatic facial emotion recognition system based on Facial Action Coding System [C] . Gavrilescu Mihai International conference on communications . 2014

机译：基于面部动作编码系统的全集成模块化神经网络自动面部情感识别系统的架构建议
5. An integrated system for voice recognition using neural networks. [D] . Broadhead, Morgan Alexander. 1997

机译：使用神经网络的语音识别集成系统。
6. Pedestrian Dead Reckoning Based on Motion Mode Recognition Using a Smartphone [O] . Boyuan Wang, Xuelin Liu, Baoguo Yu, 2018

机译：基于智能手机运动模式识别的行人航位推算
7. Ensemble Learning With Attention-Integrated Convolutional Recurrent Neural Network for Imbalanced Speech Emotion Recognition [O] . Xusheng Ai, Victor S. Sheng, Wei Fang, 2020

机译：与关注集成卷积经常性神经网络的合奏学习，用于不平衡语音情感识别
8. How Deep Neural Networks Can Improve Emotion Recognition on Video Data. [R] . Brady, K., Dagli, C., Khorrami, P., 2016

机译：深度神经网络如何改善视频数据的情感识别。

Pedestrian motion recognition via Conv-VLAD integrated spatial-temporal-relational network

摘要

著录项

相似文献

相关主题

期刊订阅