法律状态公告日
法律状态信息
法律状态
2017-02-01
授权
授权
2014-04-02
实质审查的生效 IPC(主分类):G06K9/62 申请日:20131204
实质审查的生效
2014-03-05
公开
公开
技术领域
本发明涉及一种自然环境干扰和有遮挡的行人目标检测方法,具体说是一 种基于机器视觉学习的高鲁棒行人检测方法,可用于复杂自然环境和有遮挡情 况下的行人检测。
背景技术
行人目标检测是实现机械装备可视化、智能化以及无人驾驶,同时也是公 共安全,军事侦察的重要基础,是计算机视觉领域中的研究热点,但是行人的 状态存在所处的环境不同、所穿的衣物款式多样、人体体态的差异、采集信息 时人体的姿态以及采集时的相机拍摄角度等不同的情况对检测效果的影响比较 大,需要检测效率更高鲁棒性更强的检测算法,因此如何能够有效准确地检测 行人成为具有挑战性的课题。
目前广泛使用的行人特征描述子是由Dalal等人提出的HOG(Histograms of Oriented Gradients)方法,这种检测方法是通过对待检测图像进行密集扫描的窗 口计算梯度方向直方图得到的。HOG描述器最重要的思想是:在一副图像中, 局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分 布很好地描述。因此HOG能有效地刻画出人体的梯度信息以及轮廓信息。但是 HOG特征维数较高,计算缓慢。
局部二值模式(Local Binary Pattern,LBP)是一种灰度范围内的纹理度量, 最初是由Ojala T.等人为了辅助性地度量图像的局部对比度而提出的,现已广泛 应用在人脸识别中。LBP算子是从纹理局部邻近定义中衍生出来的,是一种灰 度级不变的纹理分析方法,其优点为:对光照强度的变化有较强的鲁棒性,计 算速度快,对单调变化的灰度特征具有不变性,较好地表征局部信息以及纹理 信息,但其在低分辨率情况下判别能力较差。
单一的方法提取的特征都存在自身的局限性,针对这些不足,Xiaoyu Wang 等人提出将HOG和LPB方法结合来提取特征的HOG-LBP方法,既包含了人体 丰富的纹理信息和颜色信息(LBP),也很好的表征了人体的轮廓信息和局部梯度 信息(HOG),在INRIA行人数据库测试中取得了较好的实验结果,但是在不同 比例的遮挡、能见度不同程度条件下的复杂自然环境和不同程度的伪装检测上 存在不足。
发明内容
本发明的目的是在于针对上述现有技术存在的问题,提供一种自然环境干 扰和有遮挡时的行人目标检测方法。
为了实现上述目的,本发明采用如下技术方案:
一种自然环境干扰和有遮挡时的行人目标检测方法,该方法包括如下步骤:
步骤1、建立行人训练样本集,样本集分为有行人的正样本集和没有行人的 负样本集;样本来自NEU-Person样本库和INRIA行人数据库;
步骤2、采用HOG-CLBP特征提取方法提取样本集中的人体特征,通过分 块处理图像,在对提取的特征进行PCA降维,得到行人训练样本集样本的整体 特征;
步骤3、将提取的特征送入SVM分类器进行分类,得到基于NEU-Person 样本库的行人分类器;
步骤4、提取NEU-Person样本库的行人,计算出NEU-person样本库中行人 的各个部件的近似的权重值;
步骤5、完成训练阶段后进行行人检测,用密集扫描检测待测图像,通过滑 窗操作,利用训练好的分类器扫描每个窗口并进行判决,判断出有行人的窗口 进行标记,最后将所有标记的窗口进行融合;
步骤6、通过图像金字塔和多尺度滑窗操作,将图像不同的尺度下的矩形框 合并成一个框,进而得到目标准确的位置,即将待测行人检测出来。
本发明的优点是:
1、本发明利用HOG-CLBP结合的方法来提取特征,充分考虑到了直立的 人体不仅具有大量的轮廓梯度信息,而且在外观和衣着上还有大量的纹理信息, 可以更好地识别行人。
2、本发明NEU-Person样本库进行训练产生用于检测的部件模型, NEU-Person样本库涉及雨、雪、雾、夜间和迷彩等多种环境的样本,因此使得 行人检测具有很强的鲁棒性。
3、本发明经过PCA降维和多尺度分析,通过正负样本的训练和学习,产 生用于分类的行人特征,这样就减少了训练和检测所需要的时间,提高检测精 度。
4、本发明使用SVM分类器进行分类检测,这样就将行人检测问题转化为 二分类问题,即只需要区分行人目标和非行人目标,设计简单运算快。
附图说明
图1-1是HOG-CLBP特征提取示意图之一。
图1-2是HOG-CLBP特征提取示意图之二。
图2是NEU-person样本库部件模型图。
图3是本发明系统框图。
图4是本发明与已有方法进行实验后的性能对比结果图。
图5是单目标检测结果采样图。
图6是多目标检测结果采样图。
图7是人为由上到下遮挡检测结果采样图。
图8是人为由左到右遮挡检测结果采样图。
图9是人为遮挡不同比例的检测结果采样图。
图10是实际物体遮挡检测结果采样图。
图11是雨雪天气干扰下的行人检测结果采样图。
图12是大雾天气干扰下的行人检测结果采样图。
图13是加入高斯噪声条件下的行人检测结果采样图。
图14是夜间环境行人检测结果采样图。
图15是伪装条件下的行人检测结果采样图。
具体实施方式
结合附图图1-15具体说明本发明的实施方式;
一种自然环境干扰和有遮挡时的行人目标检测方法,该方法包括如下步骤:
步骤1、建立行人训练样本集,样本集分为有行人的正样本集和没有行人的 负样本集;样本来自NEU-Person样本库和INRIA行人数据库;
步骤2、采用HOG-CLBP特征提取方法提取样本集中的人体特征,通过分 块处理图像,在对提取的特征进行PCA降维,得到行人训练样本集样本的整体 特征;
步骤3、将提取的特征送入SVM分类器进行分类,得到基于NEU-Person 样本库的行人分类器;
步骤4、提取NEU-Person样本库的行人,计算出NEU-person样本库中行人 的各个部件的近似的权重值;
步骤5、完成训练阶段后进行行人检测,用密集扫描检测待测图像,通过滑 窗操作,利用训练好的分类器扫描每个窗口并进行判决,判断出有行人的窗口 进行标记,最后将所有标记的窗口进行融合;
步骤6、通过图像金字塔和多尺度滑窗操作,将图像不同的尺度下的矩形框 合并成一个框,进而得到目标准确的位置,即将待测行人检测出来。
所述步骤2中HOG-CLBP特征提取方法,采用分块移动进行HOG-CLBP 融合特征的提取,检测窗口中的图像为64×128像素,对这个图像分块,每块大 小为16×16像素,再将每块平均分成4个单元,则每个单元大小为8×8像素, 如图1-1所示;统计每块的CLBP直方图,每块会得到一个59维的向量A;然 后分别统计一个块中的4个单元的梯度直方图,并将其合并,可以得到一个36 维的向量B;因此一个块就能用向量A,B表示。
步骤2中的图像分块处理,其中块的移动步长为一个单元的大小,如图1-2 所示,一个单元内从左到右,由上到下移动,即由AEFD开始,下一次移动到 BGHC,再下一次移动到EIJF,直到遍历整个检测窗口,最终将会产生
(64/8-1)×(128/8-1)=105个块,则整张图片可用一个
105×(59+36)=9975维的向量表示。
步骤4中将NEU-Person样本库的行人人体划分为5部分,5部分分别为头 部,左臂与左半身躯部,右臂与右半身躯部,左右大腿为一部分和左右小腿及 脚为一部分,这样划分可以有效的处理遮挡问题;通过NEU-person样本库计算 各个部件的近似的权重值,头部的权重值为0.2,左臂与左半身躯的权重值为 0.29,右臂与右半身躯的权重值为0.29,左右两个大腿的权重值为0.15,小腿及 脚的权重值为0.07。部件模型如图2所示。
步骤6中构建图像金字塔:
用(n+2)元数组(F0,P1,…,Pn,b)定义含有n个子部件的行人目标部件模型;其中 F0用来表示整体滤波器(HOG-CLBP特征模型),Pi是第i个子部件的模型,b为 偏移量;部件模型用三元数组(Fi,vi,di)表示,其中,Fi是第i个部件的滤波器, 大小是wi×hi,vi是部件i相对整体模型的固定位置,di是目标部件相对固定位置 变化损失的函数,即子部件偏离它模型中正确位置;通过多组模型的学习可以 得到同一种目标的不同的模型,然后再组合成部件模型。
步骤6中目标图像通过多尺度滑窗检测确定目标:
在目标图像中行人的位置往往是随机和不固定的,而且行人的大小也会超 过64*128的标准检测窗口的大小,在检测的时候首先对目标图像进行密集的扫 描,其次对目标图像进行缩小;将目标图像按3层或4层进行缩小,直到目标 图像的高度或者宽度小于等于标准检测窗口的高度或者宽度,可以获得一系列 标准目标图像。
所述目标图像滑窗的密集检测过程中,可以得到很多个矩形框;然而,这 些矩形框并不在同一个位置,原因在于同一个行人在不同的尺度下,相对于原 图会有位置的偏移,则产生的矩形框就不会重合;会对目标最终位置的确定产 生影响;因此,需要将这些矩形框合并成一个框,并得到目标准确的位置。
步骤1中样本来自NEU-Person样本库和INRIA行人数据库;
所述NEU-Person样本库中训练集有正样本613张,包含2362个行人,涉 及雨、雪、雾、夜间和迷彩等环境;负样本227张;
测试集有正样本187张,包含713个行人,负样本150张;样本库中的行 人大部分为站立姿势且高度大于100个象素。
NEU-Person样本库数据集是由东北大学机械学院智能检测与质量控制研究 室所对外公开的,该样本库中训练集有正样本613张(包含2362个行人,涉及 雨、雪、雾、夜间和迷彩等环境),负样本227张;测试集有正样本187张(包 含713个行人),负样本150张。图库中的行人大部分为站立姿势且高度大于100 个象素,图像的来源图片的清晰度较高,可以正常读取和显示。
实验内容与结果分析
实验一:应用本发明和现有的CLBP方法,HOG方法以及HOG-CLBP方 法的性能进行对比,实验结果如图4所示。由图可知本发明所述的HOG-CLBP 方法配合部件模型有着姣好的检测结果。
从图4中可以看出,在10-3FFPW时,基于LBP曲线的漏检率很高,原因 是:LBP特征对纹理描述能力强,但对边缘信息不敏感。基于HOG特征的行人 检测的结果为0.19,可见HOG特征在行人检测方面有很强的优势,原因是:HOG 特征对人体的边缘信息的描述有很强的表征能力,并且在提取HOG特征时会将 大量的背景信息过滤,即将大量的无效信息过滤,而人体与背景之间的边缘变 化是比较明显的。有特征融合的HOG-CLBP曲线所得到的漏检率大约为0.06, 可见特征融合对检测率的提高确实有很大帮助,集合了HOG特征与CLBP特征 的优势。加入部件模型之后漏检率的更低达到0.02,可见部件模型使检测更加 准确,证明了本发明方法的有效性。
实验二:应用本发明对不同自然环境下及不同遮挡条件下的行人进行检测。 其中图5为单目标检测结果图,图6为多目标检测结果图,图7为人为遮挡(由 上到下)检测结果图,图8为人为遮挡(由左到右)检测结果图,图9为人为 遮挡(不同比例)检测结果图,图10为实际物体遮挡检测结果图,图11为雨 雪天气干扰下的行人检测结果图,图12为大雾天气干扰下的行人检测结果图, 图13为加入高斯噪声条件下的行人检测结果图,图14为夜间环境行人检测结 果图,图15为伪装条件下的行人检测结果图。
实验结果表明本方法对不同比例和类型的行人遮挡,不同能见度自然环境 及不同程度的伪装等复杂环境的检测具有很好的鲁棒性。同时对加入不同种高 斯噪声的图片和夜间图片中行人的检测上也取得了很好的检测效果。因此本文 提出的方法适用于多种不同的自然和人为遮挡环境,进一步证明了本发明方法 的有效性。
机译: 模拟景观中移动目标和可遮挡目标的方法,以便在静止时进行射击练习,以及实现该目标的设备。
机译: 目标检测方法和装置以及行人检测方法和系统
机译: 多目标行人跟踪方法,多目标行人跟踪装置和多目标行人跟踪装置