基于注意力机制和金字塔融合的RGB-D室内场景语义分割

余娜; 刘彦; 魏雄炬; 万源

首页> 中文期刊> 《计算机应用》 >基于注意力机制和金字塔融合的RGB-D室内场景语义分割

基于注意力机制和金字塔融合的RGB-D室内场景语义分割

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有RGB-D室内场景语义分割不能有效融合多模态特征的问题,提出一种基于注意力机制和金字塔融合的RGB-D室内场景图像语义分割网络模型APFNet,并为其设计了两个新模块:注意力机制融合模块与金字塔融合模块。其中,注意力机制融合模块分别提取RGB特征和Depth特征的注意力分配权重,充分利用两种特征的互补性,使网络聚焦于信息含量更高的多模态特征域;金字塔融合模块利用四种不同金字塔尺度特征,融合局部与全局信息,提取场景语境,提升物体边缘和小尺度物体的分割精度。将这两个融合模块整合到一个包含三个分支的“编码器-解码器”网络中,实现“端到端”输出。该模型在SUN RGB-D和NYU Depth v2数据集上与多层残差特征融合网络(RDF-152)、注意力互补网络(ACNet)、空间信息引导卷积网络(SGNet)等先进方法进行实验对比。实验结果表明,与最好的表现方法RDF-152对比,APFNet的编码器网络层数从152层降低到50层的情况下,像素精度(PA)、平均像素精度(MPA)、平均交并比(MIoU)分别提升了0.4、1.1、3.2个百分点,并对枕头、照片等小尺度物体和木板、天花板等大尺度物体的语义分割质量分别有0.9~4.5和12.4~18个百分点的提升;故该模型在处理室内场景语义分割问题上具有一定的优势。

著录项

来源
《计算机应用》 |2022年第3期|844-853|共10页
作者
余娜; 刘彦; 魏雄炬; 万源;
展开▼
作者单位

武汉理工大学理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
RGB-D语义分割; 注意力机制; 金字塔融合; 多模态; 深层监督;

相似文献

中文文献
外文文献
专利

1. 基于注意力感知和语义感知的RGB-D室内图像语义分割算法 [J] . 段立娟 ,孙启超 ,乔元华 . 计算机学报 . 2021,第002期
2. 基于RGB-D图像的室内场景语义分割网络优化 [J] . 王子羽 ,张颖敏 ,陈永彬 . 自动化与信息工程 . 2020,第002期
3. 基于注意力机制的轻量级RGB-D图像语义分割网络 [J] . 孙刘杰 ,张煜森 ,王文举 . 包装工程 . 2022,第3期
4. 基于通道注意力机制的RGB-D图像语义分割网络 [J] . 吴子涵 ,周大可 ,杨欣 . 电子设计工程 . 2020,第013期
5. 稀疏字典驱动高阶依赖的RGB-D室内场景语义分割 [J] . 刘天亮 ,徐高帮 ,戴修斌 . 南京邮电大学学报（自然科学版） . 2017,第005期
6. 基于单幅RGB-D扫描数据的室内场景解析 [C] . Sun Yuliang ,孙瑜亮 ,Miao Yongwei . 2017中国计算机辅助设计与图形学大会（2017 China CADCG） . 2017
7. 基于空间金字塔和注意力机制融合网络的影像语义分割 [A] . 李英萍 . 2021

基于注意力机制和金字塔融合的RGB-D室内场景语义分割

摘要

著录项

相似文献

相关主题

期刊订阅