节点文献

基于卷积神经网络的深度图姿态估计算法研究

Pose Estimation Using Convolutional Neural Network with Synthesis Depth Data

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 王松刘复昌黄骥许威威董洪伟

【Author】 Wang Song;Liu Fuchang;Huang Ji;Xu Weiwei;Dong Hongwei;Jiangnan University;Hangzhou Normal University;Zhejiang University;

【机构】 江南大学杭州师范大学浙江大学

【摘要】 随着深度相机的应用,三维场景的重建越来越简单、快速。从单视角的深度场景图像中检索出物体还是比较困难,特别是物体的姿态估计。提出了一种基于卷积神经网络的深度图像姿态估计算法。该算法采用了回归估计来实现姿态的估计。通过3D模型合成大量不同姿态的深度图像样本,从而解决回归估计需要稠密采样的训练数据问题。对于不同类别的物体,分别用线性回归估计来拟合姿态函数。在基于Le Net-5模型上修改了卷积神经网络的结构,使得该网络适用于回归估计。实验结果表明:我们的方法取得了平均误差约4.3°的估计结果,优于其他文献的方法。

【Abstract】 3D scenes can be reconstructed more easily and rapidly with depth camera. However, it is difficult to retrieve items in 3D scenes from a single view depth image, especially for the pose estimation. In this paper, we present a method of pose estimation using convolutional neural network with synthesis depth data, which predicts the items’ pose in 3D scenes by regression. This is achieved by(i) synthesizing large amount of depth images with different pose for linear regression using 3D model,(ii) designing a class-dependent linear regression framework, which estimates the object’s pose from different classes separately,(iii) reforming Le Net-5 model by representing the loss layer as a linear regression form. The proposed algorithm is demonstrated on different data sets and achieves higher accuracy(average error 4.3°) than other algorithms.

【基金】 国家自然科学基金青年科学项目(61502133);浙江省自然科学基金一般项目(LY16F020029)
  • 【文献出处】 系统仿真学报 ,Journal of System Simulation , 编辑部邮箱 ,2017年11期
  • 【分类号】TP183;TP391.41
  • 【被引频次】10
  • 【下载频次】374
节点文献中: 

本文链接的文献网络图示:

本文的引文网络