1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > ECCV StructSiam:《Structured Siamese Network for Real-Time Visual Tracking》论文笔记

ECCV StructSiam:《Structured Siamese Network for Real-Time Visual Tracking》论文笔记

时间:2023-09-30 20:11:07

相关推荐

ECCV  StructSiam:《Structured Siamese Network for Real-Time Visual Tracking》论文笔记

目录

整体结构创新点实验结果

理解出错之处望不吝指正。

文章链接

整体结构

本文的模型结构如下图所示:

创新点

本文的改进我觉得十分新颖:“每张特征图学习跟踪目标的一个局部结构”,模板经过卷积后得到1×1×40961\times 1\times 40961×1×4096大小的特征图,每张特征图代表该物体的一个属性(特征),基于此特征图做相似计算。

从上图来看,我们可以知道,文中主要有三个新增加的部分,分别是“Local Pattern Detection”、“Context Modeling”和“Integration Module”。

“Local Pattern Detection"部分是通过两个卷积层(11×1111\times 1111×11和5×55\times 55×5)实现的,输出的每张特征图代表一个局部特征。

“Context Modeling”部分通过“消息传递”机制实现,使用的是CRF(条件随机场)。作用是压制背景噪声、加强特征。

“Integration Module”部分通过6×66\times 66×6卷积核实现,将模板帧的特征图由6×6×40966\times 6\times 40966×6×4096变为1×1×40961\times 1\times 40961×1×4096(其实就是变成了一个向量,向量中的每个值代表该物体的一个属性,和全局均值池化类似)。

实验结果

由于要学习部分特征,作者选择使用ILSVRC和ALOV作为训练数据集,模型的实验结果如下所示:

1.OTB-

87.4%0.63845FPS

2.OTB-

85.1%0.62145FPS

3.VOT-

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。