目前,主流的基于点击的交互式分割方法对所有用户点击进行无差异的编码.这样的编码方法意味着用户的交互只能给神经网络提供目标的位置信息,且每次点击的影响力是相同的.然而,不同阶段的点击的影响力是不同的.早期的交互用于目标轮廓的选择,中后期的交互则偏向于对分割结果的局部细节进行微调.因此,应该适当扩大早期点击的影响力,以便更快地获得目标轮廓,同时削弱中后期点击的影响力,以防止因为超调或歧义而影响交互式分割的收敛性.1)本文提出了一种动态盘码(Dynamic Disk Coding,DDC)算法,该算法将用户的每个点击都编码成一个特定半径的圆盘,以此添加关于点击影响力的先验信息;2)本文提出了一个交互式分割网络DDC-Net,通过交互信息预处理模块加强交互信息,并在分割网络的浅层和深层将交互式信息与语义信息进行混合,缓解交互信息随着网络加深而逐渐衰减的问题;3)本文提出了一种改进的模拟训练策略,使得网络在训练时能够充分学习不同编码半径的点击所具备的不同影响力,从而使得提出的方法兼顾收敛速度和收敛性.通过实验表明,本文提出的使用动态盘码的深度交互式分割方法具有科学性和有效性,相较于基线方法,和分别平均取得3.63%和2.44%的提升.
暂无评论