针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横...
详细信息
针对当前方法普遍存在较为严重的细节结构信息丢失与事件间重叠的问题,提出一种基于双向特征金字塔的密集视频描述生成方法(dense video captioning with bilateral feature pyramid net,BFPVC)。BFPVC通过带有自底向上、自顶向下、横向链接3条分支的双向特征金字塔强化视频多尺度特征图,兼顾对时序信息、空间信息、语义信息的特征表示,解码器从强化后的视频特征中捕获更加全面的事件候选集,从而为对应的视频事件生成更加丰富、详尽的文本描述。在ActivityNet Captions数据集和YouCook2数据集上的实验结果表明,BFPVC与同类模型相比生成的文本描述更详细、丰富,验证了双向特征金字塔在密集视频描述领域的有效性。
针对多模态遥感影像存在非线性辐射畸变的问题,本文提出了一种结合相位对称特征与基于排序局部自相似性的多模态遥感影像匹配方法.首先,利用影像的局部相位信息构造相位对称图,在此基础上利用加速分段测试特征提取算法(features from ac...
详细信息
针对多模态遥感影像存在非线性辐射畸变的问题,本文提出了一种结合相位对称特征与基于排序局部自相似性的多模态遥感影像匹配方法.首先,利用影像的局部相位信息构造相位对称图,在此基础上利用加速分段测试特征提取算法(features from accelerated segment test,FAST)对相位对称图进行特征提取.然后结合基于排序的局部自相似性与相位一致性构造一种新的特征描述符RPCLSS(combining rank,phase congruency and local self-similarity descriptor).最后利用快速抽样一致性算法(fast sample consensus,FSC)进行误匹配点剔除.将本文方法在公开的多源遥感影像数据集上与现有的5种先进匹配方法进行对比实验.实验结果表明,本文方法在正确匹配点数量、匹配精度和匹配正确率方面,优于现有的先进多模态遥感影像匹配方法.
暂无评论