图片自动语义标注是基于内容图像检索中很重要且很有挑战性的工作。本文提出了一种基于boosting学习的图片自动语义标注方法,建立了一个图片语义标注系统BLIR(boosting for lingu istic indexing im age retrievalsystem)。假设一组具...
详细信息
图片自动语义标注是基于内容图像检索中很重要且很有挑战性的工作。本文提出了一种基于boosting学习的图片自动语义标注方法,建立了一个图片语义标注系统BLIR(boosting for lingu istic indexing im age retrievalsystem)。假设一组具有同一语义的图像能够用一个由一组特征组合而成的视觉模型来表示。2D-MHMM(2维多分辨率隐马尔科夫模型)实际上就是一种颜色和纹理特殊组合的模板。BLIR系统首先生成大量的2D-MHMM模型,然后用boosting算法来实现关键词与2D-MHMM模型的关联。在一个包含60 000张图像的图库上实现并测试了这个系统。结果表明,对这些测试图像,BLIR方法比其他方法具有更高的检索正确率。
针对视频检索系统中目标持续移动从而影响检索精度的问题,提出一种基于视频剪辑查询融合时空金字塔匹配(spatio-temporal pyramid matching,STPM)方法。借助基于特征分析和分类的片段编辑检测器将新的视频分割成多个片段,以元数据信息将视频片段存入数据库,利用基于逐帧特征结合弱分类器的boosting算法检测视频片段边界,针对新的查询视频进行分析和线上视频匹配,并利用时空金字塔匹配计算相关反馈值。在中佛罗里达大学(university of central Florida,UCF)数据集和You Tube运动视频上的实验验证了方法的有效性,实验结果表明,方法的平均精度可高达97.6%,相比其他几种较为新颖的匹配方法,取得了更好的检索性能。
暂无评论