论文摘要视讯技术不断地进步,三维(Three-dimensional, 3D)影像在下一个世代扮演着不可或缺的角色。然而,3D影像相较于传统之二维(Two-dimensional ,2D)影像,资料量更庞大,运算复杂度高。因此,如何提升编码速度及提高压缩效能是重要议题。目前已列入JVT(Joint Video Team)H.264延伸计划中之3D影像的压缩技术是以多视角视讯压缩(Multi-view Video Coding, MVC)为主,以H.264编码模式为基础,使用7种不同编码区块,减少时间轴上多余的移动预估,及加入画面内编码模式预测减少空间多余性。此外,多视角视讯影像序列中,因视角间画面有很大的相关性,因此MVC增加邻近视角影像当成编码的参考画面以减少编码多余性。MVC在编码模式决策中,使用位元率与失真率最佳化之技术从画面间(inter)编码模式与画面内(intra)编码模式中,需在画面间以及画面内做全区域的搜寻找出最适合编码模式,此作法虽然提高编码效能,却也增加运算复杂度。然而,经实验观察分析,大部分的影像序列中,背景几乎被判别为Skip模式,因此本论文利用此特性,辨识出区块是不须执行画面间或画面内编码模式的搜寻,进而减少编码时间。为了提高MVC编码速度、降低计算复杂度并维持画面品质,本论文针对基本视角(view0)与立体视角(view1-7),提出全域之多视角快速区块编码模式决策机制。提出之基本视角编码模式决策演算法,将依照画面编码顺序分成B1与B2,B3两类,因B1与参考画面差异度较大,故画面内编码模式所占比例较高,因此本论文利用Skip模式其RD-cost值大小,先行判断是否为画面内模式,以减少运算复杂度。B2,B3因参考画面距离较近差异度小,因此画面内编码模式所占比例较低,所以本论文利用相邻区块间编码模式的相关性,判断画面复杂程度,较高者则判定为画面内编码模式。另外,针对立体视角编码模式决策演算法,由于相邻视角之摄影机对同一场景拍摄,因此视角与视角间画面上有相似的区域,本论文提出在画面相似度较高区域,可参考邻近视角相对应位置的区块模式,而相似度较低的区域,则参考时间轴(Temporal)上影像特性,根据画面中不同区域做快速区块模式决策,以达到减少编码时间的目的。模拟结果显示,本论文所提出的演算法在编码时间减少上,基本视角最高可节省78%,立体视角最高可节省65%。在多视角视讯压缩系统上,利用本论文所提出的演算法,可以解决编码时间冗长运算复杂度高的问题,达到快速区块模式决策目的。
随着无线通信技术的飞速发展,多媒体业务在移动通信中的应用日趋广泛,特别是以视频为主要内容的流媒体服务,在视频会议,手机电视,可视电话等许多领域都有着重要的应用。为了适应日趋多变的传输环境,以及不同用户的多样化需求,国际标准化组织MPEG和VCEG成立了联合视频专家组(Joint Video Team, JVT),并开发了H.264/AVC标准扩展协议,即可分级视频编码标准(Scalable Video Coding, SVC)。SVC能通过一次编码,实现时间、空间和质量可分级性。但由于采用了一些新技术,以及分层编码的结构,使得编码复杂度高,计算量过大,这也在一定程度上阻碍了SVC的应用。
本文针对SVC编码复杂度高,编码时间长的问题,结合不同的可分级结构,提出相应的快速编码算法,以提高编码速度,节省编码时间。首先,在SVC帧内预测编码方面,通过分析编码层之间的模式分布规律,提出空间扩展可分级中快速层间帧内预测算法,由基本层信息指导增强层编码,减小增强层中备选模式数量,从而提高编码速度;其次,在帧间预测方面,结合时间可分级结构,利用不同时间层之间帧间预测模式的相关性,提出了快速帧模式决策算法。经过实验结果验证,两种快速算法在确保一定编码质量的同时,都能平均节省30%以上的编码时间,有效的提高了编码效率。
暂无评论