正交时序复用(Orthogonal Time Sequency Multiplexing,OTSM)通过级联时分和沃尔什-哈达玛(WHT)复用将信息符号在时延和序列域进行复用。由于WHT在调制解调过程不需要进行复杂的乘法运算,相比于正交时频空(OTFS)调制有更低的调制复杂度...
详细信息
正交时序复用(Orthogonal Time Sequency Multiplexing,OTSM)通过级联时分和沃尔什-哈达玛(WHT)复用将信息符号在时延和序列域进行复用。由于WHT在调制解调过程不需要进行复杂的乘法运算,相比于正交时频空(OTFS)调制有更低的调制复杂度。该文针对高速移动环境下的OTSM系统提出了一种二级均衡器:首先利用信道矩阵的稀疏性和带状结构在时域逐块进行低复杂度MMSE检测;随后采用高斯-赛德尔(GS)迭代检测进一步消除残余符号干扰。仿真结果表明,所提算法与基于单抽头频域均衡的GS迭代检测算法相比,采用16QAM调制且误码率为10–4时有1.8 dB性能增益。
由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特性,较少考虑人类记忆特性对视觉信息的存储和表达能力,以及视觉感知和记忆特性之间的相互作用.而用户观看长视频的时候,其质量评价需要动态评价,除了考虑感知要素外,还要引入记忆要素.为了更好地衡量长视频的质量评价,本文引入深度网络模型,深入探讨了视频感知和记忆特性对用户观看体验的影响,并基于两者特性提出长视频的动态质量评价模型.首先,本文设计主观实验,探究在不同视频播放模式下,视觉感知特性和人类记忆特性对用户体验质量的影响,构建了基于用户感知和记忆的视频质量数据库(Video Quality Database with Perception And Memory,PAM-VQD);其次,基于PAM-VQD数据库,采用深度学习的方法,结合视觉注意力机制,提取视频的深层感知特征,以精准评估感知对用户体验质量的影响;最后,将前端网络输出的感知质量分数、播放状态以及自卡顿间隔作为三个特征输入长短期记忆网络,以建立视觉感知和记忆特性之间的时间依赖关系.实验结果表明,所提出的质量评估模型在不同视频播放模式下均能准确预测用户体验质量,且泛化性能良好.
针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型。特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的最小特征内核逐渐扩展为包围完整文本实例的特征图。同时为了针对自然场景中难以检测的文本实例,在训练阶段加入了在线难例挖掘(online hard example mining,OHEM)的方法,并以迁移学习的方式采用2种不同训练策略进行训练。仿真结果表明,该算法模型在不同数据集上具有良好的检测性能。
暂无评论