为解决可逆信息隐藏(reversible data hiding,RDH)容量受限的问题,提出了一种基于相邻均值差的可逆信息隐藏(neighboring mean difference reversible data hiding,NMDRDH)算法。相邻均值差(neighboring mean diffe-rence,NMD):计算两...
详细信息
为解决可逆信息隐藏(reversible data hiding,RDH)容量受限的问题,提出了一种基于相邻均值差的可逆信息隐藏(neighboring mean difference reversible data hiding,NMDRDH)算法。相邻均值差(neighboring mean diffe-rence,NMD):计算两个相邻数值的平均值与其中一个数值的差值。NMD将差值最小化,使数据更加集中。首先将图像进行分块,然后在分块上应用NMD生成差值直方图,最后通过平移差值直方图,利用峰值点来嵌入秘密信息。由于NMD使生成的差值直方图具有更多的峰值点,所以该方法可嵌入更多的秘密信息。实验结果表明,采用本算法,原始图像恢复率和秘密信息提取正确率均为100%;相比于经典差值直方图平移方法,本算法的嵌入容量提升了43.7%;本算法在保证高容量的同时,PSNR达到42 dB以上,确保了嵌入图像失真较小。
语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型...
详细信息
语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型,能够生成质量更高、听感更自然的语音。然而,现有模型依赖多个损失函数,暂时缺乏对其有效权衡的研究。因此,在现有模型损失函数的基础上,引入了梯度归一化自适应损失平衡优化方法,它根据模型不同损失函数的量级与不同子任务的训练速度来平衡各损失函数之间的权重,以验证该方法在语音合成任务中的适用性。在公开的中文语音合成数据集上评估了该方法合成语音的准确度与自然度,结果表明,采用此损失函数的模型在性能上得到了提升,证明了方法的有效性。
暂无评论