面对网络中日益增多的数字作品以及人们版权意识的增强,确认数字作品版权归属非常重要,对于数字作品原创性检测问题,文本匹配技术能够很好地解决这一问题。文本匹配技术通过算法来判断句子之间的语义是否相近。最近几年,深度学习迅速发展,解决文本匹配任务的方法也得到了很好的发展。在已有的基于核的文档排序神经模型(a kernel based neural model for document ranking, KNRM)上进一步地研究和创新,提出融合KNRM和轻量级梯度提升机(light gradient boosting machine, LightGBM)算法的文本匹配模型,在交互矩阵转化的直方图上采用kernel-pooling的方式来提取相关局部特征信息,引入K个不同大小的核函数,来捕捉不同细粒度的相关匹配信号,获取高斯核特征,将LightGBM算法作为分类器,进行分类处理工作,预测最后的匹配结果。通过多个数据集验证模型效果,实验表明,融合模型KNRM-LightGBM在准确率方面优于原模型KNRM,能够达到更好的文本匹配效果。
对图像压缩编码算法进行了改进。首先,将小波分解后的3个高频系数进行预处理:将高频部分进行球坐标变换,降低了同一尺度内系数的相关性;基于小波域和球坐标域的两个前提,定义了多尺度模积的概念,用来控制收缩函数对小波高频部分进行收缩处理。这样,可以去除那些不影响视觉效果的小波系数以及噪声信息,达到较高的压缩比。然后,对小波变换的低频部分进行单独编码(DPCM),对球坐标下的高频部分采用改进的多级树集合分裂(SPIHT)编码。针对SPIHT编码中重复扫描的问题,引入了最大值矩阵MMP(matrix of maximum pixel),这种策略能够有效降低比较次数。仿真实验表明,本文提出的算法具有较好的编码效率。
暂无评论