检索结果-内蒙古大学图书馆

殷都学刊 2023年第1期44卷 26-30页

作者：张展杨玉起安阳师范学院甲骨文信息处理教育部重点实验室河南安阳455000 中国科学院自动化研究所模式识别国家重点实验室北京100190

目前,计算机辅助甲骨碎片图像拼接技术有所突破,该技术可应用于甲骨、纸币、文档等物体碎片图像拼接。针对甲骨碎片图像拼接技术的应用,给甲骨碎片拼接技术的科研人员与甲骨学专家带来诸多的问题,本文主要探讨计算机辅助拼接甲骨碎片技... 详细信息

目前,计算机辅助甲骨碎片图像拼接技术有所突破,该技术可应用于甲骨、纸币、文档等物体碎片图像拼接。针对甲骨碎片图像拼接技术的应用,给甲骨碎片拼接技术的科研人员与甲骨学专家带来诸多的问题,本文主要探讨计算机辅助拼接甲骨碎片技术的问题、技巧、特点和重要性,并给出计算机辅助缀合甲骨碎片的重要成果,以促进甲骨碎片图像拼接技术的交流与甲骨文信息处理交叉学科的发展,加快修复甲骨碎片文物,推进计算机视觉和深度学习等人工智能技术在人文学科的应用。

关键词：甲骨碎片图像拼接修复甲骨

来源：评论

学校读者我要写书评

暂无评论

面向影视制作的风格迁移技术及展望

影视文化

引用

影视文化 2022年第1期26卷 12-19页

作者：董未名邓盈盈张宇欣黄妮莎中国科学院自动化研究所模式识别国家重点实验室中国科学院大学人工智能学院

风格迁移是人工智能艺术的核心研究方向之一，可将一张图像或一段视频的视觉效果转换为指定的艺术图像的风格。本文首先介绍风格迁移的基本概念及已有的风格迁移技术在影视制作中的应用案例，并阐释了风格迁移的基础框架卷积神经网络和... 详细信息

风格迁移是人工智能艺术的核心研究方向之一，可将一张图像或一段视频的视觉效果转换为指定的艺术图像的风格。本文首先介绍风格迁移的基本概念及已有的风格迁移技术在影视制作中的应用案例，并阐释了风格迁移的基础框架卷积神经网络和生成式对抗网络的基本原理。其次，对不同类型的风格迁移技术框架进行概述，包括基于优化的风格迁移方法、单模型单风格的方法、单模型多风格的方法和视频风格迁移方法以及各类型的代表性算法。最后，对风格迁移技术未来在影视制作中的应用前景进行了展望，包括艺术风格影视片段制作、影视海报制作和老电影上色等方向。

关键词：风格迁移卷积神经网络影视制作

来源：评论

学校读者我要写书评

暂无评论

虹膜分割算法评价基准

引用

计算机研究与发展 2020年第2期57卷 395-412页

作者：王财勇孙哲南中国科学院大学人工智能学院北京100049 模式识别国家重点实验室(中国科学院自动化研究所) 北京100190

虹膜识别是生物特征识别中最稳定和最可靠的身份识别方法之一.在虹膜识别的整个流程中,虹膜分割处于预处理阶段,因此虹膜分割结果的好坏将直接影响虹膜识别的精度.自从1993年Daugman第1次提出高性能的虹膜识别系统以来,各种各样的虹膜... 详细信息

虹膜识别是生物特征识别中最稳定和最可靠的身份识别方法之一.在虹膜识别的整个流程中,虹膜分割处于预处理阶段,因此虹膜分割结果的好坏将直接影响虹膜识别的精度.自从1993年Daugman第1次提出高性能的虹膜识别系统以来,各种各样的虹膜分割算法陆续提出,尤其是近年来基于深度学习的虹膜分割算法极大地提升了虹膜分割的精度.然而,由于缺乏统一的数据库和评价指标,各种算法的性能比较杂乱而不公平,因此提出了一个公开的虹膜分割评价基准.首先,介绍了虹膜分割的定义和面临的挑战;其次全面梳理了3个有代表性的公开虹膜分割数据库,总结了其特点和挑战性;紧接着定义了虹膜分割的评价指标;然后对传统的和基于深度学习的虹膜分割算法进行了总结,并通过详细的实验对各类算法进行了比较和分析.实验结果表明:当前基于深度学习的虹膜分割算法在准确性上超越了传统的方法.最后,对基于深度学习的虹膜分割算法存在的问题进行了思考和讨论.

关键词：生物特征识别虹膜识别虹膜分割深度学习语义分割

来源：评论

学校读者我要写书评

暂无评论

基于卷积神经网络的边缘保真图像去噪算法

引用

计算机辅助设计与图形学学报 2020年第11期32卷 1822-1831页

作者：刘一畅马伟徐士彪张晓鹏北京工业大学信息学部北京100124 中国科学院自动化研究所模式识别国家重点实验室北京100190

现有图像去噪算法在去除噪声的同时,容易导致边缘过度光滑.为解决该问题,提出一种基于卷积神经网络的边缘保真去噪算法,它由基准去噪模块和基于多特征融合的边缘提取模块组成.首先,针对基准去噪模块所得结果,采用边缘提取网络提取边缘细... 详细信息

现有图像去噪算法在去除噪声的同时,容易导致边缘过度光滑.为解决该问题,提出一种基于卷积神经网络的边缘保真去噪算法,它由基准去噪模块和基于多特征融合的边缘提取模块组成.首先,针对基准去噪模块所得结果,采用边缘提取网络提取边缘细节;进而,通过多层次边缘损失代价最小化,反向优化基准去噪网络去噪性能,引导其生成具有更多边缘细节信息的干净图像.在PyTorch环境下用常见的图像去噪数据集Set5,Set14,Kodak,McMaster,RNI15以及跨类型医学图像数据集上测试所提出算法,并与FFDNet等去噪算法进行对比.实验结果表明,所提出算法峰值信噪比值等指标均高于其他对比算法;在视觉效果上,所提出算法能够保留更多边缘细节和纹理特征,得到的去噪后图像更加清晰.

关键词：图像去噪边缘提取卷积神经网络多特征融合

来源：评论

学校读者我要写书评

暂无评论

基于多尺度笔刷的分层油画风格化

引用

计算机辅助设计与图形学学报 2020年第4期32卷 575-581页

作者：陈颖荆树旭石剑陈彦云柳有权张彩荣长安大学信息工程学院西安710064 中国科学院自动化研究所模式识别国家重点实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190

基于图像的油画风格化绘制是计算机图形学领域非真实感绘制研究的热点之一.为了进一步提高图像油画风格化的质量,提出了一种基于多尺度笔刷的分层图像油画风格化绘制算法.该算法模拟艺术家的油画绘制过程,采用不同尺度的笔刷按照从粗到... 详细信息

基于图像的油画风格化绘制是计算机图形学领域非真实感绘制研究的热点之一.为了进一步提高图像油画风格化的质量,提出了一种基于多尺度笔刷的分层图像油画风格化绘制算法.该算法模拟艺术家的油画绘制过程,采用不同尺度的笔刷按照从粗到细的顺序逐层绘制.在每层笔刷绘制中,首先使用增量Voronoi序列采样点和图像切线方向场确定笔刷流线,然后结合笔刷形状与笔刷高度场进行纹理贴图,得到最终的图像油画风格化绘制结果.通过与现有算法比较,文中算法不仅能模拟真实的油画绘制过程,而且生成的油画效果层次感更强,充分体现了图像的结构特征和油画细节.

关键词：非真实感渲染油画风格化切线方向场笔刷流线

来源：评论

学校读者我要写书评

暂无评论

基于大语言模型与视觉语言模型的多模态事实核查

引用

中国传媒大学学报（自然科学版） 2024年第4期31卷 30-37,54页

作者：张芃芃彭勃董晶程皓楠北华航天工业学院遥感信息工程学院廊坊065000 中国科学院自动化研究所模式识别实验室北京100190 中国传媒大学媒体融合与传播国家重点实验室北京100024

多模态事实核查旨在联合多种模态的媒体内容以抽取有效信息来检测社交媒体背景下的虚假信息。针对已有研究对事实核查领域专用数据集过于依赖以及在图像理解和语义相似度计算方面可解释性弱的问题,提出了一种全新的基于预训练大模型的... 详细信息

多模态事实核查旨在联合多种模态的媒体内容以抽取有效信息来检测社交媒体背景下的虚假信息。针对已有研究对事实核查领域专用数据集过于依赖以及在图像理解和语义相似度计算方面可解释性弱的问题,提出了一种全新的基于预训练大模型的多模态事实核查自动化方法,并在公开数据集COSMOS上进行了实验。结果表明该方法达到了0.859的正确率,且在每次核查时都能提供清晰的理由,相较于传统的基线方法具有更高的准确性和更强的可解释性。此外,还深入分析了不同的方法变体,以及数据集中各种虚假信息的判别场景,验证了本方法凭借在多模态信息语义理解方面的强大能力,可以灵活应对不同情境下的脱离上下文检测。本文方法为社交网络中多模态媒体内容的事实核查工作提供有力的技术支持和新的思考方向。

关键词：深度学习大语言模型视觉语言模型多模态事实核查

来源：评论

学校读者我要写书评

暂无评论

基于SAE的睡眠呼吸中止综合症识别及预测算法

引用

自动化学报 2021年

作者：党鑫柯登峰韦然张振天津工业大学计算机科学与技术学院天津市光电检测技术与系统重点实验室中国科学院自动化研究所模式识别国家重点实验室天津工业大学生命科学学院

睡眠呼吸暂停综合症(OSA)是一种常见的睡眠中呼吸停止的睡眠障碍，在各年龄段人群中均拥有较高的患病比例。然而目前OSA的主要诊断仍依靠复杂而昂贵的多导睡眠监测(PSG)，严重制约了OSA的筛查效率。针对这个问题，本文提出了一种基于栈... 详细信息

睡眠呼吸暂停综合症(OSA)是一种常见的睡眠中呼吸停止的睡眠障碍，在各年龄段人群中均拥有较高的患病比例。然而目前OSA的主要诊断仍依靠复杂而昂贵的多导睡眠监测(PSG)，严重制约了OSA的筛查效率。针对这个问题，本文提出了一种基于栈式自编码网络(SAE)的鼾声OSA症状识别算法。该算法首先利用心电、鼾声数据进行OSA症状的特征抽出，两种特征在SAE的输入层或隐层结合后共同训练OSA诊断模型。该模型利用了深度神经网络发掘复杂特征及多模态特征相关性的能力，在自编码网络的隐层训练心电、鼾声特征的相关性，并利用这种相关性提高模型的识别性能。OSA症状识别及发病预测实验中，采用心电、鼾声同时输入的情况下，比传统算法获得了5%-7%的识别精度提升；在采用鼾声输入时，也获得了96.5%的识别精度。

关键词：睡眠呼吸中止综合征鼾声栈式自编码网络深度学习

来源：评论

学校读者我要写书评

暂无评论

基于多模态输入的对抗式视频生成方法

引用

计算机研究与发展 2020年第7期57卷 1522-1530页

作者：于海涛杨小汕徐常胜合肥工业大学计算机与信息学院合肥230031 模式识别国家重点实验室(中国科学院自动化研究所) 北京100190

视频生成是计算机视觉和多媒体领域一个重要而又具有挑战性的任务.现有的基于对抗生成网络的视频生成方法通常缺乏一种有效可控的连贯视频生成方式.提出一种新的多模态条件式视频生成模型.该模型使用图片和文本作为输入,通过文本特征编... 详细信息

视频生成是计算机视觉和多媒体领域一个重要而又具有挑战性的任务.现有的基于对抗生成网络的视频生成方法通常缺乏一种有效可控的连贯视频生成方式.提出一种新的多模态条件式视频生成模型.该模型使用图片和文本作为输入,通过文本特征编码网络和运动特征解码网络得到视频的运动信息,并结合输入图片生成连贯的运动视频序列.此外,该方法通过对输入图片进行仿射变换来预测视频帧,使得生成模型更加可控、生成结果更加鲁棒.在SBMG(single-digit bouncing MNIST gifs),TBMG(two-digit bouncing MNIST gifs)和KTH(kungliga tekniska h?gskolan human actions)数据集上的实验结果表明:相较于现有的视频生成方法,生成结果在目标清晰度和视频连贯性方面都具有更好的效果.另外定性评估和定量评估(SSIM(structural similarity index)与PSNR(peak signal to noise ratio)指标)表明提出的多模态视频帧生成网络在视频生成中起到了关键作用.

关键词：深度学习视频生成视频预测卷积神经网络生成对抗网络

来源：评论

学校读者我要写书评

暂无评论

基于双重权重偏差建模的无监督域适应

引用

计算机科学 2021年第2期48卷 217-223页

作者：马闯田青孙赫阳曹猛马廷淮南京信息工程大学计算机与软件学院南京210044 中国科学院自动化所模式识别国家重点实验室北京100190

无监督域适应(Unsupervised Domain Adaptation,UDA)是一类新兴的机器学习范式,其通过对源域知识在无标记目标域上的迁移利用,来促进目标域模型的训练。为建模源域与目标域之间的域分布差异,最大均值差异(Maximum Mean Discrepancy,MMD... 详细信息

无监督域适应(Unsupervised Domain Adaptation,UDA)是一类新兴的机器学习范式,其通过对源域知识在无标记目标域上的迁移利用,来促进目标域模型的训练。为建模源域与目标域之间的域分布差异,最大均值差异(Maximum Mean Discrepancy,MMD)建模被广泛应用,其对UDA的性能提升起到了有效的促进作用。然而,这些方法通常忽视了领域之间对应类规模与类分布等结构信息,因为目标域与源域的数据类规模与数据分布通常并非一致。为此,文中提出了一种基于跨域类和数据样本双重加权的无监督域适应模型(Sample weighted and Class weighted based Unsupervised Domain Adaptation Network,SCUDAN)。具体而言,一方面,通过源域类层面的适应性加权来调整源域类权重,以实现源域与目标域之间的类分布对齐;另一方面,通过目标域样本层面的适应性加权来调整目标域样本权重,以实现目标域与源域类中心的对齐。此外,文中还提出了一种CEM(Classification Expectation Maximization)优化算法,以实现对SCUDAN的优化求解。最后,通过对比实验和分析,验证了所提模型和算法的有效性。

关键词：无监督域适应最大均值差异类权重偏差样例权重偏差卷积神经网络

来源：评论

学校读者我要写书评

暂无评论

面向社交媒体的高质量内容识别

引用

计算机辅助设计与图形学学报 2020年第6期32卷 943-949页

作者：赵泉胡骏方全钱胜胜徐常胜合肥工业大学计算机与信息学院合肥230009 中国科学院自动化研究所模式识别国家重点实验室北京100190

如何从海量多媒体文章中自动识别高质量内容是信息推荐、搜索引擎等系统的核心功能之一.现有的方法在训练中依赖大量的人工标注数据.针对其未考虑社交媒体中的社交信息和视觉内容的问题,提出一种基于正无标记(positive and unlabeled, ... 详细信息

如何从海量多媒体文章中自动识别高质量内容是信息推荐、搜索引擎等系统的核心功能之一.现有的方法在训练中依赖大量的人工标注数据.针对其未考虑社交媒体中的社交信息和视觉内容的问题,提出一种基于正无标记(positive and unlabeled, PU)学习的图卷积高质量文章内容识别模型--基于PU学习的图卷积网络(graph convolutional network based on positive and unlabeled learning, GCN-PU),在统一的框架中使用一个异构网络同时建模社交媒体文章的文本和社交信息,并在该网络上使用图卷积网络来融合这些信息得到高阶特征.另外,使用多媒体文章的全局视觉布局信息来捕捉文章的综合视觉质量特征,用于补充图卷积网络输出的高阶特征.最后,在训练机制和损失函数中引入了PU学习来充分利用社交媒体中大量未标注的文章信息.在真实社交媒体数据集上的实验结果表明,相比于现有的方法, GCN-PU方法的F值提升了3%以上.

关键词：社交媒体多媒体文章质量识别正无标记学习图卷积网络

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：