检索结果-内蒙古大学图书馆

计算机研究与发展 2020年第2期57卷 395-412页

作者：王财勇孙哲南中国科学院大学人工智能学院北京100049 模式识别国家重点实验室(中国科学院自动化研究所) 北京100190

虹膜识别是生物特征识别中最稳定和最可靠的身份识别方法之一.在虹膜识别的整个流程中,虹膜分割处于预处理阶段,因此虹膜分割结果的好坏将直接影响虹膜识别的精度.自从1993年Daugman第1次提出高性能的虹膜识别系统以来,各种各样的虹膜... 详细信息

虹膜识别是生物特征识别中最稳定和最可靠的身份识别方法之一.在虹膜识别的整个流程中,虹膜分割处于预处理阶段,因此虹膜分割结果的好坏将直接影响虹膜识别的精度.自从1993年Daugman第1次提出高性能的虹膜识别系统以来,各种各样的虹膜分割算法陆续提出,尤其是近年来基于深度学习的虹膜分割算法极大地提升了虹膜分割的精度.然而,由于缺乏统一的数据库和评价指标,各种算法的性能比较杂乱而不公平,因此提出了一个公开的虹膜分割评价基准.首先,介绍了虹膜分割的定义和面临的挑战;其次全面梳理了3个有代表性的公开虹膜分割数据库,总结了其特点和挑战性;紧接着定义了虹膜分割的评价指标;然后对传统的和基于深度学习的虹膜分割算法进行了总结,并通过详细的实验对各类算法进行了比较和分析.实验结果表明:当前基于深度学习的虹膜分割算法在准确性上超越了传统的方法.最后,对基于深度学习的虹膜分割算法存在的问题进行了思考和讨论.

关键词：生物特征识别虹膜识别虹膜分割深度学习语义分割

来源：评论

学校读者我要写书评

暂无评论

语言认知与语言计算--人与机器的语言理解

引用

中国科学：信息科学 2022年第10期52卷 1748-1774页

作者：王少楠丁鼐林楠张家俊宗成庆中国科学院自动化研究所模式识别国家重点实验室北京100190 中国科学院大学人工智能学院北京100190 浙江大学生物医学工程与仪器科学学院生物医学工程教育部重点实验室杭州310027 之江实验室基础理论研究院应用数学与机器智能研究中心杭州311121 中国科学院行为科学重点实验室(中国科学院心理研究所) 北京100101 中国科学院大学心理学系北京100049 中国科学院脑科学与智能技术卓越创新中心北京100190

语言理解是认知科学和计算机科学交叉领域共同关心的问题,但两个学科在选择具体研究问题时却十分不同.认知科学领域的研究侧重解析大脑的工作机制,更多地关注于描述大脑对语言的响应,缺乏对大脑语言功能整体化、系统化的研究,而计算机... 详细信息

语言理解是认知科学和计算机科学交叉领域共同关心的问题,但两个学科在选择具体研究问题时却十分不同.认知科学领域的研究侧重解析大脑的工作机制,更多地关注于描述大脑对语言的响应,缺乏对大脑语言功能整体化、系统化的研究,而计算机科学家在选择研究问题时重点关注实际应用效能,往往忽略了对语言最本质规律的研究.那么,如何实现两种思路的交叉融合,为智能语言计算模型的构建和语言认知机理的研究带来新的机遇和启发呢?本文首先简要回顾了认知科学和计算机科学在语言理解方向上的研究问题、发展历程和研究方法,重点阐述研究现状和面临的挑战,之后对比认知科学和计算机科学领域对于语言理解问题的主要观点,分析两者之间的异同.最后对现有语言认知和语言计算两个领域的交叉融合方法进行归纳和总结,并对未来发展趋势予以展望.

关键词：语言认知语言计算人的语言理解机器的语言理解交叉研究

来源：评论

学校读者我要写书评

暂无评论

面向大规模数据的DBSCAN加速算法综述

引用

计算机研究与发展 2023年第9期60卷 2028-2047页

作者：陈叶旺曹海露陈谊康昭雷震杜吉祥华侨大学计算机科学与技术学院福建厦门361021 食品安全大数据技术北京市重点实验室(北京工商大学) 北京100048 电子科技大学计算机科学与工程学院成都611731 模式识别国家重点实验室(中国科学院自动化所) 北京100190 厦门市数据安全与区块链技术重点实验室(华侨大学) 福建厦门361021 福建省大数据智能与安全重点实验室(华侨大学) 福建厦门361021 江苏省计算机信息处理技术重点实验室(苏州大学) 江苏苏州215006

DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目... 详细信息

DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目标上看,这些工作大体上可分为减少冗余计算和并行化两大类;就具体加速手段而言,可分为6个主要类别:基于分布式、基于采样化、基于近似模糊、基于快速近邻、基于空间划分以及基于GPU加速技术.根据该分类,对现有工作进行了深入梳理与交叉比较,发现采用多重技术的融合加速算法优于单一加速技术;近似模糊化、并行化与分布式是当前最有效的手段;高维数据仍然难以应对.此外,对快速化DBSCAN算法在多个领域中的应用进行了跟踪报告.最后,对本领域未来的方向进行了展望.

关键词：快速化DBSCAN 密度聚类聚类算法大数据数据挖掘

来源：评论

学校读者我要写书评

暂无评论

计算机拼接甲骨碎片图像问题的研讨

引用

殷都学刊 2023年第1期44卷 26-30页

作者：张展杨玉起安阳师范学院甲骨文信息处理教育部重点实验室河南安阳455000 中国科学院自动化研究所模式识别国家重点实验室北京100190

目前,计算机辅助甲骨碎片图像拼接技术有所突破,该技术可应用于甲骨、纸币、文档等物体碎片图像拼接。针对甲骨碎片图像拼接技术的应用,给甲骨碎片拼接技术的科研人员与甲骨学专家带来诸多的问题,本文主要探讨计算机辅助拼接甲骨碎片技... 详细信息

目前,计算机辅助甲骨碎片图像拼接技术有所突破,该技术可应用于甲骨、纸币、文档等物体碎片图像拼接。针对甲骨碎片图像拼接技术的应用,给甲骨碎片拼接技术的科研人员与甲骨学专家带来诸多的问题,本文主要探讨计算机辅助拼接甲骨碎片技术的问题、技巧、特点和重要性,并给出计算机辅助缀合甲骨碎片的重要成果,以促进甲骨碎片图像拼接技术的交流与甲骨文信息处理交叉学科的发展,加快修复甲骨碎片文物,推进计算机视觉和深度学习等人工智能技术在人文学科的应用。

关键词：甲骨碎片图像拼接修复甲骨

来源：评论

学校读者我要写书评

暂无评论

基于卷积神经网络的边缘保真图像去噪算法

引用

计算机辅助设计与图形学学报 2020年第11期32卷 1822-1831页

作者：刘一畅马伟徐士彪张晓鹏北京工业大学信息学部北京100124 中国科学院自动化研究所模式识别国家重点实验室北京100190

现有图像去噪算法在去除噪声的同时,容易导致边缘过度光滑.为解决该问题,提出一种基于卷积神经网络的边缘保真去噪算法,它由基准去噪模块和基于多特征融合的边缘提取模块组成.首先,针对基准去噪模块所得结果,采用边缘提取网络提取边缘细... 详细信息

现有图像去噪算法在去除噪声的同时,容易导致边缘过度光滑.为解决该问题,提出一种基于卷积神经网络的边缘保真去噪算法,它由基准去噪模块和基于多特征融合的边缘提取模块组成.首先,针对基准去噪模块所得结果,采用边缘提取网络提取边缘细节;进而,通过多层次边缘损失代价最小化,反向优化基准去噪网络去噪性能,引导其生成具有更多边缘细节信息的干净图像.在PyTorch环境下用常见的图像去噪数据集Set5,Set14,Kodak,McMaster,RNI15以及跨类型医学图像数据集上测试所提出算法,并与FFDNet等去噪算法进行对比.实验结果表明,所提出算法峰值信噪比值等指标均高于其他对比算法;在视觉效果上,所提出算法能够保留更多边缘细节和纹理特征,得到的去噪后图像更加清晰.

关键词：图像去噪边缘提取卷积神经网络多特征融合

来源：评论

学校读者我要写书评

暂无评论

基于多尺度笔刷的分层油画风格化

引用

计算机辅助设计与图形学学报 2020年第4期32卷 575-581页

作者：陈颖荆树旭石剑陈彦云柳有权张彩荣长安大学信息工程学院西安710064 中国科学院自动化研究所模式识别国家重点实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190

基于图像的油画风格化绘制是计算机图形学领域非真实感绘制研究的热点之一.为了进一步提高图像油画风格化的质量,提出了一种基于多尺度笔刷的分层图像油画风格化绘制算法.该算法模拟艺术家的油画绘制过程,采用不同尺度的笔刷按照从粗到... 详细信息

基于图像的油画风格化绘制是计算机图形学领域非真实感绘制研究的热点之一.为了进一步提高图像油画风格化的质量,提出了一种基于多尺度笔刷的分层图像油画风格化绘制算法.该算法模拟艺术家的油画绘制过程,采用不同尺度的笔刷按照从粗到细的顺序逐层绘制.在每层笔刷绘制中,首先使用增量Voronoi序列采样点和图像切线方向场确定笔刷流线,然后结合笔刷形状与笔刷高度场进行纹理贴图,得到最终的图像油画风格化绘制结果.通过与现有算法比较,文中算法不仅能模拟真实的油画绘制过程,而且生成的油画效果层次感更强,充分体现了图像的结构特征和油画细节.

关键词：非真实感渲染油画风格化切线方向场笔刷流线

来源：评论

学校读者我要写书评

暂无评论

基于大语言模型与视觉语言模型的多模态事实核查

引用

中国传媒大学学报（自然科学版） 2024年第4期31卷 30-37,54页

作者：张芃芃彭勃董晶程皓楠北华航天工业学院遥感信息工程学院廊坊065000 中国科学院自动化研究所模式识别实验室北京100190 中国传媒大学媒体融合与传播国家重点实验室北京100024

多模态事实核查旨在联合多种模态的媒体内容以抽取有效信息来检测社交媒体背景下的虚假信息。针对已有研究对事实核查领域专用数据集过于依赖以及在图像理解和语义相似度计算方面可解释性弱的问题,提出了一种全新的基于预训练大模型的... 详细信息

多模态事实核查旨在联合多种模态的媒体内容以抽取有效信息来检测社交媒体背景下的虚假信息。针对已有研究对事实核查领域专用数据集过于依赖以及在图像理解和语义相似度计算方面可解释性弱的问题,提出了一种全新的基于预训练大模型的多模态事实核查自动化方法,并在公开数据集COSMOS上进行了实验。结果表明该方法达到了0.859的正确率,且在每次核查时都能提供清晰的理由,相较于传统的基线方法具有更高的准确性和更强的可解释性。此外,还深入分析了不同的方法变体,以及数据集中各种虚假信息的判别场景,验证了本方法凭借在多模态信息语义理解方面的强大能力,可以灵活应对不同情境下的脱离上下文检测。本文方法为社交网络中多模态媒体内容的事实核查工作提供有力的技术支持和新的思考方向。

关键词：深度学习大语言模型视觉语言模型多模态事实核查

来源：评论

学校读者我要写书评

暂无评论

融合词义信息的文本蕴涵识别方法

引用

中文信息学报 2021年第7期35卷 30-40页

作者：杜倩龙宗成庆苏克毅中国科学院自动化研究所模式识别国家重点实验室北京100190 中国科学院大学人工智能学院北京100049 台湾“中央研究院”资讯科学研究所台湾台北11529

文本蕴涵识别是对两个文本之间语义关系的有向推理,而词汇的词义对理解文本的语义以及推理文本之间的语义蕴涵关系有着重要作用。因此,为了有效利用词汇的词义信息推断文本之间的语义蕴涵关系,该文提出一种融合词义信息的文本蕴涵识别... 详细信息

文本蕴涵识别是对两个文本之间语义关系的有向推理,而词汇的词义对理解文本的语义以及推理文本之间的语义蕴涵关系有着重要作用。因此,为了有效利用词汇的词义信息推断文本之间的语义蕴涵关系,该文提出一种融合词义信息的文本蕴涵识别方法。该方法首次提出将原始的词汇转化为对应的目标词义,然后利用词汇的词义信息改善文本的语义表示和文本间语义关系的推理。实验表明,该文所提出的方法可以有效改善文本间语义关系的推理,从而提升文本蕴涵识别的准确率。

关键词：词义推断文本蕴涵识别语义推理

来源：评论

学校读者我要写书评

暂无评论

基于双重权重偏差建模的无监督域适应

引用

计算机科学 2021年第2期48卷 217-223页

作者：马闯田青孙赫阳曹猛马廷淮南京信息工程大学计算机与软件学院南京210044 中国科学院自动化所模式识别国家重点实验室北京100190

无监督域适应(Unsupervised Domain Adaptation,UDA)是一类新兴的机器学习范式,其通过对源域知识在无标记目标域上的迁移利用,来促进目标域模型的训练。为建模源域与目标域之间的域分布差异,最大均值差异(Maximum Mean Discrepancy,MMD... 详细信息

无监督域适应(Unsupervised Domain Adaptation,UDA)是一类新兴的机器学习范式,其通过对源域知识在无标记目标域上的迁移利用,来促进目标域模型的训练。为建模源域与目标域之间的域分布差异,最大均值差异(Maximum Mean Discrepancy,MMD)建模被广泛应用,其对UDA的性能提升起到了有效的促进作用。然而,这些方法通常忽视了领域之间对应类规模与类分布等结构信息,因为目标域与源域的数据类规模与数据分布通常并非一致。为此,文中提出了一种基于跨域类和数据样本双重加权的无监督域适应模型(Sample weighted and Class weighted based Unsupervised Domain Adaptation Network,SCUDAN)。具体而言,一方面,通过源域类层面的适应性加权来调整源域类权重,以实现源域与目标域之间的类分布对齐;另一方面,通过目标域样本层面的适应性加权来调整目标域样本权重,以实现目标域与源域类中心的对齐。此外,文中还提出了一种CEM(Classification Expectation Maximization)优化算法,以实现对SCUDAN的优化求解。最后,通过对比实验和分析,验证了所提模型和算法的有效性。

关键词：无监督域适应最大均值差异类权重偏差样例权重偏差卷积神经网络

来源：评论

学校读者我要写书评

暂无评论

基于多模态输入的对抗式视频生成方法

引用

计算机研究与发展 2020年第7期57卷 1522-1530页

作者：于海涛杨小汕徐常胜合肥工业大学计算机与信息学院合肥230031 模式识别国家重点实验室(中国科学院自动化研究所) 北京100190

视频生成是计算机视觉和多媒体领域一个重要而又具有挑战性的任务.现有的基于对抗生成网络的视频生成方法通常缺乏一种有效可控的连贯视频生成方式.提出一种新的多模态条件式视频生成模型.该模型使用图片和文本作为输入,通过文本特征编... 详细信息

视频生成是计算机视觉和多媒体领域一个重要而又具有挑战性的任务.现有的基于对抗生成网络的视频生成方法通常缺乏一种有效可控的连贯视频生成方式.提出一种新的多模态条件式视频生成模型.该模型使用图片和文本作为输入,通过文本特征编码网络和运动特征解码网络得到视频的运动信息,并结合输入图片生成连贯的运动视频序列.此外,该方法通过对输入图片进行仿射变换来预测视频帧,使得生成模型更加可控、生成结果更加鲁棒.在SBMG(single-digit bouncing MNIST gifs),TBMG(two-digit bouncing MNIST gifs)和KTH(kungliga tekniska h?gskolan human actions)数据集上的实验结果表明:相较于现有的视频生成方法,生成结果在目标清晰度和视频连贯性方面都具有更好的效果.另外定性评估和定量评估(SSIM(structural similarity index)与PSNR(peak signal to noise ratio)指标)表明提出的多模态视频帧生成网络在视频生成中起到了关键作用.

关键词：深度学习视频生成视频预测卷积神经网络生成对抗网络

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：