检索结果-内蒙古大学图书馆

计算机学报 2025年第5期48卷 1100-1115页

作者：张绍磊冯洋中国科学院计算技术研究所智能信息处理重点实验室中国科学院大学中国科学院智能算法安全重点实验室

实时场景中的跨语言沟通是全球化进程中的重要场景。实时语音翻译旨在通过计算机在说话者讲话的同时输出目标语言的翻译文本,在诸多实时场景中具有广泛的应用前景。当前的离线模型尽管拥有大规模参数,但其架构仍无法直接处理实时跨语言... 详细信息

实时场景中的跨语言沟通是全球化进程中的重要场景。实时语音翻译旨在通过计算机在说话者讲话的同时输出目标语言的翻译文本,在诸多实时场景中具有广泛的应用前景。当前的离线模型尽管拥有大规模参数,但其架构仍无法直接处理实时跨语言沟通场景。在此背景下,实时语音翻译对于实时性的独有要求使得其在研究和应用上具备特定的必要性。与离线语音翻译相比,实时语音翻译更具挑战性,因为其需要额外制定读/写策略以控制模型在合适的时机开始翻译,从而在低延时下获得高质量翻译。理想情况下,实时语音翻译模型应在接收到相关语音后立即生成对应的目标文本,以确保高翻译质量和低延时。因此,建模源语音和目标文本之间的对齐是指导读/写策略的关键。基于此,本文提出了一种基于连接时序分类解码器的实时语音翻译方法。该方法通过连接时序分类技术插入空白标记和重复标记,实现语音和文本不等长序列间的对齐,并根据此对齐制定读/写策略来控制模型在接收到对应的语音之后开始翻译。在训练中引入连接时序分类损失能有效地将对齐学习与目标文本生成整合在统一的框架中,从而找到最佳的读/写策略。本文在两个实时语音翻译基准上对提出的方法进行了全面评估,结果表明提出的方法在实时语音翻译性能上超过了现有最佳方法。进一步的分析实验展示了该方法的有效性和优越性。

关键词：实时翻译语音翻译机器翻译连接时序分类非自回归生成对齐

来源：评论

学校读者我要写书评

暂无评论

未知不匹配互联系统的非对称输入约束分散控制器设计

引用

工程科学学报 2024年第12期46卷 2269-2278页

作者：王鼎范文倩刘奥北京工业大学信息科学技术学院北京100124 计算智能与智能系统北京市重点实验室北京100124 智慧环保北京实验室北京100124 北京人工智能研究院北京100124

基于自适应动态规划算法研究了具有未知不匹配互联和非对称输入约束的连续时间非线性系统分散控制问题.首先,根据孤立子系统的局部状态和耦合子系统的参考状态,采用径向基函数神经网络近似未知互连项,从而消除了互联项满足匹配条件且存... 详细信息

基于自适应动态规划算法研究了具有未知不匹配互联和非对称输入约束的连续时间非线性系统分散控制问题.首先,根据孤立子系统的局部状态和耦合子系统的参考状态,采用径向基函数神经网络近似未知互连项,从而消除了互联项满足匹配条件且存在上界的常见假设.然后,基于自适应评判框架,将分散最优控制器设计问题转化为一系列子系统非对称约束下局部最优控制器设计问题.利用Lyapunov稳定性定理,证明了不对称输入约束控制器能够迅速地镇定大规模分散系统.其中,引入状态观测器估计大规模非线性互联子系统状态并保证了观测误差满足一致最终有界.另外,利用评判神经网络近似改进后的代价函数,以近似求解Hamilton–Jacobi–Bellman方程,获得满足非对称输入约束的最优分散控制策略.基于评判网络权值更新规则,通过选择合适的Lyapunov函数保证了权值近似误差满足一致最终有界.最后,通过仿真实例验证了该算法的有效性,并通过与未改进代价函数的传统方法对比,体现了该方法的先进性.

关键词：自适应动态规划非对称输入约束分散控制神经网络最优控制状态观测器未知不匹配互联

来源：评论

学校读者我要写书评

暂无评论

基于子块矩阵马尔可夫聚类识别动态蛋白质相互作用网络功能模块

引用

基因组学与应用生物学 2024年第2期43卷 217-227页

作者：张锦雄潘扬健孟雪莉唐伊红巴依提力·努尔旦艾力王鑫左振文陈清华郭顶亮韦冰冰陈陆坤广西大学计算机与电子信息学院南宁530004 广西高校并行分布与智能计算重点实验室南宁530004

细胞生物过程具有时序动态性,蛋白质功能模块是驱动细胞生物过程的功能单位。为了蛋白质功能模块识别,本文将细胞生物过程建模为动态时序表达相关蛋白质相互作用网络(DTEPIN);构建子块矩阵以表示动态时序表达相关蛋白质相互作用网络;利... 详细信息

细胞生物过程具有时序动态性,蛋白质功能模块是驱动细胞生物过程的功能单位。为了蛋白质功能模块识别,本文将细胞生物过程建模为动态时序表达相关蛋白质相互作用网络(DTEPIN);构建子块矩阵以表示动态时序表达相关蛋白质相互作用网络;利用子块矩阵特殊性,分析时空复杂度和并行性;优化设计马尔可夫聚类算法,以识别动态时序表达相关蛋白质相互作用网络中的蛋白质功能模块。为了支持基于子块矩阵马尔可夫聚类过程,本文运用图形处理器并行计算矩阵乘积。实验结果表明,与已有同类算法相比,所设计算法识别的蛋白质功能模块,统计匹配质量更高且精确匹配数量更多。

关键词：蛋白质功能模块蛋白质-蛋白质相互作用动态时序表达马尔可夫聚类 GPU并行计算

来源：评论

学校读者我要写书评

暂无评论

基于对比学习的跨模态实体链接模型

引用

计算机研究与发展 2025年第3期62卷 662-671页

作者：王苑铮孙文祥范意兴廖华明郭嘉丰中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所) 北京100190 中国科学院大学北京100049

图文跨模态实体链接是对传统实体链接任务的扩展,其输入为包含实体的图像,目标是将其链接到文本模态的知识库实体上.现有模型通常采用双编码器架构,将图像、文本模态的实体分别编码为向量,利用点乘计算两者的相似度,从而链接到与图像实... 详细信息

图文跨模态实体链接是对传统实体链接任务的扩展,其输入为包含实体的图像,目标是将其链接到文本模态的知识库实体上.现有模型通常采用双编码器架构,将图像、文本模态的实体分别编码为向量,利用点乘计算两者的相似度,从而链接到与图像实体相似度最高的文本实体.其训练过程通常采用基于Info NCE损失的对比学习任务,即提高一个实体某模态与自身另一模态的向量相似度,降低与其他实体另一模态的向量相似度.然而此模型忽视了图文2个模态内部表示难度的差异:图像模态中的相似实体,通常比文本模态中的相似实体更难以区分,导致外观相似的图像实体很容易链接错误.因此,提出2个新的对比学习任务来提升向量的判别能力.一个是自对比学习,用于提升图像向量之间的区分度;另一个是难负例对比学习,让文本向量更容易区分几个相似的图像向量.在开源数据集Wiki Person上进行实验,在12万规模的实体库上,相比于采用Info NCE损失的最佳基线模型,模型正确率提升了4.5个百分点.

关键词：实体链接模型多模态跨模态对比学习视觉信息

来源：评论

学校读者我要写书评

暂无评论

多因素引导的行人重识别数据增广方法研究

引用

电子科技大学学报 2024年第2期53卷 235-242页

作者：刘志刚张国辉高月刘苗苗东北石油大学计算机与信息技术学院大庆163318 黑龙江省石油大数据与智能分析重点实验室大庆163318

为解决行人重识别研究领域中行人标注图像获取困难的问题,提出一种多因素引导的行人数据增广方法。首先,在生成器网络中设计了一种局部多尺度引导机制,通过特征融合抑制生成图像的局部伪影;其次,提出了长距离相关性引导机制,通过外注意... 详细信息

为解决行人重识别研究领域中行人标注图像获取困难的问题,提出一种多因素引导的行人数据增广方法。首先,在生成器网络中设计了一种局部多尺度引导机制,通过特征融合抑制生成图像的局部伪影;其次,提出了长距离相关性引导机制,通过外注意力引导生成图像的长距离依赖,提高生成行人图像的整体视感质量;最后,提出一种抗博弈判别网络,通过嵌入到生成对抗网络,从而构建一种三网络稳定博弈架构模型,增加生成对抗网络训练的稳定性。通过VIPeR、Market-1501、DukeMTMC-reID这3种不同规模数据集的仿真实验,结果表明该方法与目前主流方法相比,mAP与Rank-1精度上均有不同程度的提升,在小规模数据集上的提升较为显著。

关键词：行人重识别生成对抗网络数据增广局部多尺度注意力机制

来源：评论

学校读者我要写书评

暂无评论

用于肺水肿量化的掩码图像-语言蒸馏模型

引用

基因组学与应用生物学 2024年第2期43卷 274-283页

作者：卢得民钟诚杨锋广西大学计算机与电子信息学院南宁530004 广西高校并行分布与智能计算重点实验室南宁530004

肺水肿量化是治疗急性充血性心力衰竭(congestive heart failure,CHF)的关键。用于视觉和语言预训练的多模态掩码自编码器已被证实可有效融合胸片和肺水肿放射学报告的多模态信息以提升肺水肿量化精度。但现有的方法是随机地对图像和文... 详细信息

肺水肿量化是治疗急性充血性心力衰竭(congestive heart failure,CHF)的关键。用于视觉和语言预训练的多模态掩码自编码器已被证实可有效融合胸片和肺水肿放射学报告的多模态信息以提升肺水肿量化精度。但现有的方法是随机地对图像和文本进行掩码操作,这一不稳定的操作容易导致模型忽略图像病灶和文本关键词,并阻碍多模态信息的融合与对齐,最终影响量化精度。针对上述问题,本研究设计了一种掩码图像-语言蒸馏模型,首次将自蒸馏引入到医学图像-语言预训练任务中,使得模型获得更为稳定可靠的医学图像和语言表示;并对跨模态注意力融合机制进行优化,使得模型更好地融合与对齐多模态信息。相比于101层残差神经网络(residual network 101,ResNet101)、视觉Transformer(vision transformer,ViT)-B/16、联合胸片和肺水肿放射学报告建模(joint modeling of chest radiographs and radiology reports for pulmonary edema assessment,JMC3R)和用于视觉和语言预训练的多模态掩码自编码器(multi-modal masked autoencoders for medical vision and language pre-training,M3AE),本研究所提出的方法在肺水肿量化数据集(pulmonary edemaassessmentdataset,PEAD)上获得了更高的肺水肿量化精度。

关键词：肺水肿自蒸馏掩码建模多模态注意力机制

来源：评论

学校读者我要写书评

暂无评论

基于离散麻雀搜索优化的X结构绕障Steiner最小树算法

引用

计算机科学与探索 2025年第6期19卷 1494-1507页

作者：郑瀚周茹平刘耿耿福州大学计算机与大数据学院大数据智能教育部工程研究中心福建省网络计算与智能信息处理重点实验室

Steiner最小树是求解超大规模集成电路布线问题的最佳连接模型。然而，现代芯片中往往存在各种障碍,如宏单元、IP块等，这些障碍使得Steiner最小树的构建更为困难。同时，考虑到X结构布线具有的良好线长优化能力以及麻雀搜索算法在求解N... 详细信息

Steiner最小树是求解超大规模集成电路布线问题的最佳连接模型。然而，现代芯片中往往存在各种障碍,如宏单元、IP块等，这些障碍使得Steiner最小树的构建更为困难。同时，考虑到X结构布线具有的良好线长优化能力以及麻雀搜索算法在求解NP难问题上展现出良好的应用前景，提出了一种基于离散麻雀搜索优化的X结构绕障Steiner最小树算法（DSSA＿OAXSMT）。设计了基于边点对编码的麻雀表示方法与有效的适应度计算方法，以及一种基于离散化变异与交叉运算的麻雀种群更新机制，能够有效解决离散化的X结构绕障Steiner最小树问题。提出了一种预处理策略，避免了障碍信息的重复计算，提高了算法的运行效率。提出了一种混合初始化策略，通过结合贪心思想和轮盘赌思想提高初始种群的多样性。提出了一种基于绕行的调整策略以满足障碍约束。提出了一种混合精炼策略，其中包含基于公共边的局部精炼策略与基于交叉检测与处理的优化策略，能够进一步优化线长代价。实验结果表明，所提算法相比于同类工作取得了更佳的线长优化能力。

关键词： Steiner最小树 X结构绕障离散麻雀搜索优化超大规模集成电路

来源：评论

学校读者我要写书评

暂无评论

移动边缘计算场景下针对资源竞争的服务迁移优化方法

引用

通信学报 2024年第8期45卷 37-50页

作者：王海艳张霖骆健南京邮电大学计算机学院江苏南京210023 江苏省大数据安全与智能处理重点实验室江苏南京210023

针对移动边缘计算(MEC)场景中边缘服务器资源受限导致服务迁移存在资源竞争的问题,基于Lyapunov技术和博弈论,提出了一种针对资源竞争的服务迁移优化方法OMRC-LG。考虑到系统迁移成本有限且当用户数量过多时难以进行轨迹预测,将服务迁... 详细信息

针对移动边缘计算(MEC)场景中边缘服务器资源受限导致服务迁移存在资源竞争的问题,基于Lyapunov技术和博弈论,提出了一种针对资源竞争的服务迁移优化方法OMRC-LG。考虑到系统迁移成本有限且当用户数量过多时难以进行轨迹预测,将服务迁移问题建模为迁移成本约束下的最优化问题,并利用Lyapunov技术将最优化问题转化为不需要预测用户轨迹的在线问题处理。为了缓解资源竞争,提出了一种基于博弈论的分布式方法求解在线问题,通过共享用户服务迁移决策以获取准确的边缘服务器可用资源,并不断更新迁移决策,实现服务迁移优化。仿真结果表明,OMRC-LG方法在满足迁移成本约束的同时,降低了平均服务时延。

关键词：移动边缘计算服务迁移服务时延迁移成本资源竞争

来源：评论

学校读者我要写书评

暂无评论

基于视觉注意力的图文跨模态情感分析

引用

计算机工程与设计 2024年第2期45卷 601-607页

作者：王法玉郝攀征天津理工大学智能计算及软件新技术天津市重点实验室天津300384

针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的... 详细信息

针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的文档表示。对于视觉注意力无法完全覆盖的文本内容,使用BERT模型对文本进行情感分析,得到基于文本的文档表示,将特征进行融合应用于情感分类任务。在Yelp公开餐厅数据集上,该模型相比基线模型TFN-aVGG,准确率提高了43%,相比VistaNet模型准确率提高了1.4%。

关键词：情感分析视觉注意力机制跨模态深度学习特征融合预训练模型双向门控单元

来源：评论

学校读者我要写书评

暂无评论

基于自适应混合优化的电力数据预测方法

引用

控制与决策 2023年第12期38卷 3490-3498页

作者：曾朝晖赵会勇罗恩韬张英豪杨阳严一泰湘潭大学智能计算与信息处理教育部重点实验室湖南湘潭411105 湖南科技学院信息工程学院湖南永州425099

电力数据易受气候、季节、节假日等因素影响,出现不同波动特征.针对不同特征电力数据预测精度不高、预测方法泛化能力弱等问题,提出基于自适应混合优化的电力数据预测方法.通过使用小波变换和平稳性分析,将电力数据自适应地分解为包含... 详细信息

电力数据易受气候、季节、节假日等因素影响,出现不同波动特征.针对不同特征电力数据预测精度不高、预测方法泛化能力弱等问题,提出基于自适应混合优化的电力数据预测方法.通过使用小波变换和平稳性分析,将电力数据自适应地分解为包含趋势、季节和周期信息的非平稳序列和多个平稳序列;使用状态转移算法分别优化长短时记忆深度学习网络和自回归移动平均模型,对非平稳序列和平稳序列分别拟合、预测;对预测的各序列进行重构,得到最终预测结果.在电力系统数据上进行多步预测,对比实验表明:与其他方法相比,所提方法不仅具有更高的预测精度,还具有较强的泛化能力.

关键词：电力数据预测长短期记忆深度学习网络自回归移动平均模型小波分解状态转移算法

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：