检索结果-内蒙古大学图书馆

软件学报 2025年第3期36卷 962-980页

作者：燕钰戴志宇吕泽楷王宏志哈尔滨工业大学计算学部黑龙江哈尔滨150001

近年来,随着软硬件的发展,数据库上云已经成为了新兴发展趋势,能够降低中小型企业和个人用户的数据库运维成本.进一步地,云数据库的发展带来了庞大的运维市场需求,研究者们提出了诸多数据库自调优技术来支持数据库旋钮自动优化.为了提... 详细信息

近年来,随着软硬件的发展,数据库上云已经成为了新兴发展趋势,能够降低中小型企业和个人用户的数据库运维成本.进一步地,云数据库的发展带来了庞大的运维市场需求,研究者们提出了诸多数据库自调优技术来支持数据库旋钮自动优化.为了提高调优效率,现有技术从仅关注调优问题本身,到开始关注如何复用历史经验来为当前数据库实例找到最佳参数配置.然而,随着云数据库的发展,用户逐渐提高了对隐私保护的要求,期望在拥有高效数据存取效率的同时避免隐私泄露.现有方法并未考虑到保护用户的历史调优经验隐私,可能会使得用户负载特征被感知,带来经济损失.详细分析了云数据库调优任务的特点,有机结合服务端和用户端,提出了一种基于联邦学习的云数据库旋钮调优技术.首先,为了解决联邦学习中数据异构的问题,提出了基于元特征匹配的经验筛选方法提前将数据分布差异较大的历史经验剔除,以提高联邦学习的效率.为了实现保护用户隐私,结合云数据库服务特性,提出了以节点端为训练中心的联邦贝叶斯调优算法,通过随机傅里叶特征来完成保证调优经验不失真的前提下保护用户隐私.在多个公开benchmark上的结果表明,方法可以达到与现有调优方法相当的调优结果,并且由于复用了历史经验,可以大大提高调优效率.

关键词：云数据库联邦学习旋钮调优

来源：评论

学校读者我要写书评

暂无评论

具身智能的研究与应用

引用

智能系统学报 2025年第1期20卷 255-262页

作者：张伟男刘挺哈尔滨工业大学计算学部黑龙江哈尔滨150001

随着深度学习和大模型技术的不断增强,人工智能技术从研究简单、封闭的虚拟场景,发展到研究更为复杂、开放的现实场景。研究焦点也从早期的小规模语料库和网络文本数据集处理,发展到多模态一体化的处理架构和研究范式。与此同时,以OpenA... 详细信息

随着深度学习和大模型技术的不断增强,人工智能技术从研究简单、封闭的虚拟场景,发展到研究更为复杂、开放的现实场景。研究焦点也从早期的小规模语料库和网络文本数据集处理,发展到多模态一体化的处理架构和研究范式。与此同时,以OpenAI Sora为代表的物理世界近似和仿真模型的出现,标志着人工智能再次向通用人工智能迈进了一步。然而,若要让人工智能真正达到通用人工智能的标准,成为类人的智能,需要当今的人工智能体具备与物理世界交互学习的能力,即具身智能。因此,本文主要关注具身智能的研究内容和进展,具体包括具身感知、具身认知和具身行为优化3个方面。同时结合近期人形机器人的发展,概述具身智能技术在人形机器人等载体上的应用,并对未来的研究及应用进行展望。

关键词：具身智能具身感知具身认知具身行为优化深度学习人工智能仿真环境人形机器人

来源：评论

学校读者我要写书评

暂无评论

基于时序图模式匹配的航天器故障诊断算法

引用

宇航学报 2025年第2期46卷 262-271页

作者：罗瑞欣刘显敏高宇鹏梁寒玉张妍哈尔滨工业大学计算学部哈尔滨150001 北京控制工程研究所北京100094

故障诊断是支撑航天器在轨健康运行的有效手段,其主要任务是检测故障并判断其发生的具体位置和原因。由于结构复杂、工作环境极端等原因,航天器在轨监测数据与实际故障间关系难以获取,仅通过数据分析来实现故障诊断的方案可行性很低。... 详细信息

故障诊断是支撑航天器在轨健康运行的有效手段,其主要任务是检测故障并判断其发生的具体位置和原因。由于结构复杂、工作环境极端等原因,航天器在轨监测数据与实际故障间关系难以获取,仅通过数据分析来实现故障诊断的方案可行性很低。对于同时利用知识图谱和监测数据共同完成故障诊断的思路,现有研究工作大都未考虑故障与一段时间内数据异常模式间的关系。为解决上述问题,提出了基于时序图模式匹配的航天器故障诊断算法,利用时序图表示连续时间片段内数据异常间的时序关系,支持描述更精细且更稳定的异常模式,使新算法实现更精准且更高效的航天器故障诊断。在航天数据上的实验结果表明,新算法具有更高的故障诊断精度,且时间代价较低。

关键词：异常模式故障诊断时序关系航天器

来源：评论

学校读者我要写书评

暂无评论

自然语言处理研究综述

引用

新疆师范大学学报（哲学社会科学版） 2025年第2期46卷 89-111,F0002页

作者：赵铁军许木璠陈安东哈尔滨工业大学计算学部黑龙江哈尔滨150001

近年来,自然语言处理因在分析与建模人类语言任务领域取得诸多成果而备受关注。当前,大规模预训练语言模型展现出强大的对话问答和文本生成能力,带来自然语言处理研究的新一轮热潮。自然语言处理在机器翻译、文本摘要、信息抽取等领域... 详细信息

近年来,自然语言处理因在分析与建模人类语言任务领域取得诸多成果而备受关注。当前,大规模预训练语言模型展现出强大的对话问答和文本生成能力,带来自然语言处理研究的新一轮热潮。自然语言处理在机器翻译、文本摘要、信息抽取等领域应用广泛。文本首先讨论自然语言处理针对语言学四个不同层次文本信息的分析手段,对自然语言处理的基本任务组成进行概述;其次,讨论自然语言处理在具体下游任务中的应用现状,包括自然语言处理在具体任务中的应用历史、当前的研究趋势以及面临的挑战;最后,在大规模预训练语言模型研究对数据集提出更高要求的背景下,对自然语言处理领域已有的数据集及评测基准集等进行讨论。

关键词：自然语言处理句法分析语义分析机器翻译问答系统信息抽取

来源：评论

学校读者我要写书评

暂无评论

面向LoongArch边界检查访存指令的GCC优化

引用

计算机研究与发展 2025年第5期62卷 1136-1150页

作者：舒燕君郑翔宇徐成华黄沛王永琪周凡张展左德承哈尔滨工业大学计算学部哈尔滨150001 龙芯中科技术股份有限公司北京100095 中国科学技术大学计算机科学与技术学院合肥230026

为了减少内存安全检查的开销,LoongArch指令集架构引入了边界检查访存类指令.然而,作为一种新的内存访问指令,目前GCC(GNU compiler collection)编译器不支持该类指令,LoongArch硬件能力不能得到充分利用.针对此LoongArch边界检查访存... 详细信息

为了减少内存安全检查的开销,LoongArch指令集架构引入了边界检查访存类指令.然而,作为一种新的内存访问指令,目前GCC(GNU compiler collection)编译器不支持该类指令,LoongArch硬件能力不能得到充分利用.针对此LoongArch边界检查访存指令改进了GCC编译器,实现利用该类指令优化程序的内存安全检查.具体而言,完成了3个方面的工作:1)设计实现了针对边界检查访存指令的内建函数;2)改进GCC RTL(register transfer language)阶段的优化器,使其能够识别无异常处理和带异常处理2种情况的边界检查访存语义,并自动优化;3)面向LoongArch边界检查访存指令触发的边界检查异常(bound check exception,BCE),设计了新的Linux内核异常信号SIGBCE和相应的运行时库glibc(GNU C library)的信号处理函数,实现了BCE处理.通过在GCC 12.2.0和龙芯3C5000L服务器进行实验,验证了改进后的编译器不仅能正确使用新引入的边界检查访存指令,而且在某些安全函数中带来接近20%的性能提升.完善了LoongArch生态,推进了LoongArch指令集发展,对此类特定指令编译器优化工作有一定的借鉴意义.

关键词：编译器优化 LoongArch GCC 边界检查访存龙芯CPU 异常处理内存安全

来源：评论

学校读者我要写书评

暂无评论

自适应的流水线式无监督问题生成方法

引用

计算机研究与发展 2025年第4期62卷 905-914页

作者：李昆泽张宇哈尔滨工业大学社会计算与交互机器人研究中心哈尔滨150001

在传统的问答任务中,模型一般需要大量的数据进行训练,而标注这些数据需要较多的时间和人力成本.无监督问题生成是解决问答任务训练数据匮乏的一种有效方法,但是目前使用该方法生成的问题存在难以回答、种类单一、语义不明等问题.针对... 详细信息

在传统的问答任务中,模型一般需要大量的数据进行训练,而标注这些数据需要较多的时间和人力成本.无监督问题生成是解决问答任务训练数据匮乏的一种有效方法,但是目前使用该方法生成的问题存在难以回答、种类单一、语义不明等问题.针对这些问题,提出了一个自适应的多模块流水线式模型ADVICE,多个模块分别从问题可回答性、问题多样性和语法规范性对现有方法进行改进.在问题可回答性模块中,使用了共指消解和命名实体识别技术来提升问题的可回答性.在问题多样性模块中,针对不同提问方式的问题设计了不同的规则来提升问题类型多样性与答案类型多样性.在语法规范性模块中,基于T5训练了一个针对问句的语法错误纠正模型,并设计了一个筛选模块对纠正后的问答数据进行过滤.最后,训练了一个分类器自动选择所需要的模块.实验表明,使用改进后的问题生成方法,下游的问答模型在SQuAD数据集上的EM值平均提升了2.9个百分点,F1值平均提升了4.4个百分点.

关键词：无监督学习问题生成预训练模型深度学习自然语言处理

来源：评论

学校读者我要写书评

暂无评论

面向情感语义不一致的多模态情感分析方法

引用

计算机研究与发展 2025年第2期62卷 374-382页

作者：罗渊贻吴锐刘家锋唐降龙哈尔滨工业大学计算机科学与技术学院哈尔滨150006

多模态情感分析是利用多种模式的主观信息对情感进行分析判断的一种多模态任务.情感表达具有主观性,在某些场景下不同模态的情感表达不一致,甚至存在相悖的情况,这会削弱多模态协同决策的效果.针对不同模态间情感语义不一致的问题,提出... 详细信息

多模态情感分析是利用多种模式的主观信息对情感进行分析判断的一种多模态任务.情感表达具有主观性,在某些场景下不同模态的情感表达不一致,甚至存在相悖的情况,这会削弱多模态协同决策的效果.针对不同模态间情感语义不一致的问题,提出一种多模态学习方法,学习情感语义表达一致的模态特征表示.为了在不影响模态原始信息的同时,提高各模态的共性特征表达并增加模态间的动态交互,首先学习每个模态的共性特征表示,然后利用交叉注意力使单个模态能有效从其余模态的共性特征表示中获取辅助信息.在模态融合模块,以软注意力机制为基础提出模态注意力,对情感语义表达一致的各模态特征表示进行加权连接,以增大强模态的表达,抑制弱模态对任务的影响.提出的模型在情感分析数据集MOSI,MOSEI,CH-SIMS上的实验结果均优于对比模型,表明在多模态情感分析任务中考虑情感语义不一致问题的必要性与合理性.

关键词：多模态情感分析共性特征情感语义不一致注意力机制

来源：评论

学校读者我要写书评

暂无评论

胍基荧光碳点的制备及其抗菌性能

引用

发光学报 2025年第1期46卷 174-184页

作者：姜姗杉李传恩陈策何明月李枢衡李雪婷哈尔滨工业大学生命科学和医学学部黑龙江哈尔滨150000

报道了一种表面具有胍基的荧光碳点,该碳点具有优良的发光特性和生物安全性,可有效抑制大肠杆菌和金黄色葡萄球菌。本文以缩二胍盐酸盐、二硫代二苯甲酸和乙酸为原材料,通过水热法合成了一种在固态和液态下都具有荧光特性的缩二胍碳点(B... 详细信息

报道了一种表面具有胍基的荧光碳点,该碳点具有优良的发光特性和生物安全性,可有效抑制大肠杆菌和金黄色葡萄球菌。本文以缩二胍盐酸盐、二硫代二苯甲酸和乙酸为原材料,通过水热法合成了一种在固态和液态下都具有荧光特性的缩二胍碳点(BHCDs)。高分辨透射电镜表明碳点的平均晶粒为2.24 nm,其最强发射波长为420 nm,且随着激发波长的增加而红移。根据X射线光电子能谱(XPS)和傅里叶红外光谱(FTIR)推测BHCDs表面有胍基存在。生物学成像实验显示,BHCDs进入斑马鱼体内呈现蓝色荧光,且96 h内可完全代谢出体外,结合其他毒理学实验表明了BHCDs良好的生物安全性。BHCDs能够有效抑制大肠杆菌和金黄色葡萄球菌的生长。在对其抗菌机制进行探索的过程中,发现BHCDs具有螯合Fe^(3+)和Cu^(2+)的能力。进一步通过对比其他胍基碳点发现,几种具有Fe^(3+)螯合能力的碳点均能有效抑制大肠杆菌,而具有Cu^(2+)螯合能力的聚六亚甲基双胍碳点、聚氨丙基双胍碳点和二甲基胍碳点还可有效抑制金黄色葡萄球菌,而不具有Cu^(2+)螯合能力的甲基胍碳点则不具备抑制金黄色葡萄球菌的能力。推测BHCDs的抗金黄色葡萄球菌能力可能与Cu^(2+)螯合有关。本研究制备的BHCDs具有良好的生物安全性和抗菌特性,为开发新型抗菌药物提供了重要参考,并为揭示其抗菌原理奠定了理论依据。

关键词：碳点缩二胍抗菌金属螯合

来源：评论

学校读者我要写书评

暂无评论

基于精准知识筛选及知识协同生成的农业大语言模型

引用

智慧农业(中英文) 2025年第1期7卷 20-32页

作者：姜京池闫莲刘劼哈尔滨工业大学计算学部黑龙江哈尔滨150001 智慧农场技术与系统全国重点实验室黑龙江哈尔滨150001

[目的/意义]大语言模型(Large Language Models,LLMs)依托其强大的认知理解和内容生成能力,发展迅速,有望成为智慧农业领域一种全新的研究范式。然而,由于通用LLMs缺乏农业领域知识,对于专业性问题通常会产生事实性错误或信息不完备的... 详细信息

[目的/意义]大语言模型(Large Language Models,LLMs)依托其强大的认知理解和内容生成能力,发展迅速,有望成为智慧农业领域一种全新的研究范式。然而,由于通用LLMs缺乏农业领域知识,对于专业性问题通常会产生事实性错误或信息不完备的回复。为提升大模型在农业领域的适应性,本研究提出了一种知识图谱引导的农业LLMs--KGLLM。[方法]该模型基于信息熵实现知识过滤,并在解码阶段显式利用知识图谱的语义信息约束其内容生成。具体而言,将输入问题中的关键实体链接到农业知识图谱,形成知识推理路径和问答依据。为保证此外源知识的有效性,进一步评估引入每条知识前后模型输出内容的熵差,对无法提升答案确定性的知识进行过滤。经筛选的知识路径将被用于调整词表概率,以增加与知识高度相关词的输出,实现知识图谱对LLMs的显式引导。[结果和讨论]本研究在5种主流的通用LLMs上实现了农业知识图谱引导技术,包括Baichuan、ChatGLM、Qwen等开源大模型,同时与最优的知识图谱检索增强生成技术进行了对比。实验结果表明,本研究提出的方法在内容流畅性、准确性、真实性和领域忠诚度方面都有显著提升,相较于GPT-4o,在Mean BLEU、ROUGE、BertScore上分别平均提升了2.5923、2.8151和9.84%。通过消融实验亦证明了知识引导的农业LLMs不仅实现了冗余知识过滤,而且在解码过程中可有效调整词表输出分布,有助于提升通用LLMs在农业领域的适应性及问答的可解释性。[结论]本研究为后续农业LLMs的构建提供了可借鉴思路,表明知识图谱引导的方法在提升模型的领域适应性和回答质量具有潜在的应用价值。

关键词：知识图谱农业大语言模型信息熵语义相似度知识引导

来源：评论

学校读者我要写书评

暂无评论

基于大规模人群变异的中国人参考基因组构建方法

引用

生物信息学 2025年第02期 88-95页

作者：吕俊增曹舒淇姜涛哈尔滨工业大学计算学部哈尔滨工业大学郑州研究院

基因组变异作为生物遗传多样性产生的核心，对解析生命演化、揭示物种内个体差异、探究疾病机制等方面有重要影响，而参考基因组作为遗传研究中的参考框架，其序列表征能力会直接影响遗传变异的准确识别。当前广泛应用的人类参考基因组... 详细信息

基因组变异作为生物遗传多样性产生的核心，对解析生命演化、揭示物种内个体差异、探究疾病机制等方面有重要影响，而参考基因组作为遗传研究中的参考框架，其序列表征能力会直接影响遗传变异的准确识别。当前广泛应用的人类参考基因组主要由西方人群样本组成，对中国人群特异性遗传变异解析能力不足，亟需构建有中国人遗传特性的新参考基因组，以促进对中国人群遗传和进化机制的深入研究。本研究提出一种基于人群基因组变异的参考基因组改造方法，利用单核苷酸变异(SNV)、短插入删除变异(Indel)以及结构变异(SV)三种类型的东亚人群变异数据对GRCh38版本人类参考基因组进行改造，经过多层筛选、修订，建立了一系列包含不同变异频率、变异类型的中国人参考基因组。通过选取不同地域的中国人样本测序数据对所改造的中国人参考基因组进行序列比对测试，选取变异频率超过2/3,1/2,1/2的东亚人SV,Indel和SNV变异改造GRCh38参考基因组时分别获得了最佳比对效果。最终整合上述对应变异频率下的全部变异改造参考基因组时，得到了最优的中国人参考基因组。本研究所建立的中国人参考基因组将有望提升大规模中国人群基因组变异识别的能力，为后续中国人参考基因组构建工作提供有效方法。方法详见：https://***/azheasir/Chinese-specific-reference-genome-construction。

关键词：大规模人群参考基因组基因组序列比对

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：