检索结果-内蒙古大学图书馆

北京航空航天大学学报 2025年第2期51卷 428-439页

作者：朱晓庆王涛阮晓钢陈江涛南博睿毕兰越北京工业大学信息学部北京100124 北京工业大学计算智能与智能系统北京市重点实验室北京100124

以柔性动作评价(SAC)为代表的强化学习算法在机器人复现高等动物的运动技能中已取得成功,该框架将策略搜索和状态动作价值函数相结合。但智能体使用策略探索是贪婪的,评价网络估算的Q值函数却使用低估值。为使智能体采取更好的策略,将... 详细信息

以柔性动作评价(SAC)为代表的强化学习算法在机器人复现高等动物的运动技能中已取得成功,该框架将策略搜索和状态动作价值函数相结合。但智能体使用策略探索是贪婪的,评价网络估算的Q值函数却使用低估值。为使智能体采取更好的策略,将策略蒸馏(PD)与SAC算法相融合,提出一种PD柔性动作评价(PDSAC)算法,该算法让智能体使用混合策略进行探索,使强化学习得到的奖励函数收敛速度加快。为验证PDSAC算法的有效性,理论证明该算法能提升策略的探索效率,并在四足机器人步态学习任务中进行了验证。仿真实验结果表明:相比SAC算法,PDSAC算法在步态学习任务中可以使奖励函数值提高26.7%,同时收敛速度提升40%。

关键词：强化学习策略蒸馏混合策略好奇心探索策略步态学习

来源：评论

学校读者我要写书评

暂无评论

基于自适应鲁棒模糊神经网络的MBR膜透水率软测量

引用

控制与决策 2025年第2期40卷 665-674页

作者：张祎邢刘峥韩红桂北京工业大学信息学部北京100124 计算智能与智能系统北京市重点实验室北京100124

针对膜生物反应器(MBR)污水处理工艺易受到进水水量、水质波动等外部干扰因素的影响导致膜透水率难以准确测量的问题,提出一种基于自适应鲁棒模糊神经网络(ARFNN)的膜透水率软测量模型.首先,构建一种对称抗噪损失函数,降低了模型对外部... 详细信息

针对膜生物反应器(MBR)污水处理工艺易受到进水水量、水质波动等外部干扰因素的影响导致膜透水率难以准确测量的问题,提出一种基于自适应鲁棒模糊神经网络(ARFNN)的膜透水率软测量模型.首先,构建一种对称抗噪损失函数,降低了模型对外部干扰的敏感度,提高了软测量模型的鲁棒性;然后,设计一种自适应梯度下降算法,动态优化模型参数,提升了软测量模型的检测精度;最后,利用李雅普诺夫函数验证了ARFNN的收敛性,分析了模型的鲁棒性,保证了模型的收敛速度和抗干扰能力.将所设计的基于ARFNN的膜透水率软测量模型应用于实际的污水处理过程中,实验结果表明,在有外部干扰的情况下,该模型不但能够实现膜透水率的在线检测,而且可以获得较高的检测精度.

关键词：模糊神经网络膜生物反应器膜透水率鲁棒性软测量梯度下降

来源：评论

学校读者我要写书评

暂无评论

近端策略优化的城市环境多智能体协作对抗方法

引用

通信学报 2025年第3期46卷 94-108页

作者：米广铭张辉张菁卓力北京工业大学信息科学技术学院北京100124 北京工业大学计算智能与智能系统北京市重点实验室北京100124

城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法... 详细信息

城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法进行求解;其次,针对多对一的评论网络采用嵌入方法来解决空间维度不同的异构智能体决策评价问题;再次,在近端策略优化的基础上,增加了自适应采样来辅助策略的更新;最后,对演员网络进行权重继承操作以帮助智能体迅速接管相应的任务。实验结果表明,相较于其他方法,所提方法的奖励回报提高了22.67%,收敛速度加快了8.14%,不仅可以满足城市环境下多个智能体协作对抗的决策,还能够兼容多异构智能体的协作对抗。

关键词：深度强化学习多智能体协作对抗近端策略优化城市环境

来源：评论

学校读者我要写书评

暂无评论

基于权重偏置图注意网络的复杂场景中物体位置关系推理方法

引用

计算机学报 2025年第3期48卷 572-585页

作者：左国玉王子豪赵敏于双悦北京工业大学信息科学技术学院北京100124 计算智能与智能系统北京市重点实验室北京100124

在复杂环境中安全抓取目标物体对于机器人技术至关重要,这要求机器人能够准确理解目标物体与周围其他物体之间的空间位置关系。尽管卷积神经网络在关系推理方面展现出一定的潜力,但由于其主要关注像素级信息提取,导致对全局信息的理解不... 详细信息

在复杂环境中安全抓取目标物体对于机器人技术至关重要,这要求机器人能够准确理解目标物体与周围其他物体之间的空间位置关系。尽管卷积神经网络在关系推理方面展现出一定的潜力,但由于其主要关注像素级信息提取,导致对全局信息的理解不足,并忽略了关键的物体关系,从而限制了推理的准确性。为了解决这一问题,本文提出了一种基于端到端图注意网络的关系推理模型,旨在提升推理物体位置关系的准确性。该模型首先采用EfficientNet-B0与双向特征金字塔网络(BiFPN)进行RGB特征提取。其次,在构建图结构时,通过过滤缺乏上下位置关系的物体对,使图结构更加稀疏,从而降低计算负担。随后,利用带权重偏置的图注意网络来预测物体之间的位置关系。在视觉操纵关系数据集(VMRD)上对所提模型进行了训练和评估。结果显示,该模型在关系推理的图像准确率(IA)指标上达到了71.1%。此外,采用梯度加权类激活映射(Grad-CAM)进行了注意力可视化,进一步验证了模型在多物体无序堆叠场景中推断空间位置关系的有效性,使其适用于真实的机械臂抓取应用。最后,通过在实验室环境中对常见物体进行测试,成功地将模型应用于真实世界的机械臂抓取场景,证明了该模型在实际环境中的通用性和实用性。

关键词：复杂场景关系推理 BiFPN 图注意网络抓取顺序

来源：评论

学校读者我要写书评

暂无评论

不依赖初始容许控制的非对称约束零和博弈智能评判设计

引用

控制与决策 2025年第4期40卷 1347-1356页

作者：李梦花王鼎赵明明乔俊飞北京工业大学信息科学技术学院北京100124 北京工业大学计算智能与智能系统北京市重点实验室北京100124 北京工业大学智慧环保北京实验室北京100124 北京工业大学北京人工智能研究院北京100124

利用自适应评判控制方法研究具有非对称约束的连续时间零和博弈问题.首先,建立一种新颖的非二次型函数处理非对称约束问题,以降低对控制矩阵的限制.其次,推导最优控制、最坏扰动,以及Hamilton-Jacobi-Isaacs方程.然后,建立一种自适应评... 详细信息

利用自适应评判控制方法研究具有非对称约束的连续时间零和博弈问题.首先,建立一种新颖的非二次型函数处理非对称约束问题,以降低对控制矩阵的限制.其次,推导最优控制、最坏扰动,以及Hamilton-Jacobi-Isaacs方程.然后,建立一种自适应评判控制方法以近似最优代价函数,从而获得近似最优控制以及近似最坏扰动.针对具有非对称约束的零和博弈问题,提出一种新型评判学习准则来强化学习过程并消除对初始容许控制的依赖.此外,利用Lyapunov方法证明系统状态和评判网络权值近似误差的稳定性.最后,利用F-16战斗机和倒立摆两个实例验证所提算法的有效性.同时,给出传统学习算法下的仿真结果,进一步说明所提新型学习准则的可行性.

关键词：自适应评判设计自适应动态规划连续系统零和博弈非对称约束初始容许控制

来源：评论

学校读者我要写书评

暂无评论

基于点云处理的仿人机器人楼梯障碍物识别与剔除方法

引用

工程科学学报 2025年第2期47卷 339-350页

作者：于乃功谢秋生李洪政北京工业大学信息科学技术学院北京100124 北京市计算智能与智能系统重点实验室北京100124 教育部数字社区工程研究中心北京100124

环境感知对于仿人机器人自主导航和运动规划具有重要研究意义,是实现仿人机器人在复杂环境中进行自主移动进而完成特定任务的基础.在特殊的楼梯场景中仿人机器人环境感知过程面临诸多挑战,楼梯障碍物会破坏阶梯平面特征,导致仿人机器人... 详细信息

环境感知对于仿人机器人自主导航和运动规划具有重要研究意义,是实现仿人机器人在复杂环境中进行自主移动进而完成特定任务的基础.在特殊的楼梯场景中仿人机器人环境感知过程面临诸多挑战,楼梯障碍物会破坏阶梯平面特征,导致仿人机器人获取不准确的楼梯参数而出现踏空、摔跤等问题.本文结合区域生长和平面构造方法识别和剔除楼梯障碍物点云,基于剔除障碍物后的楼梯进行三维参数估计.首先利用相邻点的投影之和最小原理准确完成对楼梯水平面的提取;其次根据区域生长算法判定楼梯障碍物聚类情况,构造平面并分析平面内点数以完成对障碍物点云的快速识别与剔除工作;最后对有障碍物楼梯与剔除障碍物楼梯进行楼梯三维感知实验.实验结果表明,本文剔除楼梯障碍物的平均精度为92.43%,且剔除后的楼梯参数感知误差仅为有障碍物时的0.5倍.总体表明所提算法能提高机器人在复杂楼梯环境中的楼梯参数估计精度,能够有效提高仿人机器人在复杂楼梯环境下的感知能力.

关键词：仿人机器人复杂环境感知楼梯区域生长参数估计

来源：评论

学校读者我要写书评

暂无评论

迁移增量启发式动态规划及污水处理应用

引用

北京工业大学学报 2025年第3期51卷 277-283页

作者：王鼎李鑫北京工业大学信息学部北京100124 计算智能与智能系统北京市重点实验室北京100124 智慧环保北京实验室北京100124 北京人工智能研究院北京100124

针对污水处理系统中的溶解氧(dissolved oxygen,DO)质量浓度控制问题,提出一种迁移增量启发式动态规划(transferable incremental heuristic dynamic programming,TI-HDP)算法。针对污水处理过程的特性,该算法通过将控制变量的更新方式... 详细信息

针对污水处理系统中的溶解氧(dissolved oxygen,DO)质量浓度控制问题,提出一种迁移增量启发式动态规划(transferable incremental heuristic dynamic programming,TI-HDP)算法。针对污水处理过程的特性,该算法通过将控制变量的更新方式改进为增量形式,提升了算法的抗干扰能力,并弱化了与增量式比例-积分-微分(proportional-integral-derivative,PID)算法之间的结构差异。基于数据驱动的思想,通过利用PID算法所产生的历史数据,成功地将传统控制领域中的专家经验迁移到TI-HDP算法框架中,保证了TI-HDP算法前期控制策略的稳定性。仿真结果表明:与PID算法和传统的启发式动态规划算法相比,所提算法对DO质量浓度具有更高的控制精度。

关键词：启发式动态规划(heuristic dynamic programming,HDP) 智能控制知识迁移非线性系统神经网络污水处理

来源：评论

学校读者我要写书评

暂无评论

基于生理电信号的自动睡眠分期算法综述

引用

北京工业大学学报 2025年第4期51卷 435-451页

作者：金峥贾克斌北京工业大学信息科学技术学院北京100124 先进信息网络北京实验室北京100124 计算智能与智能系统北京市重点实验室北京100124

基于生理电信号的睡眠分期是监测睡眠过程和诊疗睡眠疾病的重要前提,针对人工睡眠分期方法存在耗时久、效率低、具有主观性等问题,近年来自动睡眠分期方法凭借高效性和准确性受到研究者的关注。因此,从算法设计的角度针对近6年的自动睡... 详细信息

基于生理电信号的睡眠分期是监测睡眠过程和诊疗睡眠疾病的重要前提,针对人工睡眠分期方法存在耗时久、效率低、具有主观性等问题,近年来自动睡眠分期方法凭借高效性和准确性受到研究者的关注。因此,从算法设计的角度针对近6年的自动睡眠分期算法进行综述,分为传统机器学习和深度学习两大类,并对2个类别按照单通道与多通道生理电信号2种输入方式,从模型算法、信号类型、分期性能方面进行归纳总结。通过对比可知:单通道信号输入降低了信号采集成本,更适用于家庭睡眠监测,而多通道信号输入贴合分期准则,更适用于临床睡眠分析;深度学习类算法相较于传统机器学习类算法更具有研究前景,其可利用深度神经网络自动学习信号内在表征,在高效处理大规模数据的同时提供较好的分期性能。深度学习方法未来的研究重点应该从模型设计的角度转变为提升模型可解释性和泛化性,从而推动深度神经网络在睡眠医学领域中的应用。

关键词：睡眠医学生理电信号自动睡眠分期机器学习深度学习深度神经网络

来源：评论

学校读者我要写书评

暂无评论

基于注意力-残差双特征流卷积神经网络的深度图帧内编码单元快速划分算法

引用

北京工业大学学报 2025年第5期51卷 539-551页

作者：贾克斌吴岳珩北京工业大学信息学部北京100124 先进信息网络北京实验室北京100124 北京工业大学计算智能与智能系统北京市重点实验室北京100124

针对三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC)深度图编码单元(coding unit,CU)划分复杂度高的问题,提出一种基于卷积神经网络(convolutional neural networks,CNN)的算法来实现快速深度图帧内编码。首先,提出一种具有3个分支的注意力-残差双特征流卷积神经网络(attention-residual bi-feature stream convolutional neural networks,ARBS-CNN)模型,其中基于残差模块(residual module,RM)和特征蒸馏(feature distill,FD)模块的2个分支用于提取全局图像特征,基于动态模块(dynamic module,DM)和卷积-卷积块注意力模块(convolutional-convolutional block attention module,Conv-CBAM)的分支用于提取局部图像特征;然后,将提取到的特征进行整合并输出,得到对深度图CU划分结构的预测;最后,将ARBS-CNN嵌入到3D-HEVC测试平台中,利用预测结果加速深度图帧内编码。与原始算法相比,提出的算法能在维持率失真性能几乎不受影响的条件下,平均减少74.2%的编码时间。实验结果表明,该算法能够在保持率失真性能的条件下,有效降低3D-HEVC的编码复杂度。

关键词：三维高效视频编码(three-dimensional high efficiency video coding,3D-HEVC) 深度图卷积神经网络(convolutional neural networks,CNN) 编码单元(coding unit,CU)划分帧内编码双特征流

来源：评论

学校读者我要写书评

暂无评论

基于多模态生理信号特征融合的情绪识别方法研究

引用

生物医学工程学杂志 2025年第1期42卷 17-23页

作者：张志雯于乃功边琰闫金涵北京工业大学信息科学技术学院北京100124 北京市计算智能与智能系统重点实验室北京100124 天津职业技术师范大学自动化与电气工程学院天津300222 天津市信息传感与智能控制重点实验室天津300222

情绪分类识别是情感计算的关键领域,脑电等生理信号可精准反映情绪且难以伪装。现阶段,情绪识别在单模态信号特征提取和多模态信号整合方面存在局限。本研究收集了高兴、悲伤、恐惧情绪下的脑电(EEG)、肌电(EMG)、皮电(EDA)信号,采用基... 详细信息

情绪分类识别是情感计算的关键领域,脑电等生理信号可精准反映情绪且难以伪装。现阶段,情绪识别在单模态信号特征提取和多模态信号整合方面存在局限。本研究收集了高兴、悲伤、恐惧情绪下的脑电(EEG)、肌电(EMG)、皮电(EDA)信号,采用基于特征权重融合的方法进行特种融合并用支持向量机(SVM)和极限学习机(ELM)进行分类。结果表明,融合权重为EEG 0.7、EMG 0.15、EDA 0.15时分类最准确,准确率SVM为80.19%,ELM为82.48%,比单独脑电信号分别提升了5.81%和2.95%。此研究为多模态生理信号情绪分类识别提供了方法支持。

关键词：情绪多模态特征融合脑电肌电皮电

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：