检索结果-内蒙古大学图书馆

计算机研究与发展 2025年第2期62卷 346-363页

作者：刘乐郭晟楠靳希源赵苗苗陈冉林友芳万怀宇北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044

交通数据缺失是智能交通系统无法避免的问题之一,对缺失值进行补全和不确定性量化能提高智能交通系统中交通数据挖掘相关任务的精度和可靠性.然而,目前大多数交通数据插补模型都只能针对缺失值给出点估计,无法量化不确定性,难以满足交... 详细信息

交通数据缺失是智能交通系统无法避免的问题之一,对缺失值进行补全和不确定性量化能提高智能交通系统中交通数据挖掘相关任务的精度和可靠性.然而,目前大多数交通数据插补模型都只能针对缺失值给出点估计,无法量化不确定性,难以满足交通领域对数据可靠性的要求.而且,现有方法将重点放在了建模交通数据的时空相关性上,却未能在捕获时空相关性的过程中考虑缺失值的影响.此外,交通数据的不确定性同时受到时间、空间位置以及数据自身状态的影响,但是现有方法无法全面考虑这些因素的影响.为了解决这些问题,提出了一种时空不确定性指导的交通数据插补模型(spatial-temporal uncertainty guided traffic data imputation network,STUIN),以自监督训练的方式实现了时空交通数据的插补和对插补结果的不确定性量化.具体来说,创新地将神经网络的隐状态建模成服从高斯分布的随机变量,借助方差建模隐状态的不确定性,利用基于方差的注意力机制描述不确定性对时空相关性建模的影响;此外,设计了一个新颖的时空不确定性初始化模块,在初始化均值和方差时同时考虑了时间、空间和数据缺失状况多种因素的影响.在2个交通流量数据集上的实验结果表明STUIN在数据插补和不确定性量化上都达到了最先进的性能.

关键词：交通数据插补不确定性量化基于方差的注意力机制时空数据挖掘时空图数据

来源：评论

学校读者我要写书评

暂无评论

基于多样真实任务生成的鲁棒小样本分类方法

引用

软件学报 2024年第4期35卷 1587-1600页

作者：刘鑫景丽萍于剑交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044 北京交通大学计算机与信息技术学院北京100044

随着大数据、计算机与互联网等技术的不断进步,以机器学习和深度学习为代表的人工智能技术取得了巨大成功,尤其是最近不断涌现的各种大模型,极大地加速了人工智能技术在各个领域的应用.但这些技术的成功离不开海量训练数据和充足的计算... 详细信息

随着大数据、计算机与互联网等技术的不断进步,以机器学习和深度学习为代表的人工智能技术取得了巨大成功,尤其是最近不断涌现的各种大模型,极大地加速了人工智能技术在各个领域的应用.但这些技术的成功离不开海量训练数据和充足的计算资源,大大限制了这些方法在一些数据或计算资源匮乏领域的应用.因此,如何利用少量样本进行学习,也就是小样本学习成为以人工智能技术引领新一轮产业变革中一个十分重要的研究问题.小样本学习中最常用的方法是基于元学习的方法,这类方法通过在一系列相似的训练任务上学习解决这类任务的元知识,在新的测试任务上利用元知识可以进行快速学习.虽然这类方法在小样本分类任务上取得了不错的效果,但是这类方法的一个潜在假设是训练任务和测试任务来自同一分布.这意味着训练任务需要足够多才能使模型学到的元知识泛化到不断变化的测试任务中.但是在一些真正数据匮乏的应用场景,训练任务的数量也是难以保证的.为此,提出一种基于多样真实任务生成的鲁棒小样本分类方法(DATG).该方法通过对已有少量任务进行Mixup,可以生成更多的训练任务帮助模型进行学习.通过约束生成任务的多样性和真实性,该方法可以有效提高小样本分类方法的泛化性.具体来说,先对训练集中的基类进行聚类得到不同的簇,然后从不同的簇中选取任务进行Mixup以增加生成任务的多样性.此外,簇间任务Mixup策略可以减轻学习到与类别高度相关的伪判别特征.同时,为了避免生成的任务与真实分布太偏离,误导模型学习,通过最小化生成任务与真实任务之间的最大均值差异(MMD)来保证生成任务的真实性.最后,从理论上分析了为什么基于簇间任务Mixup的策略可以提高模型的泛化性能.多个数据集上的实验结果进一步证明了所提出的基于多样性和真实性任务扩充方法的有效性.

关键词：小样本学习元学习任务Mixup 多样性真实性

来源：评论

学校读者我要写书评

暂无评论

基于工人长短期时空偏好的众包任务分配

引用

软件学报 2024年第10期35卷 4710-4728页

作者：王府鑫王宁曾奇雄北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044

近年来,随着移动设备的计算能力和感知能力的提高,基于位置信息的时空众包应运而生,任务分配效果的提升面临许多挑战,其中之一便是如何给工人分配他们真正感兴趣的任务.现有的研究方法只关注工人的时间偏好而忽略了空间因素对偏好的影响... 详细信息

近年来,随着移动设备的计算能力和感知能力的提高,基于位置信息的时空众包应运而生,任务分配效果的提升面临许多挑战,其中之一便是如何给工人分配他们真正感兴趣的任务.现有的研究方法只关注工人的时间偏好而忽略了空间因素对偏好的影响,仅关注长期偏好却忽略了短期偏好,同时面临历史数据稀疏导致的预测不准的问题.研究基于长短期时空偏好的任务分配问题,从长期和短期两个角度以及时间和空间两个维度全面考虑工人的偏好,进行时空众包任务分配,提高任务的成功分配率和完成效率.为提升时空偏好预测的准确性,提出分片填充的张量分解算法(SICTD)减小偏好张量的空缺值占比,提出时空约束下的ST-HITS算法,综合考虑工人短期活跃范围,计算短期时空偏好.为了在众包任务分配中最大化任务总收益和工人偏好,设计基于时空偏好的贪心与Kuhn-Munkres(KM)算法,优化任务分配的结果.在真实数据集上的大量实验结果表明,提出的分片填补张量分解算法对时间和空间偏好的RMSE预测误差较基线算法分别下降22.55%和24.17%;在任务分配方面,提出的基于偏好的KM算法表现出色,对比基线算法,在工人总收益和工人完成任务平均偏好值上分别提升40.86%和22.40%.

关键词：时空众包任务分配张量分解偏好预测

来源：评论

学校读者我要写书评

暂无评论

基于标签感知变分自编码器的多标签分类

引用

计算机科学与探索 2025年第3期19卷 714-723页

作者：孙宏健徐鹏宇刘冰景丽萍于剑北京交通大学计算机与信息技术学院北京100044 北京交通大学交通数据分析与挖掘北京市重点实验室北京100044

随着互联网的兴起,各式各样的数据急速增长,如何高效地利用这些样本数据成为数据挖掘领域的重要问题。多标签分类任务作为机器学习与数据挖掘领域的重要任务,旨在为样本标注多个标签类别。目前的方法大多仅对特征分支进行嵌入表示学习,... 详细信息

随着互联网的兴起,各式各样的数据急速增长,如何高效地利用这些样本数据成为数据挖掘领域的重要问题。多标签分类任务作为机器学习与数据挖掘领域的重要任务,旨在为样本标注多个标签类别。目前的方法大多仅对特征分支进行嵌入表示学习,并未考虑到特征和标签之间的语义关联性,缺乏对特征嵌入空间的有效约束,从而导致学习到的特征嵌入针对性不足。在标签相关性学习方面,现有的大多数方法主要关注低阶标签相关性,在面对复杂的实际标签场景时,多个标签之间的高阶相关性学习不足的问题变得更为突出。为解决上述问题,从嵌入表示学习和标签相关性学习出发,提出了一种基于标签感知变分自编码器的多标签分类方法。针对嵌入表示学习,提出使用特征和标签双流变分自编码器同时学习和对齐特征和标签的嵌入空间,对特征嵌入空间添加标签引导来增强特征嵌入。采用基于标签语义的交叉注意力机制,将特定标签信息加入到特征嵌入中,最终获得标签感知后的判别性特征嵌入。针对标签相关性学习,采用共享解码器中的多层自注意力机制,充分融合多个标签的相似性信息,通过不同标签间的共现交互,学习到标签高阶相关性表示并用于交叉感知特征嵌入。在四个不同领域的数据集上得到的实验结果表明,提出的方法能够有效增强特征和标签嵌入,并充分捕获标签之间高阶相关性信息用于多标签分类任务,通过与多个最先进算法在多个评价指标上进行比较分析,验证了提出的方法在性能上的显著优越性。

关键词：多标签分类嵌入空间学习变分自动编码器 Transformer 标签相关性

来源：评论

学校读者我要写书评

暂无评论

面向轨道缺陷检测的联邦学习轻量化模型训练技术研究

引用

铁道学报 2023年第4期45卷 77-83页

作者：任中伟方维维许文元李中睿胡一寒北京交通大学计算机与信息技术学院北京100044 北京交通大学交通数据分析与挖掘北京市重点实验室北京100044

轨道缺陷检测对列车的安全运行意义重大,传统依赖专业人员现场人工识别的方法存在效率低下、人力成本较高等诸多问题。但传统集中式训练方法要求共享参与方的私有数据,又带来隐私泄露、流量通信压力等问题,因此基于深度学习的检测方法... 详细信息

轨道缺陷检测对列车的安全运行意义重大,传统依赖专业人员现场人工识别的方法存在效率低下、人力成本较高等诸多问题。但传统集中式训练方法要求共享参与方的私有数据,又带来隐私泄露、流量通信压力等问题,因此基于深度学习的检测方法应运而生。近年来提出的联邦学习方法是一种分布式机器学习训练策略,通过聚合多个联邦成员本地训练的参数更新,无需共享私有数据,即可有效建立全局模型。然而,在铁路等工业场景中使用的物联网边缘设备,其计算和网络资源难以承受复杂深度模型带来的计算和通信开销。因此,提出一种轻量级边缘联邦学习算法,通过对网络模型进行通道剪枝与权值量化,降低计算、存储和通信开销,加速边缘设备上进行的联邦学习过程,最终得到精度损失在一定的可接受范围内的全局模型。通过构建轨道缺陷检测数据集,并选取ResNet-18作为目标模型,进行实验验证。结果表明,与不进行剪枝量化的原始联邦学习模型效果相比,在数据集所包含的各类缺陷上达到最高93.49%的平均鉴别准确率,同时模型大小可压缩至10.75倍,全局加速2.33倍,验证了本方法的有效性。

关键词：联邦学习缺陷检测模型压缩物联网

来源：评论

学校读者我要写书评

暂无评论

融合时序知识图谱的路段级交通事故风险预测

引用

模式识别与人工智能 2023年第8期36卷 721-732页

作者：唐伟文郭晟楠陈炜林友芳万怀宇北京交通大学计算机与信息技术学院北京100044 北京交通大学交通数据分析与挖掘北京市重点实验室北京100044

从历史交通事故数据中探究事故发生的规律,实现准确的路段级交通事故风险预测,可以有效提升交通出行的安全与效率.然而,由于天气、交通状态等多源因素的影响、交通事故之间复杂的时空相关性和事故数据的稀疏性,实现准确的路段级交通事... 详细信息

从历史交通事故数据中探究事故发生的规律,实现准确的路段级交通事故风险预测,可以有效提升交通出行的安全与效率.然而,由于天气、交通状态等多源因素的影响、交通事故之间复杂的时空相关性和事故数据的稀疏性,实现准确的路段级交通事故风险预测面临巨大的挑战.针对上述挑战,文中提出融合时序知识图谱的双层次多视角时空图神经网络模型(Two-Level and Multi-view Spatial-Temporal Graph Neural Network by Incorporating Temporal Knowledge Graph,STGN-TKG).首先,构建交通事故时序知识图谱并设计交通事故时序知识图谱历时嵌入模型,挖掘多源影响因素数据之间的动态、高阶相关性.然后,利用空间图卷积注意力模块和时序表征模块,从两个层次、多个语义视角,充分建模交通事故之间复杂的时空相关性.最后,提出符合实际场景的事故风险传播策略,缓解数据稀疏带来的零膨胀问题.在两个真实的路段级交通事故风险数据集上的实验表明,STGN-TKG在路段级事故风险预测任务中表现较优.

关键词：交通事故风险预测零膨胀问题时序知识图谱双层次多视角时空相关性

来源：评论

学校读者我要写书评

暂无评论

基于对比学习和标签挖掘的点云分割算法

引用

计算机研究与发展 2025年第1期62卷 132-143页

作者：黄华卜一凡许宏丽王晓荣北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044 轨道工程北京市重点实验室(北京交通大学) 北京100044 智慧高铁系统前沿科学中心(北京交通大学) 北京100044

基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽... 详细信息

基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽略了点云无序和稀疏特性,特征提取不够准确.对此,设计了基于对比学习和标签挖掘的点云分割模型CL2M(contrastive learning label mining),通过自注意力机制学习不同位置处点云更为精准的特征,并引入对比学习方法,提高了点云边界处的分割精度.在对比边界学习过程中通过深入挖掘语义空间中的标签并设计了基于标签分布的对比边界学习模块,使得高维空间点云标签分布包含更多的语义信息.CL2M充分利用标签的分布规律计算分布间的距离,可准确划分正负样本,减少了常规硬划分带来的累计错误.在2个公开数据集上进行的实验结果表明,CL2M在多个评价指标上优于既有的点云分割模型,验证了模型的有效性.

关键词：计算机视觉点云分割对比学习自注意力机制边界挖掘

来源：评论

学校读者我要写书评

暂无评论

基于负反馈修正的多轮对话推荐系统

引用

计算机学报 2023年第5期46卷 1086-1102页

作者：朱立玺黄晓雯赵梦媛桑基韬北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044

传统的推荐系统从交互历史中挖掘用户兴趣,面临着无法动态地获取用户实时偏好和细粒度偏好的问题,近年对话推荐系统领域的兴起为此问题提供了新的解决方案.对话推荐系统优势在于其可以动态地和用户进行交互,并在交互过程中获取用户的实... 详细信息

传统的推荐系统从交互历史中挖掘用户兴趣,面临着无法动态地获取用户实时偏好和细粒度偏好的问题,近年对话推荐系统领域的兴起为此问题提供了新的解决方案.对话推荐系统优势在于其可以动态地和用户进行交互,并在交互过程中获取用户的实时偏好,从而提高推荐系统准确率,提升用户体验.然而对话推荐系统相关研究工作中缺乏对负反馈的充分利用,难以对用户偏好表示进行细粒度的修正,即难以有效平衡用户长期偏好和实时偏好之间的关系,同时存在属性候选集过大导致交互轮次过多的问题.因此,本文基于经典的对话推荐框架CPR(Conversational Path Reasoning)提出了一种能够有效利用用户负反馈的对话推荐模型NCPR(Negative-feedback-guide Conversational Path Reasoning).不同于现有的对话推荐系统工作,NCPR能够充分利用用户在交互过程中给出的属性粒度和物品粒度的负反馈对用户的偏好表示进行动态的修正.此外,CPR将对话推荐建模为一个图上的路径推理问题,NCPR使用协同过滤算法基于属性粒度的负反馈对属性候选集进行重排序,在利用图结构的自然优势限制属性候选集大小的同时,进一步减少候选属性空间大小.四个基准数据集上的实验结果表明,NCPR在推荐准确率和平均交互轮次两个评价指标上的表现优于先进的基线模型.最后,我们设计并实现了一个网页端的对话推荐系统,与在线用户进行交互产生推荐结果,证明了NCPR在真实的对话推荐场景下的有效性.

关键词：对话推荐系统强化学习交互负反馈知识图谱协同过滤

来源：评论

学校读者我要写书评

暂无评论

基于张量计算的卷积神经网络语义表示学习

引用

计算机学报 2023年第3期46卷 568-578页

作者：杨礼吉王家祺景丽萍于剑北京交通大学计算机与信息技术学院北京100044 北京交通大学交通数据分析与挖掘北京市重点实验室北京100044

卷积神经网络已在多个领域取得了优异的性能表现,然而由于其不透明的内部状态,其可解释性依然面临很大的挑战.其中一个原因是卷积神经网络以像素级特征为输入,逐层地抽取高级别特征,然而这些高层特征依然十分抽象,人类不能直观理解.为... 详细信息

卷积神经网络已在多个领域取得了优异的性能表现,然而由于其不透明的内部状态,其可解释性依然面临很大的挑战.其中一个原因是卷积神经网络以像素级特征为输入,逐层地抽取高级别特征,然而这些高层特征依然十分抽象,人类不能直观理解.为了解决这一问题,我们需要表征出网络中隐藏的人类可理解的语义概念.本文通过预先定义语义概念数据集(例如红色、条纹、斑点、狗),得到这些语义在网络某一层的特征图,将这些特征图作为数据,训练一个张量分类器.我们将与分界面正交的张量称为语义激活张量(Semantic Activation Tensors,SATs),每个SAT都指向对应的语义概念.相对于向量分类器,张量分类器可以保留张量数据的原始结构.在卷积网络中,每个特征图中都包含了位置信息和通道信息,如果将其简单地展开成向量形式,这会破坏其结构信息,导致最终分类精度的降低.本文使用SAT与网络梯度的内积来量化语义对分类结果的重要程度,此方法称为TSAT(Testing with SATs).例如,条纹对斑马的预测结果有多大影响.本文以图像分类网络作为解释对象,数据集选取ImageNet,在ResNet50和Inceptionv3两种网络架构上进行实验验证.最终实验结果表明,本文所采用的张量分类方法相较于传统的向量分类方法,在数据维度较大或数据不易区分的情况下,分类精度有显著的提高,且分类的稳定性也更加优秀.这从而保证了本文所推导出的语义激活张量更加准确,进一步确保了后续语义概念重要性量化的准确性.

关键词：深度学习卷积神经网络语义建模张量表示支持张量机张量分类

来源：评论

学校读者我要写书评

暂无评论

基于纹理与几何解耦的说话人视频连续情感编辑模型

引用

中国科学：信息科学 2023年第12期53卷 2423-2439页

作者：吕天温玉辉孙志尧刘永进清华大学计算机科学与技术系北京100084 北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室北京100044

说话人视频的情感编辑是计算机视觉和图形学当前研究热点之一,其目的是将一段中性情感的人物说话视频转为带有目标情感的说话视频.已有的方法难以同时兼顾高清晰度情感编辑、人脸三维属性的保持以及模型对不同目标人物的适用性.为同时... 详细信息

说话人视频的情感编辑是计算机视觉和图形学当前研究热点之一,其目的是将一段中性情感的人物说话视频转为带有目标情感的说话视频.已有的方法难以同时兼顾高清晰度情感编辑、人脸三维属性的保持以及模型对不同目标人物的适用性.为同时满足上述要求,本文提出基于Basel人脸模型(Basel face model,BFM)条件的几何编辑网络作为几何情感编辑模块,保证了几何编辑在不同目标人物场景下的通用性;提出了基于人物分类器的纹理情感编辑模块,使得精细纹理的编辑可以迁移到多人任务之中,突破了以往情感编辑模型仅适用特定目标人物或适用多人模型生成质量不高的局限性.本文提出的模型可以实现连续控制情感编辑强度的效果.实验结果表明,本文提出的通用情感编辑模型在多人任务上的清晰度、人物保真度、情感编辑质量等各项指标均优于已有可适用于多人情感编辑的方法,并且在训练集中未出现的目标人物上也能实现自然的情感编辑,甚至在未见的人脸位姿的说话视频中也能获得合理的结果.

关键词：情感编辑三维重建深度学习计算机视觉神经网络

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：