检索结果-内蒙古大学图书馆

计算机研究与发展 2025年第2期62卷 346-363页

作者：刘乐郭晟楠靳希源赵苗苗陈冉林友芳万怀宇北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044

交通数据缺失是智能交通系统无法避免的问题之一,对缺失值进行补全和不确定性量化能提高智能交通系统中交通数据挖掘相关任务的精度和可靠性.然而,目前大多数交通数据插补模型都只能针对缺失值给出点估计,无法量化不确定性,难以满足交... 详细信息

交通数据缺失是智能交通系统无法避免的问题之一,对缺失值进行补全和不确定性量化能提高智能交通系统中交通数据挖掘相关任务的精度和可靠性.然而,目前大多数交通数据插补模型都只能针对缺失值给出点估计,无法量化不确定性,难以满足交通领域对数据可靠性的要求.而且,现有方法将重点放在了建模交通数据的时空相关性上,却未能在捕获时空相关性的过程中考虑缺失值的影响.此外,交通数据的不确定性同时受到时间、空间位置以及数据自身状态的影响,但是现有方法无法全面考虑这些因素的影响.为了解决这些问题,提出了一种时空不确定性指导的交通数据插补模型(spatial-temporal uncertainty guided traffic data imputation network,STUIN),以自监督训练的方式实现了时空交通数据的插补和对插补结果的不确定性量化.具体来说,创新地将神经网络的隐状态建模成服从高斯分布的随机变量,借助方差建模隐状态的不确定性,利用基于方差的注意力机制描述不确定性对时空相关性建模的影响;此外,设计了一个新颖的时空不确定性初始化模块,在初始化均值和方差时同时考虑了时间、空间和数据缺失状况多种因素的影响.在2个交通流量数据集上的实验结果表明STUIN在数据插补和不确定性量化上都达到了最先进的性能.

关键词：交通数据插补不确定性量化基于方差的注意力机制时空数据挖掘时空图数据

来源：评论

学校读者我要写书评

暂无评论

基于标签感知变分自编码器的多标签分类

引用

计算机科学与探索 2025年第3期19卷 714-723页

作者：孙宏健徐鹏宇刘冰景丽萍于剑北京交通大学计算机与信息技术学院北京100044 北京交通大学交通数据分析与挖掘北京市重点实验室北京100044

随着互联网的兴起,各式各样的数据急速增长,如何高效地利用这些样本数据成为数据挖掘领域的重要问题。多标签分类任务作为机器学习与数据挖掘领域的重要任务,旨在为样本标注多个标签类别。目前的方法大多仅对特征分支进行嵌入表示学习,... 详细信息

随着互联网的兴起,各式各样的数据急速增长,如何高效地利用这些样本数据成为数据挖掘领域的重要问题。多标签分类任务作为机器学习与数据挖掘领域的重要任务,旨在为样本标注多个标签类别。目前的方法大多仅对特征分支进行嵌入表示学习,并未考虑到特征和标签之间的语义关联性,缺乏对特征嵌入空间的有效约束,从而导致学习到的特征嵌入针对性不足。在标签相关性学习方面,现有的大多数方法主要关注低阶标签相关性,在面对复杂的实际标签场景时,多个标签之间的高阶相关性学习不足的问题变得更为突出。为解决上述问题,从嵌入表示学习和标签相关性学习出发,提出了一种基于标签感知变分自编码器的多标签分类方法。针对嵌入表示学习,提出使用特征和标签双流变分自编码器同时学习和对齐特征和标签的嵌入空间,对特征嵌入空间添加标签引导来增强特征嵌入。采用基于标签语义的交叉注意力机制,将特定标签信息加入到特征嵌入中,最终获得标签感知后的判别性特征嵌入。针对标签相关性学习,采用共享解码器中的多层自注意力机制,充分融合多个标签的相似性信息,通过不同标签间的共现交互,学习到标签高阶相关性表示并用于交叉感知特征嵌入。在四个不同领域的数据集上得到的实验结果表明,提出的方法能够有效增强特征和标签嵌入,并充分捕获标签之间高阶相关性信息用于多标签分类任务,通过与多个最先进算法在多个评价指标上进行比较分析,验证了提出的方法在性能上的显著优越性。

关键词：多标签分类嵌入空间学习变分自动编码器 Transformer 标签相关性

来源：评论

学校读者我要写书评

暂无评论

基于对比学习和标签挖掘的点云分割算法

引用

计算机研究与发展 2025年第1期62卷 132-143页

作者：黄华卜一凡许宏丽王晓荣北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044 轨道工程北京市重点实验室(北京交通大学) 北京100044 智慧高铁系统前沿科学中心(北京交通大学) 北京100044

基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽... 详细信息

基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽略了点云无序和稀疏特性,特征提取不够准确.对此,设计了基于对比学习和标签挖掘的点云分割模型CL2M(contrastive learning label mining),通过自注意力机制学习不同位置处点云更为精准的特征,并引入对比学习方法,提高了点云边界处的分割精度.在对比边界学习过程中通过深入挖掘语义空间中的标签并设计了基于标签分布的对比边界学习模块,使得高维空间点云标签分布包含更多的语义信息.CL2M充分利用标签的分布规律计算分布间的距离,可准确划分正负样本,减少了常规硬划分带来的累计错误.在2个公开数据集上进行的实验结果表明,CL2M在多个评价指标上优于既有的点云分割模型,验证了模型的有效性.

关键词：计算机视觉点云分割对比学习自注意力机制边界挖掘

来源：评论

学校读者我要写书评

暂无评论

基于自然语言增强的签到轨迹与用户匹配方法

引用

计算机科学 2025年第2期52卷 99-106页

作者：王天一林友芳贡乐天陈炜郭晟楠万怀宇北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室北京100044

随着定位技术和传感器的高速发展,用户移动轨迹数据日渐丰富,但大多分散在不同平台上。为了全面利用这些数据并准确反映用户的真实行为,对轨迹用户匹配的研究变得至关重要。该任务旨在从海量签到轨迹数据中精准关联用户身份。近年来,研... 详细信息

随着定位技术和传感器的高速发展,用户移动轨迹数据日渐丰富,但大多分散在不同平台上。为了全面利用这些数据并准确反映用户的真实行为,对轨迹用户匹配的研究变得至关重要。该任务旨在从海量签到轨迹数据中精准关联用户身份。近年来,研究者们尝试运用循环神经网络、注意力机制等方法深入挖掘轨迹数据。然而,当前方法在处理用户签到轨迹时面临两大挑战:一是签到数据中有限的时空特征不足以从主观和客观两个角度全面地建模签到点信息,二是用户的签到轨迹往往围绕着一个特定的主题。针对这两点挑战,提出了一种基于自然语言增强的轨迹用户匹配模型(Natural Language Augmented Trajectory User Link,NLATUL)。首先,设计了一套自然语言模板与软提示令牌来描述签到轨迹,并使用语言模型来理解签到点中的主观意图,融合用户的时空状态,提供了一种充分从主观与客观两个方面建模签到点的方法;在此基础上,通过提示学习的方法推理签到轨迹的主题,并对建模的签到点表示的轨迹进行双向编码,通过签到轨迹主题与签到轨迹编码的结合实现对用户签到轨迹的准确理解。在两个真实世界签到数据集上验证的实验结果表明,NLATUL能够更准确地匹配签到轨迹与其对应的用户。

关键词：轨迹用户匹配签到序列学习时空数据挖掘语言模型提示学习

来源：评论

学校读者我要写书评

暂无评论

用于半监督分类的二阶近似谱图卷积模型

引用

自动化学报 2021年第5期47卷 1067-1076页

作者：公沛良艾丽华北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室北京100044

近年来,基于局部一阶近似的谱图卷积方法在半监督节点分类任务上取得了明显优势,但是在每次更新节点特征表示时,只利用了一阶邻居节点信息而忽视了非直接邻居节点信息.为此,本文结合切比雪夫截断展开式及标准化的拉普拉斯矩阵,通过推导... 详细信息

近年来,基于局部一阶近似的谱图卷积方法在半监督节点分类任务上取得了明显优势,但是在每次更新节点特征表示时,只利用了一阶邻居节点信息而忽视了非直接邻居节点信息.为此,本文结合切比雪夫截断展开式及标准化的拉普拉斯矩阵,通过推导及简化二阶近似谱图卷积模块,提出了一种融合丰富局部结构信息的改进图卷积模型,进一步提高了节点分类性能.大量的实验结果表明,本文提出的方法在不同数据集上的表现均优于现有的流行方法,验证了模型的有效性.

关键词：图理论谱图卷积半监督学习节点分类关系数据

来源：评论

学校读者我要写书评

暂无评论

一种基于频繁词集表示的新文本聚类方法

引用

计算机研究与发展 2018年第1期55卷 102-112页

作者：张雪松贾彩燕交通数据分析与数据挖掘北京市重点实验室(北京交通大学) 北京100044 北京交通大学计算机与信息技术学院北京100044

传统的文本聚类方法大部分采用基于词的文本表示模型,这种模型只考虑单个词的重要度而忽略了词与词之间的语义关系.同时,传统文本表示模型存在高维的问题.为解决以上问题,提出一种基于频繁词集的文本聚类方法(frequent itemsets based d... 详细信息

传统的文本聚类方法大部分采用基于词的文本表示模型,这种模型只考虑单个词的重要度而忽略了词与词之间的语义关系.同时,传统文本表示模型存在高维的问题.为解决以上问题,提出一种基于频繁词集的文本聚类方法(frequent itemsets based document clustering method,FIC).该方法从文档集中运用FP-Growth算法挖掘出频繁词集,运用频繁词集来表示每个文本从而大大降低了文本维度,根据文本间相似度建立文本网络,运用社区划分的算法对网络进行划分,从而达到文本聚类的目的.FIC算法不仅能降低文本表示的维度,还可以构建文本集中文本间的关联关系,使文本与文本间不再是独立的两两关系.实验中运用2个英文语料库Reuters-21578,20NewsGroup和1个中文语料库——搜狗新闻数据集来测试算法精度.实验表明:较传统的利用文本空间向量模型的聚类方法,该方法能够有效地降低文本表示的维度,并且,相比于常见的基于频繁词集的聚类方法能获得更好的聚类效果.

关键词：文本聚类频繁词集复杂网络社区划分文本表示模型

来源：评论

学校读者我要写书评

暂无评论

基于局部梯度和二进制模式的时间序列分类算法

引用

软件学报 2022年第5期33卷 1817-1832页

作者：郝石磊王志海刘海洋北京交通大学计算机与信息技术学院北京100044 交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044

时间序列分类问题是时间序列数据挖掘中的一项重要任务,近些年受到了越来越广泛的关注.该问题的一个重要组成部分就是时间序列间的相似性度量.在众多相似性度量算法中,动态时间规整是一种非常有效的算法,目前已经被广泛应用到视频、音... 详细信息

时间序列分类问题是时间序列数据挖掘中的一项重要任务,近些年受到了越来越广泛的关注.该问题的一个重要组成部分就是时间序列间的相似性度量.在众多相似性度量算法中,动态时间规整是一种非常有效的算法,目前已经被广泛应用到视频、音频、手写体识别以及生物信息处理等众多领域.动态时间规整本质上是一种在边界及时间一致性约束下的点对点的匹配算法,能够获得两条序列间的全局最优匹配.但该算法存在一个明显的不足,即不一定能实现序列间的局部合理匹配.具体的讲,就是具有完全不同局部结构信息的时间点有可能被动态时间规整算法错误匹配.为了解决这个问题,提出了一种改进的基于局部梯度和二进制模式的动态时间规整算法LGBDTW(local gradient and binary pattern based dynamic time warping),通过考虑时间序列点的局部结构信息来强化传统动态时间规整算法.所提算法虽然实质上是一种动态时间规整算法,但它通过考虑序列点的局部梯度和二进制模式值来进行相似性加权度量,有效避免了具有相异局部结构的点匹配.为了进行全面比较,将所提出的算法应用到了最近邻分类算法的相似性度量中,并在多个UCR时间序列数据集上进行了测试.实验结果表明,所提出的方法能有效提高时间序列分类的准确率.此外,实例分析验证了所提出算法的可解释性.

关键词：动态时间规整时间序列相似性数据挖掘时间序列分类

来源：评论

学校读者我要写书评

暂无评论

面向轨道缺陷检测的联邦学习轻量化模型训练技术研究

引用

铁道学报 2023年第4期45卷 77-83页

作者：任中伟方维维许文元李中睿胡一寒北京交通大学计算机与信息技术学院北京100044 北京交通大学交通数据分析与挖掘北京市重点实验室北京100044

轨道缺陷检测对列车的安全运行意义重大,传统依赖专业人员现场人工识别的方法存在效率低下、人力成本较高等诸多问题。但传统集中式训练方法要求共享参与方的私有数据,又带来隐私泄露、流量通信压力等问题,因此基于深度学习的检测方法... 详细信息

轨道缺陷检测对列车的安全运行意义重大,传统依赖专业人员现场人工识别的方法存在效率低下、人力成本较高等诸多问题。但传统集中式训练方法要求共享参与方的私有数据,又带来隐私泄露、流量通信压力等问题,因此基于深度学习的检测方法应运而生。近年来提出的联邦学习方法是一种分布式机器学习训练策略,通过聚合多个联邦成员本地训练的参数更新,无需共享私有数据,即可有效建立全局模型。然而,在铁路等工业场景中使用的物联网边缘设备,其计算和网络资源难以承受复杂深度模型带来的计算和通信开销。因此,提出一种轻量级边缘联邦学习算法,通过对网络模型进行通道剪枝与权值量化,降低计算、存储和通信开销,加速边缘设备上进行的联邦学习过程,最终得到精度损失在一定的可接受范围内的全局模型。通过构建轨道缺陷检测数据集,并选取ResNet-18作为目标模型,进行实验验证。结果表明,与不进行剪枝量化的原始联邦学习模型效果相比,在数据集所包含的各类缺陷上达到最高93.49%的平均鉴别准确率,同时模型大小可压缩至10.75倍,全局加速2.33倍,验证了本方法的有效性。

关键词：联邦学习缺陷检测模型压缩物联网

来源：评论

学校读者我要写书评

暂无评论

基于多样真实任务生成的鲁棒小样本分类方法

引用

软件学报 2024年第4期35卷 1587-1600页

作者：刘鑫景丽萍于剑交通数据分析与挖掘北京市重点实验室(北京交通大学) 北京100044 北京交通大学计算机与信息技术学院北京100044

随着大数据、计算机与互联网等技术的不断进步,以机器学习和深度学习为代表的人工智能技术取得了巨大成功,尤其是最近不断涌现的各种大模型,极大地加速了人工智能技术在各个领域的应用.但这些技术的成功离不开海量训练数据和充足的计算... 详细信息

随着大数据、计算机与互联网等技术的不断进步,以机器学习和深度学习为代表的人工智能技术取得了巨大成功,尤其是最近不断涌现的各种大模型,极大地加速了人工智能技术在各个领域的应用.但这些技术的成功离不开海量训练数据和充足的计算资源,大大限制了这些方法在一些数据或计算资源匮乏领域的应用.因此,如何利用少量样本进行学习,也就是小样本学习成为以人工智能技术引领新一轮产业变革中一个十分重要的研究问题.小样本学习中最常用的方法是基于元学习的方法,这类方法通过在一系列相似的训练任务上学习解决这类任务的元知识,在新的测试任务上利用元知识可以进行快速学习.虽然这类方法在小样本分类任务上取得了不错的效果,但是这类方法的一个潜在假设是训练任务和测试任务来自同一分布.这意味着训练任务需要足够多才能使模型学到的元知识泛化到不断变化的测试任务中.但是在一些真正数据匮乏的应用场景,训练任务的数量也是难以保证的.为此,提出一种基于多样真实任务生成的鲁棒小样本分类方法(DATG).该方法通过对已有少量任务进行Mixup,可以生成更多的训练任务帮助模型进行学习.通过约束生成任务的多样性和真实性,该方法可以有效提高小样本分类方法的泛化性.具体来说,先对训练集中的基类进行聚类得到不同的簇,然后从不同的簇中选取任务进行Mixup以增加生成任务的多样性.此外,簇间任务Mixup策略可以减轻学习到与类别高度相关的伪判别特征.同时,为了避免生成的任务与真实分布太偏离,误导模型学习,通过最小化生成任务与真实任务之间的最大均值差异(MMD)来保证生成任务的真实性.最后,从理论上分析了为什么基于簇间任务Mixup的策略可以提高模型的泛化性能.多个数据集上的实验结果进一步证明了所提出的基于多样性和真实性任务扩充方法的有效性.

关键词：小样本学习元学习任务Mixup 多样性真实性

来源：评论

学校读者我要写书评

暂无评论

语言与图灵测试

引用

自动化学报 2016年第5期42卷 668-669页

作者：于剑北京交通大学计算机与信息技术学院交通数据分析与挖掘北京市重点实验室北京100044

讨论了语言的三指功能(指名、指物、指心)与图灵测试的关系,指出早期的人工智能研究一般假设语言三指等价,因此致力于实现其中之一的功能.如果一个功能实现了,其他两个功能也就实现了,比如图灵测试将智能的表现限定在指名功能里.但是,... 详细信息

讨论了语言的三指功能(指名、指物、指心)与图灵测试的关系,指出早期的人工智能研究一般假设语言三指等价,因此致力于实现其中之一的功能.如果一个功能实现了,其他两个功能也就实现了,比如图灵测试将智能的表现限定在指名功能里.但是,现代科学已经证明,语言三指不一定等价.这给人工智能的研究带来很大挑战,本文罗列了一些开放性问题,如对话的理论计算机制等.

关键词：语言图灵测试词对话

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：