检索结果-内蒙古大学图书馆

计算机应用 2024年第10期44卷 3039-3046页

作者：李林昊张晓倩董瑶王旭董永峰河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 河北省数据驱动工业智能工程研究中心(河北工业大学) 天津300401

针对知识追踪(KT)模型没有充分考虑学生间差异、挖掘知识状态与习题的高度匹配等问题,提出一种双层网络架构——基于个性化学习和深层次细化的知识追踪(PLDRKT)。首先,利用增强注意力机制得到习题的深层次细化表示;其次,从不同学生对习... 详细信息

针对知识追踪(KT)模型没有充分考虑学生间差异、挖掘知识状态与习题的高度匹配等问题,提出一种双层网络架构——基于个性化学习和深层次细化的知识追踪(PLDRKT)。首先,利用增强注意力机制得到习题的深层次细化表示;其次,从不同学生对习题的难度感知和学习收益方面对初步知识状态进行个性化建模;最后,利用初步知识状态和深层习题表示得到学生的深层次知识状态并预测他们的未来答题情况。将PLDRKT模型与基于对抗训练的增强知识追踪(ATKT)和集成知识追踪(ENKT)等7种模型在Statics2011、ASSIST09、ASSIST15和ASSIST17数据集上进行对比实验。实验结果显示,PLDRKT模型的曲线下面积(AUC)均有增加,在4个数据集上与不考虑习题嵌入的最优基线模型相比,分别增加了0.61、1.32、5.29和0.19个百分点,可见PLDRKT模型可以较好地建模学生知识状态并预测回答。

关键词：知识追踪注意力深层次细化高度匹配个性化

来源：评论

学校读者我要写书评

暂无评论

基于深度学习的聚类综述

引用

计算机应用 2022年第4期42卷 1021-1028页

作者：董永峰邓亚晗董瑶王雅琮河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 河北省数据驱动工业智能工程研究中心(河北工业大学) 天津300401

聚类是一种寻找数据之间内在结构的技术,是许多数据驱动应用领域的一个基本问题,而聚类性能在很大程度上取决于数据表示的质量。近年来,深度学习因其强大的特征提取能力被广泛地应用于聚类任务,以学习更好的特征表示,显著提高了聚类性... 详细信息

聚类是一种寻找数据之间内在结构的技术,是许多数据驱动应用领域的一个基本问题,而聚类性能在很大程度上取决于数据表示的质量。近年来,深度学习因其强大的特征提取能力被广泛地应用于聚类任务,以学习更好的特征表示,显著提高了聚类性能。首先,介绍了传统的聚类任务;然后,根据网络结构介绍了基于深度学习的聚类及代表性方法,指出了当前存在的问题,并介绍了基于深度学习的聚类在不同领域的应用;最后,对基于深度学习的聚类发展进行了总结与展望。

关键词：聚类深度学习图聚类特征表示网络结构

来源：评论

学校读者我要写书评

暂无评论

基于多信息图注意力网络的双向迭代实体对齐

引用

计算机工程与设计 2023年第6期44卷 1836-1843页

作者：许智宏刘梓艺王利琴董永峰河北工业大学人工智能与数据科学学院天津300401 河北工业大学河北省大数据计算重点实验室天津300401 河北工业大学河北省数据驱动工业智能工程研究中心天津300401

针对当前实体对齐方法无法充分利用知识图谱实体的多种信息和缺乏先验对齐种子对限制实体对齐效果的问题,提出一种基于多信息图注意力网络的双向迭代实体对齐模型。使用具有高速公路网络机制的图注意力网络,充分利用实体的多种信息获得... 详细信息

针对当前实体对齐方法无法充分利用知识图谱实体的多种信息和缺乏先验对齐种子对限制实体对齐效果的问题,提出一种基于多信息图注意力网络的双向迭代实体对齐模型。使用具有高速公路网络机制的图注意力网络,充分利用实体的多种信息获得实体的嵌入表示,提出一种双向迭代策略,设置阈值筛选高置信度实体对加入训练集中,达到扩展先验对齐种子对的目的。在3个跨语言实体对齐数据集上进行的实验结果表明,该模型有效提高了评估指标Hits@1,Hits@10的性能。

关键词：知识图谱实体对齐多信息图注意力网络高速公路网络表示学习双向迭代

来源：评论

学校读者我要写书评

暂无评论

融合先验知识和字形特征的中文命名实体识别

引用

计算机应用 2024年第3期44卷 702-708页

作者：董永峰白佳明王利琴王旭河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 河北省数据驱动工业智能工程研究中心(河北工业大学) 天津300401

针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入... 详细信息

针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入序列进行编码,并从中文维基百科中获取实体类型的中文释义,采用双向门控循环单元(BiGRU)编码实体类型信息作为先验知识,利用注意力机制将它与字符表示进行组合;其次,采用双向长短时记忆(BiLSTM)网络编码输入序列的远距离依赖关系,通过字形编码表获得繁体的仓颉码和简体的现代五笔码,采用卷积神经网络(CNN)提取字形特征表示,并根据不同权重组合繁体与简体字形特征,利用门控机制将它与经过BiLSTM编码后的字符表示进行组合;最后,使用条件随机场(CRF)解码,得到命名实体标注序列。在偏口语化的数据集Weibo、小型数据集Boson和大型数据集PeopleDaily上的实验结果表明,与基线模型MECT(Multi-metadata Embedding based Cross-Transformer)相比,所提模型的F1值别提高了2.47、1.20和0.98个百分点,验证了模型的有效性。

关键词：命名实体识别注意力机制卷积神经网络双向长短时记忆条件随机场

来源：评论

学校读者我要写书评

暂无评论

基于注意力平衡列表的溯因推理模型

引用

计算机应用 2023年第2期43卷 349-355页

作者：徐铭李林昊齐巧玲王利琴河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 河北省数据驱动工业智能工程研究中心(河北工业大学) 天津300401

溯因推理是自然语言推理(NLI)中的重要任务,旨在通过给定的起始观测事件和最终观测事件,推断出二者之间合理的过程事件(假设)。早期的研究从每条训练样本中独立训练推理模型;而最近,主流的研究考虑了相似训练样本间的语义关联性,并以训... 详细信息

溯因推理是自然语言推理(NLI)中的重要任务,旨在通过给定的起始观测事件和最终观测事件,推断出二者之间合理的过程事件(假设)。早期的研究从每条训练样本中独立训练推理模型;而最近,主流的研究考虑了相似训练样本间的语义关联性,并以训练集中假设出现的频次拟合其合理程度,从而更精准地刻画假设在不同环境中的合理性。在此基础上,在刻画假设的合理性的同时,加入了合理假设与不合理假设的差异性和相对性约束,从而达到了假设的合理性和不合理性的双向刻画目的,并通过多对多的训练方式实现了整体相对性建模;此外,考虑到事件表达过程中单词重要性的差异,构造了对样本不同单词的关注模块,最终形成了基于注意力平衡列表的溯因推理模型。实验结果表明,与L2R2模型相比,所提模型在溯因推理主流数据集叙事文本中的溯因推理(ART)上的准确率和AUC分别提高了约0.46和1.36个百分点,证明了所提模型的有效性。

关键词：自然语言处理溯因推理预训练模型 BERT 注意力机制

来源：评论

学校读者我要写书评

暂无评论

不完整多视图聚类综述

引用

计算机应用 2024年第6期44卷 1673-1682页

作者：董瑶付怡雪董永峰史进陈晨河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 河北省数据驱动工业智能工程研究中心(河北工业大学) 天津300401

多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的... 详细信息

多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的发展具有重要的理论意义和实践价值。首先,归纳分析不完整多视图数据缺失类型;其次,详细比较基于多核学习(MKL)、矩阵分解(MF)学习、深度学习和图学习这4类IMC方法,分析代表性方法的技术特点和区别;再次,从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集;继次,总结评价指标,并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现;最后,归纳分析不完整多视图聚类目前存在的问题、未来的发展方向和现有应用领域。

关键词：不完整性多视图聚类图数据挖掘缺失视图多视图学习

来源：评论

学校读者我要写书评

暂无评论

融合多跳关系路径信息的关系推理方法

引用

计算机应用 2021年第10期41卷 2799-2805页

作者：董永峰刘超王利琴李英双河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 河北省数据驱动工业智能工程研究中心(河北工业大学) 天津300401

针对目前知识图谱(KG)中存在大量关系的缺失,以及在进行关系推理时没有充分考虑两实体间多跳路径中隐含信息的问题,提出了一种融合多跳关系路径信息的关系推理方法。首先,对于给定的候选关系和两个实体,利用卷积运算将连接两个实体的多... 详细信息

针对目前知识图谱(KG)中存在大量关系的缺失,以及在进行关系推理时没有充分考虑两实体间多跳路径中隐含信息的问题,提出了一种融合多跳关系路径信息的关系推理方法。首先,对于给定的候选关系和两个实体,利用卷积运算将连接两个实体的多跳关系路径编码到低维空间里并提取信息;其次,利用双向长短时记忆(BiLSTM)网络建模以生成关系路径表示向量,并利用注意力机制将其与候选关系表示向量进行组合;最后,采用多步推理方式找到匹配程度最高的关系作为推理结果并判断其精确率。与目前常用的路径排序算法(PRA)、神经网络模型Path-RNN以及强化学习模型MINERVA相比,在使用大型知识图谱数据集NELL995进行实验时,所提算法的平均精确率均值(MAP)分别提高了1.96、8.6和1.6个百分点;在使用小型知识图谱数据集Kinship进行实验时,所提方法的MAP比PRA、MINERVA分别提高了21.3、13和12.1个百分点。实验结果表明,所提算法能更加准确地推理出实体间的关系链接。

关键词：知识图谱关系推理双向长短时记忆网络注意力机制卷积神经网络

来源：评论

学校读者我要写书评

暂无评论

基于加权特征融合与局部特征注意的人种分类

引用

计算机工程与设计 2024年第9期45卷 2683-2689页

作者：董永峰钟璨齐巧玲李林昊河北工业大学人工智能与数据科学学院天津300401 河北工业大学河北省大数据计算重点实验室天津300401 河北工业大学河北省数据驱动工业智能工程研究中心天津300401

为充分利用浅层特征中的细节纹理信息对人种特性的描述能力,挖掘具有区分性部位的表达特征对人种分类的作用,更好利用数据不同层次的特征与区分性部位以提供更具鲁棒性的人种信息,提出一种基于加权特征融合与局部特征注意的人种分类模型... 详细信息

为充分利用浅层特征中的细节纹理信息对人种特性的描述能力,挖掘具有区分性部位的表达特征对人种分类的作用,更好利用数据不同层次的特征与区分性部位以提供更具鲁棒性的人种信息,提出一种基于加权特征融合与局部特征注意的人种分类模型(weighted feature fusion and local feature attention model,WFLA)。模型设计加权特征融合模块增强浅层与深层特征的交互,构建局部特征注意模块重点关注区分性部位。在3个公开数据集中的大规模验证实验验证了WFLA模型在人种分类任务中具有明显优势。

关键词：人种分类注意力机制多层融合深度学习局部特征特征提取特征交互

来源：评论

学校读者我要写书评

暂无评论

基于PB-DBSCAN的GPS数据去噪

引用

计算机工程与设计 2021年第3期42卷 678-683页

作者：汪鹏刘泽玲王利琴董永峰河北工业大学人工智能与数据科学学院天津300401 河北工业大学河北省大数据计算重点实验室天津300401 河北工业大学河北省数据驱动工业智能工程研究中心天津300401

针对公交车GPS数据量大、数据密度不均匀、噪声点多等问题,提出PB-DBSCAN(pixel_based-DBSCAN,PB-DBSCAN)算法。将聚类过程中判断数据点之间的关系改为判断像素格之间的关系,减小数据点邻域中的搜索范围,加快聚类速度。因公交线路的多样... 详细信息

针对公交车GPS数据量大、数据密度不均匀、噪声点多等问题,提出PB-DBSCAN(pixel_based-DBSCAN,PB-DBSCAN)算法。将聚类过程中判断数据点之间的关系改为判断像素格之间的关系,减小数据点邻域中的搜索范围,加快聚类速度。因公交线路的多样性,同一聚类参数无法适应所有线路,提出一种动态参数选择的方法。在石家庄公交车GPS实际数据集上进行实验,其结果表明,PB-DBSCAN可以有效识别并过滤GPS数据集中的噪声点,实现快速聚类。与采用固定参数的算法进行比较,参数的动态选择提高了聚类准确度。

关键词： GPS轨迹数据基于像素格的快速密度聚类动态参数选择像素格去噪

来源：评论

学校读者我要写书评

暂无评论

将行为依赖融入多任务学习的个性化推荐模型

引用

计算机科学与探索 2024年第1期18卷 231-243页

作者：顾军华李宁宁王鑫鑫张素琪河北工业大学人工智能与数据科学学院天津300401 河北省大数据计算重点实验室(河北工业大学) 天津300401 天津商业大学理学院天津300134 天津商业大学信息工程学院天津300134

多种类型行为数据的引入缓解了协同过滤算法存在的数据稀疏和冷启动问题,在推荐领域被广泛研究和应用。尽管当前对多行为推荐的研究已经取得很大进展,但仍然存在以下问题:未能全面捕获行为之间复杂的依赖关系;忽略了行为特征与用户和项... 详细信息

多种类型行为数据的引入缓解了协同过滤算法存在的数据稀疏和冷启动问题,在推荐领域被广泛研究和应用。尽管当前对多行为推荐的研究已经取得很大进展,但仍然存在以下问题:未能全面捕获行为之间复杂的依赖关系;忽略了行为特征与用户和项目的相关性。这导致学习到的特征向量无法准确表达用户的兴趣偏好,使得推荐结果存在偏差。为了解决以上问题,提出了将行为依赖融入多任务学习的个性化推荐模型(BDMR),将行为之间复杂的依赖关系分为特征相关性和时序相关性。首先,设置用户个性化行为向量,利用图神经网络处理多个单行为交互图,联合用户、项目和行为特征聚合高阶邻域信息,结合注意力机制学习行为之间的特征相关性;其次,将行为特征和项目特征构成的交互序列输入长短期记忆网络,捕获行为之间的时序相关性;最后,将个性化行为向量融入多任务学习框架获取更加准确的用户、行为和项目特征。为了验证提出模型的性能,在三个真实数据集上进行对比实验,在Yelp数据集上,相较于最优基线,HR和NDCG分别提升了1.5%和2.9%;在ML20M数据集上,HR和NDCG分别提升了2.0%和0.5%;在Tmall数据集上,HR和NDCG分别提升了25.6%和30.2%。实验结果表明,该模型优于其他的基准模型。

关键词：多行为推荐图神经网络循环神经网络多任务学习框架

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：