检索结果-内蒙古大学图书馆

郑州大学学报（理学版） 2025年第1期57卷 15-22页

作者：郭陈虹王菁巩会龙郭浩浩张睿轩北方工业大学信息学院北京100144 大规模流数据集成与分析技术北京市重点实验室(北方工业大学) 北京100144

针对实时性要求高和作业量大的流处理作业执行过程中,多个作业之间存在的相同处理片段可能会导致流处理引擎重复计算、资源浪费和处理性能低下的问题,提出了融合深度强化学习与算子优化的流式任务调度方法。首先利用算子优化算法将多个... 详细信息

针对实时性要求高和作业量大的流处理作业执行过程中,多个作业之间存在的相同处理片段可能会导致流处理引擎重复计算、资源浪费和处理性能低下的问题,提出了融合深度强化学习与算子优化的流式任务调度方法。首先利用算子优化算法将多个复杂的作业去重、重构,其次将重构得到的作业输入循环神经网络中得到任务的调度策略,最后利用强化学习模型进行调度策略的优化。所提方法利用算子优化减少了每个作业中创建的算子实例,结合深度强化学习自动发现最优的调度策略,有效地避免了因大量实例运行而造成的系统资源不足、数据拥塞等问题。对比实验结果表明,所提方法在吞吐量和延迟方面的表现更优异。

关键词：流处理作业任务调度算子优化深度强化学习

来源：评论

学校读者我要写书评

暂无评论

一种基于运动特征的多目标航迹生成方法

引用

计算机科学 2025年

作者：张浩然王桂玲大规模流数据集成与分析技术北京市重点实验室(北方工业大学) 北方工业大学信息学院

在空间跟踪船海上多目标跟踪场景中，目标船的航迹关联一直是严峻的挑战。由于海洋表面是一个高度动态的环境，海杂波的存在有很大的不规则性和随机性，这就使得探测到的目标点中夹杂大量不真实点，本文提出了一种基于运动特征的多目标... 详细信息

在空间跟踪船海上多目标跟踪场景中，目标船的航迹关联一直是严峻的挑战。由于海洋表面是一个高度动态的环境，海杂波的存在有很大的不规则性和随机性，这就使得探测到的目标点中夹杂大量不真实点，本文提出了一种基于运动特征的多目标航迹生成方法。该方法包括预处理和航迹段关联两个关键环节：在预处理阶段，通过目标船数据的经纬度、速度和航向角的阈值剔除轨迹异常点，并采用基于B-spline的采样-分段-插值方法，增强目标轨迹的完整性、连续性和平滑性；在航迹段关联阶段，设计了一种结合运动特征和时间约束的多目标航迹关联策略。实际海域实验结果表明，该方法能够有效提高航迹生成的准确性和鲁棒性。

关键词：雷达航迹关联航迹插值航迹生成运动特征多目标

来源：评论

学校读者我要写书评

暂无评论

基于关键词抽取和混合检索的领域问答对齐优化方法

引用

北方工业大学学报 2025年第1期37卷 52-62页

作者：杨冬菊杨坤北方工业大学信息学院北京100144 大规模流数据集成与分析技术北京市重点实验室北京100144

针对目前基于检索增强生成技术的领域问答任务中由于用户查询和知识库中相关知识的语义差距导致回答效果差的问题,本文提出一种基于关键词抽取和混合检索的对齐优化方法。首先,利用大语言模型抽取用户查询中的关键词;其次,将用户查询拼... 详细信息

针对目前基于检索增强生成技术的领域问答任务中由于用户查询和知识库中相关知识的语义差距导致回答效果差的问题,本文提出一种基于关键词抽取和混合检索的对齐优化方法。首先,利用大语言模型抽取用户查询中的关键词;其次,将用户查询拼接抽取后的关键词组成组合查询,将组合查询与用户查询分别输入稀疏检索模型和稠密检索模型召回相关文档;然后,将检索模型召回的文档做并集处理并重排;最后,将重排后的相关知识输入文本过滤器提取出关键信息文本,并与用户查询合并输入大语言模型生成答案返回给用户。实验结果表明,所提方法在公开的中医药问答数据集和通用领域问答数据集CMRC2018上相较于基于查询改写的对齐优化方法,Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence(ROUGE-L)指标分别提高了9.9个百分点和2.3个百分点,F1指标分别提高了4.1个百分点和1.7个百分点。本文的实验结果验证了所提方法在提升领域问答准确度的有效性。

关键词：检索增强生成关键词抽取领域问答混合检索

来源：评论

学校读者我要写书评

暂无评论

基于BERT模型自适应的科技项目申报书关键文本抽取方法

引用

科技通报 2025年第1期41卷 8-14页

作者：徐晨阳李子伦张兆娜杨冬菊中国科学技术信息研究所北京100038 大规模流数据集成与分析技术北京市重点实验室北京100144 北方工业大学数据工程研究院北京100144

科技项目申报书内容涵盖了科技领域主要的研究方向和创新性。为提升科技领域项目文本关键内容的抽取效果,本文提出了一种基于BERT(bidirectional encoder representations from transformers)模型自适应的科技项目申报书关键文本抽取方... 详细信息

科技项目申报书内容涵盖了科技领域主要的研究方向和创新性。为提升科技领域项目文本关键内容的抽取效果,本文提出了一种基于BERT(bidirectional encoder representations from transformers)模型自适应的科技项目申报书关键文本抽取方法。在该方法中,首先进行原始文本的预处理;其次,将BERT和伪标签相结合进行模型训练,并构建自适应阈值确保模型训练最优化;最后,本文将模型工程化,进行实际应用。通过实验对比验证:提出的方法在文本抽取过程中表现出良好的性能,数据标注准确度随着数据规模不断增大而呈现提升;该方法在准确率、精确率、召回率与F1值等方面,均优于模型LSTM+SAT(long short-term memory+short-term memery)和模型BERT+PL(BERT+pseudo label)。

关键词： BERT模型自适应伪标签文本抽取模型训练

来源：评论

学校读者我要写书评

暂无评论

探索式服务组合中的增量式失败服务模式挖掘

引用

计算机集成制造系统 2022年第10期28卷 3238-3245页

作者：袁云静王菁韩燕波栗倩文陈高建焦博扬北方工业大学大规模流数据集成与分析技术北京市重点实验室北京100144

为了有效提高服务组合效率,对探索式服务组合过程中大量可用于学习的服务组合流程进行挖掘,并将挖掘结果抽象为服务模式,其中针对失败服务组合流程进行的失败服务模式挖掘,提出一种探索式服务组合中的增量式失败服务模式挖掘算法,该算法... 详细信息

为了有效提高服务组合效率,对探索式服务组合过程中大量可用于学习的服务组合流程进行挖掘,并将挖掘结果抽象为服务模式,其中针对失败服务组合流程进行的失败服务模式挖掘,提出一种探索式服务组合中的增量式失败服务模式挖掘算法,该算法对gSpan算法进行扩展,将挖掘聚焦于失败服务组合流程的失败轨迹部分,同时对新增服务组合流程进行增量式挖掘,以有效提高失败服务模式挖掘效率。实验评估表明,相比未采用增量式的失败服务模式挖掘算法和原始gSpan算法,所提增量式失败服务模式挖掘算法的挖掘效率均有显著提升。

关键词：探索式服务组合服务模式挖掘 gSpan算法增量式更新

来源：评论

学校读者我要写书评

暂无评论

一种面向定点轨迹数据的行程识别方法

引用

北京邮电大学学报 2020年第4期43卷 39-47页

作者：张宽赵卓峰郭炜强北方工业大学大规模流数据集成与分析技术北京市重点实验室北京100144

为了对长周期定点轨迹数据进行行程识别,提出了一种基于动态阈值的定点轨迹数据行程识别方法.首先,采用聚类方法确定与阈值相关的时空多粒度参数;其次,根据参数对历史记录进行统计,计算参数对应的阈值;利用时空相关参数获取对应阈值,对... 详细信息

为了对长周期定点轨迹数据进行行程识别,提出了一种基于动态阈值的定点轨迹数据行程识别方法.首先,采用聚类方法确定与阈值相关的时空多粒度参数;其次,根据参数对历史记录进行统计,计算参数对应的阈值;利用时空相关参数获取对应阈值,对轨迹进行分段,进而实现行程识别.基于真实的城市交通卡口数据的实验结果表明,使用时空相关的动态阈值方法对定点轨迹数据进行行程识别在准确率和覆盖率上都要优于传统基于固定和单一阈值的方法.

关键词：定点轨迹数据行程识别轨迹分段

来源：评论

学校读者我要写书评

暂无评论

基于海量车牌识别数据的相似轨迹查询方法

引用

清华大学学报（自然科学版） 2017年第2期57卷 220-224页

作者：赵卓峰卢帅韩燕波北方工业大学大规模流数据集成与分析技术北京市重点实验室北京100144

车牌识别数据是一种具有数据量大、时空相关、位置可测等特征的车辆监测数据,基于此类数据的相似轨迹查询面临着诸多问题。该文给出一种基于"点伴随关系"的车辆相似轨迹定义,提出了一种多级任务并行的相似轨迹查询方法,并给... 详细信息

车牌识别数据是一种具有数据量大、时空相关、位置可测等特征的车辆监测数据,基于此类数据的相似轨迹查询面临着诸多问题。该文给出一种基于"点伴随关系"的车辆相似轨迹定义,提出了一种多级任务并行的相似轨迹查询方法,并给出了基于MapReduce迭代计算模型的方法实现,可支持在海量车牌识别数据集中利用分布计算环境高效地完成相似轨迹查询。基于近千万条真实车牌识别数据的实验表明,相对于传统方法,该方法在保证相似轨迹查询结果准确的前提下具有更好的查询性能。

关键词：相似轨迹车牌识别数据点伴随多级任务并行

来源：评论

学校读者我要写书评

暂无评论

基于服务关联网络的服务依赖关系识别

引用

计算机集成制造系统 2021年第9期27卷 2691-2700页

作者：杨冬菊张伟达赵卓峰大规模流数据集成与分析技术北京市重点实验室北京100144 北方工业大学数据工程研究院北京100144

在跨领域、跨区域、跨网络广泛互联的大服务环境下,为实现组合服务的分布部署和并行执行,如何识别并发现服务之间存在的依赖关系、支撑组合服务的合理划分是亟待解决的问题。提出一种基于服务关联网络的服务依赖关系识别方法,首先利用... 详细信息

在跨领域、跨区域、跨网络广泛互联的大服务环境下,为实现组合服务的分布部署和并行执行,如何识别并发现服务之间存在的依赖关系、支撑组合服务的合理划分是亟待解决的问题。提出一种基于服务关联网络的服务依赖关系识别方法,首先利用有向图刻画服务关联网络模型,探索了一种通过已有组合服务分析服务控制流和数据流并构建服务关联网络的方法。利用图遍历、社区发现及关联规则挖掘等算法识别并抽取服务之间的数据依赖及控制依赖关系,生成服务依赖图,通过服务依赖图实现服务依赖关系的识别。通过实验验证了方法的可行性和有效性,并通过与经典算法的对比分析验证了方法的执行效率。

关键词：服务关联网络服务依赖关系服务组合服务控制依赖服务数据依赖

来源：评论

学校读者我要写书评

暂无评论

海量车牌识别数据集上基于时空划分的旅行时间计算方法

引用

电子学报 2016年第5期44卷 1227-1233页

作者：赵卓峰丁维龙张帅北方工业大学云计算研究中心北京100144 大规模流数据集成与分析技术北京市重点实验室北京100144

城市路段旅行时间计算是智能交通领域的一个研究热点.车牌识别数据作为近年来新兴的一种针对城市道路行驶车辆的实时监测数据,具有持续生成且数据量大、时间空间相关等特性.为了利用车牌识别数据集进行高效、准确的旅行时间计算,给出了... 详细信息

城市路段旅行时间计算是智能交通领域的一个研究热点.车牌识别数据作为近年来新兴的一种针对城市道路行驶车辆的实时监测数据,具有持续生成且数据量大、时间空间相关等特性.为了利用车牌识别数据集进行高效、准确的旅行时间计算,给出了基于车牌识别数据集的旅行时间计算定义,在此基础上提出一种基于时空划分的流水线式并行计算模型,并给出了该模型基于实时MapReduce的实现.通过一组基于海量真实车牌识别数据集的实验表明,本文方法在亿级车牌识别数据集上的旅行时间计算性能方面相对于直接基于Hadoop的实现可以提高3倍以上,同时具有适合细粒度划分及受路网规模影响小的特点.

关键词：旅行时间时空划分流水线并行实时MapReduce 车牌识别数据

来源：评论

学校读者我要写书评

暂无评论

基于交叉模型的改进遗传算法

引用

控制与决策 2016年第10期31卷 1837-1844页

作者：杨新武杨丽军北京工业大学计算机学院北京100124 北京工业大学多媒体与智能软件技术北京市重点实验室北京100124 北京工业大学大规模流数据集成与分析技术北京市重点实验室北京100124

提出一种解决早熟收敛问题的改进遗传算法.通过最小生成树聚类将种群划分为若干个子种群,子种群内的个体之间及不同子种群间的个体之间同时进行遗传操作.同子种群间个体的遗传操作可以保证算法的进化方向和收敛速度,不同子种群间个体的... 详细信息

提出一种解决早熟收敛问题的改进遗传算法.通过最小生成树聚类将种群划分为若干个子种群,子种群内的个体之间及不同子种群间的个体之间同时进行遗传操作.同子种群间个体的遗传操作可以保证算法的进化方向和收敛速度,不同子种群间个体的遗传操作可以避免近亲繁殖,提供多样性.分别采用二进制和实数编码,在经典的23个基准函数上的对比测试结果表明,所提出算法具有较好的收敛速度和寻优能力.

关键词：遗传算法早熟收敛最小生成树聚类多样性

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：