版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国铁道科学研究院集团有限公司电子计算技术研究所北京100081 中国铁道科学研究院集团有限公司基础设施检测研究所北京100081 中国铁道科学研究院研究生部北京100081
出 版 物:《中国铁路》 (China Railway)
年 卷 期:2020年第8期
页 面:7-12页
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 082301[工学-道路与铁道工程] 0823[工学-交通运输工程]
基 金:中国铁路总公司科技研究开发计划项目(P2018Z001、J2019Z001)
摘 要:计算断电区间长度是铁路供电故障数据分析的一项重要工作,由于故障数据多采用非结构化文字描述,人工整理、计算断电区间长度耗费大量时间。基于有限状态机的自动化特征信息提取方法能够处理非结构化文字描述的供电故障信息,利用自然语言处理分词、正则表达式及模式匹配等技术,快速定位关键词位置,挖掘关联关系,自动、快速、准确地提取故障区间起始点与结束点等关键特征信息,再根据线路设备技术台账,查询、计算得到断电区间长度。试验结果表明,本方法占用资源少、耗时短,对测试样本数据提取的准确率较高,可大幅提升工作效率。