版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国铁道科学研究院研究生部北京100081 中国铁道科学研究院北京100081 中国铁道科学研究院电子计算技术研究所北京100081
出 版 物:《交通信息与安全》 (Journal of Transport Information and Safety)
年 卷 期:2019年第37卷第2期
页 面:33-39页
学科分类:08[工学] 0823[工学-交通运输工程]
基 金:国家重大研发计划课题项目(2018YFB1201403) 铁路总公司课题项目(K2018S007)资助
主 题:交通信息工程 铁路大数据 文本智能分类 进化集成分类器 安全事故隐患
摘 要:针对铁路安全事故隐患文本数据分类提出进化集成分类器模型。分析安全事故隐患数据特征,根据每一类安全事故隐患数据都有特征关键词的特点,运用TF-IDF方法提取文本特征并转换为向量。设计进化集成分类器模型实现流程。采用Bagging集成分类器将TF-IDF转换后的文本向量进行随机采样,训练若干个决策树基分类器模型,设计遗传算法编码机制、灵敏度设定、适应度函数及目标函数选择等关键步骤。根据遗传算法流程实现基分类器组合优化,将经过遗传算法进化的最优个体对应的基分类器参与Bagging投票分类,验证分类效果。通过对某铁路局供电接触网安全事故隐患文本数据实验分析,进化集成分类器模型在安全事故隐患分类的准确率相比于单个决策树分类器和Bagging集成分类器分类结果分别提升17.42%和4.63%,证明设计的进化集成分类模型能够取得较好的分类效果,可应用于铁路安全事故隐患分类。