检索结果-内蒙古大学图书馆

模式识别与人工智能 2017年第11期30卷 1012-1018页

作者：张超李德玉山西大学计算机与信息技术学院计算智能与中文信息处理教育部重点实验室太原030006

犹豫模糊集作为定量描述犹豫不决的有效工具,通过同时处理不确定性信息中的犹豫性与模糊性,解决犹豫不决背景下的多属性决策问题.文中针对属性值为犹豫模糊数的多属性决策问题,研究基于模糊图论的相关模型与多属性决策方法.首先,提出犹... 详细信息

犹豫模糊集作为定量描述犹豫不决的有效工具,通过同时处理不确定性信息中的犹豫性与模糊性,解决犹豫不决背景下的多属性决策问题.文中针对属性值为犹豫模糊数的多属性决策问题,研究基于模糊图论的相关模型与多属性决策方法.首先,提出犹豫模糊图的概念和部分常见运算规则.然后,构建基于犹豫模糊图的一般性多属性决策方法.最后,通过具体算例和对比性分析验证文中方法的合理性.

关键词：犹豫模糊集多属性决策犹豫模糊图

来源：评论

学校读者我要写书评

暂无评论

基于熵的多尺度决策表最优尺度选择

引用

海南热带海洋学院学报 2018年第5期25卷 61-65页

作者：魏巍张嘉宇陈千崔军彪山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006

为了能表示数据的层次结构,Wu和Leung从粒计算的角度提出了一种新的数据表示方法称为多尺度决策表,并提出了最优尺度的定义,在最优尺度上进行属性约简、规则获取等任务可以提高知识发现效率.但是Wu和Leung所提出的基于协调性的最优尺度... 详细信息

为了能表示数据的层次结构,Wu和Leung从粒计算的角度提出了一种新的数据表示方法称为多尺度决策表,并提出了最优尺度的定义,在最优尺度上进行属性约简、规则获取等任务可以提高知识发现效率.但是Wu和Leung所提出的基于协调性的最优尺度选择的方法在面对不协调的多尺度决策表的时候,仅考虑广义决策而忽视了不协调的多尺度决策表决策规则置信度的变化.针对这个问题,本文提出了基于熵的最优尺度选择的方法,该方法无需判断多尺度决策表的协调性,就可以获取保持决策规则置信度的最优尺度.

关键词：信息熵多尺度决策表最优尺度选择

来源：评论

学校读者我要写书评

暂无评论

基于数据分布的标签噪声过滤方法

基于数据分布的标签噪声过滤方法

引用

第六届中国计算机学会大数据学术会议

作者：陈庆强王文剑姜高霞山西大学计算机与信息技术学院计算机与信息技术学院太原 030006 山西大学计算智能与中文信息处理教育部重点实验室计算智能与中文信息处理教育部重点实验室太原 030006

在监督学习中,标签噪声对模型建立有较大的影响.目前对于标签噪声的处理方法主要有基于模型预测的过滤方法和鲁棒性建模方法,然而这些方法要么过滤效果不好,要么过滤效率不高.针对该问题,本文提出一种基于数据分布的标签噪声过滤方法.... 详细信息

在监督学习中,标签噪声对模型建立有较大的影响.目前对于标签噪声的处理方法主要有基于模型预测的过滤方法和鲁棒性建模方法,然而这些方法要么过滤效果不好,要么过滤效率不高.针对该问题,本文提出一种基于数据分布的标签噪声过滤方法.首先对于数据集中的每一个样本,根据其近邻内样本的分布,将其及邻域样本形成的区域划分为高密度区域和低密度区域,然后针对不同的区域采用不同的噪声过滤规则进行过滤.与已有方法相比,本文从数据分布角度出发,使得噪声过滤更具有针对性从而提高过滤效果;另外本文使用过滤规则对噪声数据进行处理而非建立噪声预测模型,因而可以提高过滤效率.在15个UCI标准多分类数据集上的实验结果表明,本文提出的方法在噪声低于30％时,噪声检测效率和分类精度均有很好的表现.

关键词：数据处理标签噪声过滤规则分类精度

来源：评论

学校读者我要写书评

暂无评论

面向函数型数据的快速特征选择方法

引用

模式识别与人工智能 2017年第9期30卷 822-832页

作者：马忱王文剑姜高霞山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006

函数型数据的特征选择是从庞大的函数信息中选出那些相关性小、代表性强的少部分特征,以简化后期分类器的计算,提高泛化能力.由于特征选择方法用于函数数据分类效果并不理想,文中提出面向函数型数据的结合主成分分析法和最小凸包法的快... 详细信息

函数型数据的特征选择是从庞大的函数信息中选出那些相关性小、代表性强的少部分特征,以简化后期分类器的计算,提高泛化能力.由于特征选择方法用于函数数据分类效果并不理想,文中提出面向函数型数据的结合主成分分析法和最小凸包法的快速特征选择(FFS)方法,可以快速获得稳定的特征子集.此外,考虑到特征之间可能存在相关性,将FFS的结果作为其它方法的初始特征子集,故融合FFS与条件互信息方法.在UCR数据集上的实验证明FFS的有效性,并通过对比实验给出在不同时间代价和分类精度需求下的方法选择策略.

关键词：函数型数据(FD) 特征选择主成分分析(PCA) 最小凸包条件互信息(CMI)

来源：评论

学校读者我要写书评

暂无评论

基于标记关系的模糊粗糙集模型

引用

模式识别与人工智能 2017年第10期30卷 952-960页

作者：郭荣超李德玉王素格山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006

多标记分类任务中的数据通常是高维的,直接利用高维数据建模可能导致训练效率低下,模型复杂,同时可能影响分类效果.针对多标记数据,文中提出属性-标记矩阵的概念,建立基于标记关系的模糊粗糙集模型,设计此类模型的约简算法,用于多标记... 详细信息

多标记分类任务中的数据通常是高维的,直接利用高维数据建模可能导致训练效率低下,模型复杂,同时可能影响分类效果.针对多标记数据,文中提出属性-标记矩阵的概念,建立基于标记关系的模糊粗糙集模型,设计此类模型的约简算法,用于多标记数据分类任务的特征选择.在8个公开的数据集上实验验证文中算法的有效性.

关键词：多标记分类模糊粗糙集约简特征选择

来源：评论

学校读者我要写书评

暂无评论

一种基于决策森林的单调分类方法

引用

计算机研究与发展 2017年第7期54卷 1477-1487页

作者：许行王文剑任丽芳山西大学计算机与信息技术学院太原030006 计算智能与中文信息处理教育部重点实验室(山西大学) 太原030006 山西财经大学应用数学学院太原030006

单调分类问题是特征与类别之间带有单调性约束的有序分类问题.对于符号数据的单调分类问题已有较好的方法,但对于数值数据,现有的方法分类精度和运行效率有限.提出一种基于决策森林的单调分类方法(monotonic classification method base... 详细信息

单调分类问题是特征与类别之间带有单调性约束的有序分类问题.对于符号数据的单调分类问题已有较好的方法,但对于数值数据,现有的方法分类精度和运行效率有限.提出一种基于决策森林的单调分类方法(monotonic classification method based on decision forest,MCDF),设计采样策略来构造决策树,可以保持数据子集与原数据集分布一致,并通过样本权重避免非单调数据的影响,在保持较高分类精度的同时有效提高了运行效率,同时这种策略可以自动确定决策森林中决策树的个数.在决策森林进行分类时,给出了决策冲突时的解决方法.提出的方法既可以处理符号数据,也可以处理数值数据.在人造数据集、UCI及真实数据集上的实验数据表明:该方法可以提高单调分类性能和运行效率,缩短分类规则的长度,解决数据集规模较大的单调分类问题.

关键词：单调分类决策树单调一致性决策森林集成学习

来源：评论

学校读者我要写书评

暂无评论

面向高考阅读理解的句子语义相关度

引用

清华大学学报（自然科学版） 2017年第6期57卷 575-579,585页

作者：郭少茹张虎钱揖丽李茹杨陟卓顾兆军马淑晖山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006 中国民航大学信息安全测评中心天津300300

高考阅读理解选择题是基于背景材料,通过对材料的"理解"从多个选项中选出最佳选项。由于提供的背景材料相对较短且关键信息极具隐藏性,答案可能无法在背景材料中直接找到,因此从背景材料中挖掘信息并与选项进行相关性分析是... 详细信息

高考阅读理解选择题是基于背景材料,通过对材料的"理解"从多个选项中选出最佳选项。由于提供的背景材料相对较短且关键信息极具隐藏性,答案可能无法在背景材料中直接找到,因此从背景材料中挖掘信息并与选项进行相关性分析是解答该类问题的关键,而句子级的语义相关性分析是背景材料与选项相关性分析的基础。该文通过对大量高考科技文文意理解类选择题进行分析,提出基于多维度投票算法的句子语义相关度计算方法。该方法将不同维度的语义相关性作为度量标准,运用投票算法的思想,选取问题的最佳选项。在近十年北京市高考真题上进行测试,解答准确率为53.84%,验证了该方法的有效性。

关键词：高考语文文意理解选择题多维度投票算法语义相关度

来源：评论

学校读者我要写书评

暂无评论

一种高斯区间核SVM分类模型

引用

数据采集与处理 2017年第1期32卷 46-53页

作者：王文剑祁晓博郭虎升山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006

区间型数据(Interval data,ID)是属性特征取值为区间的一类数据,针对区间型数据的分类问题,本文提出一种高斯区间核支持向量机分类模型(Support vector machine based on Gauss interval kernel,GIK_SVM)。该方法引入半宽因子,在区间型... 详细信息

区间型数据(Interval data,ID)是属性特征取值为区间的一类数据,针对区间型数据的分类问题,本文提出一种高斯区间核支持向量机分类模型(Support vector machine based on Gauss interval kernel,GIK_SVM)。该方法引入半宽因子,在区间型数据的中值与半宽度之间进行折中,并据此构造高斯区间核用以衡量两个区间型数据间的相似性,然后用SVM模型进行分类。在人造数据集和真实数据集上的实验结果表明,本文提出的算法对区间数据有更好的分类性能。

关键词：区间型数据半宽因子区间核 GIK_SVM模型

来源：评论

学校读者我要写书评

暂无评论

基于分层抽样的k近邻分类加速算法

引用

数据采集与处理 2017年第6期32卷 1153-1162页

作者：宋云胜梁吉业山西大学计算机与信息技术学院太原030006 山西大学计算智能与中文信息处理教育部重点实验室太原030006

k近邻(k nearest neighbor,kNN)分类作为数据挖掘中最典型的算法之一,以较高的泛化性能以及充足的理论基础被广泛应用。然而kNN在测试时需要计算待识别实例与所有训练实例之间的距离,以至于在面对大规模数据时需要大量的时间。为此,提... 详细信息

k近邻(k nearest neighbor,kNN)分类作为数据挖掘中最典型的算法之一,以较高的泛化性能以及充足的理论基础被广泛应用。然而kNN在测试时需要计算待识别实例与所有训练实例之间的距离,以至于在面对大规模数据时需要大量的时间。为此,提出一种基于分层抽样的kNN加速算法(KNN based on stratified sampling,SS-kNN)。首先将训练实例所在的空间划分为若干个实例个数相等的区域,然后从每个区域内抽取实例,最后判定待识别实例落入划分区域中的哪一个,并从此区域以及相邻区域抽取的实例中寻找其k个近邻。与原始kNN算法以及基于随机抽样的kNN算法相比,SSkNN算法可以获得与其相近分类精度,但将其运行速度分别提高大约399倍和16倍。

关键词：分层抽样数据划分近邻分类精度运行时间

来源：评论

学校读者我要写书评

暂无评论

一种基于优化模型的演化数据流聚类方法

引用

中国科学：信息科学 2017年第11期47卷 1464-1482页

作者：杜航原王文剑白亮山西大学计算机与信息技术学院太原030006 计算智能与中文信息处理教育部重点实验室太原030006

本文针对数据流演化聚类问题,建立了基于模糊最大熵的优化模型,利用模糊隶属度表达类别划分的模糊性,通过信息熵描述类别划分的有效性.在此基础上定义了优化目标函数,在滑动窗口下将数据子集的聚类过程理解为一个优化问题,使聚类结果能... 详细信息

本文针对数据流演化聚类问题,建立了基于模糊最大熵的优化模型,利用模糊隶属度表达类别划分的模糊性,通过信息熵描述类别划分的有效性.在此基础上定义了优化目标函数,在滑动窗口下将数据子集的聚类过程理解为一个优化问题,使聚类结果能有效描述数据内在结构特征,同时维持相邻窗口间聚类模型的连续性.将优化问题的解作为概念漂移检测的依据,保证了检测结果的有效性,有利于捕获聚类结构的变化趋势.在仿真实验中,利用人造数据集和真实数据集对新算法的有效性进行了验证,并通过实验与多种演化聚类方法在聚类精度、概念漂移检测精度以及计算效率等多个方面进行了比较.仿真结果表明了该算法的有效性,在相同条件下其聚类精度和概念漂移检测精度相比其他聚类算法具有显著优势,能够同时降低计算耗费时间和存储空间.

关键词：数据流演化聚类优化模型模糊隶属度信息熵

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：