One-class问题包括one-class描述问题和one-class分类问题,给定一组没有标签的样本集,前者指如何描述它包含的内在信息(与异常信息或噪音信息相对应),而后者指如果把此样本集作为目标类,如何与其它所有无关类(当然也包括outliers)分类的问题.One-class问题的研究无论是在模式识别还是在信息处理领域都具有重要意义.论文的主要内容包括:(1)概述分析了one-class问题的研究内容及研究意义,并首次把one-class问题分为one-class描述问题和one-class分类问题,并给出了这两种问题的潜在应用.(2)提出了一种解决one-class描述问题的模型:基于方差的信息分解模型(Variance-based Information Decomposing Model, VIDM),并为此模型引入了基于主成分分析的算法和基于主曲线的算法.(3)用股票异常收益检测和说话人识别的特征提取两个实验验证了VIDM模型及其算法的有效性.(4)用SVM方法研究one-class分类和outlier检测问题.在将one-class分类问题理解为一种函数估计问题的基础上,首次定义了η-one-class和η-outlier问题的泛化错误,进而定义了线性可分性和边缘,得到了求解one-class问题的最大边缘、软边缘和v-软边缘算法.(5)首次在one-class分类问题中引入半监督学习的思想,提出了一种半监督的one-class分类算法(Semi-v-SVM),此方法在易趣拍卖网站中的商品分类上取得了很好的效果.
暂无评论