近些年,随着科学技术的发展,在商业金融、信息技术和科学研究等各个领域,都会产生大量的高维数据,这些数据之间的关联性变得越来越复杂,那么,怎样来处理这些高维数据,并从这些数据当中得出有效的结论,是我们需要解决的问题。部分线性单指标模型作为一种重要的半参数模型,在处理高维数据时有许多自身的优点,该模型预测的结果能够更加接近真实模型。本文选取了适当的部分线性单指标模型,用三种不同的方法对该模型进行了变量选择问题的研究,具体内容如下:首先,用Adaptive group lasso估计方法对部分线性单指标模型进行参数估计,然后用Oracle定理来研究部分线性单指标模型Adaptive group lasso估计方法的相合性以及渐进正态性,证明了该方法的Oracle性质。其次,用Adaptive elastic net估计方法对部分线性单指标模型进行参数估计,同样地,用Oracle定理来研究该方法的相合性以及渐进正态性,证明了该方法的Oracle性质和组效应性质。然后,用惩罚相对偏导数法对部分线性单指标模型进行参数估计,给出了部分线性单指标模型惩罚相对偏导数法的一些相关的推导过程,对部分线性单指标模型的系数指标进行压缩,同时也对系数与方向导数的相对值进行压缩。最后,根据影响北京市空气质量的污染指标建立了适当的部分线性单指标模型,分别用这三种方法对该模型进行实证分析,比较这三种方法的优劣性,并给出部分线性单指标模型的一种较好的变量选择方法。
暂无评论