随着科技的快速发展,市场竞争愈加激烈,通信行业也不例外,为了迎合市场需要,各个服务供应商不断推出更优质的服务,顾客更是可以自由选择满意的供应商,也因此电信客户的流失行为预测问题成为了当前研究的热门话题。本文从Kaggle竞赛数据网获取了国外2022年部分电信客户数据,再经数据预处理最终保留了4835个样本,并通过描述性统计分析、机器学习模型和智能优化算法等方法对其进行预测分析。论文工作简述如下:1.电信客户数据预处理。首先是处理了数据集中的缺失值和无效值,再对数据中的离散特征进行映射处理,以及极差标准化数据到0-1区间。对客户性别、年龄、套餐类型、互联网连接类型、账单支付方式、合同类型和使用服务月数等特征使用图、表的方式进行描述性统计分析。2.提出GMGWO算法和构建支持向量机模型。灰狼优化算法(Grey wolf optimizer,GWO)在进行特征选择和SVM参数优化时存在低精度、慢收敛和易陷入局部最优的缺点。在第三章,根据GWO算法理论,设计一种基于余弦函数的非线性过渡参数替代GWO的原线性过渡参数,同时引入高斯变异(Gaussian mutation,GM)策略以增强群体多样性,提出一种改进GWO算法(记为GMGWO)。并结合支持向量机模型构建特征选择与优化支持向量机参数的组合模型,GMGWO-SVM分类模型。选取10个UCI数据集进行实验,结果表明,GMGWO-SVM在10个数据集上的分类精度均得到提升,同时平均去除了77%的冗余特征。***-SVM算法实证分析。将GMGWO-SVM模型应用于电信客户流失行为预测的实证分析中,GMGWO-SVM算法平均能去除62%的冗余特征,同时提高了SVM模型4.2%的分类精度。通过精确率、召回率、AUC值等指标分析GMGWO-SVM算法的预测结果,分析结果说明GMGWO-SVM算法预测正例(流失客户)的准确性较高,在电信客户数据上分类预测效果较好,即GMGWO-SVM算法适用于电信客户流失行为的预测。另外,根据特征在十次运行中被选择次数,进一步分析提出了一套新的、更具代表性的特征子集。
暂无评论