版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:天津商业大学
学位级别:硕士
导师姓名:唐文广
授予年度:2021年
学科分类:12[管理学] 120203[管理学-旅游管理] 1202[管理学-工商管理] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:在线评论 用户满意度 情感分析 评分预测 随机森林回归
摘 要:伴随着我国服务经济的飞速发展,作为现代服务业重要组成部分之一的酒店行业在我国得到蓬勃发展。但是最近几年酒店行业面临的市场竞争也日趋激烈,因此酒店行业就提高用户满意度这一问题需要尽快解决。随着移动互联网的飞速发展和日益普及,越来越多的酒店用户在消费后在酒店预订平台上发表关于酒店消费的综合评价,这些用户消费后的第一手评论会即刻更新。所以如果能够通过对酒店用户评论来分析用户情感倾向以及喜好,那么对于酒店行业提高用户满意度和业绩水平将具有重要意义。本文基于星级酒店在线评论的用户满意度研究主要工作如下:酒店用户满意度影响因素的探究。本文基于携程网站北京市的酒店用户评论,以八爪鱼为数据采样器,共计爬取12000条酒店用户评论数据,对用户满意度影响因素展开研究。对获取的数据进行预处理数据清洗、过滤噪声词汇、Jieba分词以及去停用词,然后通过TF-IDF算法加权提取50个词汇作为酒店用户满意度二级影响因素、借助Word2Vec模型对二级影响因素词汇做向量化处理、采用K-means聚类算法获取词向量的聚类结果,获取酒店用户满意度一级影响因素。通过文本聚类分析结果,将酒店用户满意度影响因素分为5类,分别是性价比、设施配套及服务、餐饮、位置距离以及主观感受。最后根据这5类用户满意度影响因素,有针对性地对酒店行业给出意见建议,进一步提高酒店服务水平和用户满意度。基于在线评论构建机器学习模型对用户评分进行预测。首先通过探究酒店用户评论的情感倾向与用户评分的关系,发现情感在评分中占主导因素,但并不是唯一主导的影响因素,因此构建模型时需要引入其他NLP特征。本文使用预处理后去噪声的文本评论数据,通过Word2vec算法构造50维向量特征。综合酒店评分、情感倾向、积极类别概率、消极类别概率和50维文字评论特征,分别构建基于机器学习的贝叶斯岭回归、SVM回归、随机森林回归模型训练拟合用户星级评分,通过对比分析选择预测效果最好的随机森林回归模型对用户评分进行预测。最后对随机森林回归进行参数调优,进一步提高模型预测的准确率,对缺乏具体评分的在线评论、用户投诉、电话回访、网络平台“意见箱等进行预测,量化用户评论的情感倾向与满意程度。研究表明,随机森林回归算法作为集成学习算法,更适合处理在线评论类的高维度数据,它一方面使训练过程不容易出现过拟合现象,另一方面改善了单一模型准确率不高的弊端。用户评分预测模型的建立,实现了对缺少量化评分的文本进行更高精度的量化功能,相比在线评论系统中的“好评、“中评、“差评更加细致与可视化。在线评论的量化评分对于进一步拓宽酒店员工绩效考评途径,促进酒店从业人员服务意识的提升,完善酒店用户满意度评价系统等具有重要的意义。