本研究旨在分析2018~2022年QS世界大学排名前350名高校的数据,以揭示全球高等教育的发展趋势。采用统计模型和集成树模型,结合数据挖掘与可视化分析,对高校数量、城市分布、QS得分及排名进行了深入研究。研究发现,美国连续五年位居上榜高校数量榜首,伦敦和纽约在高校数量上占据优势。通过比较不同回归模型和集成树模型,XGBoost算法在QS得分和排名预测中表现最优。本文还通过可视化分析评估了QS排行榜的稳定性和一致性。研究结果为高等教育发展提供参考,并为高校管理者和决策者提供决策支持。This study aims to analyze the data of the top 350 universities in the QS World University Rankings from 2018 to 2022 to reveal the development trends of global higher education. Statistical models and ensemble tree models, combined with data mining and visualization analysis, were used to conduct an in-depth study on the number of universities, city distribution, QS scores, and rankings. The study found that the United States has been at the top of the list for five consecutive years in terms of the number of universities listed, and London and New York have an advantage in the number of universities. By comparing different regression models and ensemble tree models, the XGBoost algorithm performed best in predicting QS scores and rankings. This paper also evaluates the stability and consistency of the QS rankings through visualization analysis. The findings provide a reference for the development of higher education and decision support for university administrators and policymakers.
为解决医疗数据中存在的特征高维和类别不平衡问题,在基于简单、快速和有效高维特征选择算法SFE(simple,fast and effective high-dimensional feature selection)的基础上,提出了一种面向不平衡医疗数据的多阶段混合特征选择算法HFSIM(...
详细信息
为解决医疗数据中存在的特征高维和类别不平衡问题,在基于简单、快速和有效高维特征选择算法SFE(simple,fast and effective high-dimensional feature selection)的基础上,提出了一种面向不平衡医疗数据的多阶段混合特征选择算法HFSIM(hybrid feature selection for imbalanced medical data)。HFSIM算法采用改进的自适应边界SMOTE过采样技术,生成符合边界条件的新少数类实例以解决医学数据中类不平衡问题。同时,为了改善搜索空间多样性不足的问题,优化了SFE算法中的非选择操作符率参数UR(unselected rate),有效避免了算法过早收敛及易陷入局部最优的问题。将过滤式Fisher Score方法与优化UR参数后的算法有效结合,使算法能以较低的计算成本获得较好寻优能力。经实验验证,相比于SFE算法,HFSIM算法在Ovarian数据集上准确率达到99.67%,提升了2.11个百分点,G-means和F1分别提升了5.13和2.30个百分点。此外,通过对比特征数量和运行时间,证明了HFSIM算法既能保证算法精度又有效降低了计算成本。
抽水蓄能具有突出的能量密度和功率密度优势。借助其快速响应和灵活调节能力,能够有效平抑新能源出力随机波动,提高系统频率稳定性。针对抽水蓄能如何融入电力系统频率稳定控制问题,提出一种基于转速保护的变速抽蓄自适应综合惯量控制策略,并采用优化思想对控制参数进行求解。在考虑短期频率变化率(rate of change of frequency,RoCoF)预测及变速抽蓄自适应综合惯量控制响应系统频率变化的基础上,对传统电力系统低频切泵策略进行改进,提出定速抽蓄自适应低频切泵控制策略。通过不同场景下的仿真验证,结果表明,将变速抽蓄自适应综合惯量调频控制策略与改进低频切泵策略相结合能够更好地适应高比例新能源电力系统,提升系统的频率调节性能。
现有的索引选择方法存在诸多局限性.首先,大多数方法考虑场景较为单一,不能针对特定数据模态选择合适的索引结构,进而无法有效应对海量多模态数据;其次,现有方法未考虑索引选择时索引构建的代价,无法有效应对动态的工作负载.针对上述问题,提出一种面向多模态数据的智能高效索引选择模型APE-X DQN(Distributed prioritized experience replay in deep Q-network),称为AP-IS(APE-X DQN for index selection).AP-IS设计了新型索引集编码和SQL语句编码方法,该方法使AP-IS在感知多模态数据的同时兼顾索引结构本身的特性,极大地降低了索引的存储代价.APIS集成新型索引效益评估方法,在优化强化学习奖励机制的同时,监控数据库工作负载的执行状态,保证动态工作负载下AP-IS在时间和空间上的优化效果.在真实多模态数据集上进行大量实验,验证了AP-IS在工作负载的延迟、存储代价和训练效率等方面的性能,结果均明显优于最新索引选择方法.
暂无评论