新话题发现是进行舆情分析的基础和前提,新话题发现的一个关键环节是进行关键词的聚类分析.目前,大量的新话题来源于微博,但是将传统的聚类算法用于微博新话题发现时,会产生特征向量的高维性和稀疏性问题,使得聚类结果非常不准确,而且收敛时间难以控制,进而影响舆情分析的可靠性和实时性.鉴此,本文提出了频繁词集聚类FWSC(frequent words sets clustering)方法.实验结果表明,我们提出的方法能够快速有效地发现新话题.
随着云数据中心的大规模应用,其高能耗、高污染等问题日益突出。围绕数据中心的动态能耗管理(DEM,Dynamic Energy Management)问题,提出了一种基于广义随机Petri网(GSPN,Generalized Stochastic Petri Nets)的DEM建模、求解与分析的系...
详细信息
随着云数据中心的大规模应用,其高能耗、高污染等问题日益突出。围绕数据中心的动态能耗管理(DEM,Dynamic Energy Management)问题,提出了一种基于广义随机Petri网(GSPN,Generalized Stochastic Petri Nets)的DEM建模、求解与分析的系统性能评价框架。该框架综合考虑了多种任务调度策略的联合应用与服务器工作模式的动态调整,设计了合理的能耗优化策略,在保证系统服务质量(Qo S,Quality of Service)的同时,降低了数据中心能耗。仿真实验表明,所建立的性能评价框架,在不同系统负载下,可实现最佳任务调度策略的动态选择和服务器工作模式的动态切换,相较于随机调度策略,所提出的均衡调度策略和集中调度策略,分别可降低28%和43%的能耗。
暂无评论