微软的SQL Server2000是当今最流行的数据库管理软件之一,研究了在SQL Server 2000上数据挖掘实现方面的决策树算法。决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识。SQL Server 2000/Analysis Service两层结构决策...
详细信息
微软的SQL Server2000是当今最流行的数据库管理软件之一,研究了在SQL Server 2000上数据挖掘实现方面的决策树算法。决策树算法通过构造精度高、小规模的决策树采掘训练集中的分类知识。SQL Server 2000/Analysis Service两层结构决策树,采用了以类记数表及深度优先策略生成,在建树算法和数据库间设立数据挖掘中间件。并讨论了通过使用像SQL Server 2000 Analysis Service这样的典型工具来如何实现数据挖掘模型的创建,且为商业组织的决定挖掘出必要的数据。
近年来,在网络经济学、环境科学、互联网技术等许多领域产生的大数据,使得许多传统的数据处理及分析算法已不能满足数据急速增长的需求。解决这一问题的方案之一是针对不同数据的特点建立适当的数据挖掘模型并研究高效的求解算法。本文针对大数据背景下无线传感网的优化建模及分布式优化算法设计与应用进行研究。论文的主要工作如下: 首先,针对具有分布式结构的凸优化问题,介绍三种常用的分布式优化算法:交替方向乘子法(Alternating Direction Method of Multipliers)、分布式投影次梯度法和增量次梯度法,并给出各算法的思想和迭代格式。 其次,针对具有分布式结构的严格凸优化问题,当网络拓扑结构含有一条哈密尔顿路径时,利用对偶理论与Jacobi迭代技巧,提出非精确分布式牛顿方法。当网络拓扑结构为任意连通网络时,通过该网络的生成树,利用特殊的矩阵分解技巧提出适用于任意连通网络的非精确分布式牛顿法。非精确分布式牛顿法充分利用了目标函数的二阶信息,并且避免了对原问题目标函数Hessian矩阵的整体求解,实现了原始向量、对偶向量和牛顿方向的分布式求解,通过理论证明了算法的收敛性。 第三,将分布式算法应用到两个问题中。针对无线定位问题,将分布式投影次梯度方法用于求解该模型,数值实验表明该方法比增量次梯度方法在运行时间上更高效;将文章提出的非精确分布式牛顿法应用到求解耦合非线性振子的Kuramoto模型中,并与分布式投影次梯度法和增量次梯度法进行比较,数值实验结果说明非精确分布式牛顿法的高效性。 最后,对文章的主要内容进行总结,并针对现有一些算法的问题提出了进一步研究的课题。
暂无评论