DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目...
详细信息
DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目标上看,这些工作大体上可分为减少冗余计算和并行化两大类;就具体加速手段而言,可分为6个主要类别:基于分布式、基于采样化、基于近似模糊、基于快速近邻、基于空间划分以及基于GPU加速技术.根据该分类,对现有工作进行了深入梳理与交叉比较,发现采用多重技术的融合加速算法优于单一加速技术;近似模糊化、并行化与分布式是当前最有效的手段;高维数据仍然难以应对.此外,对快速化DBSCAN算法在多个领域中的应用进行了跟踪报告.最后,对本领域未来的方向进行了展望.
共享单车调配是优化城市交通资源配置的重要手段,但目前的最优路径调配方法往往对单车系统规模敏感。为此,研究一种分时段、区域间调配的共享单车投放方法,提出了带约束的游牧算法(nomad algorithm with constraints,NCA)求解调配模型...
详细信息
共享单车调配是优化城市交通资源配置的重要手段,但目前的最优路径调配方法往往对单车系统规模敏感。为此,研究一种分时段、区域间调配的共享单车投放方法,提出了带约束的游牧算法(nomad algorithm with constraints,NCA)求解调配模型的最优解。将单车调配问题建模为以单车流量为约束、以最小化运营损耗为目标的优化问题;提出求解上述模型的NCA算法,预测投放区域单车存量和区域间转移量,相比无约束的原游牧算法,改进了局部搜索和全局寻优策略,优化了部落初定位方法;基于预测的存量和转移量得出分时段区域间单车的调配方案。在上海和纽约相关数据集上的对比实验结果表明,运行时长约为其他方法的15%,租赁需求响应率高于分支定界算法0.15%,单车总数和运营损耗比遗传算法降低了约10%,验证了该方法具有更高的优化效率和用户需求响应率。
时间序列分类问题是时间序列数据挖掘中的一项重要任务,近些年受到了越来越广泛的关注.该问题的一个重要组成部分就是时间序列间的相似性度量.在众多相似性度量算法中,动态时间规整是一种非常有效的算法,目前已经被广泛应用到视频、音频、手写体识别以及生物信息处理等众多领域.动态时间规整本质上是一种在边界及时间一致性约束下的点对点的匹配算法,能够获得两条序列间的全局最优匹配.但该算法存在一个明显的不足,即不一定能实现序列间的局部合理匹配.具体的讲,就是具有完全不同局部结构信息的时间点有可能被动态时间规整算法错误匹配.为了解决这个问题,提出了一种改进的基于局部梯度和二进制模式的动态时间规整算法LGBDTW(local gradient and binary pattern based dynamic time warping),通过考虑时间序列点的局部结构信息来强化传统动态时间规整算法.所提算法虽然实质上是一种动态时间规整算法,但它通过考虑序列点的局部梯度和二进制模式值来进行相似性加权度量,有效避免了具有相异局部结构的点匹配.为了进行全面比较,将所提出的算法应用到了最近邻分类算法的相似性度量中,并在多个UCR时间序列数据集上进行了测试.实验结果表明,所提出的方法能有效提高时间序列分类的准确率.此外,实例分析验证了所提出算法的可解释性.
暂无评论