为了在数据密集型工作流下有效降低缓存碎片整理开销并提高缓存命中率,提出一种持久性分布式文件系统客户端缓存DFS-Cache(Distributed File System Cache)。DFS-Cache基于非易失性内存(NVM)设计实现,能够保证数据的持久性和崩溃一致性...
详细信息
为了在数据密集型工作流下有效降低缓存碎片整理开销并提高缓存命中率,提出一种持久性分布式文件系统客户端缓存DFS-Cache(Distributed File System Cache)。DFS-Cache基于非易失性内存(NVM)设计实现,能够保证数据的持久性和崩溃一致性,并大幅减少冷启动时间。DFS-Cache包括基于虚拟内存重映射的缓存碎片整理机制和基于生存时间(TTL)的缓存空间管理策略。前者基于NVM可被内存控制器直接寻址的特性,动态修改虚拟地址和物理地址之间的映射关系,实现零拷贝的内存碎片整理;后者是一种冷热分离的分组管理策略,借助重映射的缓存碎片整理机制,提升缓存空间的管理效率。实验采用真实的Intel傲腾持久性内存设备,对比商用的分布式文件系统MooseFS和GlusterFS,采用Fio和Filebench等标准测试程序,DFS-Cache最高能提升5.73倍和1.89倍的系统吞吐量。
结合IMIA(International Medical Informatics Association)年鉴的定性数据和分别取自Web of Science和CNKI的国际、国内定量数据,用LDA主题模型识别研究的主题,在识别论文主题模型基础上采用3种聚类算法对研究进行聚类分析。研究发现,2...
详细信息
结合IMIA(International Medical Informatics Association)年鉴的定性数据和分别取自Web of Science和CNKI的国际、国内定量数据,用LDA主题模型识别研究的主题,在识别论文主题模型基础上采用3种聚类算法对研究进行聚类分析。研究发现,2000—2018年医学信息学分化出生物信息学和健康信息学两大分支,分别形成医学信息学的“硬”走向和“软”走向。在揭示两类走向分别标志医学信息学的技术性和应用性发展的同时,建议对医学信息学的健康信息学转向给予关注,并强化国家政策设计。
暂无评论