随着计算机网络、移动互联网等信息技术的迅猛发展,云存储作为一种新兴的网络存储技术也蓬勃发展起来。云存储技术将数据资源存放在云服务器上供用户访问,有效解决了用户本地存储容量紧张的问题。然而,随着用户规模不断扩大,越来越多的重复数据存储在云服务器端,给云服务器带来了存储资源的巨大浪费。数据去重技术是云存储系统提高存储效率的有效方法,即云服务器通过存储重复数据的唯一副本来降低数据存储和传输成本。然而,随着安全意识的提高,用户将数据加密后上传至云服务器,这使得云服务器很难基于密文识别相同数据进行数据去重。如何在提高数据去重效率的同时,更好地保护数据隐私,是当今学术界和工业界的研究热点问题。本文针对现有加密数据去重方案中存在的若干问题,重点关注用户属性对数据去重的影响,并提出以下两个解决方法:1)首次提出聚类偏差的概念,对DBSCAN算法进行改进,提出一种新算法——可容忍聚类偏差的DBSCAN(TCD-DBSCAN)算法,并将其应用于数据去重过程中。设计了一种基于TCD-DBSCAN算法的数据去重方案。方案采用数据流行度划分的策略,考虑到用户属性,数据的流行度贡献值由当前上传者与先前上传者间的属性相似度决定,降低了内部隐私数据过早变为流行数据而导致隐私泄露的风险。对于流行程度不同的数据采用不同的加密方法,以平衡数据安全性和计算开销。安全性分析表明该方案具有较高的安全性。最后,通过仿真实验验证了本方案的可用性和高效性。2)提出了一种无需可信第三方参与的双层认证的数据去重方案。基于双线性映射构造数据标签以实现数据所有权证明(Proof of Ownership,PoW)。考虑到用户属性对数据去重的影响,首次提出了安全性证明(Proof of Security,PoS)的概念,限制用户间密钥共享,进一步保障了数据的安全性。在该方案中,用户使用ECDHE密钥协商算法进行密钥共享,以确保数据的语义安全。同时,云服务器采用基于密文策略的属性加密(CP-ABE)算法对用户上传的密文进行重新加密,以确保系统的前向安全。最后,通过安全性分析和仿真实验验证了本方案是安全、高效的。
暂无评论