全民健康保险研究资料库(National Health Insurance Data ,NHIRD),里面含有台湾人民的就医纪录。在台湾,研究人员是可以运用健保资料库来研究医学数据的。在发表文章前,研究人员必须运用去识别化和加密标识的技术来保障病人的隐私...
详细信息
全民健康保险研究资料库(National Health Insurance Data ,NHIRD),里面含有台湾人民的就医纪录。在台湾,研究人员是可以运用健保资料库来研究医学数据的。在发表文章前,研究人员必须运用去识别化和加密标识的技术来保障病人的隐私。但是如果只有去识别化和加密标识并不足以保障病人的隐私,举例来说,有一个众所皆知的名人,其实骇客只要透过一些比较明显的个人特征还是能轻易地堆断出名人的就医纪录。 因此本文的研究目的是透过对模型的扰动和重建,达到限制披露风险,同时也要尽可能保留较多资料的内容和结构,让资料能在被保护的情况下,进行统计分析。 在本文中,扰动方法为添加噪音,重建的方法为对组别和类别进行转换,再比较转换前和转换后的差异后,发现类别交换比例、组别交换比例和添加噪音的多寡是影响检定力重要的因素,要让资料的检定力越强,就应该要保留越多的原始资料。
暂无评论