冗余的条件独立性测试严重影响了基于约束的因果发现方法的效率和准确性。针对这一问题,本研究提出一种基于K-means聚类的因果分解方法(Causal decomposition method based on K-means clustering,CDKM)。CDKM利用K-means聚类将原始因...
详细信息
冗余的条件独立性测试严重影响了基于约束的因果发现方法的效率和准确性。针对这一问题,本研究提出一种基于K-means聚类的因果分解方法(Causal decomposition method based on K-means clustering,CDKM)。CDKM利用K-means聚类将原始因果发现问题划分为多个子因果发现问题,然后再将发现的子因果网络合并,从而得到完整的因果网络。具体来说,CDKM首先利用K-means聚类将原始变量集分割成k个簇;其次在每个簇中加入其他簇中与当前簇相关距离最小的两个节点,得到更新后的k个簇;然后在每个簇上进行因果发现,得到k个子因果网络;最后将所有子因果网络合并得到一个完整的因果网络。CDKM不仅避免了使用高阶条件独立性测试进行分解,还大大减少了冗余的条件独立性测试,相比传统的递归型基于约束的因果发现方法,CDKM可以将原始变量集任意分割。在8个数据集上的实验结果表明,CDKM可以极大地加速因果发现,降低了时间复杂度,且精准度优于基线模型。
暂无评论