版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:北京科技大学文法学院
出 版 物:《电子政务》 (E-Government)
年 卷 期:2025年第2期
页 面:34-44页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家社会科学基金重大项目“人工智能时代大国跨境数据战略竞争与中国应对研究”(批准号:23&ZD335) 教育部人文社会科学青年基金项目“我国平台经济领域自我优待行为的反垄断规制研究”(项目号:24YJC820003)
主 题:人工智能 大模型 道德主体 价值对齐 生成式人工智能 人机对齐
摘 要:价值对齐是让大模型理解人类目标,使其行动决策与人类利益保持一致的风险治理对策。在理论方法上,大模型价值对齐包括自上而下和自下而上两种路径;在技术路线上,大模型价值对齐包括外部对齐、内部对齐和模型原理可解释等解决方案。不管采用哪一种理论方法和技术方案,大模型价值对齐面临的共同困境包括价值观多元性带来的价值标准选择难题,模型脆弱性带来的对齐“失败挑战,以及对齐后成本与效率的综合平衡问题。面对价值对齐的实践挑战,仅从技术、伦理或法律的单一维度无法充分应对,因而宜采用技术、伦理和法律协同规制的方法。在技术上,坚持混合式进路,并构建循环对齐模式;在伦理上,基于社会选择理论合理选取价值观标准;在法律上,基于技术特征构建大模型价值对齐的规范指引。