文献详情 >人工智能大模型价值对齐的现状考察、问题检视与规范进路收藏

人工智能大模型价值对齐的现状考察、问题检视与规范进路

作者：曾雄

出版物：《电子政务》 (E-Government)

年卷期：2025年第2期

页面：34-44页

核心收录：

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

基　　金：国家社会科学基金重大项目“人工智能时代大国跨境数据战略竞争与中国应对研究”(批准号:23&ZD335) 教育部人文社会科学青年基金项目“我国平台经济领域自我优待行为的反垄断规制研究”(项目号:24YJC820003)

主　　题：人工智能大模型道德主体价值对齐生成式人工智能人机对齐

摘要：价值对齐是让大模型理解人类目标,使其行动决策与人类利益保持一致的风险治理对策。在理论方法上,大模型价值对齐包括自上而下和自下而上两种路径;在技术路线上,大模型价值对齐包括外部对齐、内部对齐和模型原理可解释等解决方案。不管采用哪一种理论方法和技术方案,大模型价值对齐面临的共同困境包括价值观多元性带来的价值标准选择难题,模型脆弱性带来的对齐“失败挑战,以及对齐后成本与效率的综合平衡问题。面对价值对齐的实践挑战,仅从技术、伦理或法律的单一维度无法充分应对,因而宜采用技术、伦理和法律协同规制的方法。在技术上,坚持混合式进路,并构建循环对齐模式;在伦理上,基于社会选择理论合理选取价值观标准;在法律上,基于技术特征构建大模型价值对齐的规范指引。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

人工智能大模型价值对齐的现状考察、问题检视与规范进路

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

人工智能大模型价值对齐的现状考察、问题检视与规范进路

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：