咨询与建议

限定检索结果

文献类型

  • 360 篇 专利
  • 1 篇 成果

馆藏范围

  • 361 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 信息与通信工程

主题

  • 1 篇 语音识别
  • 1 篇 mapreduce框架
  • 1 篇 hadoop云计算
  • 1 篇 查分平台
  • 1 篇 语言模型训练

机构

  • 22 篇 北京百度网讯科技...
  • 13 篇 腾讯科技有限公司
  • 8 篇 清华大学
  • 8 篇 平安科技有限公司
  • 8 篇 北京声智科技有限...
  • 7 篇 科大讯飞股份有限...
  • 7 篇 上海交通大学
  • 7 篇 厦门快商通科技股...
  • 6 篇 苏州思必驰信息科...
  • 6 篇 平安国际智慧城市...
  • 6 篇 华南理工大学
  • 5 篇 沈阳雅译网络技术...
  • 5 篇 阿里巴巴有限公司
  • 5 篇 支付宝信息技术有...
  • 4 篇 北京壹永科技有限...
  • 4 篇 北京一览群智数据...
  • 4 篇 智慧眼科技股份有...
  • 4 篇 中国人民大学
  • 4 篇 电子科技大学
  • 4 篇 北京金山数字娱乐...

作者

  • 8 篇 陈孝良
  • 7 篇 肖龙源
  • 7 篇 李稀敏
  • 7 篇 刘晓葳
  • 7 篇 冯大航
  • 7 篇 俞凯
  • 6 篇 万广鲁
  • 6 篇 蔡振华
  • 6 篇 孙一博
  • 6 篇 黄际洲
  • 5 篇 常乐
  • 5 篇 李恬静
  • 5 篇 王伟
  • 5 篇 钱泓锦
  • 5 篇 窦志成
  • 5 篇 杜权
  • 5 篇 朱威
  • 4 篇 王晓龙
  • 4 篇 张广学
  • 4 篇 刘占亮

语言

  • 361 篇 中文
检索条件"主题词=语言模型训练"
361 条 记 录,以下是111-120 订阅
排序:
语言模型训练方法、回复文本获取方法、装置及设备
大语言模型训练方法、回复文本获取方法、装置及设备
收藏 引用
作者: 欧阳晟 胡羽蓝 万峻辰 100085 北京市海淀区西二旗西路16号院12号楼8层101
本公开提供了一种大语言模型训练方法、回复文本获取方法、装置及设备,属于计算机技术领域。方法包括:获取样本文本、样本文本的样本回复文本对及样本回复文本对中每个样本回复文本的匹配度;对于每个样本回复文本,将样本文本及样本... 详细信息
来源: 评论
可持续学习语言模型训练方法、装置及商户信息挖掘方法
可持续学习语言模型训练方法、装置及商户信息挖掘方法
收藏 引用
作者: 徐晓明 王迎伟 简宁 李超 吕斌 王丽华 孟敬奇 王悦 100808 北京市西城区金融大街3号
本申请公开了一种可持续学习语言模型训练方法、装置及商户信息挖掘方法,所述训练方法包括扩充得到相关领域样本数据;根据所述相关领域样本数据,对预训练语言模型进行持续学习,得到对应领域的语言模型;对所述对应领域的语言模型进... 详细信息
来源: 评论
语言模型训练方法及装置
大语言模型训练方法及装置
收藏 引用
作者: 代季峰 宁雪妃 100084 北京市海淀区清华园1号
本公开涉及大语言模型技术领域,尤其涉及一种大语言模型训练方法及装置,获取基于人类反馈而获得用于奖励模型的第一数据集,第一数据集中包括手动标记的多个第一数据;利用第一数据集对预训练语言模型进行训练得目标奖励模型;根据利... 详细信息
来源: 评论
语言识别、语言模型训练、字符预测方法及装置
语言识别、语言模型训练、字符预测方法及装置
收藏 引用
作者: 龚彩霞 100193 北京市海淀区东北旺西路8号院34号楼
本申请实施例提供了一种语言识别、语言模型训练、字符预测方法及装置,其中,语言识别方法包括:获取多个样本文本,并按照多个切分尺寸对所述样本文本进行切分处理,获取与每个所述切分尺寸分别对应的多个字符串组;其中,每个所述字... 详细信息
来源: 评论
一种用于自动驾驶的生成式大语言模型训练方法及存储介质
一种用于自动驾驶的生成式大语言模型训练方法及存储介质
收藏 引用
作者: 何弢 严骏驰 廖文龙 任麒冰 241000 安徽省芜湖市西昌路1号
本发明公开了一种用于自动驾驶的生成式大语言模型训练方法及储存介质,先把场景和自动驾驶汽车的决策信息组成规则,构建第一训练集,并预训练出第一生成式大语言模型;再进行有监督微调训练,得到第二生成式大语言模型;然后构建第二... 详细信息
来源: 评论
一种加速大语言模型训练的数据预处理方法及系统
一种加速大语言模型训练的数据预处理方法及系统
收藏 引用
作者: 李多海 201203 上海市浦东新区博霞路11号
本发明提出了一种加速大语言模型训练的数据预处理方法及系统,解决了现有大语言模型训练过程中将数据完全打散,以致数据的随机性缺失的问题。先后通过将用于大语言模型训练的数据打散后进行分块并按照文本数据的长度大小进行排序,实... 详细信息
来源: 评论
语言模型训练方法及计算机设备
大语言模型训练方法及计算机设备
收藏 引用
作者: 陈孝良 涂贤玲 常乐 黄赟贺 100094 北京市海淀区北清路81号院一区1号楼6层601
本申请实施例公开了一种大语言模型训练方法及计算机设备,属于计算机技术领域。方法包括:处理器获取多个GPU的状态信息及多个训练任务;处理器基于多个GPU的状态信息,将多个训练任务分发给多个GPU;多个GPU通过大语言模型执行分发到... 详细信息
来源: 评论
一种垂直领域大语言模型训练方法及相关设备
一种垂直领域大语言模型训练方法及相关设备
收藏 引用
作者: 蔡一平 黄琦敏 刘江 王文杰 陶扬 万谦 谢磊 430205 湖北省武汉市东湖新技术开发区软件园东路1号软件产业4.1期B区B3栋6层01室-5(自贸区片区)
本申请涉及大语言模型技术领域,尤其涉及一种垂直领域大语言模型训练方法及相关设备。方法包括:获取训练样本集;通用领域数据样本集中样本包括:通用领域问答指令,以及对应于通用领域问答指令的输出;垂直领域数据样本集中样本包括... 详细信息
来源: 评论
一种强化中文实体语义特征的语言模型训练方法和系统
一种强化中文实体语义特征的语言模型训练方法和系统
收藏 引用
作者: 饶璐 杨兰 谭斌 周兴发 孙锐 610000 四川省成都市中国(四川)自由贸易试验区成都高新区天府四街199号1栋33层
本发明提供了一种强化中文实体语义特征的语言模型训练方法和系统,包括以下步骤:对语料数据进行文本规范化处理;将所述语料数据分为标准集和候选集;将所述标准集中的n条语料和候选集中的m条语料放入文本相似度模型中,形成n个相似... 详细信息
来源: 评论
基于持续预训练语言模型训练方法和装置
基于持续预训练的语言模型训练方法和装置
收藏 引用
作者: 蒋刚玮 魏颖 蒋才高 薛思乔 詹姆士·张 郝鸿延 冯晓云 王言 潘晨 周俊 310000 浙江省杭州市西湖区西溪路556号8层B段801-11
本说明书的实施例提供了一种基于持续预训练语言模型训练方法和装置。在该基于持续预训练语言模型训练方法中,利用当前软提示生成模型得到与当前领域的各个当前训练样本对应的软提示特征;进而利用当前语言模型根据各个文本数据和... 详细信息
来源: 评论