检索结果-内蒙古大学图书馆

您好，读者！请登录

内蒙古大学图书馆

首页
概况
党建
资源
服务
科研支持
- 论文收录引用证明
- 科技查新
知识产权
档案馆
帮助

咨询与建议

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

您的常用邮箱：*

您的手机号码：*

问题描述：

当前已输入0个字，您还可以输入200个字

全部搜索
期刊论文
图书
学位论文
标准
纸本馆藏
外文资源发现
数据库导航
超星发现

高级检索

时间限定

出版年份：

文献类型

图书期刊文献学位论文多媒体

馆藏选择

电子馆藏纸本馆藏

核心期刊

全部期刊 SCI 收录期刊 SSCI 收录期刊 EI 收录期刊 CSCD 收录期刊 CSSCI 收录期刊

语言

中文英文

文献类型

期刊文献图书学位论文标准纸本馆藏

帮助

文字说明：

T=题名（书名、题名），A=作者（责任者），K=主题词，P=出版物名称，PU=出版社名称，O=机构（作者单位、学位授予单位、专利申请人），L=中图分类号，C=学科分类号，U=全部字段，Y=年（出版发行年、学位年度、标准发布年）

检索规则说明：

AND代表“并且”；OR代表“或者”；NOT代表“不包含”；(注意必须大写,运算符两边需空一格)

检索范例：

范例一：(K=图书馆学 OR K=情报学) AND A=范并思 AND Y=1982-2016
范例二：P=计算机应用与软件 AND (U=C++ OR U=Basic) NOT K=Visual AND Y=2011-2016

分类表

所选分类

>> <<

限定检索结果

文献类型

360 篇 专利
1 篇 成果

馆藏范围

361 篇 电子文献
0 种 纸本馆藏

日期分布

学科分类号

1 篇 工学
- 1 篇 信息与通信工程

主题

1 篇 语音识别
1 篇 mapreduce框架
1 篇 hadoop云计算
1 篇 查分平台
1 篇 语言模型训练

机构

22 篇 北京百度网讯科技...
13 篇 腾讯科技有限公司
8 篇 清华大学
8 篇 平安科技有限公司
8 篇 北京声智科技有限...
7 篇 科大讯飞股份有限...
7 篇 上海交通大学
7 篇 厦门快商通科技股...
6 篇 苏州思必驰信息科...
6 篇 平安国际智慧城市...
6 篇 华南理工大学
5 篇 沈阳雅译网络技术...
5 篇 阿里巴巴有限公司
5 篇 支付宝信息技术有...
4 篇 北京壹永科技有限...
4 篇 北京一览群智数据...
4 篇 智慧眼科技股份有...
4 篇 中国人民大学
4 篇 电子科技大学
4 篇 北京金山数字娱乐...

作者

8 篇 陈孝良
7 篇 肖龙源
7 篇 李稀敏
7 篇 刘晓葳
7 篇 冯大航
7 篇 俞凯
6 篇 万广鲁
6 篇 蔡振华
6 篇 孙一博
6 篇 黄际洲
5 篇 常乐
5 篇 李恬静
5 篇 王伟
5 篇 钱泓锦
5 篇 窦志成
5 篇 杜权
5 篇 朱威
4 篇 王晓龙
4 篇 张广学
4 篇 刘占亮

语言

361 篇 中文

检索条件"主题词=语言模型训练"

共 361 条记录，以下是111-120 订阅

全选清除本页清除全部题录导出标记到"检索档案"

详细简洁

排序：

大语言模型训练方法、回复文本获取方法、装置及设备

大语言模型训练方法、回复文本获取方法、装置及设备

引用

作者：欧阳晟胡羽蓝万峻辰 100085 北京市海淀区西二旗西路16号院12号楼8层101

本公开提供了一种大语言模型训练方法、回复文本获取方法、装置及设备，属于计算机技术领域。方法包括：获取样本文本、样本文本的样本回复文本对及样本回复文本对中每个样本回复文本的匹配度；对于每个样本回复文本，将样本文本及样本... 详细信息

标准号: CN118278457A

本公开提供了一种大语言模型训练方法、回复文本获取方法、装置及设备，属于计算机技术领域。方法包括：获取样本文本、样本文本的样本回复文本对及样本回复文本对中每个样本回复文本的匹配度；对于每个样本回复文本，将样本文本及样本回复文本输入待训练的大语言模型进行编码和解码，得到样本回复文本的概率；确定第一数值及第二数值；基于第一数值及第二数值，对待训练的大语言模型进行训练。在本公开实施例中，在训练大语言模型的过程中考虑不同样本回复文本的质量差异的影响，保证大语言模型能够基于输入文本生成高质量的回复文本，进而提升了大语言模型的准确性。

关键词：回复文本样本语言模型样本文本计算机技术领域语言模型训练装置及设备输入文本文本获取质量差异匹配度概率保证

来源：评论

学校读者我要写书评

暂无评论

可持续学习语言模型训练方法、装置及商户信息挖掘方法

可持续学习语言模型训练方法、装置及商户信息挖掘方法

引用

作者：徐晓明王迎伟简宁李超吕斌王丽华孟敬奇王悦 100808 北京市西城区金融大街3号

本申请公开了一种可持续学习语言模型训练方法、装置及商户信息挖掘方法，所述训练方法包括扩充得到相关领域样本数据；根据所述相关领域样本数据，对预训练语言模型进行持续学习，得到对应领域的语言模型；对所述对应领域的语言模型进... 详细信息

标准号: CN117829263A

本申请公开了一种可持续学习语言模型训练方法、装置及商户信息挖掘方法，所述训练方法包括扩充得到相关领域样本数据；根据所述相关领域样本数据，对预训练语言模型进行持续学习，得到对应领域的语言模型；对所述对应领域的语言模型进行知识蒸馏，得到轻量化语言模型。通过本申请实现了在专业领域中少样本的扩充，以及提供了可持续学习、轻量化的语言模型训练方案。本申请可用于金融领域的商户信息挖掘处理，或者是其他领域的信息挖掘处理。

关键词：语言模型语言模型训练商户信息样本数据轻量化申请金融领域信息挖掘专业领域蒸馏挖掘可用学习样本

来源：评论

学校读者我要写书评

暂无评论

大语言模型训练方法及装置

大语言模型训练方法及装置

引用

作者：代季峰宁雪妃 100084 北京市海淀区清华园1号

本公开涉及大语言模型技术领域，尤其涉及一种大语言模型训练方法及装置，获取基于人类反馈而获得用于奖励模型的第一数据集，第一数据集中包括手动标记的多个第一数据；利用第一数据集对预训练语言模型进行训练得目标奖励模型；根据利... 详细信息

标准号: CN118036757B

本公开涉及大语言模型技术领域，尤其涉及一种大语言模型训练方法及装置，获取基于人类反馈而获得用于奖励模型的第一数据集，第一数据集中包括手动标记的多个第一数据；利用第一数据集对预训练语言模型进行训练得目标奖励模型；根据利用目标奖励模型对第一数据进行测试得到的测试结果计算出目标奖励模型的误差率；在误差率大于或等于误差阈值时，利用第一数据集训练目标奖励模型得到新的目标奖励模型并进行误差率计算，直至最新的目标奖励模型的误差率小于误差阈值；利用所有目标奖励模型和用于大语言模型的第二数据集训练预训练语言模型得到训练好的大语言模型。利用训练出的高效奖励模型得到高性能增益的LLM，提高了LLM的精度和效果。

关键词：第一数据奖励语言模型误差率语言模型训练手动标记训练目标数据集阈值时测试反馈

来源：评论

学校读者我要写书评

暂无评论

语言识别、语言模型训练、字符预测方法及装置

语言识别、语言模型训练、字符预测方法及装置

引用

作者：龚彩霞 100193 北京市海淀区东北旺西路8号院34号楼

本申请实施例提供了一种语言识别、语言模型训练、字符预测方法及装置，其中，语言识别方法包括：获取多个样本文本，并按照多个切分尺寸对所述样本文本进行切分处理，获取与每个所述切分尺寸分别对应的多个字符串组；其中，每个所述字... 详细信息

标准号: CN111859948B

本申请实施例提供了一种语言识别、语言模型训练、字符预测方法及装置，其中，语言识别方法包括：获取多个样本文本，并按照多个切分尺寸对所述样本文本进行切分处理，获取与每个所述切分尺寸分别对应的多个字符串组；其中，每个所述字符串组包括多个样本字符串；针对每个字符串组，获取该字符串组中每个样本字符串在所有样本文本中出现的概率；基于所述样本文本以及每个字符串组中每个样本字符串在所有样本文本中出现的概率，训练语言模型；基于训练的所述语言模型，获取待识别语言的语言识别结果。本申请实施例能够兼顾语言识别功能的上线更新速度和识别准确率。

关键词：样本文本字符串语言识别样本字符语言模型语言模型训练字符预测概率准确率上线申请更新语言

来源：评论

学校读者我要写书评

暂无评论

一种用于自动驾驶的生成式大语言模型训练方法及存储介质

一种用于自动驾驶的生成式大语言模型训练方法及存储介质

引用

作者：何弢严骏驰廖文龙任麒冰 241000 安徽省芜湖市西昌路1号

本发明公开了一种用于自动驾驶的生成式大语言模型训练方法及储存介质，先把场景和自动驾驶汽车的决策信息组成规则，构建第一训练集，并预训练出第一生成式大语言模型；再进行有监督微调训练，得到第二生成式大语言模型；然后构建第二... 详细信息

标准号: CN118227761A

本发明公开了一种用于自动驾驶的生成式大语言模型训练方法及储存介质，先把场景和自动驾驶汽车的决策信息组成规则，构建第一训练集，并预训练出第一生成式大语言模型；再进行有监督微调训练，得到第二生成式大语言模型；然后构建第二训练集，并预训练出第三生成式大语言模型；然后得到奖励模型；最后将第二生成式大模型，基于奖励模型，进行人类反馈强化学习，得到目标生成式大语言模型。本发明利用有监督微调和人类偏好强化学习的方法来让生成式大语言模型拥有和人类驾驶员的驾驶经验和常识，并且基于生成式大语言模型的推理能力，可以有效面对真实环境中出现的长尾案例，提升自动驾驶或者辅助驾驶的安全性、可解释性降低训练成本和部署成本。

关键词：生成式语言模型自动驾驶强化学习训练集构建语言模型训练储存介质辅助驾驶决策信息目标生成真实环境解释性奖励长尾偏好推理微调调和场景反馈驾驶监督部署汽车

来源：评论

学校读者我要写书评

暂无评论

一种加速大语言模型训练的数据预处理方法及系统

一种加速大语言模型训练的数据预处理方法及系统

引用

作者：李多海 201203 上海市浦东新区博霞路11号

本发明提出了一种加速大语言模型训练的数据预处理方法及系统，解决了现有大语言模型训练过程中将数据完全打散，以致数据的随机性缺失的问题。先后通过将用于大语言模型训练的数据打散后进行分块并按照文本数据的长度大小进行排序，实... 详细信息

标准号: CN118171108A

本发明提出了一种加速大语言模型训练的数据预处理方法及系统，解决了现有大语言模型训练过程中将数据完全打散，以致数据的随机性缺失的问题。先后通过将用于大语言模型训练的数据打散后进行分块并按照文本数据的长度大小进行排序，实现了在保证数据集一定随机性的情况下，大幅提升了训练效率，进而降低训练的时间成本。

关键词：语言模型训练随机性打散数据预处理时间成本文本数据训练效率数据集分块排序保证

来源：评论

学校读者我要写书评

暂无评论

大语言模型训练方法及计算机设备

大语言模型训练方法及计算机设备

引用

作者：陈孝良涂贤玲常乐黄赟贺 100094 北京市海淀区北清路81号院一区1号楼6层601

本申请实施例公开了一种大语言模型训练方法及计算机设备，属于计算机技术领域。方法包括：处理器获取多个GPU的状态信息及多个训练任务；处理器基于多个GPU的状态信息，将多个训练任务分发给多个GPU；多个GPU通过大语言模型执行分发到... 详细信息

标准号: CN118013274A

本申请实施例公开了一种大语言模型训练方法及计算机设备，属于计算机技术领域。方法包括：处理器获取多个GPU的状态信息及多个训练任务；处理器基于多个GPU的状态信息，将多个训练任务分发给多个GPU；多个GPU通过大语言模型执行分发到的训练任务；处理器在多个GPU执行分发到的训练任务的过程中，响应于第一GPU处于阻塞状态，基于多个GPU的状态信息，确定每个GPU的繁忙度；处理器基于多个GPU的繁忙度，从多个GPU中确定第二GPU，第二GPU的繁忙度低于第一GPU的繁忙度；处理器基于第一GPU待执行训练任务的优先级，将第一训练任务分发给第二GPU。本申请提升大语言模型的训练效率。

关键词：处理器繁忙度任务分发语言模型分发计算机技术领域语言模型训练计算机设备训练效率阻塞状态申请响应

来源：评论

学校读者我要写书评

暂无评论

一种垂直领域大语言模型训练方法及相关设备

一种垂直领域大语言模型训练方法及相关设备

引用

作者：蔡一平黄琦敏刘江王文杰陶扬万谦谢磊 430205 湖北省武汉市东湖新技术开发区软件园东路1号软件产业4.1期B区B3栋6层01室-5(自贸区片区)

本申请涉及大语言模型技术领域，尤其涉及一种垂直领域大语言模型训练方法及相关设备。方法包括：获取训练样本集；通用领域数据样本集中样本包括：通用领域问答指令，以及对应于通用领域问答指令的输出；垂直领域数据样本集中样本包括... 详细信息

标准号: CN117828401A

本申请涉及大语言模型技术领域，尤其涉及一种垂直领域大语言模型训练方法及相关设备。方法包括：获取训练样本集；通用领域数据样本集中样本包括：通用领域问答指令，以及对应于通用领域问答指令的输出；垂直领域数据样本集中样本包括：垂直领域问答指令，以及对应于垂直领域问答指令的输出；垂直领域续写样本集中样本包括：垂直领域续写指令和续写指令，以及对应于领域提示文本和垂直续写指令的续写文本；通过训练样本集对微调模型进行再训练，得到垂直领域大语言模型。本申请能够解决现有技术中在训练垂直领域大语言模型方法上存在训练效率低和训练质量低的问题。

关键词：垂直样本语言模型写指令指令训练样本集领域数据通用文本语言模型训练训练效率输出微调申请提示

来源：评论

学校读者我要写书评

暂无评论

一种强化中文实体语义特征的语言模型训练方法和系统

一种强化中文实体语义特征的语言模型训练方法和系统

引用

作者：饶璐杨兰谭斌周兴发孙锐 610000 四川省成都市中国(四川)自由贸易试验区成都高新区天府四街199号1栋33层

本发明提供了一种强化中文实体语义特征的语言模型训练方法和系统，包括以下步骤：对语料数据进行文本规范化处理；将所述语料数据分为标准集和候选集；将所述标准集中的n条语料和候选集中的m条语料放入文本相似度模型中，形成n个相似... 详细信息

标准号: CN116029300A

本发明提供了一种强化中文实体语义特征的语言模型训练方法和系统，包括以下步骤：对语料数据进行文本规范化处理；将所述语料数据分为标准集和候选集；将所述标准集中的n条语料和候选集中的m条语料放入文本相似度模型中，形成n个相似候选集，为标准集中的每条语料在候选集中找出top k个相似数据；根据所述n个相似候选集，构建实体标准库、实体别名库和实体对立库；根据所述实体标准库、实体别名库和实体对立库，构建用于训练语言模型的文本相似对和文本不相似对；将所述文本相似对和所述文本不相似对放入包含了初始化语言模型的分类模型中进行训练，获得包含实体语义特征的语言模型。

关键词：语料文本语言模型候选集实体标准实体语义放入构建语言模型训练文本相似度分类模型对立初始化规范化中文

来源：评论

学校读者我要写书评

暂无评论

基于持续预训练的语言模型训练方法和装置

基于持续预训练的语言模型训练方法和装置

引用

作者：蒋刚玮魏颖蒋才高薛思乔詹姆士·张郝鸿延冯晓云王言潘晨周俊 310000 浙江省杭州市西湖区西溪路556号8层B段801-11

本说明书的实施例提供了一种基于持续预训练的语言模型训练方法和装置。在该基于持续预训练的语言模型训练方法中，利用当前软提示生成模型得到与当前领域的各个当前训练样本对应的软提示特征；进而利用当前语言模型根据各个文本数据和... 详细信息

标准号: CN117875449A

本说明书的实施例提供了一种基于持续预训练的语言模型训练方法和装置。在该基于持续预训练的语言模型训练方法中，利用当前软提示生成模型得到与当前领域的各个当前训练样本对应的软提示特征；进而利用当前语言模型根据各个文本数据和对应的软提示特征得到各个文本数据对应于当前领域的隐特征；再基于所得到的各个文本数据对应于当前领域的隐特征与相应基于所述初始当前语言模型而得到的对应于上一领域的隐特征之间的差异，确定跨域损失值；在不满足当前领域的训练结束条件时根据跨域损失值调整当模型参数；在满足当前领域的训练结束条件时继续利用下一领域的训练样本集重复执行上述模型训练过程，直至满足持续预训练的训练结束条件。

关键词：结束条件文本数据语言模型训练语言模型提示跨域模型训练过程方法和装置训练样本集模型参数生成模型训练样本重复执行

来源：评论

学校读者我要写书评

暂无评论

没有更多数据了...

全选清除本页清除全部题录导出标记到“检索档案”

共37页 << < 8 9 10 11 12 13 14 15 16 17 > >>

检索报告对象比较合并检索0

隐藏清空

合并搜索

回到顶部

执行限定条件

内容：

评分：

请选择保存的检索档案：

请选择收藏分类：

订阅名称：

通借通还

温馨提示：

图书名称：

借书校区：

取书校区：

手机号码：

邮箱地址：

一卡通帐号：

电话和邮箱必须正确填写，我们会与您联系确认。

联系人：

所在院系：

联系邮箱：

联系电话：

内蒙古自治区呼和浩特市赛罕区大学西街235号邮编: 010021

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：