咨询与建议

限定检索结果

文献类型

  • 182 篇 专利

馆藏范围

  • 182 篇 电子文献
  • 0 种 纸本馆藏

日期分布

机构

  • 16 篇 腾讯科技有限公司
  • 9 篇 北京百度网讯科技...
  • 8 篇 平安科技有限公司
  • 7 篇 百度在线网络技术...
  • 7 篇 中国工商银行股份...
  • 5 篇 北京三快在线科技...
  • 5 篇 北京声智科技有限...
  • 4 篇 深圳追一科技有限...
  • 4 篇 北京捷通华声科技...
  • 4 篇 中国平安人寿保险...
  • 4 篇 阿里巴巴集团控股...
  • 3 篇 华为技术有限公司
  • 3 篇 苏州元脑智能科技...
  • 2 篇 北京达佳互联信息...
  • 2 篇 中国农业银行股份...
  • 2 篇 上海燧原科技有限...
  • 2 篇 云知声智能科技股...
  • 2 篇 南京硅基智能科技...
  • 2 篇 广州虎牙科技有限...
  • 2 篇 北京百悟科技有限...

作者

  • 5 篇 陈孝良
  • 5 篇 王健宗
  • 4 篇 王雅晴
  • 4 篇 李健
  • 4 篇 武卫东
  • 3 篇 王强
  • 3 篇 赵旭东
  • 3 篇 窦德景
  • 2 篇 吴俊江
  • 2 篇 宋勋超
  • 2 篇 韩友
  • 2 篇 金培根
  • 2 篇 王惠东
  • 2 篇 吴振宗
  • 2 篇 张俊
  • 2 篇 刘杰
  • 2 篇 王晓龙
  • 2 篇 马源
  • 2 篇 潘学海
  • 2 篇 郭同

语言

  • 182 篇 中文
检索条件"主题词=目标语言模型"
182 条 记 录,以下是31-40 订阅
排序:
语言模型训练方法、装置和计算机设备
语言模型训练方法、装置和计算机设备
收藏 引用
作者: 谭翊章 缪畅宇 518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层
本申请涉及一种语言模型训练方法、装置和计算机设备,所述方法包括:获取待处理文本及对应的标签词;将待处理文本输入至语言模型中进行处理,得到第一待选词对应的第一概率以及第二待选词对应的第二概率,其中,第一待选词为预设词表... 详细信息
来源: 评论
一种多种语言模型的文本转换方法及装置
一种多种语言模型的文本转换方法及装置
收藏 引用
作者: 刘纯一 王鹏 薛艳云 柳俊宏 李奘 100193 北京市海淀区东北旺西路8号院34号楼
本发明提供了一种多种语言模型的文本转换方法及装置,该方法包括:获取待转换文本和目标语言模型标识;根据目标语言模型标识从多种语言模型信息库中获取对应的目标配置文件、目标编码规则和目标语言模型参数;利用目标编码规则对待转... 详细信息
来源: 评论
一种基于语言模型的数据处理方法、装置、设备及介质
一种基于语言模型的数据处理方法、装置、设备及介质
收藏 引用
作者: 郑伟 王国栋 王强 吴海胖 310058 浙江省杭州市西湖区余杭塘路866号
本申请公开了计算机技术领域内的一种基于语言模型的数据处理方法、装置、设备及介质。本申请针对目标角色名称,能够生成目标角色名称对应的描述提示词来提示模型进行角色扮演;针对目标角色名称的目标问句,能够选择与目标问句的相关... 详细信息
来源: 评论
用于金融服务的语言模型微调方法、装置、设备及介质
用于金融服务的语言模型微调方法、装置、设备及介质
收藏 引用
作者: 陆凯 518000 广东省深圳市福田区福田街道益田路5033号平安金融中心14、15、16、37、41、44、45、46、54、58、59层
本发明涉及金融领域,尤其涉及一种用于金融服务的语言模型微调方法、装置、设备及介质,该方法获取历史时间段内金融服务对应的N个历史问答数据的问题文本,对所有问题文本进行文本筛选,得到目标业务下的目标问题文本;对目标问题文... 详细信息
来源: 评论
大规模语言模型的开放域问答实现方法、装置及设备
大规模语言模型的开放域问答实现方法、装置及设备
收藏 引用
作者: 吴志华 孙瑞鑫 214000 江苏省无锡市建筑西路581号19楼整层、20楼整层
本发明涉及深度学习技术领域,公开了一种大规模语言模型的开放域问答实现方法、装置及设备。该方法包括:获取多个切分算子,各切分算子对应的多个切分策略,以及各切分策略对应的通信算子;根据各切分算子、各切分算子对应的多个切分... 详细信息
来源: 评论
基于知识蒸馏的语言模型训练方法、文本分类方法及设备
基于知识蒸馏的语言模型训练方法、文本分类方法及设备
收藏 引用
作者: 吴俊江 王晓龙 李文昊 马源 410000 湖南省长沙市岳麓区学士街道学士路336号慧谷科技产业园B1栋205号
本发明公开了一种基于知识蒸馏的语言模型训练方法、文本分类方法及设备,包括:获取样本数据集,采用初始语言模型对样本数据集进行文本编码,得到句向量XE;基于句向量XE构建每个batch样本的软标签;构建损失函数,损失函数包含分类... 详细信息
来源: 评论
语言模型预训练、产品搜索方法、装置以及计算机设备
语言模型预训练、产品搜索方法、装置以及计算机设备
收藏 引用
作者: 刘克松 蒋建慧 吕非非 310023 浙江省杭州市余杭区五常街道文一西路969号6幢2层213室
本说明书实施方式提供一种语言模型预训练、产品搜索方法、装置以及计算机设备。通过提供包括非结构化的文本数据集和结构化的产品数据集的语料集,利用文本数据集训练所述辅助转化器和所述主转化器执行RTD预训练任务,利用产品数据集... 详细信息
来源: 评论
一种语言模型的扩容方法、电子设备和存储介质
一种语言模型的扩容方法、电子设备和存储介质
收藏 引用
作者: 徐睿峰 张晗 梁斌 李建新 石国忠 胡斐然 江万国 518000 广东省深圳市福田区福田街道福华一路111号
本申请公开了一种语言模型的扩容方法。该方法中通过获取源语言模型,所述源语言模型包括多个层,利用预设分层迁移策略,对所述源语言模型的多个层进行迁移,以得到目标语言模型,其中,所述目标语言模型的尺寸大于所述源语言模型的尺... 详细信息
来源: 评论
一种语言模型训练方法、装置、设备和存储介质
一种语言模型训练方法、装置、设备和存储介质
收藏 引用
作者: 王鹏远 庞竟成 陈雄辉 俞扬 210000 江苏省南京市江宁区麒麟科技创新园天骄路100号江苏南京侨梦苑A栋703室
本发明实施例公开了一种语言模型训练方法、装置、设备和存储介质,其中,方法包括:将预设无标签问题样本输入至初始语言模型中的答案生成子模型中,得到模型输出答案;基于所述初始语言模型中的答案评价子模型和所述预设无标签问题样... 详细信息
来源: 评论
一种基于适配器的语言模型知识注入方法和系统
一种基于适配器的语言模型知识注入方法和系统
收藏 引用
作者: 叶茂 赵洲 张伟 王海涛 孙翔 陆诚 韩嘉佳 杨涛 张彩 310058 浙江省杭州市西湖区余杭塘路866号
本发明公开了一种基于适配器的语言模型知识注入方法和系统,所述的语言模型为基于Transformer架构的语言模型,属于语言模型参数高效优化和知识注入领域。包括:获取待注入知识的文本数据,对文本数据分词并映射为词表中相应的标识,... 详细信息
来源: 评论