版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310575020.0
公 开 号:CN116594601A
代 理 人:李玉平
代理机构:南京乐羽知行专利代理事务所(普通合伙)
专利类型:发明专利
申 请 日:20230815
公 开 日:20230522
专利主分类号:G06F8/30
关 键 词:知识库 生成算法 算法生成 奖赏 测试用例集合 模型评估 算法描述 问题描述 提示 模型代码生成 测试过程 代码生成 模型参数 数据标记 训练过程 训练集合 训练模型 优化目标 测试样 通过率 预设 排序 历史问题 测试 重复 更新
摘 要:本发明公开一种基于知识库和多步提示的预训练大模型代码生成方法。首先获得新的问题描述与其对应的测试用例集合,如果不存在算法生成模型,获取大量历史问题描述和测试用例集合,代入提示模板并输入预训练模型生成算法描述,由人类数据标记员对算法描述根据其与知识库的符合程度进行打分和排序,构造训练集合训练知识奖赏模型,作为后续训练过程中的奖赏。将问题描述输入算法生成模型,生成算法描述;将算法描述输入知识奖赏模型评估与知识库的符合程度和代码生成模型评估测试样例通过率,两者作为算法生成模型的优化目标,更新模型参数直至训练误差低于预设阈值。测试过程中生成算法描述与代码解决方案,重复该过程直至代码通过全部测试用例。