咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 多lora任务服务系...
  • 1 篇 量化
  • 1 篇 多任务调度
  • 1 篇 lora

机构

  • 1 篇 北京大学

作者

  • 1 篇 cui bin
  • 1 篇 夏义扉
  • 1 篇 xia yi-fei
  • 1 篇 崔斌
  • 1 篇 符芳诚
  • 1 篇 fu fang-cheng

语言

  • 1 篇 中文
检索条件"主题词=多LoRA任务服务系统"
1 条 记 录,以下是1-10 订阅
排序:
MQLserve:基于量化的任务大语言模型服务系统
收藏 引用
计算机学报 2025年 第3期48卷 517-536页
作者: 符芳诚 夏义扉 崔斌 北京大学计算机学院 北京100871
随着大语言模型(LLMs)的不断发展,针对各种各样下游任务进行微调并部署的需求也与日俱增,以lora为代表的高效微调技术和以GPTQ、AWQ为代表的模型量化技术发挥着至关重要的作用。然而,尽管这些技术在单任务场景下已经有了众成熟应用,... 详细信息
来源: 评论