Skip to content

大模型微调介绍

TIP

微调是在预训练大模型的基础上,用特定领域的数据进一步训练,使模型更好地适应特定任务。

为什么微调?

预训练模型微调后模型
通用知识领域专家
知识截止到训练数据可注入新知识
回复风格通用风格可控

微调方式对比

方式训练参数显存
Full Fine-tuning全部
LoRA少量
QLoRA极少极低

适用场景

  • 指令遵循:学会特定的输出格式
  • 领域知识:注入专业知识
  • 风格迁移:调整回复语气