大模型微调介绍

TIP

微调是在预训练大模型的基础上，用特定领域的数据进一步训练，使模型更好地适应特定任务。

为什么微调？

预训练模型	微调后模型
通用知识	领域专家
知识截止到训练数据	可注入新知识
回复风格通用	风格可控

微调方式对比

方式	训练参数	显存
Full Fine-tuning	全部	高
LoRA	少量	低
QLoRA	极少	极低

适用场景

指令遵循：学会特定的输出格式
领域知识：注入专业知识
风格迁移：调整回复语气