大模型微调实战：基于 LLaMAFactory 通过 LoRA 微调修改模型自我认知

xueduan.li@gmail.com (意琦行) — Wed, 18 Sep 2024 22:00:00 +0000

本文主要分享如何使用 LLaMAFactory 实现大模型微调，基于 Qwen1.5-1.8B-Chat 模型进行 LoRA 微调，修改模型自我认知。

GPT 是如何炼成的：大模型微调基础概念指北

xueduan.li@gmail.com (意琦行) — Tue, 10 Sep 2024 00:00:00 +0000

本文主要分享一下大模型微调相关的基本概念，包括大模型(GPT)训练流程、微调(SFT)方法&分类&框架&最佳实践、强化学习(RLHF)，最后则是分享了如何训练垂直领域大模型。