Sorry, your browser cannot access this site
This page requires browser support (enable) JavaScript
Learn more >

Llama-factory LoRA 微调简介LLaMA-Factory 是一个开源的、简单易用且高效的大型语言模型(LLM)训练与微调框架,旨在帮助用户以低代码或无代码的方式对超过 100 种预训练模型进行高效微调。它支持多种模型(如 LLaMA、Mistral、Qwen、Gemma、Phi 等)以及多种训练任务,包括预训练、监督微调(SFT)、奖励模型训练、PPO、DPO、KTO、ORP...