秋季的blog

- 博客
- 分类
- 标签
- 归档
- 友链
- 关于
- 白天/黑夜

Llama-factory LoRA 微调

Llama-factory LoRA 微调简介LLaMA-Factory 是一个开源的、简单易用且高效的大型语言模型（LLM）训练与微调框架，旨在帮助用户以低代码或无代码的方式对超过 100 种预训练模型进行高效微调。它支持多种模型（如 LLaMA、Mistral、Qwen、Gemma、Phi 等）以及多种训练任务，包括预训练、监督微调（SFT）、奖励模型训练、PPO、DPO、KTO、ORP...

2024-11-04

粘贴文本
全选文本
剪切文本
复制文本
站内搜索
必应搜索
新标签页打开
复制链接地址
复制图片
谷歌识图
常见问题
示例博客
加入社区

本站源码
主题源码

暗黑模式
打印页面
阅读模式