🦈LLaMA-Efficient-Tuning&text-generation-webui
https://github.com/hiyouga/LLaMA-Efficient-Tuning/tree/main
模型
微调方法
数据集
软件依赖
如何使用
数据准备(可跳过)
环境搭建(可跳过)
浏览器一键微调/测试
二次预训练
指令监督微调
奖励模型训练
RLHF 训练
多 GPU 分布式训练
指标评估(BLEU分数和汉语ROUGE分数)
模型预测
API 服务
命令行测试
浏览器测试
导出微调模型
Last updated