🦅Aquila 悟道天鹰系列

https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila

发布团队：智源

能否商用：能

成员：

模型

模型类型

简介

文件路径

单独下载模型权重

状态

训练所用显卡

Aquila-7B

基础模型，70亿参数

Aquila 基础模型在技术上继承了 GPT-3、LLaMA 等的架构设计优点，替换了一批更高效的底层算子实现、重新设计实现了中英双语的 tokenizer，升级了 BMTrain 并行训练方法，实现了比 Magtron+DeepSpeed ZeRO-2 将近８倍的训练效率。

./examples/Aquila/Aquila-pretrain

下载Aquila-7B

已发布

Nvidia-A100

Aquila-33B

基础模型，330亿参数

同上

——

敬请期待

Nvidia-A100

AquilaChat-7B

SFT model，基于 Aquila-7B 进行微调和强化学习

AquilaChat 对话模型支持流畅的文本对话及多种语言类生成任务，通过定义可扩展的特殊指令规范，实现 AquilaChat对其它模型和工具的调用，且易于扩展。例如，调用智源开源的 AltDiffusion 多语言文图生成模型，实现了流畅的文图生成能力。配合智源 InstructFace 多步可控文生图模型，轻松实现对人脸图像的多步可控编辑。

./examples/Aquila/Aquila-chat

下载AquilaChat-7B

已发布

Nvidia-A100

AquilaChat-33B

SFT model，基于 Aquila-33B 进行微调和强化学习

同上

——

敬请期待

Nvidia-A100

AquilaCode-7B-NV

基础模型，“文本-代码”生成模型，基于 Aquila-7B继续预训练，在英伟达芯片完成训练