![图片](https://image.jiqizhixin.com/uploads/editor/d1ffa829-b3ba-47e4-8a26-97fb9b0296be/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/5be53f2c-2969-448d-8729-f01cbc1308c4/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/98730d6a-a6cf-4ab1-8aca-66926df7f3cc/640.png)
-
ChatLLaMA 是一个完整的开源实现,允许用户基于预训练的 LLaMA 模型构建 ChatGPT 风格的服务; -
与 ChatGPT 相比,LLaMA 架构更小,但训练过程和单 GPU 推理速度更快,成本更低; -
ChatLLaMA 内置了对 DeepSpeed ZERO 的支持,以加速微调过程; -
该库还支持所有的 LLaMA 模型架构(7B、13B、33B、65B),因此用户可以根据训练时间和推理性能偏好对模型进行微调。
![图片](https://image.jiqizhixin.com/uploads/editor/0c51a6c5-5c8c-4a96-96ad-d80e73b841b0/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/daa743a3-bc2f-49e3-a7b3-a3036dd7ea3d/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/e37f35b4-5a06-4b0b-aebb-a54f03fdb8ff/640.png)
-
带有微调 权重 的 Checkpoint; -
用于快速推理的优化技术; -
支持将模型打包到有效的部署框架中。
然后是克隆 LLaMA 模型: