相关文章推荐

曾深爱过的电池 · Centos系统下，安装nodejs环境-C ...· 昨天 ·

买醉的仙人球 · 资讯评论 - MyBatis ...· 昨天 ·

宽容的企鹅 · PHP环境提取m3u8,PHP读取转发M3U ...· 20 小时前 ·

个性的风衣 · SpringBoot打包成jar之后在Lin ...· 19 小时前 ·

爱吹牛的牙膏 · 安装完docker以后我无法访问本来http ...· 17 小时前 ·

失恋的马铃薯 · excel巧用REPT函数在数字前补0-阿里 ...· 1 月前 ·

玉树临风的电梯 · 【岁月留声（Java）】org.spring ...· 3 月前 ·

老实的高山 · [ARM学习]ARM指令集详解(超详细！带实 ...· 1 年前 ·

发呆的生姜 · c# wpf datagrid ...· 1 年前 ·

大力的勺子 · iOS富文本属性 - 掘金· 1 年前 ·

首发于 AGI专栏

切换模式

基于LLaMA复现ChatGPT的方案一览

AGI札记

NLP算法工程师

前言

自从Meta开源LLaMA（Large Language Model Meta AI）后，一些类ChatGPT的模型便如雨后春笋般涌现，这里简要介绍下Alpaca和Vicuna两种方案。

一、Alpaca（以7B为例）

Alpaca-Full Tuning

数据使用：在175个seed tasks基础上，让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循（instruction-following）样本，以此作为 Alpaca 的训练数据

硬件&时间：8 张 80GB A100 上微调了 3 个小时

评估&效果：人工评估。评估表明Alpaca 的性能与 text-davinci-003 非常相似。

Alpaca项目地址： https:// github.com/tatsu-lab/st anford_alpaca

self-instruct项目地址： GitHub - yizhongw/self-instruct: Aligning pretrained language models with instruction data generated by themselves.

Alpaca-LoRA

为了进一步降低微调成本，一位来自斯坦福的研究者 ——Eric J. Wang 使用 LoRA（low-rank adaptation）技术复现了 Alpaca 的结果。

硬件&时间：一张RTX 4090 显卡（24GB），只用 5 个小时就训练了一个和 Alpaca 水平相当的模型

项目地址： GitHub - tloen/alpaca-lora: Instruct-tune LLaMA on consumer hardware

三、Vicuna（以13B为例）

数据使用：7W ShareGPT数据（ShareGPT：一个ChatGPT 数据共享网站，用户会上传自己觉得有趣的ChatGPT回答）

硬件：8 A100 GPUs with 80GB

评估&效果：使用GPT-4评估。评估表明Vicuna达到了ChatGPT 90%的性能。评估链接： https:// vicuna.lmsys.org/eval/

项目地址： https:// github.com/lm-sys/FastC hat

PS：Vicuna使用GPT-4的评估方式有感而发，完全可以通过GPT-4构造大量的Comparison数据，从而快速构建出一个Reward模型用于后续PPO。

参考资料：

发布于 2023-04-09 16:06 ・IP 属地广东

NLP

chat GPT

GPT

文章被以下专栏收录

AGI专栏

收录AGI领域内容

推荐文章

曾深爱过的电池 · Centos系统下，安装nodejs环境-CSDN博客

昨天

买醉的仙人球 · 资讯评论 - MyBatis Plus<=3.5.6 存在SQL注入漏洞 - OSCHINA - 中文开源技术交流社区

昨天

宽容的企鹅 · PHP环境提取m3u8,PHP读取转发M3U8的方法 PHP解码转发M3U8-CSDN博客

20 小时前

个性的风衣 · SpringBoot打包成jar之后在Linux执行，然后删除jar，会发生什么?-腾讯云开发者社区-腾讯云

19 小时前

爱吹牛的牙膏 · 安装完docker以后我无法访问本来https://localhost/ - CSDN文库

17 小时前

失恋的马铃薯 · excel巧用REPT函数在数字前补0-阿里云开发者社区

1 月前

玉树临风的电梯 · 【岁月留声（Java）】org.springframework.beans.factory.support.BeanDefinitionOverrideException-CSDN博客

3 月前

老实的高山 · [ARM学习]ARM指令集详解(超详细！带实例！）_老徐_新浪博客

1 年前

发呆的生姜 · c# wpf datagrid datetime format-掘金

1 年前

大力的勺子 · iOS富文本属性 - 掘金

1 年前

今天看啥 · Py中国 · codingpro · 藏经阁 · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号