相关文章推荐

俊秀的花卷 · Rust中的三种多态性——Enum和Trai ...· 11 月前 ·

内向的烤面包 · Linux之grep风骚用法_51CTO博客 ...· 1 年前 ·

面冷心慈的马克杯 · 第八届中国R语言会议暨2015北大光华数据与 ...· 2 年前 ·

近视的针织衫 · ChatGPT 错误代码 1020 - ...· 2 年前 ·

气宇轩昂的遥控器 · AI新场景②丨AI+医疗：数据已成核心驱动力 ...· 2 年前 ·

首发于二十四桥明月夜

切换模式

FastChat/vicuna v1.1本地部署

NoobImp

字节跳动算法工程师

可直接启动推理的权重文件整理后发出~自己的实践和后续微调的尝试也在github更新，感兴趣的老板可以点个star： GitHub - noobimp/vicuna_test

新版本v1.1

1.安装fastchat和transformers

pip install fschat
# Install the latest main branch of huggingface/transformers
pip install git+https://github.com/huggingface/transformers

2.下载LLaMA权重

该项目也是由Meta的LLaMA 7B微调而来，因此需要下载LLaMA权重：可以从这里申请并下载 LLaMA ，也可以：

pip install pyllama -U

推荐文章

俊秀的花卷 · Rust中的三种多态性——Enum和Trait（上） - _朝晖 - 博客园

11 月前

内向的烤面包 · Linux之grep风骚用法_51CTO博客_linux命令grep用法

1 年前

面冷心慈的马克杯 · 第八届中国R语言会议暨2015北大光华数据与价值论坛成功举办-商务统计与经济计量系|光华管理学院

2 年前

近视的针织衫 · ChatGPT 错误代码 1020 - 如何修复访问被拒绝错误 - 知乎

2 年前

气宇轩昂的遥控器 · AI新场景②丨AI+医疗：数据已成核心驱动力，深度学习算法产品进入商业化阶段 - 21经济网

2 年前

今天看啥 · Py中国 · codingpro · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号