相关文章推荐
重情义的刺猬  ·  產生 OpenAPI 文件 | ...·  2 周前    · 
健壮的苦咖啡  ·  XMind如何快速插入超链接并设置样式?_编 ...·  2 周前    · 
英姿勃勃的伤疤  ·  Qt事件系统深入解析事件分发传播过滤与自定义 ...·  2 周前    · 
痴情的啄木鸟  ·  如何禁用三星S24U系统自动更新?_编程语言 ...·  2 周前    · 
年轻有为的香烟  ·  浏览器事件开发者社区·  1 周前    · 
坚韧的松鼠  ·  前沿 | ...·  7 月前    · 
玩篮球的罐头  ·  《The Song Of Life ...·  8 月前    · 
大力的油条  ·  中華民國外交部全球資訊網-非洲地區-赤道幾內 ...·  9 月前    · 
狂野的麦片  ·  基于 TMDB ...·  1 年前    · 
淡定的跑步鞋  ·  广州新火车站!预计明年具备开通条件_澎湃号· ...·  1 年前    · 
Code  ›  本地私有化部署大模型RWKV-懒人包一键安装享受专属免费大模型-RWKV Runner开发者社区
软件
https://cloud.tencent.com/developer/article/2304062
深情的登山鞋
2 年前
作者头像
唯一Chat
0 篇文章

本地私有化部署大模型RWKV-懒人包一键安装享受专属免费大模型-RWKV Runner

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP
返回腾讯云官网
社区首页 > 专栏 > 陶士涵的菜地 > 本地私有化部署大模型RWKV-懒人包一键安装享受专属免费大模型-RWKV Runner

本地私有化部署大模型RWKV-懒人包一键安装享受专属免费大模型-RWKV Runner

作者头像
唯一Chat
发布 于 2023-07-21 20:57:37
101 0
发布 于 2023-07-21 20:57:37
举报

仓库地址:https://github.com/josStorer/RWKV-Runner

预设配置已经开启自定义CUDA算子加速,速度更快,且显存消耗更少。如果你遇到可能的兼容性问题,前往配置页面,关闭 使用自定义CUDA算子加速

如果Windows Defender说这是一个病毒,你可以尝试下载 v1.3.7_win.zip ,然后让其自动更新到最新版,或添加信任

对于不同的任务,调整API参数会获得更好的效果,例如对于翻译任务,你可以尝试设置Temperature为1,Top_P为0.3

功能

  • RWKV模型管理,一键启动
  • 与OpenAI API完全兼容,一切ChatGPT客户端,都是RWKV客户端。启动模型后,打开 http://127.0.0.1:8000/docs 查看详细内容
  • 全自动依赖安装,你只需要一个轻巧的可执行程序
  • 预设了2G至32G显存的配置,几乎在各种电脑上工作良好
  • 自带用户友好的聊天和补全交互页面
  • 易于理解和操作的参数配置
  • 内置模型转换工具
  • 内置下载管理和远程模型检视
  • 内置一键LoRA微调
  • 也可用作 OpenAI ChatGPT 和 GPT Playground 客户端
  • 多语言本地化
  • 主题切换
  • 自动更新

API并发压力测试

ab -p body.json -T application/json -c 20 -n 100 -l http://127.0.0.1:8000/chat/completions

body.json:

{
  "messages": [
      "role": "user",
      "content": "Hello"
}

Embeddings API 示例

如果你在用langchain, 直接使用 OpenAIEmbeddings(openai_api_base="http://127.0.0.1:8000", openai_api_key="sk-")

import numpy as np
import requests
def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
values = [
    "I am a girl",
    "我是个女孩",
    "私は女の子です",
    "广东人爱吃福建人",
    "我是个人类",
    "I am a human",
    "that dog is so cute",
    "私はねこむすめです、にゃん♪",
    "宇宙级特大事件!号外号外!"
embeddings = []
for v in values:
    r = requests.post("http://127.0.0.1:8000/embeddings", json={"input": v})
    embedding = r.json()["data"][0]["embedding"]
    embeddings.append(embedding)
compared_embedding = embeddings[0]
 
推荐文章
重情义的刺猬  ·  產生 OpenAPI 文件 | Microsoft Learn
2 周前
健壮的苦咖啡  ·  XMind如何快速插入超链接并设置样式?_编程语言-CSDN问答
2 周前
英姿勃勃的伤疤  ·  Qt事件系统深入解析事件分发传播过滤与自定义事件-开发者社区-阿里云
2 周前
痴情的啄木鸟  ·  如何禁用三星S24U系统自动更新?_编程语言-CSDN问答
2 周前
年轻有为的香烟  ·  浏览器事件开发者社区
1 周前
坚韧的松鼠  ·  前沿 | GAN用于材料设计:哈佛大学新研究登上Science-腾讯云开发者社区-腾讯云
7 月前
玩篮球的罐头  ·  《The Song Of Life 生命之歌》赫敏攻略
8 月前
大力的油条  ·  中華民國外交部全球資訊網-非洲地區-赤道幾內亞共和國 Republic of Equatorial Guinea
9 月前
狂野的麦片  ·  基于 TMDB 数据集的电影数据分析_厦大数据库实验室博客
1 年前
淡定的跑步鞋  ·  广州新火车站!预计明年具备开通条件_澎湃号·政务_澎湃新闻-The Paper
1 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号