瞄 准 我 的 心~
接下来播放 自动连播
大模型推理引擎vllm,以及pagedattention提高吞吐量的原理
打造智能客服:LLM和本地 知识库的完美协同原理
M3E中文文本嵌入模型:替代OpenAI text-embedding-ada-002的最佳选择
vLLm: 大模型LLM快速推理的神器, llama2秒级完成推理不用再等待
探索开源FastChat 平台,揭秘基于LLM大型语言模型的智能化应用框架!
如何让清华ChatGLM2-6b模型推理性能提升20倍? #小工蚁 #chatglm2
北大正式发布中文法律大模型ChatLaw,并开源
TGI让Huggingface Transformer推理速度提升10倍,本地演示 #小工蚁 #huggingface
清华发布VisualGLM-6B多模态模型 ChatGLM-6B升级版
掌握FastChat RESTful API和SDK打造独一无二的人工智能应用 #小工蚁 #fastchat #2openai
伯克利大学开源vLLM项目 让LLM推理效率提升24倍
斯坦福博士开源新算法FlashAttention2 让Transformer模型推理和训练成本再削50%
PagedAttention(vLLM):更快地推理你的GPT【论文粗读·7】
SalesGPT开源AI销售助理演示和源代码介绍 #小工蚁 #salesgpt
微调LLM中的魔鬼细节|大型语言模型lora调教指南
VLLM ——高效GPU训练框架
北大开源法律大模型ChatLaw:让法律问题不再复杂 #小工蚁 #ChatLaw
利用FastChat快速安装开源大模型Vicuna-小哥发音很好听,建议作为听力用~
本地模型哪家强?上期说了本地模型一站式部署,对比开源模型T5,fastchat T5, stableVicunaLM,WizardLM使用embedding效果
ChatGLM2如何进行模型微调演示 #小工蚁 #chatglm2