Stable Diffusion公司开源大语言模型StableLM，网友：不是我想要的！|AI_新浪财经

相关文章推荐

千杯不醉的跑步鞋 · java读写resources文件夹下的文件 ...· 7 月前 ·

失落的企鹅 · 解决锁升级导致的阻塞问题 - SQL ...· 8 月前 ·

强健的土豆 · BLE 的deviceId是否就是 Mac ...· 1 年前 ·

文武双全的荒野 · 强化学习(十六) ...· 1 年前 ·

彷徨的铁链 · while能设置循环间隔时间吗_百度知道· 1 年前 ·

出品 | CSDN（ID：CSDNnews）

众所周知，去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion，成为一种革命性的图像模型，也使 AI“文生图”实现了飞速的发展。

满载着大家对其“不再局限于开发图像生成”和“开源”的期待，在 4 月 20 日， Stability AI 宣布推出开源大型语言模型（LLM）—— StableLM。

小参数大训练，开源备受热捧

据 Stability AI 官方报道，StableLM 模型还处于 Alpha 阶段，参数比较少，只有 30 亿和 70 亿个参数，之后还会推出有 150 亿到 650 亿参数的模型。作为一个类 ChatGPT 模型，StableLM 模型可以生成文本和代码，并为一系列下游应用程序提供动力，能为小而高效的模型通过适当的培训提供高性能。

然而，与 ChatGPT、Bard 等模型相比，StableLM 最大的“优势”莫过于可供每一个人下载并部署在本地，就连笔记本也可以跑起来。

正如 Stability AI 在报道中坦言的：“语言模型将成为我们数字经济的支柱，我们希望每个人都在他们的设计中拥有发言权。”

StableLM 目前已在 GitHub 开源，其高性能低消耗等特点快速吸引了一大波人的关注，不到一天时间，星标已接近 6000 Stars。

（图源：GitHub

截图）

写文案、编代码，还支持商业化

值得一提的是，StableLM 的发布主要得益于 Stability AI 在 EleutherAI (一个非营利性研究中心)开源早期语言模型方面的经验，其语言模型包括 GPT-J 、 GPT-NeoX 和 Pythia 套件，它们基于 The Pile 开源数据集训练。

StableLM 是基于一个新的实验数据集训练出来的，该数据集基于 The Pile 构建，但数据集规模是原来的 3 倍，包含 1.5 万亿个标记内容。尽管其参数只有 30 到 70 亿（相比之下，GPT-3 有 1750 亿个参数），但这个数据集的丰富性使得 StableLM 在对话和编码任务中表现出惊人的高性能。

Stability AI 还表示，作为概念验证，他们还使用了斯坦福大学 Alpaca程序对模型进行了微调，使用了五个最近的对话代理数据集的组合：斯坦福大学的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 数据集、Databricks 实验室的 Dolly 和 Anthropic 的 HH，并把这些模型发布为 StableLM-Tuned-Alpha。

目前，在官方博客中， Stability AI 也展示了 70 亿参数微调模型在“文本对话、创作内容、编写代码”几个方面的示例：