Stability AI 开源大语言模型StableLM，支持中文，对决GPT-4 _Code

相关文章推荐

大气的日光灯 · 从C++11到C++23(一) ...· 3 周前 ·

胡子拉碴的地瓜 · Unity3D设置窗口可使用最大化按钮_un ...· 2 月前 ·

气宇轩昂的蜡烛 · Open See Gallery ...· 6 月前 ·

一身肌肉的酱肘子 · c# ...· 1 年前 ·

4月20日，生成人工智能艺术工具Stable Diffusion背后的初创公司Stability AI今天开源了一套文本生成人工智能模型，这是一个类ChatGPT模型，支持文本问答、创意写作、代码生成等功能。旨在与OpenAI的GPT-4等系统正面对决。

官网博客地址：

stability.ai/blog/stabil…

Stability AI被称为StableLM，在GitHub和Hugging Face（一个托管AI模型和代码的平台）上以“alpha”形式提供，Stabletease AI表示，这些模型可以生成代码和文本，并“演示小型高效模型如何通过适当的培训提供高性能。”

据悉，StableLM推出了30亿、70亿参数两种版本，后续还将推出150亿和650亿，1750亿的大参数也在计划中。该模型允许商业化但必须遵守CCBY-SA-4.0许可的条款。

支持中文。StableLM仅用10个小时github已突破3000颗星，其高性能低资源消耗非常适用于中小型企业和个人开发者，普通笔记本也能运行。

稳定人工智能团队在公司网站上的一篇博客文章中写道：“语言模型将构成我们数字经济的支柱，我们希望每个人都在设计中拥有发言权。”

stability.ai： stability.ai

Github开源地址： github.com/stability-A…

测试地址： huggingface.co/spaces/stab…

Discord公告摘录：

我们非常兴奋地宣布推出StableLM-Alpha；一个漂亮而闪亮的新发布的开源语言模型！开发人员、研究人员和好奇的业余爱好者都可以自由检查、使用和调整我们的StableLM基础模型，用于商业和/或研究目的！ 兴奋了吗？

我们来谈谈参数吧！该模型的Alpha版本有30亿和70亿个参数，随后将有150亿至650亿个参数模型。StableLM是在EleutherAI的“The Pile”上构建的新实验数据集（一个825GiB的多样化的开源语言建模数据集，由22个更小、高质量的数据集组合在一起！）尽管StableLM的参数很小，但该数据集的丰富性使StableLM在会话和编码任务中的高性能出人意料。

相关报道：

techcrunch.com/2023/04/19/…

透明的。我们开源我们的模型，以提高透明度和促进信任。研究人员可以 "查看引擎盖 "以验证性能，研究可解释性技术，识别潜在的风险，并帮助开发保障措施。公共和私营部门的组织可以为他们自己的应用调整（"微调"）这些开源模型，而不需要分享他们的敏感数据或放弃对其人工智能能力的控制。

可访问性。我们为边缘设计，使日常用户可以在本地设备上运行我们的模型。使用这些模型，开发者可以建立与广泛使用的硬件兼容的独立应用，而不是依赖一两家公司的专有服务。通过这种方式，人工智能的经济利益被广泛的用户和开发者社区所分享。对我们的模型的开放、细粒度的访问允许广泛的研究和学术界开发可解释性和安全技术，而这是封闭模型所无法做到的。

支持性。我们建立模型来支持我们的用户，而不是取代他们。我们专注于高效、专业和实用的人工智能性能--而不是追求神一样的智能。我们开发工具，帮助普通人和普通公司使用人工智能来释放创造力，提高他们的生产力，并开辟新的经济机会。

这些模型是在名为The Pile的数据集上训练的，该数据集混合了来自PubMed、StackExchange和维基百科等网站的互联网刮擦文本样本。但Stability AI声称它创建了一个自定义训练集，将标准桩的大小扩大了3倍。

Stability AI在StableLM的回购协议中写道：“就像任何没有额外微调和强化学习的预训练大型语言模型一样，用户获得的响应质量可能各不相同，并可能包括冒犯性语言和视图。”“预计这将随着规模、更好的数据、社区反馈和优化而得到改善。”

相关推荐

ChatGPT保姆级教程，一分钟学会使用ChatGPT！

最近ChatGPT大火！微软退出首款ChatGPT搜索引擎，阿里等国内巨头也纷纷爆出自家产品，一夜之间，全球最大的科技公司仿佛都回到了自己年轻时的样子！然而，ChatGPT这么火，这么好玩的东西，国

70.4w
OpenAI

OpenAI 推出超神 ChatGPT 注册攻略来了

前几天，OpenAI 推出超神 ChatGPT，非常火爆。但是呢，因为不可抗力原因，大部分人无法体验到。这里我分享一下注册的攻略。

43.4w
嵌入式视觉掘金·日新计划 ChatGPT

手把手教你注册和使用ChatGPT

ChatGPT 是一个基于 GPT-3 模型的对话系统，它主要用于处理自然语言对话。通过训练模型来模拟人类的语言行为。本文给出了 ChatGPT 的详细注册及使用教程，称得上是保姆级别的丰富图文教程。

35.4w
OpenAI

StableStudio：来自 Stability AI 的开源聊天和图像生成UI

StableStudio 是 Stability AI 开源项目，是 DreamStudio 的开源迭代版本，而 DreamStudio 是专门为其 AI 图像生成模型 Stable Diffusio

1688
随风而逝_风逝 Vue.js

30 道 Vue 面试题，内含详细讲解（涵盖入门到精通，自测 Vue 掌握程度）

本文以前端面试官的角度出发，对 Vue 框架中一些重要的特性、框架的原理以问题的形式进行整理汇总，意在帮助作者及读者自测下 Vue 掌握的程度。本文章节结构以从易到难进行组织，建议读者按章节顺序进行阅读，当然大佬级别的请随意。希望读者读完本文，有一定的启发思考，也能对自己的 V…

65.1w

中高级前端大厂面试秘籍，为你保驾护航金三银四，直通大厂(上)

当下，正面临着近几年来的最严重的互联网寒冬，听得最多的一句话便是：相见于江湖~🤣。缩减HC、裁员不绝于耳，大家都是人心惶惶，年前如此，年后想必肯定又是一场更为惨烈的江湖厮杀。但博主始终相信，寒冬之中，人才更是尤为珍贵。只要有过硬的操作和装备，在逆风局下，同样也能来一波收割翻盘…

66.7w
vortesnail

做了一份前端面试复习计划，保熟～

前言以前我在掘金上看到面试贴就直接刷掉的，从不会多看一眼，直到去年 9 月份我开始准备面试时，才发现很多面试经验贴特别有用，看这些帖子（我不敢称之为文章，怕被杠）的过程中对我的复习思维形成影响很大，

50.6w
Vue.js React.js

你会用ES6，那倒是用啊！

不是标题党，这是一位leader在一次代码评审会对小组成员发出的“怒吼”，原因是在代码评审中发现很多地方还是采用ES5的写法，也不是说用ES5写法不行，会有BUG，只是造成代码量增多，可读性变差而已。

39.4w
GitHubDaily ChatGPT

Stable Diffusion 母公司开源大语言模型，代号「StableLM」！

昨天晚上 11 点，Stable Diffusion 的母公司 Stability AI 重磅宣布，正式开源一款全新的大语言模型：StableLM。

467
掘金·金石计划

“老默我想吃鱼了”与五层网络模型

最近看狂飙有点上头了😂，还专门把几百人的群昵称改成了“摸鱼强盛集团”，群友们也很积极，昵称都改成了狂飙中的人名，聊着聊着嘴里蹦出几句狂飙中的台词，一时间感觉还蛮有意思的，群里充满了欢心笑语

25.8w

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

新智元报道编辑：编辑部大语言模型之战，Stability AI也下场了。近日， Stability AI宣布推出他们的第一个大语言模型——StableLM。划重点：它是开源的，在GitHub

1043
yeyan1996 JavaScript

字节跳动面试官：请你实现一个大文件上传和断点续传

这段时间面试官都挺忙的，频频出现在博客文章标题，虽然我不是特别想蹭热度，但是实在想不到好的标题了-。-，蹭蹭就蹭蹭 :)

30.7w
ssssyoki JavaScript

这一次，彻底弄懂 JavaScript 执行机制

本文的目的就是要保证你彻底弄懂javascript的执行机制，如果读完本文还不懂，可以揍我。不论你是javascript新手还是老鸟，不论是面试求职，还是日常开发工作，我们经常会遇到这样的情况：给定的几行代码，我们需要知道其输出内容和顺序。因为javascript是一门单线程…

31.7w
superZidan ChatGPT React.js

基于 ChatGPT 和 React 搭建 JSON 转 TS 的 Web 应用

在本文中，你将学习如何使用 ChatGPT API 构建一个将 JSON 对象转换为 Typescript interface 的 Web 应用。通过这个例子，你还可以创建功能更加强大的应用程序

14.0w
ChatGPT 掘金·金石计划

开发者故事 #8 微软 New Bing AI 申请与使用保姆级教程

最近的 AI 技术实在火爆，从 OpenAI 的 ChatGPT，到微软的 New Bing，再到百度的文心一言，说明 AI 在应用层已经发展到一个新的阶段，每个人都有必要学习使用和控制 AI。

25.1w

开发者故事 #8 微软 New Bing AI 申请与使用保姆级教程

友情链接：

聚类算法可分为哪几类? java 线程中刷新ui 文本相似度检测算法 sql数据表设置有效数字 plsql查数据库日志 php script list files in directory AI练习生

推荐文章

大气的日光灯 · 从C++11到C++23(一) C++20圆周率、常数e和常见对数-CSDN博客

3 周前

胡子拉碴的地瓜 · Unity3D设置窗口可使用最大化按钮_unity 打包不可最大化-CSDN博客

2 月前

气宇轩昂的蜡烛 · Open See Gallery |「500台胶片相机漂流创作计划」展览今日开幕_生活

6 月前

一身肌肉的酱肘子 · c# List.FindAll和for的性能对比_阮玉峰的博客-CSDN博客

1 年前

今天看啥 · Py中国 · codingpro · 藏经阁 · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号