出品 | CSDN(ID:CSDNnews)

众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。

满载着大家对其“不再局限于开发图像生成”和“开源”的期待,在 4 月 20 日, Stability AI 宣布推出开源大型语言模型(LLM)—— StableLM。

(图源:Stability AI 官方博客截图)

小参 大训练,开源备受热捧

据 Stability AI 官方报道,StableLM 模型还处于 Alpha 阶段,参数比较少,只有 30 亿和 70 亿个参数,之后还会推出有 150 亿到 650 亿参数的模型。作为一个类 ChatGPT 模型,StableLM 模型可以生成文本和代码,并为一系列下游应用程序提供动力,能为小而高效的模型通过适当的培训提供高性能。

然而,与 ChatGPT、Bard 等模型相比,StableLM 最大的“优势”莫过于可供每一个人下载并部署在本地,就连笔记本也可以跑起来。

正如 Stability AI 在报道中坦言的:“语言模型将成为我们数字经济的支柱,我们希望每个人都在他们的设计中拥有发言权。”

StableLM 目前已在 GitHub 开源,其高性能低消耗等特点快速吸引了一大波人的关注,不到一天时间,星标已接近 6000 Stars。

(图源:GitHub (图源:GitHub

截图)

写文案、编代码,还支持商业化

值得一提的是,StableLM 的发布主要得益于 Stability AI 在 EleutherAI (一个非营利性研究中心)开源早期语言模型方面的经验,其语言模型包括 GPT-J 、 GPT-NeoX 和 Pythia 套件,它们基于 The Pile 开源数据集训练。

StableLM 是基于一个新的实验数据集训练出来的,该数据集基于 The Pile 构建,但数据集规模是原来的 3 倍,包含 1.5 万亿个标记内容。尽管其参数只有 30 到 70 亿(相比之下,GPT-3 有 1750 亿个参数),但这个数据集的丰富性使得 StableLM 在对话和编码任务中表现出惊人的高性能。

Stability AI 还表示,作为概念验证,他们还使用了斯坦福大学 Alpaca程序对模型进行了微调,使用了五个最近的对话代理数据集的组合:斯坦福大学的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 数据集、Databricks 实验室的 Dolly 和 Anthropic 的 HH,并把这些模型发布为 StableLM-Tuned-Alpha。

目前,在官方博客中, Stability AI 也展示了 70 亿参数微调模型在“文本对话、创作内容、编写代码”几个方面的示例:

  • 在对话方面,当提问“你会对即将高中毕业的朋友说些什么”,StableLM 回答说:“你们应该为自己的成就、工作、交友等方面感到骄傲,并对自己的未来抱以期望。”

  • 面对“写一封邮件”的任务,StableLM 也是可以依照信件的格式,清晰的罗列出相关内容。

(图源: Stability AI 官方博客截图) (图源: Stability AI 官方博客截图)
  • 甚至,StableLM 还可以完成一首 rap 的歌词:

    (图源: Stability AI 官方博客截图)
  • 在面对“用 C 语言编写可以计算机生命意义”的问题上,StableLM 在“解答未果”后,还用幽默的口吻调侃道: “生命的实际意义会有更复杂的成分,例如社会、哲学等。

(图源: Stability AI 官方博客截图) (图源: Stability AI 官方博客截图)

仅如此, StableLM 模型还允许商业化,但开发人员需要遵守 CCBY-SA-4.0 许可条款,自由地检查、使用和调整 StableLM 基础模型。

“大方开源” 遭来非议

伴随着 StableLM 在 GitHub 上的开源,国内外网友也展开了热议,而万万没想到的是,许多网友在试用后,竟开始疯狂抨击 StableLM 的效果:

  • “我试图用它生成的所有东西,但最后我都没有采纳。”;

  • “StableLM 的‘开源’是唯一的优势了吧”;

  • “它的回答结果真的平平无奇,不是我想要的”。

但是,也有网友帮忙解释道:

  • “毕竟 Alpha 版本的参数量目前较小”;

  • “我还是相信在不久的将来, StableLM 会进步的”;

  • “能大方开源,已经让我欣慰了”。

此外, StableLM 模型“开源”的安全性等问题也备受大家关注。

众所周知,去年在 Stable Diffusion 发布后,Stability AI 遭到了很多艺术家的投诉和起诉。因此,很多人对 StableLM 表示怀疑:“ 不知道是否还会引发诉讼”、“害怕又发生剽窃问题”……

与此同时,不少人担心有人会利用开源来撰写钓鱼链接的文案和协同软件攻击等。

对此, Stability AI 官方表示:“我们开源我们的模型,以提高透明度并促进信任。研究人员可以'深入了解'来验证性能,研究可解释性技术,识别潜在风险并帮助制定保障措施” 。

参考链接:

https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models

https://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/?guccounter=1

https://news.ycombinator.com/item?id=35629127

https://github.com/Stability-AI/StableLM

  • 01 / 任华为轮值董事长后 孟晚舟首次亮相发声!谈到AI、5.5G、欧拉与鸿蒙操作系统
  • 02 / 最火“五一”将至 国内民宿一夜均价超500元
  • 03 / 突发!这家号称日收益5%的“银行”是假的,从未批准设立,涉嫌犯罪!银保监会发声
  • 04 / 超100位外企高管密集访华,会投资多少个“小目标”?
  • 05 / 一季度地方财政收入好转 基层财政收支矛盾仍较大
  • 06 / A股分拆暖风频吹 三大投资主线浮现
  • 07 / 宝马mini被指区别对待中国和外国访客?工作人员回应:事发昨天下午,后续总部会回应此事
  • 08 / 最新持仓浮出水面:百亿级私募左手AI右手“央国企”
  • 09 / 宝马mini被指区别对待中外访客:中国人领冰淇淋时称发完了 外国人领时热情接待
  • 10 / 电子社保卡,你会用吗?一图带你看懂→
  • 01 / 中国芯片大会吸引多家美企到场,日媒:证明美企渴望与中国保持联系
  • 02 / 浙商证券李超:四大宏观因素逆转 股市已进入牛市状态 重点关注核心资产中特估
  • 03 / 又有重大财务造假!*ST奇信立马跌停
  • 04 / 4月20日操盘必读:影响股市利好或利空消息
  • 05 / 财经早报:6G关键技术有新突破为国内首次 全球“芯片大战”剑拔弩张
  • 06 / 许家印最新发声!无关地产、无关汽车,而是…
  • 07 / 私募出逃?4000亿巨头突然跳水!业绩太牛,多股20CM涨停了!
  • 08 / 突发,千亿光伏龙头创新低!多只TMT龙头再创新高,这些优质股低位低估值(附股)
  • 09 / 被免职CFO,宝宝树高管持长剑硬闯办公室,曾不给员工发工资
  • 10 / 林园突然现身这两家公司,“弯腰捡钱”!3月仓位布局曝光!“最爱”领域是它......
  • 01 / 红线不可触碰!这家大行员工夫妻民间借贷超千万,涉诈骗获刑被“终身禁业”,当事支行也被罚
  • 02 / 邮储银行迎高管变动,张学文、曲家文两位副行长同日辞任
  • 03 / 推搡扯头发!上海邮储银行男职工殴打女职工
  • 04 / 净利3连降!浦发银行未达30%分红率,但人均薪酬仍超45万元
  • 05 / 净值回撤影响逐步消退 银行理财市场一季度企稳回升
  • 06 / 意料之外!一季末头部银行理财子规模减少近2万亿,市场回暖难敌存款挤压,大行跌出前三甲
  • 07 / 拉卡拉自曝“跳码”家丑
  • 08 / 上海银保监局局长:穿着合规外衣做各种粉饰过的、编故事式的创新是不行的
  • 09 / 大调查!公安专案组与银保监工作组同步进行,"雪松系"风险持续暴露
  • 10 / 建行深圳市分行原党委副书记、副行长张学庆受贿案一审公开开庭
  •