ChatGPT固然好,国产平替味更香
来源:雪球App,作者: 价值投资马拉松,(https://xueqiu.com/3291483942/249207710)
ChatGPT固然好,国产平替味更香 $英伟达(NVDA)$ $贵州茅台(SH600519)$ $寒武纪-U(SH688256)$ @今日话题
原创 雨仔 IT之家 2023-04-28 21:46 发表于山东
IT之家的朋友们,大家好,我是雨仔。
自从 ChatGPT 横空出世,一场 围绕大型语言模型展开的军备竞赛 拉开帷幕。
先有 微软 、 谷歌 等海外巨头针锋相对,后有 百度 、阿里等国内势力奋起直追,谁都清楚 AI 是最当红的风口,抢占先机就意味着能引领时代更迭。
只是巨头们打造的对话模型好归好,但几乎都存在一定的使用门槛,并且 OpenAI 也不可能放开 ChatGPT。
因此如果有效果相近,且门槛较低的应用,就更利好大众。
目前,市面上已经出现了 众多 ChatGPT 的“平替” ,其中更是有不少国产的开源项目。
所以雨仔就向大家分享几个,在无法拥有正主的情况下, 找个“备胎”不失为上佳之选。
一·Open Assistant
LAION AI 在近日发布了 Open Assistant,该平台被视为“世界最大 ChatGPT 开源平替”。
作为 AI 助手,Open Assistant 通过使用和训练高级语言模型来理解人类并做出回应。
不仅覆盖了广泛的消息和写作风格,还支持 35 种不同的语言,官方将其定义为 面向所有人的对话式 AI 。
经雨仔实测,Open Assistant 确实对得起“对话式 AI”的称号 ,大多数场景下都能做到有问必答、有理有据。
问它最基础的名字,它会给出多个名字,也允许用户随意给它起一个新名字。
无论是简单的九九乘法表计算,还是难度较大的函数题,它也信手拈来。
甭管是用关键词撰写诗歌,还是根据说明起草文案,它同样易如反掌。
就连敲代码、搞编程这种专业的事情,也难不倒它,轻而易举就能应对。
总体聊下来,它对数学、生活、文化等领域都比较精通, 水平和 ChatGPT 在伯仲之间。
但是,Open Assistant 现阶段存在一个很大的短板。
虽说它数据集的语言中包括中文,但用中文和它对话, 它的表现就很“捉急” ,时而乱码,时而中英文混合,时而不用中文回答。
有时就算用中文回答,也驴唇不对马嘴,比如把李白和杜甫说成了明清时期的人物。
就感觉, 它在关乎中国历史和百科知识方面尚且是个小白 ,还有极大的完善空间。
总的来说,在应对英文问题时,Open Assistant 确实能展现出不逊于 ChatGPT 的水平,妥妥的平替。
甚至一些机构认为它的回复比 ChatGPT 更优秀,不少外国网友也觉得 它具备干翻 ChatGPT 的实力。
但对于咱们而言,它显然还不够成熟,倘若日后能加以补足,再凭借其开源的属性,绝对能让大家获益匪浅。
二·MiniGPT-4
还记得 GPT-4 首次问世时,很多人感慨科技的发展速度超乎想象。
相对于 GPT-3.5,GPT-4 在精进生成文字内容的同时,也做到了理解图像输入内容,不仅能看图说话,还能根据图片展开联想。
如今,一个名为“MiniGPT-4”的平台破土而出,在几位博士携手打造下,它同样 提供理解图片的能力 ,并且还是开源的。
所谓“理解图片的能力”,主要集中在三方面: 描述图片场景,提供解决方法,撰写相关文案。
让它描述图片中的内容,它会跟景区的导游介绍一般面面俱到,不放过任何元素。
上传一张美食的照片,询问它如何制作,它会把每一步该准备什么罗列得清清楚楚。
丢给它公司 logo 或其他商品让它撰写文案,它会主动发散,文笔颇为出彩。
体验了一大圈下来,雨仔虽心悦诚服,但也发现了一个问题,那就是 MiniGPT-4 的处理时间有点久 。
从上传图片到识别问题再到给出回答,每个环节通常都要在五分钟起步,并且时间会逐渐拉长。
整个流程下来,基本需要十五分钟左右, 着实会让人等得心急火燎 ,不过考虑到是“白嫖”,也不能有太多奢望。
三·Alpaca
想必关注 AI 的老哥,就算不知道 Alpaca,也一定听闻过其中文名 —— 羊驼。
今年 2 月,Meta 开源了一个新的大模型系列 —— LLaMA,半个月后,斯坦福基于 LLaMA 7B 微调出一个具有 70 亿参数的新模型 Alpaca。
在仅用了 52k 数据的情况下,性能却约等于 GPT-3.5。
并且成本低到令人咋舌, 只用了不到 600 美元 (约合人民币 4100 元),还直接将数据集和代码统统开源了。
由于近期其服务器出现问题,雨仔未能进行最新的测试,但结合过往的使用情况,Alpaca 相当给力。
像介绍物品、计算数学、撰写邮件这种基础的场景不必多说,它都能妥善应对。
并且相对于 ChatGPT 的啰嗦,
它的回答都言简意赅
,更能直白传递重点。
并且得益于团队的努力,解决了 LLaMA 模型缺乏指令微调的最大弱点,使用了现有的大语言模型,来自动生成遵循指令演示。
从总体评价来看,可用度极高。
当然了,Alpaca 也绝非尽善尽美,尚且存在两个问题需要改进。
一个是关乎美国以外的地理问题, 会犯常识性错误 ;另一个是在一些与底层语言模型和指令微调数据相关的地方,存在局限。
但即便如此,不妨碍它是当下外网最炙手可热的 ChatGPT 平替之一。
四·ChatGLM-6B
说完了几个国外的平台,是时候把目光转回到国内,说起现在国内的 AI 模型,大家首先会想到 百度 的文心一言或阿里的通义千问。
但其实,流淌着清华血脉的 ChatGLM-6B 同样不容小觑, 其主要用于中文问答、提供建议和支持等日常交互场景。
由于目前处于内测阶段,雨仔没有机会体验,但从网友们的反馈来看,效果可圈可点。
常识问答、创作剧本、撰写提纲、数学计算等都不在话下,甚至还能写文言文。
唯独在处理论文方面,略显为难,还有面对较复杂的数学题时,也会束手无策。
而且虽说 可以在个人电脑上部署 ,但 比较吃显卡性能 ,至少得配备一块 2080Ti。
不过考虑到体积袖珍且刚问世不久,已经做的很不错了,希望在新一轮内测开始之际,能展现出肉眼可见的进步。
五·MOSS
除了清华,另一家老牌中国院校——复旦大学,上周也开源了自家的 MOSS 模型。
MOSS 名字就是从前一阵子大热的《流浪地球》中取出来的,英文意思为“苔藓”,最大亮点就是 支持插件增强 ,有 GPT-4 那个味道了。
另一大亮点就是可以在民用级显卡上跑起来。根据复旦官方的介绍,MOSS 在 FP16 精度下可在单张 A100 / A800 或两张 3090 显卡运行,在 INT4/8 精度下就能在 单张 3090 显卡运行 了,大大降低了老百姓玩 AI 的成本。
根据复旦大学官方的演示,
MOSS 的功能不输 GPT-4
,例如可以做数学计算:
画画:
处理文字工作:
目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,感兴趣的小伙伴可以下载体验一下。
好了,以上几个就是 ChatGPT“平替”中的佼佼者了,在拥有比肩正主能力的同时,使用起来也相对便捷,足以满足大家的需求。
此外也有 YouChat、Jasper Chat、Poe、Ghostwriter Chat等产品供大家选择,不得不说现在的 AI 市场可谓是百花齐放。
ChatGPT 不愧是跨时代的产物 ,它的出现颠覆了整个世界,开启了属于 AI 的新纪元。
有理由相信,AI 在未来会展现出更多不可思议的能量,同时也伴随着更多相关技术、产品的问世,推动时代潮流前进。