【新智元导读】「日日新 SenseNova」大模型体系发布,商汤正式官宣入局!

商汤正式加入 ChatGPT 战局!

就在昨天,商汤在发布会现场一口气来了个全套的,大模型文生图、代码生成、做视频、2D/3D 数字人....

话不多说,直接上图。

一个人类站在非常有未来感的建筑面前,畅想平行宇宙种种可能。

只需 5 分钟真人视频素材,活灵活现的数字人就来了。

还有代码翻译实时演示,码农狂喜。

日日新,又日新

这些让所有人惊呆的大模型能力,便来自商汤的「日日新 SenseNova」大模型体系。

「日日新 SenseNova」这一名字取自《礼记 · 大学》中,汤之盘铭曰「苟日新、日日新、又日新」。

它寓意着在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁 AGI 更多可能。

在这一大模型体系中,商汤自研了中文语言大模型商量 SenseChat、以及包括 AI 文生图创作、2D/3D 数字人生成、大场景 / 小物体生成等一系列生成式 AI 模型与应用。

商量 SenseChat:妙解复杂问题,创作一流文本

商量 SenseChat 是商汤最新研发的中文语言大模型。

模型训练使用了大量数据,并充分考虑了中文语境,能够更好地理解和处理中文文本。

活动现场,商量 SenseChat 不仅能进行单轮对话,而且多轮对话,超长文本理解能力上表现出色。

在单轮对话上,理解句子含义,判断句子合理性不在话下。

另外,还能够进行逻辑推理,比如正确完成非命题和命题的逻辑问题。

问它旺仔的爸爸有三个孩子,老大叫大毛,老二叫二毛,老三叫什么?

在多轮对话中,商量 SenseChat 还具备出色的语义理解、创造力和共情能力。

能够为你提供情感上的抚慰,比如「如何提高自我认识,更好地了解自己?」

它还可以进行共同创作,比如与人一人一句共同创作儿童故事。

最后,在超长文本理解上,商量 SenseChat 能够帮助用户快速通过与大模型互动来获取知识、寻找答案。比如,让它快速阅读理解《专利法》。

此外,商汤直接把商量 SenseChat 用在了代码开发上,推出了 AI 代码助手。

更刺激一点在于,他们这次竟然上了现场实时演示,而且还是镜头直接怼屏幕的那种。

据了解,全新的 AI 代码助手为码农提供了代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

与此同时,AI 代码助手还支持中英文,以及多种编程语言,并能够快速适应码农个性化编码风格。

在内部实测中,AI 代码助手可以让代码编写效率提升 62%,HumanEval 测试集一次通过率 40.2%。

商汤科技董事长兼 CEO 徐立称,下一代软件开发范式是 AI for AI,并提出了全新的二八定律:代码 = 80% AI 生成 + 20% 人工。

除了写代码,商量 SenseChat 已经用在医疗场景中,比如问诊分诊、医疗知识科普、疾病鉴别诊断。

未来,将继续拓展在药物治疗、手术方案等方面的问诊能力,帮助医生进一步提升诊疗效率。

真 · 全能 AI

除了发布中文语言大模型,当前,最火的就是生成式 AI 了,商汤在该领域也展开了全方位的布局。

基于「日日新 SenseNova」大模型体系,商汤自研了包括秒画 SenseMirage、如影 SenseAvatar、琼宇 SenseSpace、格物 SenseThings 等一系列生成式 AI 模型及应用。

文生图创作平台「秒画 SenseMirage」

文生图有多强,其实你刚刚也见证到了。秒画 SenseMirage 能够展现光影真实、细节丰富、风格多变,还能支持 6K 高清图的生成。

该模型基于超 10 亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格。

另外,用户还可以自主训练,可基于单卡,5 分钟内定制属于自己的 LoRA 模型 @20 张训练图片。

对创作者来说,生成模型开源社区汇聚了 1 万 + 开源模型,结合自研模型及训练能力,为其提供了更加完善的内容生产工具。

AI 数字人视频生成平台「如影 SenseAvatar」

谈到元宇宙,就需要数字化分身 Avatar。

如今,无需专业拍摄设备,通过文字驱动,你就可以快速、高效打造一个高度逼真的数字形象。

如影 SenseAvatar 仅需要 5 分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

甚至,只需提供一个粗略的想法,文案也有了。此外,它还能支持百种语言,让你轻松创作跨国际化内容。

除了打造短视频,「如影 SenseAvatar」还可以轻松制作教育、企业,娱乐文化等领域的视频。

3D 内容生成平台「琼宇 SenseSpace / 格物 SenseThings」

格物 SenseThings 可基于 3D 内容生成技术实现对空间和物体的复刻与交互,并支持再编辑再创作。

除了数字人,基于 NeRF,商汤的琼宇 SenseSpace 可以进行场景生成,复刻和还原真实空间。

琼宇 SenseSpace 生成的场景不仅支持自由漫游,还支持实时交互和编辑。

比如进行城市生成,高度还原场景细节。

甚至有厘米级的重建精度,可通过实时渲染和互动带来超真实感的场景。

多源数据融合带来超精细化的清晰度和细节效果。

另外,格物 SenseThings 可以进行物体 3D 内容生成。

它能够良好支持复杂结构物体复刻,并做到光照精准复刻,材质完美还原。

以上是日日新 SenseNova 大模型体系带来的强大内容生成能力,不论在图片、还是数字人、视频上,直接打破了人类创意天花板,将重塑行业生态。

释放大模型这么多能力,商汤的底气在哪?

5 年磨一剑,直指 AGI

2023 年,由 AIGC 及 ChatGPT 引领的新一轮人工智能热潮已箭在弦上。

其实,早在 2018 年,商汤就开始着手 AI 大模型研发。只不过,这个概念,今年才被炒火。

到现在,这家 AI 公司已经 5 年多的技术沉淀和实践经验。已经打造了 CV、NLP、AIGC 多个 AI 大模型。

2019 年,商汤最先推出了 10 亿参数量规模的视觉模型,实现了当时业界最好的算法效果。

那时,商汤已经具备了千卡并行的系统能力,使用了上千张 GPU 卡进行单任务训练。

在 2021-2022 年,商汤还训练了百亿参数规模的超大视觉模型,这相当于千亿参数语言模型的训练量。

目前,商汤已成功研发了 320 亿参数量的全球最大的通用视觉模型。

该模型已经实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

今年 3 月,商汤还开源了多模态多任务通用大模型书生(INTERN)2.5,有 30 亿参数。

商汤这家前沿 AI 科技公司,不仅有着深厚的算法积淀,最重要的是还有强大的基础设施——SenseCore AI 大装置。

在急需算力的当下,商汤 SenseCore AI 大装置以 5000 Petaflops 超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施。

现有 27000 块 GPU,可输出 5000 PetaFlops 算力,能够以最大 4000 卡规模集群进行单任务训练,并可做到 7 天以上不间断的稳定训练。

算法,算力有了,数据怎么来?

一直以来,商汤在智慧城市、智慧商业等领域的长期耕耘,积累了海量真实世界的高质量视觉数据。

徐立表示,模型的能力应考量包括参数量和数据量。而参数量和数据量的乘积即计算量,即模型的能力可以用所依赖计算量来做标定。这就是新时代下,算法、数据和算力的新公式。

发布会现场,商汤基于「日日新 SenseNova」大模型体系和 AI 大装置 SenseCore,面向商业伙伴提供 API。

其中包括图片生成,自然语言生成,视觉感知通用任务与标注服务,客户可以根据自己想要的内容进行调用。

在推进 AGI 布局上,商汤向所有人展示了大模型 + 大算力的战略布局。

未来,商汤还将继续推进「日日新 SenseNova」大模型体系的建设,将 AGI 作为核心发展目标。

日复一日,在大模型研发实现 AGI 突破,让 AI 惠及每个人。

分类:
人工智能
  •