商汤 ChatGPT「商量」炸场！秒生 6K 神图，代码提速 62%，现场直播怼脸

相关文章推荐

挂过科的烤面包 · 桌面软件开发框架大赏 - Lzhdim's ...· 2 月前 ·

强健的苦瓜 · 元旦假期，消费市场一派红火-湖南省人民政府门户网站· 9 月前 ·

风流的冰淇淋 · 2021年四川首马 ...· 1 年前 ·

健壮的番茄 · 湖北9岁女孩山坡雪中上网课：家里无信号，爸爸 ...· 1 年前 ·

飘逸的作业本 · 2023年2月份熊猫mini销量6661台_ ...· 1 年前 ·

【新智元导读】「日日新 SenseNova」大模型体系发布，商汤正式官宣入局！

商汤正式加入 ChatGPT 战局！

就在昨天，商汤在发布会现场一口气来了个全套的，大模型文生图、代码生成、做视频、2D/3D 数字人....

话不多说，直接上图。

一个人类站在非常有未来感的建筑面前，畅想平行宇宙种种可能。

只需 5 分钟真人视频素材，活灵活现的数字人就来了。

还有代码翻译实时演示，码农狂喜。

日日新，又日新

这些让所有人惊呆的大模型能力，便来自商汤的「日日新 SenseNova」大模型体系。

「日日新 SenseNova」这一名字取自《礼记 · 大学》中，汤之盘铭曰「苟日新、日日新、又日新」。

它寓意着在模型的迭代速度及处理问题的能力上可以日日更新，不断解锁 AGI 更多可能。

在这一大模型体系中，商汤自研了中文语言大模型商量 SenseChat、以及包括 AI 文生图创作、2D/3D 数字人生成、大场景 / 小物体生成等一系列生成式 AI 模型与应用。

商量 SenseChat：妙解复杂问题，创作一流文本

商量 SenseChat 是商汤最新研发的中文语言大模型。

模型训练使用了大量数据，并充分考虑了中文语境，能够更好地理解和处理中文文本。

活动现场，商量 SenseChat 不仅能进行单轮对话，而且多轮对话，超长文本理解能力上表现出色。

在单轮对话上，理解句子含义，判断句子合理性不在话下。

另外，还能够进行逻辑推理，比如正确完成非命题和命题的逻辑问题。

问它旺仔的爸爸有三个孩子，老大叫大毛，老二叫二毛，老三叫什么？

在多轮对话中，商量 SenseChat 还具备出色的语义理解、创造力和共情能力。

能够为你提供情感上的抚慰，比如「如何提高自我认识，更好地了解自己？」

它还可以进行共同创作，比如与人一人一句共同创作儿童故事。

最后，在超长文本理解上，商量 SenseChat 能够帮助用户快速通过与大模型互动来获取知识、寻找答案。比如，让它快速阅读理解《专利法》。

此外，商汤直接把商量 SenseChat 用在了代码开发上，推出了 AI 代码助手。

更刺激一点在于，他们这次竟然上了现场实时演示，而且还是镜头直接怼屏幕的那种。

据了解，全新的 AI 代码助手为码农提供了代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

与此同时，AI 代码助手还支持中英文，以及多种编程语言，并能够快速适应码农个性化编码风格。

在内部实测中，AI 代码助手可以让代码编写效率提升 62%，HumanEval 测试集一次通过率 40.2%。

商汤科技董事长兼 CEO 徐立称，下一代软件开发范式是 AI for AI，并提出了全新的二八定律：代码 = 80% AI 生成 + 20% 人工。

除了写代码，商量 SenseChat 已经用在医疗场景中，比如问诊分诊、医疗知识科普、疾病鉴别诊断。

未来，将继续拓展在药物治疗、手术方案等方面的问诊能力，帮助医生进一步提升诊疗效率。

真 · 全能 AI

除了发布中文语言大模型，当前，最火的就是生成式 AI 了，商汤在该领域也展开了全方位的布局。

基于「日日新 SenseNova」大模型体系，商汤自研了包括秒画 SenseMirage、如影 SenseAvatar、琼宇 SenseSpace、格物 SenseThings 等一系列生成式 AI 模型及应用。

文生图创作平台「秒画 SenseMirage」

文生图有多强，其实你刚刚也见证到了。秒画 SenseMirage 能够展现光影真实、细节丰富、风格多变，还能支持 6K 高清图的生成。

该模型基于超 10 亿参数自研文生图生成模型，支持二次元、三次元等多种生成风格。

另外，用户还可以自主训练，可基于单卡，5 分钟内定制属于自己的 LoRA 模型 @20 张训练图片。

对创作者来说，生成模型开源社区汇聚了 1 万 + 开源模型，结合自研模型及训练能力，为其提供了更加完善的内容生产工具。

AI 数字人视频生成平台「如影 SenseAvatar」

谈到元宇宙，就需要数字化分身 Avatar。

如今，无需专业拍摄设备，通过文字驱动，你就可以快速、高效打造一个高度逼真的数字形象。

如影 SenseAvatar 仅需要 5 分钟的真人视频素材，就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

甚至，只需提供一个粗略的想法，文案也有了。此外，它还能支持百种语言，让你轻松创作跨国际化内容。

除了打造短视频，「如影 SenseAvatar」还可以轻松制作教育、企业，娱乐文化等领域的视频。

3D 内容生成平台「琼宇 SenseSpace / 格物 SenseThings」

格物 SenseThings 可基于 3D 内容生成技术实现对空间和物体的复刻与交互，并支持再编辑再创作。

除了数字人，基于 NeRF，商汤的琼宇 SenseSpace 可以进行场景生成，复刻和还原真实空间。

琼宇 SenseSpace 生成的场景不仅支持自由漫游，还支持实时交互和编辑。

比如进行城市生成，高度还原场景细节。

甚至有厘米级的重建精度，可通过实时渲染和互动带来超真实感的场景。

多源数据融合带来超精细化的清晰度和细节效果。

另外，格物 SenseThings 可以进行物体 3D 内容生成。

它能够良好支持复杂结构物体复刻，并做到光照精准复刻，材质完美还原。

以上是日日新 SenseNova 大模型体系带来的强大内容生成能力，不论在图片、还是数字人、视频上，直接打破了人类创意天花板，将重塑行业生态。

释放大模型这么多能力，商汤的底气在哪？

5 年磨一剑，直指 AGI

2023 年，由 AIGC 及 ChatGPT 引领的新一轮人工智能热潮已箭在弦上。

其实，早在 2018 年，商汤就开始着手 AI 大模型研发。只不过，这个概念，今年才被炒火。

到现在，这家 AI 公司已经 5 年多的技术沉淀和实践经验。已经打造了 CV、NLP、AIGC 多个 AI 大模型。

2019 年，商汤最先推出了 10 亿参数量规模的视觉模型，实现了当时业界最好的算法效果。

那时，商汤已经具备了千卡并行的系统能力，使用了上千张 GPU 卡进行单任务训练。

在 2021-2022 年，商汤还训练了百亿参数规模的超大视觉模型，这相当于千亿参数语言模型的训练量。

目前，商汤已成功研发了 320 亿参数量的全球最大的通用视觉模型。

该模型已经实现了高性能的目标检测、图像分割和多物体识别算法，并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

今年 3 月，商汤还开源了多模态多任务通用大模型书生（INTERN）2.5，有 30 亿参数。

商汤这家前沿 AI 科技公司，不仅有着深厚的算法积淀，最重要的是还有强大的基础设施——SenseCore AI 大装置。

在急需算力的当下，商汤 SenseCore AI 大装置以 5000 Petaflops 超大规模算力和出色的并行计算能力，为大模型研发提供强大的算力基础设施。

现有 27000 块 GPU，可输出 5000 PetaFlops 算力，能够以最大 4000 卡规模集群进行单任务训练，并可做到 7 天以上不间断的稳定训练。

算法，算力有了，数据怎么来？

一直以来，商汤在智慧城市、智慧商业等领域的长期耕耘，积累了海量真实世界的高质量视觉数据。

徐立表示，模型的能力应考量包括参数量和数据量。而参数量和数据量的乘积即计算量，即模型的能力可以用所依赖计算量来做标定。这就是新时代下，算法、数据和算力的新公式。

发布会现场，商汤基于「日日新 SenseNova」大模型体系和 AI 大装置 SenseCore，面向商业伙伴提供 API。

其中包括图片生成，自然语言生成，视觉感知通用任务与标注服务，客户可以根据自己想要的内容进行调用。

在推进 AGI 布局上，商汤向所有人展示了大模型 + 大算力的战略布局。

未来，商汤还将继续推进「日日新 SenseNova」大模型体系的建设，将 AGI 作为核心发展目标。

日复一日，在大模型研发实现 AGI 突破，让 AI 惠及每个人。