相关文章推荐
怕老婆的帽子  ·  AI编程应用实战 - 知乎·  6 月前    · 
深沉的松鼠  ·  使用 LLM ...·  1 年前    · 
< 查看全部产品
GPU云服务器
播放视频
GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚洲第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。
特惠精选
计算型GPU
弹性裸金属GPU
轻量型GPU
含光800 NPU

V100-16G卡GN6v GPU云服务器

16G显存V100计算卡,最高配置336G DDR4内存
实例
8核32G
购买时长
1 个月
数量
1

A10卡GN7i GPU云服务器

24G显存A10计算卡,最高配置752G DDR4内存
实例
32核188G
购买时长
1 个月
数量
1

T4卡GN6i GPU云服务器

16G显存T4计算卡,最高配置372G DDR4内存
实例
4核15G
购买时长
1 个月
数量
1

为您提升计算效率的GPU软件

阿里云为您提供专有的辅助工具
AIACC-Training
AIACC-Inference
FastGPU
cGPU
EAIS
能够提供
支持四种主流框架
Tensorflow, Pytorch, MXNet和Caffe四种分布式训练框架
性能提升50%至300%
适用于带宽密度的网络模型
单机多卡/多机多卡间高性能通信
支持FP16梯度压缩及混合精度压缩
MXNet的API扩展
支持insightface类型的数据+模型并行
RDMA网络深度优化
支持混合链路通信(RDMA+VPC)
推荐搭配使用
神龙AI加速推理引擎
AIACC-Inference是阿里云推出的神龙AI加速推理引擎,针对阿里云环境进行了深度优化,能够显著提升GPU利用率,大幅提高推理业务性能。目前,AIACC-Inference已创造两项世界纪录:
斯坦福Dawnbench Imagenet 推理延迟最低,世界第一
斯坦福Dawnbench Imagenet 推理成本最低,世界第一
能够提供
支持多个框架
Tensorflow, Pytorch, MXNet及其它可导出ONNX模型的深度学习框架进行GPU推理优化
性能提升30%至400%
适用于计算密集的网络模型
支持两种精度模型
FP32和FP16两种精度的模型优化
推荐搭配使用
阿里云GPU实例集群极速部署工具
FastGPU是一套阿里云GPU实例集群极速部署工具,帮助用户在阿里云上一键部署GPU计算资源,使其简单适配、一键部署、随处运行,为用户提供了省时、经济、便捷的阿里云GPU实例集群即刻构建方案。
能够提供
快速部署
提供便捷的API将线下训练/推理脚本快速部署在阿里云GPU实例集群中
便捷管理
提供便捷的命令行工具用于管理阿里云GPU实例集群的运行状态和生命周期
高效省时
用户无需进行阿里云IAAS层相关的计算、存储、网络等繁琐的部署操作,获取集群资源时自动获取相应环境
推荐搭配使用
阿里云容器共享GPU软件
一款在GPU上创建运行多个GPU容器,将GPU资源隔离,实现多个容器共享一张GPU的软件。cGPU可以实现在单张显卡上运行多个容器,并在多个容器间隔离GPU应用,提高GPU硬件资源利用率。
能够提供
GPU切分
划分GPU提升GPU利用率
共享GPU
多个AI应用共享GPU节约成本
灵活匹配
算力和显存灵活切分,满足应用需求
推荐搭配使用
阿里云弹性加速计算实例
Alibaba Elastic Accelerated Computing Instances(EAIS)是一款弹性加速计算实例,可在Alibaba ECS实例中灵活添加GPU加速资源。您可以针对您的应用程序的整体计算和内存需求在 Alibaba Cloud 中选择最适用的ECS实例,然后再配置所需量级的 GPU 驱动推理加速,有效利用资源,同时火速节约成本高达50%。
能够提供
推理成本降低50%
满足用户选择最合适应用的ECS总体计算实例类型,单独制定所需GPU推理加速量级,相比GPU推理实例成本降低50%
灵活的CPU与GPU配比
根据用户需求灵活配比CPU和GPU资源,准确获取用户需求
弹性伸缩
轻松扩展和缩减推理加速量级,有助于用户仅为所需资源付费
推荐搭配使用
深度学习
图形可视化
视频处理
科学计算
业内领先解决方案,超强性能
适用于工程模拟和分析的业内领先解决方案能够提供高性能、可扩展性及企业级可靠性。借助GPU超大显存容量和超强性能,利用所需计算能力执行复杂模拟并解决极具挑战性的问题。
能够解决
优化的解决方案
进行负责CFD建模,极大缩短解决时间
加速计算电磁学的电子设计
在设计高性能电子产品和组件时,模拟电磁性能,准确预测电磁辐射、干扰和信号传输
工程模拟
在云端,提升工作效率,并让IT部门节省预算开支的应用虚拟化
推荐搭配使用
高清视频处理,最佳展示
在视频处理领域同样存在计算量大,处理时间长的问题,而GPU因其计算任务高并行度,可以用于优化。目前GPU主要被用于大规模高清视频转码,4K/8K高清直播,多人视频会议、片源修复等领域
能够解决
高性能
优化程度高,提高计算性能
强计算力
快速处理多帧数据,提供处理大量计算任务的算力
推荐搭配使用
高性能计算
在气象预测、油气勘探、分子动力学等需要大规模并行计算的科学计算领域,GPU已在发挥强大的作用。通过提供大规模浮点运算的算力,与弹性计算完美结合,无论在线或离线均能提供高效的计算性能
能够解决
弹性伸缩
与ESS和SLB结合实现弹性扩容
超强计算力
提供最新型号GPU及最便捷的部署方法,满足科学计算的强大计算需求
推荐搭配使用
深势科技 基于阿里云的弹性供应方案结合抢占式GPU实例,能够快速低成本地获取所需的算力资源。
流利说 云上GPU按需购买,同时可以以比较低成本进行硬件升级。丰富的云上生态也减轻系统搭建和运维成本。
小牛翻译 GPU弹性使用方案,提供灵活充足的GPU运算资源,随时用随时申请。