阿里云全面升级GPU云服务:AI大模型推理性能可提升100%马姓爸爸给儿子取名,女老师看了含羞怒斥:存心让人为难
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。
针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。
随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。
阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。
通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。
ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。
为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。
比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。
在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。
此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。
在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。
零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。
小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。

- 2 “NFT”骗局还是游戏?《香蕉》同时在线“人”数超50万
- 3 首发!手机上能用的免费AI视频工具,文案一键生成原创视频!
- 4 争议中的数字人直播上海地铁上两名男子不雅举动,视频曝光,丝毫不顾周围乘客的感受
- 5 德州市自然资源局干部职工成为短视频主角 让政策宣传更接地气没想到,央视主持人桑晨原来是这位大明星的后代,难怪长这么好看
- 6 被抖音限流 美妆品牌温博士销售额断崖式下滑初中生作文引用“原神”,老师看完沉默了,网友:隔着屏幕都尴尬
- 7 《香蕉》NFT游戏引争议:同时在线玩家数突破50万
- 8 京东管理人员名单 京东高层管理人员 京东高层领导简历
- 9 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程
- 10 京东&习酒2024年定制封坛仪式圆满举行央视镜头映现妖镜 观众惊呼刘亦菲妆容脏、陈都灵嘴歪
- 11 微信:9月1日起,微信小程序须完成备案后才可上架

- 聊聊我喜欢的10个优质,正能量的自媒体
- “NFT”骗局还是游戏?《香蕉》同时在线“人”数超50万
- 首发!手机上能用的免费AI视频工具,文案一键生成原创视频!
- 争议中的数字人直播上海地铁上两名男子不雅举动,视频曝光,丝毫不顾周围乘客的感受
- 德州市自然资源局干部职工成为短视频主角 让政策宣传更接地气没想到,央视主持人桑晨原来是这位大明星的后代,难怪长这么好看
- 被抖音限流 美妆品牌温博士销售额断崖式下滑初中生作文引用“原神”,老师看完沉默了,网友:隔着屏幕都尴尬
- 《香蕉》NFT游戏引争议:同时在线玩家数突破50万
- 京东管理人员名单 京东高层管理人员 京东高层领导简历
- 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程
- 京东&习酒2024年定制封坛仪式圆满举行央视镜头映现妖镜 观众惊呼刘亦菲妆容脏、陈都灵嘴歪
- 微信:9月1日起,微信小程序须完成备案后才可上架
- 吉利银河星舰内饰发布:首搭AI智能座椅
- 调查报道|长沙一小区物业费收3.98元/㎡/月 监管:未备案,已责令整
- 快手管理层有谁?快手领导班子名单 快手主要领导简介
- 高盛:重申阿里健康(00241)“买入”评级 目标价4.4港元