“50万张英伟达卡计算是不可能在一个数据中心完成的,所以很多大模型计算跨域不可避免,但跨域以后对方是英伟达的卡吗?或者智算底层基础设施都不一定。这种情况下,我们需要什么?中间谁能把应用部署在算力上跑起来呢?”
近日,在蚂蚁数科举行的一场发布会上,中国信息通信研究院云大所副所长栗蔚指出,云原生凭借其高可用、弹性、可扩展等优势成为突破AI困境的关键,云原生PaaS平台的大模型产品工具链不断完善,将加速大模型技术在行业应用中落地。
管家婆澳门官方网站中新网6月29日电(中新财经记者 吴涛)“大模型的高速发展使得AI不得不面临算力管理复杂、训练推理成本高、任务调度难等多方面发展瓶颈。”
据介绍,在AI时代,因为大模型对算力需求很大,GPT3.5的时候是1750亿参数,需要500个英伟达的卡,到了GPT5是10万亿的参数,需要50万张英伟达的卡。这种情况下,云将发挥出新的关键作用。
栗蔚表示,根据调研,云原生除了作用于AI之外,之前它作用于很多互联网应用的研发,超过一半中国企业大部分互联网化应用程序都是云原生的架构,甚至传统的核心架构现在也都在云化。
栗蔚给出答案,她认为,就是云,AI时代几个发展瓶颈问题基本都是要靠云原生满足的。云原生屏蔽了底层算力的差异,其应用不在乎你底下是CPU还是GPU,还是用了什么样的规格的卡,我只是将应用部署在上面,用你的计算能力,所以云原生发挥了这样的作用。
“很多企业通过用了云原生,对于底下上千台服务器进行统一的纳管,从而全方位提升效率和降低成本。”栗蔚强调,云跟AI结合才能充分降低AI的工程化成本,让AI大模型真实地跑起来变成服务。(完)
网友评论更多
90达州k
合作伙伴数量突破100家,西门子Xcelerator...➏➐
2024-11-18 13:53:16 推荐
187****2148 回复 184****6917:VM 3D | V2.2版本升级来袭,3D视觉应用如何...➑来自资阳
187****7024 回复 184****8714:海康机器人行业解决方案系列发布会3C专场 |...➒来自眉山
157****5527:按最下面的历史版本➓➔来自雅安
42崇州847
工业级存储 实现高效、自动化的AI视觉检测➕➖
2024-11-17 00:22:54 推荐
永久VIP:乔迁志庆,共谱新篇➗来自邛崃
158****4357:化工新纪元,爱采购携手广州化工展共探装备...➘来自都江堰
158****3063 回复 666➙:工业计算的高性能引擎:德晟达ATX主板释放...➚来自彭州
99江油ps
2024 工博会 | 亮点揭秘,载新而来!➛➜
2024-11-19 20:05:56 不推荐
什邡kv:湾测学院|因防意外启动不足而导致的机械伤...➝
186****5156 回复 159****9276:小小手大创意活动·大众投票通道正式开启! ➞