大模型时代,阿里云怎么做好云网络?
“比如AI业务的训练过程,一定需要一个高性能、高带宽、大规模的网络。网络的发展还是比较迅速的,比如Scale-out(横向扩展)网络里大规模的RDMA互联,从几百卡到千卡到万卡,带宽也是从百GB到现在的200G、400G,最新的一台服务器网络带宽通过多卡叠加已经达到了3.2T,发展速度大幅超过我们原来面向以CPU为中心通用算力的网络...
阿里云(常磊):深度用云 网络先行云网络卓越架构设计
2.云网络卓越架构五大支柱-稳定-同地域多可用区部署设计:通过合理的IP地址、多可用区和负载均衡规划,如采用/16掩码、双可用区规划及利用SLB产品构建应用池,实现同城双活网络。-跨地域容灾网络设计:利用全局流量管理GTM+DNS实现业务跨地域灾备多活,结合CEN和TR实现数据同步和服务可用性探测。-安全-...
为了让中小企业用好云,阿里云和合作伙伴今年“双11”干了这个
行业内一般将计算、存储、网络、安全等云产品归入IaaS(InfrastructureasaService,基础设施即服务);PaaS(PlatformasaService,平台即服务)则包含了开发工具、数据库、数据分析等,是企业IT架构的核心支撑层,PaaS市场增长往往意味着企业对敏捷开发和数据处理需求在快速增长。这组数据深刻反映了当下中国大中小企业...
一文详解阿里云AI大基建
灵骏集群采用了HPN7.0网络架构。HPN7.0架构是一个多轨和多平面的网络设计,可以支持单集群扩展到10万张卡的规模,并提升GPU计算效率。每台机器通过3.2Tb/s的高性能RDMA网络连接,保障了在大规模GPU集群联合的计算效率的提升。同时,阿里云做了一系列网络方面的创新和优化,比如自研的SolarRDMA协...
2024年能源人工智能创新发展大会成功召开|人工智能|能源行业|人工...
安徽明生恒卓科技有限公司技术总监徐晓波作了题为“视觉大模型在配网无人机巡检中的研发与应用”的报告,他介绍道,公司研发了基于Transformer架构的以视觉网络为骨干网络的多模态大模型,将视觉大模型技术应用到配网领域,实现了人工智能技术与无人机巡检业务的有机结合,构建了对巡检图片5层200余类数据的挖掘能力,综合检出...
AI网络新突破,阿里云将牵头制定下一代智算网络架构国际标准
在此背景下,中国公司积极展开了一系列AI基础设施建设的前沿探索,而最新的成果,就来自阿里云(www.e993.com)2024年11月28日。阿里云提出的HPN7.0架构被国际通信网络领域顶会SIGCOMM录用接收,成为首篇AI高性能网络架构的学术论文。SIGCOMM是计算机网络领域资历最老的顶级学术会议,从计算机教科书里的TCP/IP网络协议到云数据中心经典架构,SIGCOMM见证了...
重磅论文!阿里云提出新一代AI网络架构,有望替代谷歌成为全球新范式
HPN7.0架构:为AI设计的高性能网络集群从2023年9月开始,HPN7.0在阿里云展开大规模部署,大模型训练性能较上一代架构在典型场景下提升14.9%,且大幅提高了智算网络整体稳定性。前不久阿里云发布通义千问2.5版本大模型,中文性能全面赶超GPT-4Turbo,就是基于HPN7.0高性能网络集群训练而成。阿里云基础设施...
阿里云6篇论文入选SIGCOMM2024,HPN7.0论文成AI智算网络架构首篇
5月13日消息,网络通信领域国际顶会SIGCOMM2024确定了收录论文名单,中国企业表现亮眼,阿里云6篇论文入选,其中,介绍阿里云最新一代的智算集群网络架构HPN7.0的成果论文,成为SIGCOMM历史上在AI智算集群网络架构领域的首篇论文。据了解,SIGCOMM2024将于8月在悉尼线下召开会议。
阿里云斩获SIGCOMM首篇AI智算网络架构论文,HPN7.0有望成为新范式
5月13日消息,网络通信领域国际顶会SIGCOMM2024确定了收录论文名单,中国企业表现亮眼,阿里云6篇论文入选,其中,介绍阿里云最新一代的智算集群网络架构HPN7.0的成果论文,成为SIGCOMM历史上在AI智算集群网络架构领域的首篇论文。据了解,SIGCOMM2024将于8月在悉尼线下召开会议。
有望替代谷歌成全球新范式!阿里云重磅论文提出新一代AI网络架构
快科技5月14日消息,在网络通信领域的国际顶会SIGCOMM2024上,阿里云6篇论文被收录。其中最引人注目的是介绍其最新一代智算集群网络架构HPN7.0的论文,该论文也是SIGCOMM历史上首篇关于AI智算集群网络架构的论文。据介绍,HPN7.0架构是为满足AI时代对网络高性能需求而研发的,它创新性地设计了"双上联+多轨+双平面...