中国电信基于800GWDM现网完成首例千卡分布式无损智算网验证

发布日期:2024-09-03     176 次

9月3日消息,当前,随着智算卡数达到千卡、甚至万卡,所需带宽往往高达百 T 比特级、甚至超 P 比特级。因此,光传输系统的大带宽、高可靠与高效率的特点是保证分布式训练高算效的关键。

中国电信集团宣布,中国电信研究院、中国电信北京公司、天翼云公司共同在中国电信现网基于 800G C+L 技术,为 1024 卡规模的分布式集群提供大容量带宽,实现 120 公里千亿参数大模型分布式训练,性能达到集中训练的 95% 以上。

据介绍,针对数据传输的大带宽问题,中国电信采用高阶调制格式的单波长 800G 技术以提高频谱效率,配合当前的业界热点的 C+L 波段技术实现超大传输带宽,在中国电信武清与润泽机房之间采用华为公司传输设备,通过多次环回构建了大带宽互联的智算验证网,距离达到 120km。

针对数据传输的高可靠问题,中国电信完成了链路误码、波长故障、光纤故障等异常测试试验,结果表明,一个 800G 业务波中断会导致超 40% 的算效降低,而百毫秒级以上光纤故障会导致算效大幅下降甚至训练中断。IT之家从官方获悉,采用 WSON 重路由恢复技术,此次在两点间将重路由恢复时间控制在 50ms 以内,可保证分布式智算业务的高可靠互联,最大程度释放算效。

针对传输链路的高效率问题,中国电信提出分钟级波长动态拆建解决方案来实现算与网的协同分时复用,有效提升网络资源利用率。此次验证为跨地域、跨层级、跨主体高可靠的算力协同调度奠定基础。


为您精选

寻找更多销售、技术和解决方案的信息?

关于绿测

广州绿测电子科技有限公司(简称:绿测科技)成立于2015年11月,是一家专注于耕耘测试与测量行业的技术开发公司。绿测科技以“工程师的测试管家”的理念向广大客户提供专业的管家服务。绿测科技的研发部及工厂设立于广州番禺区,随着公司业务的发展,先后在广西南宁、深圳、广州南沙、香港等地设立了机构。绿测科技经过深耕测试与测量领域多年,组建了一支经验丰富的团队,可为广大客户提供品质过硬的产品及测试技术服务等支持。

绿测工场服务号
绿测工场服务号
绿测科技订阅号
绿测科技订阅号
020-2204 2442
Copyright @ 2015-2024 广州绿测电子科技有限公司 版权所有 E-mail:Sales@greentest.com.cn 粤ICP备18033302号