第116章 首个国产单池万卡液冷算力集群投入运营万亿级大模型训练(1/2)
随着人工智能技术的快速发展,大模型训练对算力的需求日益旺盛。wanng中国电信作为通信行业的领军企业,积极响应国家“东数西算”战略,加速布局算力基础设施建设。近日,中国电信宣布天翼云上海临港国产万卡算力池正式启用,并迎来首批用户入驻,这一举措标志着我国算力产业迈向新的里程碑。
天翼云上海临港国产万卡算力池是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。其创新性地采用网络中置、算力分层的“魔方”型架构设计,不仅实现了单一集群内万卡高速互联,满足了万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求,更在绿色低碳方面迈出坚实步伐。通过全面采用融合液冷服务和idc基础设施的新一代智算液冷dc舱,该算力池实现了数据中心的能效和智算集群的算效双提升,为“人工智能+”时代提供了智能、弹性的绿色算力。
这一公共智算中心的启用,不仅意味着中国电信在算力基础设施建设上取得了重要突破,更为人工智能产业的发展注入了强劲动力。随着生成式ai的迭代和发展,大模型规模迅速扩展,对算力的需求急剧增长。天翼云上海临港国产万卡算力池的建成和启用,将有效缓解当前算力供应紧张的局面,为ai企业提供更加优质、更加普惠的智算公共服务。
此次启用的算力池以中国电信天翼云自研telecloudos 40为底座,承载了多项先进的技术平台。其中,算力分发网络平台“息壤”能够实现算力的灵活调度和分配,确保算力资源的高效利用;智算基础设施平台“云骁”则提供了稳定可靠的硬件基础设施,为ai模型训练提供了坚实的保障;而一站式智算服务平台“慧聚”则集成了模型训练、推理应用等一站式服务,降低了ai企业的技术门槛和运营成本。这些平台的综合运用,使得天翼云上海临港国产万卡算力池在算力供应、算力输送、算力调度以及模型训练和应用等方面实现了全栈能力的自主可控和安全可信,多项技术指标领先行业。
首批入驻的八家合作伙伴涵盖了人工智能产业链的各个层面,包括通用语言大模型公司、金融领域的行业大模型公司、企业级ai-ant平台公司以