8月18日,中国算力大会在银川盛大开幕,在“智算无限全栈智能联想AI算力战略暨AI服务器新品发布会”上,联想重磅发布两款全新AI服务器产品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。
这两款服务器是基于AI导向打造的全新产品,能够助力构建更加绿色高效的人工智能数据中心,满足客户从训练到推理等多样的算力需求。
AI赋智,绿色赋能:打造AI导向的算力基础设施,领跑中国智能化变革
(资料图)
近年来,在“建设数字中国”的背景下,中国算力基础设施的“地基”快速发展,行业智能化转型迎来进一步深化。与此同时,据IDC报告显示,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力1,AI算力已成为算力发展的主要方向。
今年年初,联想发布了联想服务器的首个本地化品牌“联想问天”,以“本地创新、敏捷高效”为品牌内涵,更好地满足中国本土客户的个性化需求。联想通过AI导向的算力基础设施,加速人工智能进入千行百业、覆盖多元场景,最终实现普适、智慧相融合,引领算力行业走向普适、智慧和绿色的新未来。
会上,联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽表示:“在通用算力向AI算力发展的当下,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器两款新品将分别满足不同类型的AI应用场景需求。”
联想问天WA7780 G3 AI大模型训练服务器:性能强劲,灵活高效
联想问天WA7780 G3是一款专为AI大模型训练所打造的服务器。AI算力已成为企业训练开发使用人工智能的硬门槛。联想问天WA7780 G3 AI大模型训练服务器正是为打破AI算力供给困境而来,为训练提供强劲的算力支撑。
澎湃算力
联想问天WA7780 G3 AI大模型训练服务器基于第四代英特尔®至强®可扩展处理器。NVIDIA HGX H800系统配备8颗H800 NVLink GPU,拥有高达640GB的HBM3高速显存,通过NVLINK,GPU间互联带宽高达400GB/s。将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代TensorCore配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。
灵活架构
联想问天WA7780 G3 AI大模型训练服务器,为了满足AI超大模型训练场景下,GPU服务器间高速数据通信的需求,支持IB、RoCE等多种对外网络连接方案。最高可以支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。同时,在本地存储的设计上,采用了GPU Direct Storage (GDS)技术。通过GDS技术,GPU与NVMe实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。
节能高效
联想问天WA7780 G3 AI大模型训练服务器,在产品设计中采用了三重独立风道设计,针对不同部件的散热特征,进行了系统性的优化,有效降低了由风扇带来的散热功耗。相比同级别产品,联想问天WA7780 G3 AI大模型训练服务器功耗降低约10%。同时,为了满足未来智算中心对PUE值更低的要求,本产品预留了液冷冷板设计,未来将支持液冷,这将大幅度节省在AI大模型训练过程中,因系统散热带来的额外能耗,PUE值有望低于1.1。
联想问天WA5480 G3 AI训推一体服务器:多元丰富,稳定可靠
从机器视觉、推荐系统,自然语言处理,再到更为复杂的AI大模型,不同AI应用场景对于AI服务器有着不同要求。本次发布会一同亮相的联想问天WA5480 G3 AI训推一体服务器,是联想问天品牌中的一款4U机架式AI服务器,支持多元的算力和丰富的生态,能够为AI模型的训练推理提供极致可靠的算力,加速人工智能在千行百业的落地,从而推动各行业乃至整个社会的智能化变革进程。
多元算力
联想问天WA5480 G3 AI训推一体服务器采用2颗第四代英特尔至强可扩展处理器,支持最新PCIe5.0。通过PCIe扩展,最多可以支持10张包括最新NVIDIA H800 GPU在内的,多类型、多品牌AI加速卡。可以灵活应用于AI通用模型训练、大模型推理、AI生成、云游戏、科学计算等多种应用场景,为AI的多样场景提供多元算力。
灵活拓扑
联想问天WA5480 G3 AI训推一体服务器在CPU-GPU互联的硬件设计上也充分体现了灵活多变的设计理念。联想问天WA5480 G3 AI训推一体服务器基于不同AI工作负载,可以为客户提供包括直通、Balance、Common多种CPU-GPU互联方式,避免了因为CPU-GPU数据通信方式单一与工作负载不匹配,带来的潜在性能瓶颈和系统效率下降。结合不同种类,不同数量的加速卡选择,真正实现了对AI各种复杂场景的完美匹配。
极致可靠
联想问天WA5480 G3 AI训推一体服务器充分考虑了设计冗余,为AI算力提供了安全稳定的运行环境。支持电源N+N冗余,节点内电源间互为备份,对外可以连接双路市电,保障服务器24小时在线运行。支持CPU、GPU、内存等关键部件的功耗监测,整机功耗封顶调控,动态保障服务器运行在合理的功耗区间,保证性能的稳定,以及风扇N+1冗余等多种安全设计保障高环温无间断运行。
这两款AI服务器新品是“联想问天”品牌家族重要的组成部分,传承了联想服务器高性能、高可靠、高扩展、低功耗“三高一低”的特性,具备“本地创新、敏捷高效”的品牌内涵。未来,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器将与联想其它AI基础设施产品组合多向赋能,助力AI算力覆盖AI全域应用。同时,配合联想领先的液冷技术,联想AI导向的算力基础设施,将持续助力AI算力绿色赋能,为普慧算力铸造牢固的“基石”。