要闻
xAI Grok 3突破训练难关,液冷散热成关键
时间:2025-02-20 16:40
xAI推出的Grok 3号称地表最强AI,但训练过程中遭遇供电和散热两大难题。为解决这些问题,xAI采用了液冷散热系统,成功突破运算瓶颈。
xAI的Grok 3采用NVIDIA的H100芯片,而液冷散热系统的引入,使得xAI的数据中心能够发挥更高的算力。据xAI团队透露,训练Grok 2时,由于散热和供电限制,只能发挥80%的算力。
现在,xAI已拥有20万颗H100芯片用于训练Grok 3,这得益于Musk决定自建数据中心,并采用了液冷散热技术。
xAI的数据中心位于美国田纳西州曼菲斯,由Supermicro提供液冷散热机柜。Supermicro的4U高度H100机柜内含64颗H100 GPU,且原本就留有液冷散热孔洞,方便客户转换散热方式。
业界认为,AI的发展将推动液冷散热市场的快速增长。随着AI服务器TDP的提升,气冷散热已接近极限,而液冷散热成为必然选择。xAI的Grok 3成功采用液冷散热,再次凸显了液冷散热在AI数据中心中的重要性。