
亞馬遜的云計(jì)算部門亞馬遜網(wǎng)絡(luò)服務(wù) (AWS) 設(shè)計(jì)了一套定制的冷卻系統(tǒng),以控制 Nvidia 強(qiáng)大的新型人工智能 (AI) 芯片的溫度。
周三, AWS宣布它開發(fā)了行內(nèi)熱交換器 (IRHX),這是專為配備高性能 Nvidia GPU 的數(shù)據(jù)中心設(shè)計(jì)的定制液體冷卻系統(tǒng)。
這類芯片用于訓(xùn)練大型人工智能模型,例如如今非常流行的聊天機(jī)器人或圖像生成器,是世界上最耗電的硬件之一。它們?cè)谌斯ぶ悄芄ぷ髫?fù)載中的日益普及,給傳統(tǒng)的冷卻解決方案,尤其是空氣冷卻帶來了壓力。
亞馬遜沒有將可擴(kuò)展的冷卻解決方案留給市場(chǎng),而是發(fā)揮創(chuàng)造力,解決了這個(gè)問題。IRHX 適用于數(shù)據(jù)中心改造和新建應(yīng)用,無需進(jìn)行大規(guī)模重新設(shè)計(jì)。它通過在服務(wù)器排附近循環(huán)冷卻液來實(shí)現(xiàn)這一點(diǎn),從而為緊密排列的 GPU 散熱。
AWS 計(jì)算和機(jī)器學(xué)習(xí)服務(wù)副總裁 Dave Brown解釋標(biāo)準(zhǔn)冷卻解決方案無法滿足他們的需求。他說,這些方案會(huì)浪費(fèi)太多數(shù)據(jù)中心占地面積并且用水效率低下。雖然此類系統(tǒng)可能適用于小型供應(yīng)商的幾個(gè)機(jī)柜,但他指出,這些系統(tǒng)缺乏支持 AWS 規(guī)模所需的液體冷卻能力。
AWS 推出搭載 Nvidia Blackwell GPU 的 P6e 實(shí)例
AWS 也剛剛介紹P6e 實(shí)例利用 Nvidia 的 GB200 NVL72,這是一個(gè)密集的超級(jí)計(jì)算平臺(tái),包含 72Blackwell GPU將它們整合到一個(gè)機(jī)架中。這些設(shè)計(jì)旨在應(yīng)對(duì)大型 AI 模型和生成 AI 任務(wù)的計(jì)算密集型特性。
迄今為止,只有微軟和 CoreWeave 等公司提供這種新一代 GPU 集群。現(xiàn)在,AWS 客戶可以訪問云端最新、最先進(jìn)的定制 GPU 機(jī)器學(xué)習(xí)訓(xùn)練基礎(chǔ)設(shè)施,該基礎(chǔ)設(shè)施由最新一代水冷式 NVIDIA A100 Tensor Core GPU 提供支持。
IRHX 將這些集群保持在安全的溫度,從而提供最佳性能,避免過熱。通過將 IRHX 直接融入其數(shù)據(jù)中心設(shè)計(jì),AWS 無需等待改造整個(gè)結(jié)構(gòu)以進(jìn)行液體冷卻,也無需支付昂貴的建設(shè)費(fèi)用。
布朗在 P6e 發(fā)布會(huì)上指出,通過將 GB200 NVL72 系統(tǒng)與亞馬遜的 IRHX 相結(jié)合,客戶可以大規(guī)模利用無與倫比的計(jì)算能力。它還將使開發(fā)人員、研究人員和公司能夠比過去更快、更高效地訓(xùn)練更大規(guī)模的 AI 模型。
亞馬遜鞏固其在云基礎(chǔ)設(shè)施領(lǐng)域的領(lǐng)先地位
在正在建設(shè)的數(shù)據(jù)中心中,亞馬遜力推內(nèi)部部署冷卻技術(shù),這進(jìn)一步揭示了亞馬遜為擁有更多基礎(chǔ)設(shè)施而采取的更廣泛舉措。近年來,AWS 投入巨資開發(fā)芯片、存儲(chǔ)系統(tǒng)和網(wǎng)絡(luò)設(shè)備為其云服務(wù)提供支持。
這些進(jìn)步使亞馬遜能夠進(jìn)一步減少對(duì)第三方供應(yīng)商的依賴,并在運(yùn)營(yíng)績(jī)效和成本之間取得平衡。
這一策略已初見成效。2025年第一季度,AWS 創(chuàng)下了自成立以來的最高營(yíng)業(yè)利潤(rùn)率,如今已成為亞馬遜整體盈利的主要引擎。IRHX 的推出拓展了 AWS 在云行業(yè)的創(chuàng)新領(lǐng)導(dǎo)力和基礎(chǔ)設(shè)施布局。
其他科技巨頭也在采取類似舉措。例如,微軟就打造了自己的AI芯片和定制冷卻系統(tǒng)Sidekicks。谷歌和Meta也在研究構(gòu)建針對(duì)AI工作負(fù)載的硬件和系統(tǒng)的方法。
然而,亞馬遜擁有一個(gè)關(guān)鍵優(yōu)勢(shì)——其遍布全球的數(shù)據(jù)中心,以及多年來大規(guī)模構(gòu)建和部署定制硬件的經(jīng)驗(yàn)。IRHX 可以通過精簡(jiǎn)其 AI 就緒型基礎(chǔ)設(shè)施,使其更加高效、可持續(xù)和可擴(kuò)展,從而進(jìn)一步增強(qiáng)其優(yōu)勢(shì)。
KEY 差異線幫助加密貨幣品牌快速突破并占據(jù)頭條新聞






.png)





















