FB 建議貼文

選取貼文複製成功(包含文章連結)!

Solidigm分享AI資料中心儲存趨勢分析:高效能、高密度、水冷滿足AI訓練與推論需求

Solidigm分享AI資料中心儲存趨勢分析:高效能、高密度、水冷滿足AI訓練與推論需求

ADVERTISEMENT

分享在企業級技術應用分享交流會中分析AI資料中心儲存趨勢,說明在AI訓練與推論等不同階段的需求差異,以及水冷散熱帶來的優勢。

高效能、高密度分進合擊

儲存解決方案供應商Solidigm旗下的產品以企業級固態硬碟為主,除了有針對高效能應用需求設計的D7-PS1010系列固態硬碟,也有提供更高儲存密度的D5-P5336系列固態硬碟,能夠應用於AI資料中心內不同階段的工作負載。

延伸閱讀:
Solidigm針對資料中心與AI應用推出PCIe Gen 5介面D7-PS1030、D7-PS1010固態硬碟
Solidigm 推出全球最大容量 122TB 資料中心 PCIe SSD,專為 AI 和資料密集型工作負載打造
Solidigm針對資料中心應用推出QLC固態硬碟D5-P5336,最高容量可達61.44TB

企業AI運算的負載可以先粗分為基礎模型開發的「訓練階段」,以及部署解決方案的「推論階段」。在訓練階段中的收集資料步驟需要儲存大量檔案,適合使用儲存密度較高的D5-P5336系列固態硬碟,而到了資料預處理步驟,則對容量與效能都有需求。

在接下來的模型訓練步驟中,GPU(繪圖處理器)或AI加速器需要巨大的資料吞吐量,因此使用效能更高的D7-PS1010系列固態硬碟能夠化解效能瓶頸,縮短訓練過程的整體時間。

在基礎模型訓練完成後,推論運算對於儲存的效能的需求沒有那麼高,可以採用混合儲存架構節省成本,並將高效能固態硬碟的資源集中應用於後期模型微調。至於AI推論所生成的資料,則需要更大容量的儲存裝置,也可以將負載放置於D5-P5336系列固態硬碟。

Solidigm針對企業應用需求推出多種儲存解決方案,其中包含高效能取向的D7-PS1010系列固態硬碟,以及高儲存密度取向的D5-P5336系列固態硬碟。

D5-P5336提供U.2與E1.L等尺寸選擇,最大容量達到122 TB,有助於提高資料中心儲存密度。

企業AI運算在不同階段對儲存特性的需求不盡相同,圖中水藍色代表對儲存容量、密度需求較高的步驟,淺橘色則對效能、頻寬需求較高。

熱插拔水冷固態硬碟

Solidigm在GTC 2025 NVIDIA GPU技術大會首次展示水冷版D7-PS1010固態硬碟,它採用E1.S 9.5mm外型,能夠同時對固態硬碟的正反2面進行散熱,尺寸不但比氣冷版D7-PS1010的E1.S 15mm還要小,還能夠達到100%無風扇的散熱環境,可以在同樣的機櫃空間容納更多固態硬碟,達到提高資料密度的效果。

另一方面,使用水冷散熱也可以簡化資料中心的空調系統與風道設計,提高電力使用效率(Power Usage Effectiveness,PUE),滿足許多企業ESG與永續發產的需求。

水冷版D7-PS1010也針對資料中心的營月需求,採用可熱插拔的設計,代表可以在開機的狀態下更換固態應碟,有助於縮短故障時的維修時間,在平時維護時也不需關機,能夠有效縮短維護時間(Downtime),大大提升資料中心的可靠度。

Solidigm積極投入水冷固態硬碟研發,並取得NVIDIA RVL(Recommended Vendor List,推薦供應商)資格。

Solidigm除了提出水冷板散熱方案,也開發將固態硬碟泡入冷卻液的浸沒式水冷方案。

▲水冷版D7-PS1010的介紹影片,可以看到它採用彈簧快拆機構並支援熱插拔。

氣冷版D7-PS1010的尺寸為E1.S 15mm,水冷版則為E1.S 9.5mm,有助於提高機櫃的儲存密度。

Solidigm先前展示的熱插拔水冷散熱方案,其散熱片能夠同時對固態硬碟的正反2面進行散熱。

這個方案特別之處在於能夠在不關機的情況下進行熱插拔更換,有助於縮短伺服器的維護時間(Downtime)。

現今資料中心除了需要提供強大的CPU、GPU運算能力之外,也需要準備高效能以及高容量的儲存系統,以滿足運算過程需要存取的資料,以及儲存AI生成的內容,讓儲存解決方案成為資料中心建置時必須審慎規劃的環節。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則