FB 建議貼文

選取貼文複製成功(包含文章連結)!

讓 AI 效能倍增的關鍵,MSI GeForce RTX 5070 DIY PC,AI 生成、剪輯、3D、遊戲效能火力全開!

讓 AI 效能倍增的關鍵,MSI GeForce RTX 5070 DIY PC,AI 生成、剪輯、3D、遊戲效能火力全開!

談到高效能,絕大多數人第一個想到的肯定是「電競玩家」,事實上內容創作者與 AI 開發者,同樣需要最頂尖的硬體火力支援。對這些追求速度與效率的用戶來說,強大的 GPU 幾乎是標配,今年 NVIDIA 全新推出的 GeForce RTX 50 系列,不僅效能顯著提升,更帶來領先的 AI 加速技術,一上市就成為話題焦點。

NVIDIA GeForce RTX 50 系列採用全新 Blackwell 架構,搭載第五代 Tensor 核心、第四代光線追蹤核心以及新型串流多處理器,能提供更真實細膩的遊戲畫面,再加上 AI 驅動的 DLSS 4 技術,可大幅提升遊戲的動態幀率;而對創作者來說,GeForce RTX 50 系列同樣展現強大優勢,NVIDIA 針對創作族群推出的 Studio 驅動程式,全面加速多元創作應用,無論是影片編輯、3D 渲染或平面設計及影像處理,皆能帶來較以往更流暢、更高效的工作體驗。

全新的 Blackwell 架構為 NVIDIA GeForce RTX 50 系列注入強大火力,升級的 Tensor 核心大幅提升 AI 運算效率,第四代光線追蹤核心進一步強化光影效果,而新一代串流多處理器則帶來更出色的影像渲染效能。

除了圖像與渲染效能全面升級,GeForce RTX 50 系列同樣在 CUDA 運算能力上大幅強化,成為 AI 應用加速的最佳利器。無論是大型語言模型(LLM)的推理運算,還是圖像生成模型的本地端部署,都能透過 RTX GPU 獲得更高效的表現。同時,使用者也能結合 NVIDIA NIM 微服務與 AI Blueprints,直接在本機快速組建與部署 AI 應用,打造更完整的工作流程。

接下來我們將透過實測來驗證 GeForce RTX 50 系列 GPU 在各類型內容創作中是否真的「火力全開」,夠不夠力支撐創作者的高效需求!

測試平台與規格介紹

讓 AI 效能倍增的關鍵,MSI GeForce RTX 5070 DIY PC,AI 生成、剪輯、3D、遊戲效能火力全開!

在本篇報導的實測部分,我們選用 MSI GeForce RTX 5070 DIY PC - 天空之夜作為測試平台,採用的是 GeForce RTX 5070 12G VANGUARD SOC 與 AMD Ryzen 7700 的組合,並配備 32GB DDR5-5600 記憶體與 1TB PCIe Gen4 SSD,確保整體系統具備充足的效能支援。同時,平台也安裝了最新版本的 NVIDIA Studio 驅動程式,以呈現最貼近創作者實際使用情境的測試結果。完整規格如下:

  • 顯示卡:MSI GeForce RTX 5070 12G VANGUARD SOC
  • 處理器:AMD Ryzen 7 7700
  • 主機板:MSI B850 Gaming Plus Wi-Fi
  • 記憶體:32GB DDR5-5600
  • 儲存:MSI SPATIUM M470 Pro 1TB SSD
  • 作業系統:Windows 11 Home
  • 驅動程式:NVIDIA Studio Driver Ver. 581.29

本次實測使用的 MSI GeForce RTX 5070 DIY PC - 天空之夜。

為了更直觀呈現效能差異,本次測試同時準備了另一張 MSI GeForce RTX 4070 GAMING X TRIO 12G 顯示卡,搭配原主機作為對照組,透過新、舊顯示卡的比較,讓大家能更清楚感受到不同世代硬體在實際應用情境下的效能落差。

本次實測平台搭載 MSI GeForce RTX™ 5070 12G VANGUARD SOC 獨立顯示卡,配備 6,144 個 CUDA 核心與 12GB GDDR7 顯示記憶體,運行時脈最高可達 2,655MHz,流線外型、頂級散熱,在效能與穩定度上都具備旗艦級水準。

透過 GPU-Z 進行檢測,能清楚看到實測主機所搭載顯示卡的詳細規格資訊,一覽其核心數量、記憶體配置與運行時脈等關鍵數據。

 

Stable Diffusion 圖像生成平台實測

對內容創作者而言,透過文字或圖像提示,利用 AI 生成圖像來輔助創作已成為日益普及的工作模式。而除了雲端服務之外,用戶也能選擇在本地端部署 Stable Diffusion 等生成模型,享受更高的自由度與即時性。不過,Stable Diffusion 的運行對硬體效能要求相當嚴苛,特別是在模型推理與運算過程中,GPU 扮演的角色至關重要。此時,NVIDIA RTX GPU 的 TensorRT 與 CUDA 核心便能發揮強大優勢,為生成速度與運算效率帶來大幅加速,讓創作流程更加流暢。

我們採用 WebUI 預設的 epiCRealism XL 模型進行文字生成圖像(TXT2IMG)的測試,並開啟高解析度修復(Hires.fix)功能,生成一張 512 x 512 px的影像後再擴大為 1,024 x 1,024 px 的尺寸,同時開啟影像精煉(Refiner)功能,以上述任務流程作為實測依據。

為了更全面檢視實測主機在 AI 圖像生成上的效能表現,我們選擇以 Stable Diffusion XL 為基礎模型的圖像生成套件 WebUI 作為測試平台,並採用相同的生成提示詞進行新舊顯示卡的比較,藉此清楚呈現不同世代硬體在生成效率上的差異。

在首次圖片生成實測中,實測主機完成影像生成僅花費 25.2 秒(圖上),相較之下,對照主機則需 40.9 秒(圖下),整體效能差距約 39%,足見新世代 GPU 在 AI 圖像生成上的優勢相當顯著。

在第二組圖片生成測試中,實測主機完成影像僅耗時 20.5 秒(圖上),而對照主機則需 42.1 秒(圖下),兩者效能差距約 52%。

在第三組圖片生成測試中,實測主機完成影像耗時 18.8 秒(圖上),而對照主機則需 41.2 秒(圖下),整體效能差距達到 55% 左右。

除了文字生成圖片,我們也實測了圖片生成圖片(IMG2IMG)的功能,透過手繪原圖作為參考生成真實風格的影像,實測主機完成影像耗時 16.1 秒(圖上),而對照主機則需 38.3 秒(圖下),整體效能差距達到 58% 左右。

除了圖片生成圖片的功能,我們另外測試了 INPAINT 指定遮罩內生成的功能,在原人像照中加上生成的太陽眼鏡,實測主機完成影像耗時 18.5 秒(圖上),而對照主機則需 35.6 秒(圖下),整體效能差距達到 48% 左右。

LLM 大型語言模型平台實測

除了圖片生成,不少使用者也會需要在本地端建立一個私有的大型語言模型(LLM)平台,打造個人化的 AI 助理,協助進行資料彙整、索引搜尋…等應用,而這樣的功能同樣極度要求 GPU 出色的效能,才能發揮具效率的可用性。

此次本地端LLM實測我們使用了 Anything LLM搭配 Ollama 與 GPT-OSS:20b 的開源模型。

因此我們也實際針對這樣的需求進行實測 -透過 AnythingLLM 搭配 Ollama,使用 OpenAI 開源的 GPT-Oss 20B 模型,實測不同類型任務的效能表現,並同樣以對照的 RTX 4070 平台進行效能差異的比較。

首個測試我們選擇一篇 12,000 字的英文論文,要求翻譯為流暢的繁體中文,實測主機完成內容輸出耗時 116.683 秒(圖上),而對照主機則需 213.830 秒(圖下),效能差距約 46% 左右。

第二個測試我們匯入約 2,400 字的新聞稿,要求摘要出三個重點與三個關鍵詞,實測主機完成內容輸出耗時 21.198 秒(圖上),而對照主機則需 43.655 秒(圖下),效能差距約 52% 左右。

第三個測試我們以常識問答的形式進行,問題為「LLM 中的 Attention 機制如何運作?」,實測主機完成內容輸出耗時 53.057 秒(圖上),而對照主機則需 107.402 秒(圖下),效能差距約 51% 左右。

UL Procyon AI 效能實測

除了前面的的圖片生成與語言大模型實測,接下來我們也透過 UL Procyon 這套效能基準測試工具,實際進行圖像生成與文字生成的跑分實測,並同樣以對照的 RTX 4070 平台進行效能差異的比較。

AI Image Generation Benchmark – Stable Diffusion 1.5(FP16)項目中,實測主機獲得 3,145 分,(圖上),對照主機獲得 2,522 分(圖下),效能差距約 24% 左右。

AI Image Generation Benchmark – Stable Diffusion 1.5(INT8)項目中,實測主機獲得 38,375 分,(圖上),對照主機獲得 30,587 分(圖下),效能差距約 25% 左右。

AI Image Generation Benchmark – Stable Diffusion XL(FP16)項目中,實測主機獲得 2,707 分,(圖上),對照主機獲得 2,128 分(圖下),效能差距約 27% 左右。

AI Text Generation Benchmark項目中,實測主機獲得平均 3,519.5 分,(圖上),對照主機獲得平均 3,031.75 分(圖下),效能差距約 16% 左右。

DaVinci Resolve 與 Premiere Pro 影音編輯軟體實測

無論是素材剪輯、特效後製甚至最終的渲染輸出,GPU 效能都扮演關鍵角色。特別是在常見的專業軟體中,例如 Adobe Premiere Pro、After Effects 以及 Blackmagic DaVinci Resolve,都高度仰賴 GPU 的平行運算能力,來加速編解碼流程與內容輸出效率。

影音創作者最常使用的 Adobe Premiere Pro,在編解碼環節全面支援 NVIDIA CUDA 加速,能大幅提升影片即時編輯與預覽的流暢度,同時也縮短最終輸出的時間。此外,CUDA 加速也進一步強化了 Premiere Pro 中的各項 AI 功能,讓創作者能更有效率地完成後製工作。

NVIDIA 亦針對影音工作流程提供專屬的 GPU 加速功能。其中,NVDEC 解碼技術可確保在編輯過程中進行影片預覽、倒播或快轉時依舊流暢;而 NVENC 編碼技術則能在匯出影片時大幅縮短處理時間,減少等待成本。此外,NVIDIA GPU 還能針對不同軟體提供進一步的加速支援,例如 Adobe Premiere Pro 的 Media Intelligence 功能,或 DaVinci Resolve 對 GPU 加速 4:2:2 編碼與解碼的支援,都讓整體編輯與輸出效率再提升一個層級。

深受專業影音剪輯創作者喜愛的 DaVinci Resolve,在工作流程中能充分發揮 GPU 加速的優勢,不僅可加快影片的編碼與解碼速度,還能強化色彩調整的即時效能。同時,透過 RTX 加速的 AI 功能,軟體可自動完成影片標記,並提升臉部辨識的準確度,讓創作者在後製流程中更省時高效。

透過 PugetBench 進行 DaVinci Resolve 的效能測試,結果顯示實測主機獲得總分 7,701 分(上圖),而對照主機則為 7,005 分(下圖),效能差距約10%。

3D 模型編輯與渲染工具實測

NVIDIA GPU 向來以 3D 圖像處理見長,因此 GeForce RTX 50 系列除了在遊戲運行上表現出色,在 3D 設計與動畫製作領域同樣具備強大實力。無論是 Blender、Cinema 4D 等主流 3D 工具,都能透過 NVIDIA GPU 的加速,獲得更流暢的模型即時互動體驗,並顯著縮短各類 3D 渲染器的運算時間。

Blender 是許多創作者愛用的 3D 建模、動畫與視效製作工具,而在 NVIDIA GPU 的加持下,其效能表現能進一步提升。透過 OptiX 光線追蹤技術,Blender 在最終畫格的渲染速度上可大幅加快,讓創作者能更有效率地完成專案。

接下來我們透過常見的效能評測工具,進一步量化此次實測主機的表現,讓大家能更直觀地參考與比較其實際效能。

在 V-Ray Benchmark 的 3D 渲染實測中,實測主機在 CUDA 渲染項目獲得 4,508 分,RTX 渲染則達到 6,669 分(圖上);相比之下,對照主機僅在 CUDA 部分獲得 2,929 分,RTX 渲染則為 4,469 分(圖下),整體效能差距介於 53% 至 49% 之間。

在 Blender Benchmark 效能測試中,實測主機繳出 6,275.23 分(上圖),而對照主機則為 5,367.48 分(下圖),整體效能差距約 17%。

接下來的測試中,我們使用 Blender 4.5,並透過官方網站提供的三個 Demo 專案,以靜態圖像渲染的方式進行效能評估,並同樣以相同主機換裝 RTX 4070顯示卡作為對照組,藉此清楚比對兩台平台在渲染效能上的差異。

在 Blender 4.0 - Gaku 官方 Demo 專案的實測中,實測主機完成渲染花費 42.91 秒(上圖),而 對照主機為 59.11 秒。整體效能差距約 28%。

在 Blender 4.1 - Lynxsdesign 官方 Demo 專案的實測中,實測主機完成渲染耗時 3 分 43 秒(上圖),對照主機需 4 分 32 秒,效能差距約 19%。

在 Blender 4.2 LTS - Gold 官方 Demo 專案的實測中,實測主機完成渲染耗時 2 分 52 秒(上圖),而對照主機為 3 分 36 秒。整體效能差距約 21%。

遊戲效能實測

除了優異的 AI 與創作者應用加速效能,NVIDIA GeForce RTX GPU 在遊戲運行方面的效能自然也不在話下,尤其是最新的 RTX 50 系列 GPU,更擁有全新 DLSS 4 技術的「多畫格生成」技術,能夠在超高畫質與即時光線追蹤特效開啟的狀況下,依舊維持超高的動態幀率。

《明末:明末:淵虛之羽》是一款類魂動作遊戲,遊戲的美術風格極為華麗真實,因此相當考驗硬體效能。

同樣的,為了確認實際的效能表現,我們以最新的 3A 級大作《明末:明末:淵虛之羽》這款遊戲進行實測,在 2K 解析度下將畫質開啟至最高且啟動即時光線追蹤,分別實測關閉 DLSS 與開啟 DLSS 多畫格生成(4x)的方式比較,同時也以 RTX 4070 顯卡作為比較標的,同樣關閉 DLSS 與開啟 DLSS 畫格生成(2x)來對比效能差異。

實測主機透過 NVIDIA FrameView 進行畫面幀數的監測,圖上為關閉 DLSS 時的實測結果,平均為 89 FPS,圖下為開啟 DLSS 與 4x 畫格生成的實測結果,平均為 298 FPS,效能提升達 3.34 倍左右。

對照主機同樣透過 NVIDIA FrameView 進行畫面幀數的監測,圖上為關閉 DLSS 時的實測結果,平均為 78 FPS,圖下為開啟 DLSS 與 2x 畫格生成的實測結果,平均為 152 FPS,效能提升約 1.9 倍左右。若是對比配置 RTX 5070 的實測主機,在未開啟 DLSS 時,兩者效能相差約 13% 左右;若是在開啟 DLSS 的畫格生成時,兩者效能差距將近 2 倍左右。

結語:RTX 50 系列 GPU 成為地端 AI、創作者、玩家必備加速利器!

近年來,隨著 NVIDIA RTX GPU 運算效能持續進化,不僅為玩家帶來更擬真、震撼的遊戲體驗,也透過 AI 加速與內容創作應用的深度整合,為創作者提供前所未有的效率優勢。無論是影像處理、2D 繪圖、3D 建模與動畫,或是影音剪輯與特效後製,都能受惠於 GPU 的強大運算力。同時,RTX GPU 也帶來包括 渲染降噪、影音編解碼、影像升頻、色彩調整等功能的全面加速,讓創作流程更加順暢。

此次實測的 MSI GeForce RTX 5070 DIY PC 搭載 NVIDIA GeForce RTX 5070 12G GDDR7 規格的 GPU 屬於中階定位,在創作者應用工具運行的效能表現擁有不錯的水準。

本次實測中,搭載 MSI GeForce RTX 5070 12GB 顯示卡的 DIY PC - 天空之夜,雖屬於中階定位,但在各類創作者應用工具上的表現已相當亮眼。特別是在日益重要的 AI 圖像生成領域,RTX GPU 憑藉強大的運算效能與 TensorRT 技術,大幅縮短生成時間並提升品質,讓創作者能高效率地將想法具象化,甚至進一步拓展至影音內容的生成。

讓 AI 效能倍增的關鍵,MSI GeForce RTX 5070 DIY PC,AI 生成、剪輯、3D、遊戲效能火力全開!

綜觀多項實測結果,搭載 NVIDIA GeForce RTX 5070 GPU 的 MSI GeForce RTX 5070 12G VANGUARD SOC 顯示卡展現出卓越的效能與穩定度,能全面滿足不同類型的創作需求,讓創作者專注於創意與靈感,而不必為硬體效能受限而分心。同時,專為創作者優化的 NVIDIA Studio 驅動程式,更進一步確保硬體與軟體的最佳整合,避免相容性問題與系統不穩定所造成的困擾,讓整體創作效率再攀新高。

了解更多https://msi.gm/S9EEEDFD

Axiang Chin
作者

阿祥,本名秦庭祥(Axiang Chin),是一個專注於3C領域、尤其是行動通訊領域的部落客,自2004年10月開始經營部落格超過20年之久,長期關注3C產品資訊與應用,也有豐富的講師經驗。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則