← AI 動態 The Decoder

NVIDIA GTC 2026 震撼發佈:Rubin 平台與首款專用推理硬體 Groq 3 LPX 登場

NVIDIA 於 GTC 2026 推出 Vera Rubin 平台,不僅效能大幅提升,更首度推出專為低延遲推理設計的 Groq 3 LPX 硬體,並聯手多方成立 Nemotron 聯盟開發開放模型。

NVIDIA GTC 2026 AI 推理
NVIDIA GTC 2026 震撼發佈:Rubin 平台與首款專用推理硬體 Groq 3 LPX 登場

NVIDIA 推出全新 Vera Rubin 平台,其 POD 架構包含 1,152 顆 GPU,總運算力高達 60 exaflops。最引人注目的是首度加入專用的推理硬體 Groq 3 LPX,旨在解決 AI 應用中對延遲極其敏感的「推理」需求,其每瓦推理效能較前代 Blackwell 提升達 10 倍,這標誌著 NVIDIA 正式進軍專用推理硬體市場。

這項轉變象徵 NVIDIA 從單純的通用晶片商轉向全方位的 AI 基礎設施提供者。透過與 Mistral AI、Perplexity 等夥伴成立 Nemotron 聯盟,NVIDIA 試圖將開源模型生態與其硬體深度綁定。對一般大眾而言,這意味著未來的 AI 助理與自動化工具反應將更即時、更聰明,且運算成本有望因硬體效率提升而大幅降低,加速 AI 走入日常生活的應用。