
Nvidia已將首批Vera CPU系統交付四大AI/雲端客戶,OCI擬2026年大規模部署,標誌「agentic」運算進入量產時代。
Nvidia近期開始向企業客戶交付首批Vera中央處理器(CPU)系統,代表公司將其「agentic computing」架構推向生產環境。據官方與多方訊息,Nvidia高階主管Ian Buck親自將第一批基礎設施系統手交給早期採用者,包括Anthropic、OpenAI、Oracle Cloud Infrastructure(OCI)與SpaceXAI。
交付場景具象徵意義:首臺系統送達位於舊金山SoMa的Anthropic辦公室,當天最後一臺則交付到Palo Alto的SpaceXAI;Nvidia團隊並向Elon Musk展示系統內部細節。Nvidia表示,Vera是為「agentic AI」設計:當模型從「回答問題」邁向「主動執行任務」時,需要不同於純GPU推理的主機處理能力,Vera旨在於此提供可擴充套件的運算支援。
背景與技術架構:Vera是Nvidia極致協同設計(extreme co-design)策略的一環,與Rubin GPU、BlueField‑4 DPU、Spectrum‑X交換器與MGX機架架構共同構成整體解決方案。Vera既可作為獨立CPU系統,也擔任Vera Rubin NVL72主機處理器,透過第二代NVIDIA NVLink‑C2C與兩顆Rubin GPU高速互聯,強化CPU—GPU協同運算效能。
客戶用途與部署規模:SpaceXAI正在評估Vera於強化學習工作負載與驅動其訓練堆疊的代理式模擬管線的適用性。更具規模性的是OCI,身為首家在超大規模雲端環境部署Vera的雲廠,規劃自2026年起部署「數十萬顆」Vera CPU,顯示雲端服務商對Vera的商業可行性抱持高度期待。
事實與意義分析:此舉不僅是硬體交付的里程碑,還代表Nvidia拓展控制資料中心主機層(host CPU)的企圖。過去AI訓練與推理長期倚重GPU,Nvidia藉由推出自家CPU並與Rubin GPU、DPU等深度整合,企圖掌握從主機到加速器的整體軟硬體棧,強化端到端效能與資料流通效率。OCI的大規模部署計畫亦可能帶動其他雲端或企業級買家跟進,改寫資料中心硬體組合。
替代觀點與駁斥:市場上也有不同聲音,批評者認為GPU仍是AI運算的核心,且x86生態系(Intel/AMD)與既有軟體優勢短期內難以被取代;另有人擔心新CPU在軟體相容性、開發者生態與功耗成本上的挑戰。對此,Nvidia的回應是:agentic工作負載需要更緊密的CPU—GPU協同、低延遲連線與資料平面加速(由DPU與NVLink提供),單靠GPU難以全面處理控制、協調與模擬等任務;而OCI的大規模採購計畫則為Vera的可行性提供實際背書,但軟體與生態系建構仍是關鍵觀察點。
結論與未來展望:Nvidia首批交付Vera CPU系統,標誌AI資料中心架構可能進入新階段——從以GPU為中心轉向更整合的CPU+GPU+DPU協同模式。短期觀察重點包括:第三方基準與實測結果、開發工具與雲端管理整合情況、以及其他雲廠或企業是否跟進採用。對業界而言,應密切關注2026年前後OCI等大規模部署的實際效益報告;對企業採購與架構決策者,則需評估軟體相容性、能耗與總持有成本,並在可觀察的實測資料出爐後再調整部署策略。
點擊下方連結,開啟「美股K線APP」,獲得更多美股即時資訊喔!
https://www.cmoney.tw/r/56/9hlg37
發表
我的網誌


