
Google(GOOG)週四正式發表全新的Gemma 4人工智慧開源模型系列,此次更新主要鎖定進階推理能力與AI代理工作流程。Google在官方網誌中強調,Gemma 4專為複雜任務打造,提供前所未有的「每參數智慧」表現。自第一代推出以來,開發者社群的下載量已突破4億次,並衍生出超過10萬種變體,展現出強大的生態系動能。
效能與規格再進化,四款模型滿足多元需求
Gemma 4建立在與Gemini 3相同的研究與技術基礎上,共推出四種不同尺寸的模型,包含Effective 2B(E2B)、Effective 4B(E4B)、26B混合專家模型(MoE)以及31B密集模型(Dense)。這些模型具備處理複雜邏輯與AI代理工作流程的能力。根據Arena AI文本排行榜的最新數據,最大的31B模型目前在全球開源模型中排名第三,而26B模型則位居第六,效能表現甚至能擊敗體積大上20倍的競爭對手。
打破硬體限制高效運行,攜手輝達與高通優化
在硬體適配性方面,Google表示26B與31B模型能夠在一般個人電腦上順暢運行,其未量化的bfloat16權重更可高效容納於單張80GB的輝達(NVDA) H100晶片中。此外,針對運算與記憶體效率進行高度優化的E2B與E4B模型,則可直接在智慧型手機、Raspberry Pi以及輝達Jetson Orin Nano等行動與邊緣裝置上執行。為了達到最佳表現,Google更積極與自家的Pixel團隊、高通(QCOM)及聯發科展開深入合作,持續推動AI技術在各類終端裝置上的普及。
發表
我的網誌