筆電就能跑:Google Gemma 4 12B 登場,效能直追 26B 模型

-

刊登廣告? 點此聯絡

AI 模型的發展在追求龐大參數的同時,也積極向邊緣運算靠攏以滿足落地應用的需求。Google 最新發布的 Gemma 4 12B 開放模型,正是針對後者所提出的解決方案。

作為一款具備 120 億參數的模型,Gemma 4 12B 的核心價值在於硬體友善度,開發者僅需具備 16GB VRAM 的一般筆記型電腦,就能在本地端順暢運行並運用先進的代理推理(Agent Reasoning)與多模態處理能力。這項特性讓開發者能在保障資料隱私的前提下,有效節省雲端算力成本。

筆電就能跑:Google Gemma 4 12B 登場,效能直追 26B 模型 79d605c6-1390-4c4e-93fe-bf5adc09ac5a-1500x844

效能表現:12B 版本的基準測試成績亮眼

評估一款模型是否能滿足實際開發需求,基準測試(Benchmark)數據提供了客觀的參考基準。根據 Google 公布的數據圖表,Gemma 4 12B 在各項測試指標中展現了極高的運算效率。

與上一代體積更大的 Gemma 3 27B 相比,Gemma 4 12B 在包括 GPQA Diamond、BBEH 等所有的測試項目中皆取得了領先,顯示出第四代架構在訓練與推論效率上的具體提升。同時,若將其與同世代、體積大上一倍的 Gemma 4 26B 模型對比,12B 版本的表現亦相當接近。例如在科學問答 GPQA Diamond 項目中取得 78.8 分,在 MMLU Pro 取得 77.2 分。在視覺問答能力方面,Gemma 4 12B 在處理文件問答的 DocVQA 項目中獲得了 94.9 的高分,在 InfoVQA 中也有 88.4 的表現,證明其具備處理複雜圖表與萃取資訊的實用能力。

筆電就能跑:Google Gemma 4 12B 登場,效能直追 26B 模型 img_3649-1

統一架構:移除獨立編碼器以降低延遲

Gemma 4 12B 能夠以相對小的記憶體佔用空間,達成接近大型模型的效能,關鍵在於採用了全新的「統一架構(Unified Architecture)」。傳統的多模態模型在處理圖片或聲音時,必須依賴獨立的編碼器將非文字資訊轉換為模型可處理的格式,這個過程往往會增加系統的運算延遲並佔用額外的記憶體。

視覺與音訊處理機制的改變

為了克服傳統架構的限制,Google 在 Gemma 4 12B 中進行了深度的架構優化。在視覺處理部分,開發團隊移除了傳統的視覺編碼器,改用極度輕量化的嵌入模組(Embedding module)替代,讓語言模型的主幹能直接負擔大部分的視覺處理工作。而在音訊處理方面,模型完全移除了音訊編碼器,改以將原始音訊訊號直接投影(Project)到文字標記(Text Token)相同空間的方式運作。這兩項技術的結合,讓模型能原生處理多模態輸入,進而實現更低的反應延遲與更高的硬體使用效率。

開發者的邊緣運算新選擇

Gemma 4 12B 結合了低硬體門檻與實用的模型效能,並在寬鬆的 Apache 2.0 授權下開放使用。這使其成為企業開發語音助理、內部機密資料分析工具,以及各類邊緣智慧應用的務實選擇,進一步擴大了本地端 AI 開發的應用範疇。

更多AI相關報導

相關文章/報導
手哥 HANDBRO
手哥 HANDBRO
硬是要學共同創辦人兼職打雜編輯,熱愛網路、熱愛 3C!腦袋是個不定時炸彈,隨時會炸出新玩意兒!如有開箱、評測或各種合作需求,請洽:contact@soft4fun.net。 YouTube 頻道:手哥科科

留下一個評論

請輸入你的評論!
請在這裡輸入你的名字

網站搜尋
我們的頻道
看更多新聞
- 廣告 -
分享給朋友