title: Gemini 3 Pro 實測跑分總整理，幾乎全面領先

---

**Category**

- [AI](https://www.soft4fun.net/category/tech/ai)
- [新聞](https://www.soft4fun.net/category/tech/news)
- [科技](https://www.soft4fun.net/category/tech)

**Tag**

- [AI](https://www.soft4fun.net/tag/ai)
- [AI 模型](https://www.soft4fun.net/tag/ai-%e6%a8%a1%e5%9e%8b)
- [Gemini 3](https://www.soft4fun.net/tag/gemini-3)
- [Google](https://www.soft4fun.net/tag/google)

**圖片清單**

- ![gemini3](https://cf.img.soft4fun.net/2025/11/gemini3-scaled.png "gemini3")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-8-1500x844](https://cf.img.soft4fun.net/2025/11/image-8-8-1500x844.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-8-1500x844")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-7-1500x1371](https://cf.img.soft4fun.net/2025/11/image-8-7-1500x1371.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-7-1500x1371")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8](https://cf.img.soft4fun.net/2025/11/image-8.png "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-9-1500x635](https://cf.img.soft4fun.net/2025/11/image-9-1500x635.png "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-9-1500x635")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x809](https://cf.img.soft4fun.net/2025/11/image-10-1500x809.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x809")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1-1500x796](https://cf.img.soft4fun.net/2025/11/image-10-1-1500x796.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1-1500x796")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x683](https://cf.img.soft4fun.net/2025/11/image-10-1500x683.png "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x683")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1500x809](https://cf.img.soft4fun.net/2025/11/image-11-1500x809.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1500x809")
- ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1-1500x859](https://cf.img.soft4fun.net/2025/11/image-11-1-1500x859.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1-1500x859")

---

經過一段時間的內測，[Google](https://www.soft4fun.net/tag/google) 發表旗下最先進的 [AI 模型](https://www.soft4fun.net/tag/ai-%e6%a8%a1%e5%9e%8b) **[Gemini 3](https://www.soft4fun.net/tag/gemini-3)**，這個模型在各項測試中展現優異的推理能力，尤其在數學能力上更是遠超其他主流模型，同時也支援達 100 萬 Tokens 的超長脈絡 (context)，更適合處理大型任務或多媒體檔案。

 

到底 Gemini 3 有多強？ 手哥整理目前為止的各項測試數據，包含 Google 官方及 LMArena 的測試結果和大家分享。

          

## Google 官方數據：Gemini 3 有最先進的推理能力

 

根據官方提供的數據，在博士級科學知識的測試項目上 (GPQA Diamond)，Gemini 3 獲得 91.9% 的高分，比最近推出的 Claude Sonnet 4.5 及 GPT-5.1 的 88.1% 更高。

 

在 **ARC-AGI-2** 抽象視覺推理（非單純記憶）測試上，Gemini 3 得分高達 31.3% 及 45.1% (Deep Think)，遠超過 Claude Sonnet 4.5 及 GPT5-1，相較前一代 Gemini 2.5 Pro 成長了 6 倍，顯示在視覺能力上有突破性的成長。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-8-1500x844](https://cf.img.soft4fun.net/2025/11/image-8-8-1500x844.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-8-1500x844") 

在程式開發工作方面，Gemini 3 在 SWE-Bench 這項軟體工程測試項目獲得 76.2% 的成績，相較前代有明顯進步，與 Claude Sonnet 4.5 (77.2%) 及 GPT-5.1 (76.3%) 幾乎已經並駕齊驅。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-7-1500x1371](https://cf.img.soft4fun.net/2025/11/image-8-7-1500x1371.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8-7-1500x1371") 

在長期規劃能力上，Gemini 3 進行了一項測試，該測試透過管理模擬的自動販賣機業務來測試長期規劃能力。Gemini 3 Pro 在整整一年的模擬營運中，保持了一致的工具使用和決策能力，在不偏離任務的情況下帶來了更高的回報。不過這樣的能力在中長期交易策略上是否能展現優勢，手哥也很期待下一季的 [Alpha Arena](https://nof1.ai/) 能納入 Gemini 3 一起進行競賽。。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8](https://cf.img.soft4fun.net/2025/11/image-8.png "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-8") 

## Gemini 3 Pro 在 LMArena 真實世界實測

 

接著來看一下 LMArena 上使用者盲測數據。由於 Gemini 3 才剛推出，測試數據有限，不過還是可以從目前的結果觀察出 Gemini 3 Pro 大致上的能力範圍。

 

在整體的文字相關處理上，目前 Gemini 3 Pro 已經展現明顯優勢，而 grok 4.1 thinking 緊追在後。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-9-1500x635](https://cf.img.soft4fun.net/2025/11/image-9-1500x635.png "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-9-1500x635") 

指令遵循能力關係到 AI 互動和產出的結果，可以看到 Gemini 3 Pro 和 [claude-sonnet-4-5-20250929-thinking-32k](https://www.anthropic.com/news/claude-sonnet-4-5)、[grok-4.1-thinking](https://x.ai/news/grok-4-1) 這兩個模型的能力幾乎是相近的。不過 Open AI 最新的 GPT-5.1 則還沒出現在榜上。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x809](https://cf.img.soft4fun.net/2025/11/image-10-1500x809.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x809") 

在**創意寫作**上，頂級模型的分數幾乎是不相上下，也可以解釋每個模型都有自己的風格，而且也找得到喜歡自己風格的使用者。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1-1500x796](https://cf.img.soft4fun.net/2025/11/image-10-1-1500x796.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1-1500x796") 

在**程式開發**能力上，目前 Gemini 3 Pro 已經展現出能和以開發見長的 [claude-sonnet-4-5](https://www.anthropic.com/news/claude-sonnet-4-5) 一較高下的能力，如果再考量 100 萬的超長 tokens，對大型專案開發有龐大優勢，後續測試分數還滿令人期待的。

 

另外這邊也可以觀察到：像這類會頻繁出現大量 tokens 使用的情境幾乎都是大型私有模型的天下了，在整體排名中也只有 [kimi-k2-thinking](https://huggingface.co/moonshotai/Kimi-K2-Thinking) (未列在下方截圖) 勉強進入第 9 名。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x683](https://cf.img.soft4fun.net/2025/11/image-10-1500x683.png "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-10-1500x683") 

在**網頁開發**工作上，Gemini 3 Pro 基本上是以壓倒性的分數拉開與第 2 名之間的差距。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1500x809](https://cf.img.soft4fun.net/2025/11/image-11-1500x809.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1500x809") 

在視覺理解、辨識能力上，Gemini 從 2.5 Pro 就展現出強大的能力，Gemini 3 Pro 又有更顯著的進步，也拉開了和對手的差距。這個領域看來就是 Open AI 和 Google 的競爭了。

 ![Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1-1500x859](https://cf.img.soft4fun.net/2025/11/image-11-1-1500x859.jpg "Gemini 3 Pro 實測跑分總整理，幾乎全面領先 image-11-1-1500x859") 

## 如何開始使用 Gemini 3？

 

目前 Gemini 3 已經開放所有人使用，一般使用者可以到[網頁版 Gemini](https://gemini.google.com/) 或使用 [Gemini App](https://gemini.google.com/app/download?hl=zh-TW)，Google AI Studio 也以開放使用。開發人員部分，目前開放 Google AI Ultra 訂戶、Gemini API key 使用者、Vertex API key 使用者可以使用 Gemini 3 Pro，Gemini Code Assist Enterprise 的使用者也即將在稍晚時間開放。

 

其他如 Google AI Pro、Google Code Assist 標準版、免費版使用者則需要填寫這份表單[加入 Gemini 3 等待清單](https://goo.gle/geminicli-waitlist-signup)。

 

## Google 的優勢資源正在席捲 AI 市場

 

從 Google 官方數據到 LMArena 的實測結果，我們可以明確看出 Gemini 3 不僅在推理、視覺理解與程式開發等多方面都有長足進步，更以百萬 tokens 的超長脈絡處理能力，拉開與其他模型的差距。無論是科研用途、大型專案開發，還是日常生成任務，Gemini 3 都展現出令人期待的潛力與實力。雖然目前還有部分應用與測試尚待觀察，但可以確定的是：這場 AI 模型的競賽已進入新階段，Google 的這一步，走得不只是快，更是狠，其他競爭者要跟上的成本會越來越高。

 

- [Gemini 3 官方
  告](https://blog.google/intl/zh-tw/products/explore-get-answers/gemini-3/)
- [LMArena](https://lmarena.ai/leaderboard/search)

 

#### 更多AI相關報導

- [筆電就能跑：Google Gemma 4 12B 登場，效能直追 26B 模型](https://www.soft4fun.net/tech/ai/%e7%ad%86%e9%9b%bb%e5%b0%b1%e8%83%bd%e8%b7%91%ef%bc%9agoogle-gemma-4-12b-%e7%99%bb%e5%a0%b4%ef%bc%8c%e6%95%88%e8%83%bd%e7%9b%b4%e8%bf%bd-26b-%e6%a8%a1%e5%9e%8b.htm)
- [國際AI工
  進台灣卡在發票 歐買尬出手](https://www.soft4fun.net/tech/%e5%9c%8b%e9%9a%9bai%e5%b7%a5%e5%85%b7%e9%80%b2%e5%8f%b0%e7%81%a3%e5%8d%a1%e5%9c%a8%e7%99%bc%e7%a5%a8%e3%80%80%e6%ad%90%e8%b2%b7%e5%b0%ac%e5%87%ba%e6%89%8b-2.htm)
- [國際AI工
  進台灣卡在發票 歐買尬出手](https://www.soft4fun.net/tech/%e5%9c%8b%e9%9a%9bai%e5%b7%a5%e5%85%b7%e9%80%b2%e5%8f%b0%e7%81%a3%e5%8d%a1%e5%9c%a8%e7%99%bc%e7%a5%a8%e3%80%80%e6%ad%90%e8%b2%b7%e5%b0%ac%e5%87%ba%e6%89%8b.htm)
- [AI 變身最強駭客？Anthropic 發表未
  開模型 Claude Mythos，找到 27 年未被發現的漏洞](https://www.soft4fun.net/tech/ai/anthropic-project-glasswing-claude-mythos.htm)
- [影片生成「白菜價」時代來臨！Google 推 Veo 3.1 Lite 影片生成模型，每秒只要 0.05 美
  ](https://www.soft4fun.net/tech/ai/google-vieo-3-1-lite.htm)
