S的 AI 研究所
Posts
AI 模型選擇全攻略

AI 模型選擇全攻略

三大巨頭:誰真正值得你花時間?

Selina Liu
March 11, 2025

訂閱 | 合作｜電子書

歡迎熱愛AI 的你

今天是我一直很想分享的主題，也是經常被讀者訊問的-

也就是如何選擇適合的 AI 模型？

即使隨著時間的推移你也會越來越有經驗，但考量到大家的工作都很繁忙，仍然希望加速學習曲線，這裡為你整理了一份精實的 AI 模型選擇指南，幫助你更高效地做出最適合自己的選擇。

讓我們直接開始吧！

今天的重點整理：

何時使用每個 AI 模型
三大AI巨頭：誰真正值得你花時間？
OpenAI 系列：你的創意工廠
Anthropic 系列：富有洞察力的作家
xAI 和 Grok：不帶濾鏡的AI

^{閱讀時間 5 分鐘}

🗞️最新消息

AI Models
何時使用每個頂級 AI 模型

有想過要利用哪個 AI 大腦來完成不同的任務嗎？

這也是我幾乎在每一場企業培訓都會被問到的問題

AI 發展速度真的快，新模型與功能幾乎天天上線。我原本想等到 GPT-4.5 正式開放給 Plus 用戶後再分享這份清單—而就在上禮拜（耶），這一刻終於來了！經過上千小時的測試，我整理出這份 AI 選擇指南，不僅告訴你該用哪款 AI，也會指出它們的盲點，幫助你做出最明智的選擇。

先不用急著開始反對，因為這只是我的個人見解。而且，這些都帶有主觀性，隨時在變化，還比大家期待的要九一些。總之現實就是，你的 AI 體驗可能和我的不同。

讓我直接拆解我的 AI 使用堆疊經驗，幫助你避開錯誤工具，提升效率，精準選擇最適合的 AI 模型！

三大巨頭：誰真正值得你花時間？

我自己使用的習慣是假如一樣的問題，我會問不同的模型，看哪個答案最接近，也是測試每個模型的表現，不過，是因為這是我的工作。

你完全可以只用三大 AI 助手之一（ChatGPT、Gemini 或 Claude）。如果你只是一般使用者，不需要第一時間用上最新模型或功能，免費版已經足夠應付你的需求。如果你的目標只是生成運動計劃或提升一點工作效率，選一個就好，不用浪費太多時間。

即使花了數小時搜尋（還動用AI 深入研究），還是找不到最新的 AI助理的使用數據。每家公司都只公佈自己的數字，例如 ChatGPT 目前有 4 億 月活躍用戶，而一些非官方消息推測 Google Gemini 目前約 2.75 億。Google 設下的目標是 年底突破 5 億，我現在就先在 Google Calendar 設個提醒，等 12 月看看他們是否有達成。

6 個月後繼續付費的付費使用者百分比

但這裡有一個關鍵點。

如果你真的想理解 AI 的能力與限制，「多樣性」是你的秘密武器。使用多種 AI 模型能幫助你分辨哪些是 AI 本質上的能力，哪些只是特定供應商的風格差異（例如：Grok 比較有幽默感跟俏皮，但不是所有 AI 都這樣）。

目前各大 AI 實驗室都在彼此競爭，未來也會不斷推出其他模型沒有的有趣功能。

總之，我已經測試了他們，而這裡是我的看法：

OpenAI 系列：你的創意工廠

最適合：產生初稿、解決創新問題、寫碼、商業研究、聽寫、基於語音的體驗

如果 OpenAI 是一位朋友，他會是那種有點混亂但充滿點子的夥伴—總是能想到最棒的點子，但有時會不是完全準時。

OpenAI-o3-mini-high 是一個擅長推理的 AI，就像一個深思熟慮的顧問，當你請它解決複雜問題時，感覺就像它找來了一個最合適的專家來幫忙。

ChatGPT 4o/4.5 則像是目前最強的「非推理型」問題解決者，而 Claude 和 Gemini 也緊隨其後，表現非常接近。

訂閱方案：

如果你是經常編寫程式、從事深入研究，或者是願意花錢嘗鮮的使用者：專業模式（$200/月）

對於大多數人來說：Plus計劃（$20/月）

如果是家庭使用：團隊計劃（$25/人/月），享有更高使用上限

對於極少使用或注重成本的人：免費計劃

讓人不耐煩的地方：不知道 OpenAI 最近對 GPT-4o 做了什麼更新，現在它聽指令的能力有點差。prompt drift 特別嚴重，用的時候要小心，或者看看一些指令優化技巧來補救。最近 AI 模型的行為穩定性很低，所以每當有新模型推出，建議留幾個小時來測試，確保它真的符合你的需求。

優點：

🔸o3-mini-high 型號在最佳編碼能力上與頂級對手並駕齊驅，但價格只有 1/3，展現出驚人的性價比。AI 進入「發明」階段的未來，感覺比想像中更近了。

🔸GPT-4.5（OpenAI 最新模型）是一個超強的頭腦風暴夥伴，最近才用它構思新logo的設計概念。

🔸此外，OpenAI 的語音模式 是同類產品中最優秀的，而螢幕共享與 ChatGPT 進行即時對話來排除故障或提問，感覺真的跟魔法一樣。這就像在跟專家 FaceTime，隨時解決問題。

Anthropic系列：有洞察力的作家

最適合：創意寫作、保持個人風格、寫程式、數據視覺化。

如果 Anthropic 是個朋友，他就像個貼心的傾聽者，懂你，幫助你用最適合自己的方式解決問題。每當 ChatGPT 不太對勁，我就立刻跑去找 Claude。

訂閱方案

📌 專業版 $20/月：適合經常寫作（郵件、社群、行銷）或想把 Claude 當主要助手的人。
📌 免費版：適合所有人。

優點

🔸 Claude 3.5 Sonnet 以前是我寫作時的首選，因為它能保持我的個人風格，還能理解我要做什麼，不需要我狂調指令。

🔸現在有了 Claude 3.7 Sonnet（開啟「擴展思考」功能，但只限 Pro 版），效果更強大。

🔸Claude 內建的指令生成器超強大，能幫你把「模糊的想法」轉成「有效的指令」，幾秒鐘就能得到你要的答案。

令人不耐煩的地方

😵‍💫 Claude 3.7 Sonnet 想要幫到你五倍多，有時候真的有點太過熱情
💻 你讓它改一行程式碼，它會直接幫你重寫 15 個區塊。
🛠️ 就像你請它修理餐桌，它可能會乾脆拆了你的牆，幫你蓋一間新房。
💡 解決方法：在指令最後加上「只做我要求的，別多管閒事」，能有效防止這種「熱心過頭」的情況。

專業小技巧

💡 Claude Artifacts 是目前最強的程式碼與視覺化工具之一，我經常用來做互動式數據可視化和決策分析，還能輕鬆分享給別人。
🍽️ 你甚至可以請它幫你做今晚吃什麼的決策矩陣，效果超直觀！
🌐 Lovable.dev 更適合完整的 Web 應用，但 Claude 的程式設計能力絕對是一流水準。
🎬 真的很強——我甚至在 Claude Artifacts 裡幾分鐘內就重現了《Severance》（人生切割術）的場景！

xAI 和 Grok

最適合：搞怪、耍狠、管制不多、超強圖像生成，還有適合瘋傳的內容。

如果 Grok 是個朋友，他大概是那種難以預測、偶爾在飯局上講些不太合時宜的話，但總能把大家逗笑的人。

訂閱方案

📌 免費版：先試試 Grok 3，感受一下風格。
📌 $40/月升級版：只有當你需要更高的使用頻率時才值得升級。

優點

🔸Grok 3.0 的創意度爆棚，比起傳統 AI 那種「標準格式」的輸出，它更不按牌理出牌，寫出來的東西很有個性（GPT-4.5 也很接近，但 Grok 更有趣）。

🔸風格明顯是千禧世代的語氣，幽默、隨性，帶點諷刺感，讀起來特別有趣。

🔸xAI 團隊比想像中還大，據 MSN 報導，它背後有近 1000 位 AI 導師。

🔸 學習速度驚人，雖然 OpenAI、Anthropic 和 Google 總是技術領先，但 Grok 追得很快，尤其在 AI 圖像生成方面，表現出奇地好，甚至有些地方超越 DALL·E。

令人不耐煩的地方

😵 很難讓 Grok 保持你的寫作風格，除非你用指令嚴格控制細節。
🎭 它不像其他 AI 那樣專門幫你「提高效率」，更像是一個專為「好玩」而生的 AI。
📉 雖然深度連結 X（Twitter）平台和數據，但它的功能並沒有想像中那麼「神奇」。

現實情況檢查

⚠️ Grok 強調比競爭對手更少限制，它的團隊也說它會觸及一些其他 AI 可能避開的話題。
📌 但這不代表它沒偏見，也不是完全「自由發揮」。
💥 爭議案例：
🔸 有人問「誰應該被判死刑？」，Grok 直接點名川普，導致 xAI 迅速滅火，引發 X 平台上的倫理爭議。
🔸 它還說川普是俄羅斯的資產，機率 75-85%。這些內容讓 xAI 團隊不得不緊急修改 AI 回應機制，因為許多 X 使用者認為這是有問題的偏見。

💡 總結：Grok 確實比其他 AI 更敢說話，但它的信任度與一致性還需要觀察，尤其是當 xAI 團隊在市場行銷與實際 AI 表現之間做出修正時。

Google 系列：平衡的方法

最適合：文件交互、影片處理、做Podcast 、非工作研究

如果 Google 的 AI 是朋友，他就是那個可靠、穩重的夥伴，總能條理清晰地幫你總結會議內容。且，你們認識最久，這種多年累積的默契可不是說丟就丟的。

訂閱方案

📌 長篇內容或研究需求：試試 Gemini Advanced，首月免費，之後 $20/月。
📌 一般使用者：用免費版，等 Google 推出更強的 AI 代理功能再考慮升級。你也可以用 AI Studio（免費） 來測試更強的模型，但記住，你的數據可能會被用來訓練 Gemini，你的公司可能不會太開心。

優點

🔸 Gemini 2 Pro 給出的回應最平衡，僅次於 Claude 在「懂我」這點上的表現。

🔸能處理影片輸入——這點超強！我經常錄下跟其他 AI 模型的對話，最後讓 Gemini 幫我總結重點、列出行動計劃，甚至做風險評估。

🔸超長上下文記憶——2M tokens（約 6000 頁內容），比其他 AI 記憶力更強。

🔸一次對比多個模型——可以在 AI Studio 同時運行不同 AI，比較輸出效果。

🔸Google Meet 內建 AI 輔助——直接在會議中與 Gemini 互動，共享螢幕，強化討論內容。
🔥 Google 這波 AI 更新，真的猛！

令人不耐煩的地方

🤯 Google，超強功能呢？
📨 為什麼還不能幫我整理整個 Gmail 收件匣？
🎙️ 為什麼不能讓我直接用語音控制 Gmail？ 這樣我就能用說的來處理所有未讀郵件！
💾 你手上有我 20 年的郵件資料，卻沒拿來做更聰明的事？
😤 還有很多未發揮的潛力

專業小技巧

💰 Google Deep Research 的價格只有 OpenAI 類似功能的 1/10，但效果幾乎一樣，對個人用戶來說 CP 值超高！
📖 NotebookLM 超好用——2023 年推出，2024 年 9 月因為「音頻概覽」功能爆紅，可以像Podcast一樣幫你整理重點。
📝 我超愛它的幾個功能：
✔️ 直接上傳 50 份文件或網站，一鍵問問題，不用慢慢整理提示詞或貼來貼去。
✔️ 上傳多小時的 YouTube 影片，直接讓它幫你歸納重點、回答問題，超省時間！

沒有 AI 是完美的

AI 還是會犯錯，但現在已經更精準了！
雖然 AI 偶爾還是會「胡說八道」，但隨著推理模型的進步和瀏覽工具的輔助，幻覺率已經降到 1.5% 以下。
👇 這裡是 2025 年 3 月 4 日的 AI 幻覺排行榜，讓你一目了然哪些 AI 最可靠。

💡 我希望你能放心用 AI，所以這裡有幾個提升可靠性的使用技巧！ 🚀

截至 2025 年 3 月 4 日的幻覺排行榜

恭喜你讀完了！今天又成長了一些

反饋是禮物

在你離開之前，我們想聽聽你的想法！
你最喜歡的部分是什麼？希望我能改變什麼？感到困惑？回覆並分享您的想法，或者只是點選下面的投票，讓我繼續改進並為大家提供價值。

你覺得這個email 小課程怎麼樣？

下期再見囉！

AI 模型選擇全攻略

三大巨頭:誰真正值得你花時間?

歡迎熱愛AI 的你

今天的重點整理：

AI Models 何時使用每個頂級 AI 模型

三大巨頭：誰真正值得你花時間？

OpenAI 系列：你的創意工廠

Anthropic系列：有洞察力的作家

最適合：創意寫作、保持個人風格、寫程式、數據視覺化。

訂閱方案

優點

令人不耐煩的地方

專業小技巧

xAI 和 Grok

訂閱方案

優點

令人不耐煩的地方

現實情況檢查

Google 系列：平衡的方法

訂閱方案

優點

令人不耐煩的地方

專業小技巧

沒有 AI 是完美的

反饋是禮物

你覺得這個email 小課程怎麼樣？

AI Models
何時使用每個頂級 AI 模型