- S的 AI X GPT 研究所
- Posts
- AI 模型選擇全攻略
AI 模型選擇全攻略
三大巨頭:誰真正值得你花時間?

歡迎熱愛AI 的你
今天是我一直很想分享的主題,也是經常被讀者訊問的-
也就是如何選擇適合的 AI 模型?
即使隨著時間的推移你也會越來越有經驗,但考量到大家的工作都很繁忙,仍然希望加速學習曲線,這裡為你整理了一份精實的 AI 模型選擇指南,幫助你更高效地做出最適合自己的選擇。
讓我們直接開始吧!
今天的重點整理:
何時使用每個 AI 模型
三大AI巨頭:誰真正值得你花時間?
OpenAI 系列:你的創意工廠
Anthropic 系列:富有洞察力的作家
xAI 和 Grok:不帶濾鏡的AI
閱讀時間 5 分鐘
🗞️最新消息
AI Models
何時使用每個頂級 AI 模型
有想過要利用哪個 AI 大腦來完成不同的任務嗎?
這也是我幾乎在每一場企業培訓都會被問到的問題
AI 發展速度真的快,新模型與功能幾乎天天上線。我原本想等到 GPT-4.5 正式開放給 Plus 用戶後再分享這份清單—而就在上禮拜(耶),這一刻終於來了!經過上千小時的測試,我整理出這份 AI 選擇指南,不僅告訴你該用哪款 AI,也會指出它們的盲點,幫助你做出最明智的選擇。
先不用急著開始反對,因為這只是我的個人見解。而且,這些都帶有主觀性,隨時在變化,還比大家期待的要九一些。總之現實就是,你的 AI 體驗可能和我的不同。
讓我直接拆解我的 AI 使用堆疊經驗,幫助你避開錯誤工具,提升效率,精準選擇最適合的 AI 模型!
三大巨頭:誰真正值得你花時間?
我自己使用的習慣是假如一樣的問題,我會問不同的模型,看哪個答案最接近,也是測試每個模型的表現,不過,是因為這是我的工作。
你完全可以只用三大 AI 助手之一(ChatGPT、Gemini 或 Claude)。如果你只是一般使用者,不需要第一時間用上最新模型或功能,免費版已經足夠應付你的需求。如果你的目標只是生成運動計劃或提升一點工作效率,選一個就好,不用浪費太多時間。
即使花了數小時搜尋(還動用AI 深入研究),還是找不到最新的 AI助理的使用數據。每家公司都只公佈自己的數字,例如 ChatGPT 目前有 4 億 月活躍用戶,而一些非官方消息推測 Google Gemini 目前約 2.75 億。Google 設下的目標是 年底突破 5 億,我現在就先在 Google Calendar 設個提醒,等 12 月看看他們是否有達成。

6 個月後繼續付費的付費使用者百分比
但這裡有一個關鍵點。
如果你真的想理解 AI 的能力與限制,「多樣性」是你的秘密武器。使用多種 AI 模型能幫助你分辨哪些是 AI 本質上的能力,哪些只是特定供應商的風格差異(例如:Grok 比較有幽默感跟俏皮,但不是所有 AI 都這樣)。
目前各大 AI 實驗室都在彼此競爭,未來也會不斷推出其他模型沒有的有趣功能。
總之,我已經測試了他們,而這裡是我的看法:
OpenAI 系列:你的創意工廠

最適合:產生初稿、解決創新問題、寫碼、商業研究、聽寫、基於語音的體驗
如果 OpenAI 是一位朋友,他會是那種有點混亂但充滿點子的夥伴—總是能想到最棒的點子,但有時會不是完全準時。
OpenAI-o3-mini-high 是一個擅長推理的 AI,就像一個深思熟慮的顧問,當你請它解決複雜問題時,感覺就像它找來了一個最合適的專家來幫忙。
ChatGPT 4o/4.5 則像是目前最強的「非推理型」問題解決者,而 Claude 和 Gemini 也緊隨其後,表現非常接近。
訂閱方案:
如果你是經常編寫程式、從事深入研究,或者是願意花錢嘗鮮的使用者:專業模式($200/月)
對於大多數人來說:Plus計劃($20/月)
如果是家庭使用:團隊計劃($25/人/月),享有更高使用上限
對於極少使用或注重成本的人:免費計劃
讓人不耐煩的地方:不知道 OpenAI 最近對 GPT-4o 做了什麼更新,現在它聽指令的能力有點差。prompt drift 特別嚴重,用的時候要小心,或者看看一些指令優化技巧來補救。最近 AI 模型的行為穩定性很低,所以每當有新模型推出,建議留幾個小時來測試,確保它真的符合你的需求。
優點:
🔸o3-mini-high 型號在最佳編碼能力上與頂級對手並駕齊驅,但價格只有 1/3,展現出驚人的性價比。AI 進入「發明」階段的未來,感覺比想像中更近了。
🔸GPT-4.5(OpenAI 最新模型)是一個超強的頭腦風暴夥伴,最近才用它構思新logo的設計概念。
🔸此外,OpenAI 的語音模式 是同類產品中最優秀的,而螢幕共享與 ChatGPT 進行即時對話來排除故障或提問,感覺真的跟魔法一樣。這就像在跟專家 FaceTime,隨時解決問題。
Anthropic系列:有洞察力的作家

最適合:創意寫作、保持個人風格、寫程式、數據視覺化。
如果 Anthropic 是個朋友,他就像個貼心的傾聽者,懂你,幫助你用最適合自己的方式解決問題。每當 ChatGPT 不太對勁,我就立刻跑去找 Claude。
訂閱方案
📌 專業版 $20/月:適合經常寫作(郵件、社群、行銷)或想把 Claude 當主要助手的人。
📌 免費版:適合所有人。
優點
🔸 Claude 3.5 Sonnet 以前是我寫作時的首選,因為它能保持我的個人風格,還能理解我要做什麼,不需要我狂調指令。
🔸現在有了 Claude 3.7 Sonnet(開啟「擴展思考」功能,但只限 Pro 版),效果更強大。
🔸Claude 內建的指令生成器超強大,能幫你把「模糊的想法」轉成「有效的指令」,幾秒鐘就能得到你要的答案。
令人不耐煩的地方
😵💫 Claude 3.7 Sonnet 想要幫到你 五倍 多,有時候真的有點太過熱情
💻 你讓它改一行程式碼,它會直接幫你重寫 15 個區塊。
🛠️ 就像你請它修理餐桌,它可能會乾脆拆了你的牆,幫你蓋一間新房。
💡 解決方法:在指令最後加上「只做我要求的,別多管閒事」,能有效防止這種「熱心過頭」的情況。
專業小技巧
💡 Claude Artifacts 是目前最強的程式碼與視覺化工具之一,我經常用來做互動式數據可視化和決策分析,還能輕鬆分享給別人。
🍽️ 你甚至可以請它幫你做今晚吃什麼的決策矩陣,效果超直觀!
🌐 Lovable.dev 更適合完整的 Web 應用,但 Claude 的程式設計能力絕對是一流水準。
🎬 真的很強——我甚至在 Claude Artifacts 裡幾分鐘內就重現了《Severance》(人生切割術)的場景!
xAI 和 Grok

最適合:搞怪、耍狠、管制不多、超強圖像生成,還有適合瘋傳的內容。
如果 Grok 是個朋友,他大概是那種難以預測、偶爾在飯局上講些不太合時宜的話,但總能把大家逗笑的人。
訂閱方案
📌 免費版:先試試 Grok 3,感受一下風格。
📌 $40/月升級版:只有當你需要更高的使用頻率時才值得升級。
優點
🔸Grok 3.0 的創意度爆棚,比起傳統 AI 那種「標準格式」的輸出,它更不按牌理出牌,寫出來的東西很有個性(GPT-4.5 也很接近,但 Grok 更有趣)。
🔸風格明顯是千禧世代的語氣,幽默、隨性,帶點諷刺感,讀起來特別有趣。
🔸xAI 團隊比想像中還大,據 MSN 報導,它背後有近 1000 位 AI 導師。
🔸 學習速度驚人,雖然 OpenAI、Anthropic 和 Google 總是技術領先,但 Grok 追得很快,尤其在 AI 圖像生成方面,表現出奇地好,甚至有些地方超越 DALL·E。
令人不耐煩的地方
😵 很難讓 Grok 保持你的寫作風格,除非你用指令嚴格控制細節。
🎭 它不像其他 AI 那樣專門幫你「提高效率」,更像是一個專為「好玩」而生的 AI。
📉 雖然深度連結 X(Twitter)平台和數據,但它的功能並沒有想像中那麼「神奇」。
現實情況檢查
⚠️ Grok 強調比競爭對手更少限制,它的團隊也說它會觸及一些其他 AI 可能避開的話題。
📌 但這不代表它沒偏見,也不是完全「自由發揮」。
💥 爭議案例:
🔸 有人問「誰應該被判死刑?」,Grok 直接點名川普,導致 xAI 迅速滅火,引發 X 平台上的倫理爭議。
🔸 它還說川普是俄羅斯的資產,機率 75-85%。這些內容讓 xAI 團隊不得不緊急修改 AI 回應機制,因為許多 X 使用者認為這是有問題的偏見。
💡 總結:Grok 確實比其他 AI 更敢說話,但它的信任度與一致性還需要觀察,尤其是當 xAI 團隊在市場行銷與實際 AI 表現之間做出修正時。
Google 系列:平衡的方法
最適合:文件交互、影片處理、做Podcast 、非工作研究
如果 Google 的 AI 是朋友,他就是那個可靠、穩重的夥伴,總能條理清晰地幫你總結會議內容。且,你們認識最久,這種多年累積的默契可不是說丟就丟的。
訂閱方案
📌 長篇內容或研究需求:試試 Gemini Advanced,首月免費,之後 $20/月。
📌 一般使用者:用免費版,等 Google 推出更強的 AI 代理功能再考慮升級。你也可以用 AI Studio(免費) 來測試更強的模型,但記住,你的數據可能會被用來訓練 Gemini,你的公司可能不會太開心。
優點
🔸 Gemini 2 Pro 給出的回應最平衡,僅次於 Claude 在「懂我」這點上的表現。
🔸能處理影片輸入——這點超強!我經常錄下跟其他 AI 模型的對話,最後讓 Gemini 幫我總結重點、列出行動計劃,甚至做風險評估。
🔸超長上下文記憶——2M tokens(約 6000 頁內容),比其他 AI 記憶力更強。
🔸一次對比多個模型——可以在 AI Studio 同時運行不同 AI,比較輸出效果。
🔸Google Meet 內建 AI 輔助——直接在會議中與 Gemini 互動,共享螢幕,強化討論內容。
🔥 Google 這波 AI 更新,真的猛!
令人不耐煩的地方
🤯 Google,超強功能呢?
📨 為什麼還不能幫我整理整個 Gmail 收件匣?
🎙️ 為什麼不能讓我直接用語音控制 Gmail? 這樣我就能用說的來處理所有未讀郵件!
💾 你手上有我 20 年的郵件資料,卻沒拿來做更聰明的事?
😤 還有很多未發揮的潛力
專業小技巧
💰 Google Deep Research 的價格只有 OpenAI 類似功能的 1/10,但效果幾乎一樣,對個人用戶來說 CP 值超高!
📖 NotebookLM 超好用——2023 年推出,2024 年 9 月因為「音頻概覽」功能爆紅,可以像Podcast一樣幫你整理重點。
📝 我超愛它的幾個功能:
✔️ 直接上傳 50 份文件或網站,一鍵問問題,不用慢慢整理提示詞或貼來貼去。
✔️ 上傳多小時的 YouTube 影片,直接讓它幫你歸納重點、回答問題,超省時間!
沒有 AI 是完美的
AI 還是會犯錯,但現在已經更精準了!
雖然 AI 偶爾還是會「胡說八道」,但隨著推理模型的進步和瀏覽工具的輔助,幻覺率已經降到 1.5% 以下。
👇 這裡是 2025 年 3 月 4 日的 AI 幻覺排行榜,讓你一目了然哪些 AI 最可靠。
💡 我希望你能放心用 AI,所以這裡有幾個提升可靠性的使用技巧! 🚀

截至 2025 年 3 月 4 日的幻覺排行榜
恭喜你讀完了!今天又成長了一些
反饋是禮物
在你離開之前,我們想聽聽你的想法!
你最喜歡的部分是什麼?希望我能改變什麼?感到困惑?回覆並分享您的想法,或者只是點選下面的投票,讓我繼續改進並為大家提供價值。
下期再見囉!
