開源免費 VS. 大廠付費 AI：開發工具的計價與試錯

呷米得知道米價，這次我花了大半天進行各種 LLM 開發工具組合的「試錯」，以下是我的實測經過、踩坑紀錄以及大廠、開源兩者使用上的優缺點統整。

開源免費 AI 工具的試錯紀錄

想用開源模型寫程式，通常需要「VS Code extension」加上「第三方 API 平台」的組合。我測試了幾種常見的搭配，結果如下：

Continue (extension) + OpenRouter
- 結果：Continue無法配對上 OpenRouter Free Model。
- 開發體驗：0 顆星
Roo Code (extension) + OpenRouter
- 結果：雖然可以成功串接並使用，但 OpenRouter 上的免費模型全球都在搶，遇到嚴重的排隊塞車問題，沒試幾次我先放棄。
- 速度：0 顆星
Continue (extension) + Groq
- 結果：Continue 的介面選單預設不支援所有 Groq 的模型。
- 開發體驗：0 顆星
Roo Code (extension) + Groq
- 結果：Roo Code 不支援 Groq。
- 開發體驗：0 顆星
Cline (extension) + Groq
- 結果：這組終於能支援 Groq。先不討論 Groq 免費模型的表現好壞，體驗如下（相對於 Cursor 體驗→五星）
- Cline 開發體驗：／ Groq API 速度：
如果你有台空電腦並有不錯的 GPU，可以本地跑一個開源模型來體驗一下。並搭配上述 vscode extension 來使用。
不能少講 claw-code，拋開 vscode，改用這個也行。

結論：免費仔無路可走，天下沒有白吃的午餐

前面提到 OpenRouter，是個蠻酷的 API 聚合服務平台，上面有目前主流 model 排名與效能定位圖可供參考。去註冊一個 API Key，就能呼叫包含 Anthropic、Google、Meta 以及各大開源社群的所有模型。特色在於動態路由、價格透明。
除非有特殊用途啦，不然以 API 計價比直接訂閱貴多少...就各自評估囉。

大廠 AI 工具怎麼算流量？

放棄折騰免費資源後，來對標一下大廠 AI 工具。這裡以目前主流的 Cursor 和 Claude Code 來分析實際的用量與花費。

這邊提供幾筆真實的對話消耗範例，如果有需要可以自行套到 Cursor、Claude Code 試算一下。

// claude-4.6-sonnet-high-thinking
Cache Read：373,901 Token
Cache Write：20,357 Token
Input：5 Token
Output：17,127 Token

// claude-opus-4-8-thinking-medium
Cache Read：435,549
Cache Write：32,842
Input：22
Output：9,542

// gpt-5.5-medium
Cache Read：287,232
Cache Write：0
Input：11,728
Output：2,700

1. Cursor

假設一個開發者的日常用量是：每天問高階的 Opus 4.X 2 個問題，問一般 Sonnet 4.X 10 個問題。

事實是，如果只買每月 20 美金的 Pro 方案，這個用量絕對會把額度抽乾。專案的大量上下文反覆傳送，流量暴增很快。以這種用量來評估的話，買一個月 60 美金的 Pro+ 方案可能都很勉強，通常要升到每月 200 美金的 Ultra 方案才真的夠用。

另外補充，根據 Velosa（2026.02.22）[1]比較，完成同一任務 Claude Code 消耗的 token 數約只有 Cursor 的五分之一。Context 方面 Cursor 完整效率上支援 70K–120K 大約是 Claude Code 的一半。

2. Claude Code

Claude 官方的 CLI 採用的是「每 5 小時重新計算一次上限」的機制。如果一個 Sonnet 模型需要讀取大量的程式碼上下文，它內部的 Token 消耗權重計算，由價格反推大約是這樣：

Cache Read: $0.30/MTok (0.1x) ← 最便宜
Cache Write: $3.75/MTok (1.25x)
Input: $3.00/MTok (1.0x)
Output: $15.00/MTok (5.0x) ← 最貴

按照這個權重，可以用以下的例子來推算很快就撞到上限的原因。不過在 2026 年 5 月，Anthropic 官方把額度調高了兩倍。

如果要計算，以上對話範例消耗的 token 數到底可以用多久，其實有很難算的地方。實際體感就如前述 Velosa 說的一樣，對同樣模型、同樣輸入 Claude Code 會比 Cursor 還省，這是 IDE、extension 帶來的協作效果，整合得比較好的 Claude Code 效率顯而易見的好很多。

以上估計都相當粗略，另外可以參考 Gajie（2026.05.07）的一篇文章[2] ，如果純算 API 計價，單單只是一輪 5 小時的配額（Anthropic 5月新配額）改以 API 計價等同於花了 $62，他是訂閱 $125/每月的方案。

可以得知如果自己接 API 來用，遠遠不會比訂閱划算。

P.S. 為了省點額度，這是一個小技巧：

5 分鐘內利用 Cache hit，參考 Claude Code Camp[3]（2026.02.25），LLM 在讀取專案後，會把這些記憶在後台保留約 5 分鐘。如果你在這 5 分鐘內連續追問，模型就不需要重新讀取檔案，而是會走「Cache Read」（費用和算力只佔原本的十分之一）。
「不要頻繁重開新對話視窗」是可以節省流量，但另一方面，如果你接下來的對話，跟之前的 Cache 內容完全無關，果斷開新視窗會更省。
非必要不開啟「自動同意模式（Auto-accept / -y）」：避免自動跑一些不必要執行。

總之

這兩個都是計流量。如果不開 On-Demand Usage，在 Claude Code 就會被暫時停用（5 小時），在 Cursor 就會被改 auto 模式並降速直到下個月。

實際上哪個比較適合自己，還是要看自己的開發時程和習慣，如果是一次寫一堆，然後停好幾天不寫，那 Cursor 的流量限制方式會比較適合你。反之，如果是很平均的每天斷斷續續的寫，那 Claude Code 的每 5 小時重計的方式，就會比較適合。

至於 development experience 的部分，若比較 Cursor 和「Claude Code extension + vscode」這組合，我是覺得兩者都差不多優秀，有些超細節的部分才比得出優劣。目前比較明顯的差異感是：

Cursor 不論哪個模型，chat 都會有偏長的留言，反之 Claude Code 簡短很多，雖然這可以手動寫 rule，但在原生上 Claude Code 這點是蠻加分的。
Cursor 蠻吃電腦 RAM，反之 Claude Code 純用 vscode，就好蠻多。
Cursor 多模型可選，這優勢不用多說了。
Cursor 修改結果區塊 accept/reject 介面比 Claude Code 好很多。這點未來會越來越不重要，現階段也可以用 git stage 弭平 Claude Code 的不足。
plan mode，Cursor 略勝一籌，會自動畫 flow 或 mermaid 等圖，速度比 Claude Code 快很多。
思考時間，果然還是 Cursor 回應速度比較快（畢竟人家底層是 API 計價）

（P.S. 以上評估基於「不做調校」的狀態）

延伸想想

本篇不僅是粗淺嘗試一下黑箱反推流量計算而已，也涵蓋到一點點競品比較，可以思考的是，Anysphere（Cursor 公司）和 Anthropic 這兩家公司盈利模式上有絕大的差異，導致這兩個產品的定價策略有上述的差異。