go to top

115.06

開源免費 VS. 大廠付費 AI:開發工具的計價與試錯

呷米得知道米價,這次我花了大半天進行各種 LLM 開發工具組合的「試錯」,以下是我的實測經過、踩坑紀錄以及大廠、開源兩者使用上的優缺點統整。

開源免費 AI 工具的試錯紀錄

想用開源模型寫程式,通常需要「VS Code extension」加上「第三方 API 平台」的組合。我測試了幾種常見的搭配,結果如下:

  1. Continue (extension) + OpenRouter
    • 結果:Continue無法配對上 OpenRouter Free Model。
    • 開發體驗:0 顆星 empty-star
  2. Roo Code (extension) + OpenRouter
    • 結果:雖然可以成功串接並使用,但 OpenRouter 上的免費模型全球都在搶,遇到嚴重的排隊塞車問題,沒試幾次我先放棄。
    • 速度:0 顆星 empty-star
  3. Continue (extension) + Groq
    • 結果:Continue 的介面選單預設不支援所有 Groq 的模型。
    • 開發體驗:0 顆星 empty-star
  4. Roo Code (extension) + Groq
    • 結果:Roo Code 不支援 Groq。
    • 開發體驗:0 顆星 empty-star
  5. Cline (extension) + Groq
    • 結果:這組終於能支援 Groq。先不討論 Groq 免費模型的表現好壞,體驗如下(相對於 Cursor 體驗→五星)
    • Cline 開發體驗:full-starfull-starfull-starempty-starempty-star / Groq API 速度:full-starfull-starempty-starempty-starempty-star
  6. 如果你有台空電腦並有不錯的 GPU,可以本地跑一個開源模型來體驗一下。並搭配上述 vscode extension 來使用。
  7. 不能少講 claw-code,拋開 vscode,改用這個也行。

結論:免費仔無路可走,天下沒有白吃的午餐



P.S. 關於 OpenRouter

前面提到 OpenRouter,是個蠻酷的 API 聚合服務平台,上面有目前主流 model 排名與效能定位圖可供參考。 去註冊一個 API Key,就能呼叫包含 Anthropic、Google、Meta 以及各大開源社群的所有模型。特色在於動態路由、價格透明。
除非有特殊用途啦,不然以 API 計價比直接訂閱貴多少...就各自評估囉。

大廠 AI 工具怎麼算流量?

放棄折騰免費資源後,來對標一下大廠 AI 工具。這裡以目前主流的 Cursor 和 Claude Code 來分析實際的用量與花費。

這邊提供幾筆真實的對話消耗範例,如果有需要可以自行套到 Cursor、Claude Code 試算一下。

// claude-4.6-sonnet-high-thinking
Cache Read:373,901 Token
Cache Write:20,357 Token
Input:5 Token
Output:17,127 Token

// claude-opus-4-8-thinking-medium
Cache Read:435,549
Cache Write:32,842
Input:22
Output:9,542

// gpt-5.5-medium
Cache Read:287,232
Cache Write:0
Input:11,728
Output:2,700

1. Cursor

假設一個開發者的日常用量是:每天問高階的 Opus 4.X 2 個問題,問一般 Sonnet 4.X 10 個問題。

事實是,如果只買每月 20 美金的 Pro 方案,這個用量絕對會把額度抽乾。專案的大量上下文反覆傳送,流量暴增很快。以這種用量來評估的話,買一個月 60 美金的 Pro+ 方案可能都很勉強,通常要升到每月 200 美金的 Ultra 方案才真的夠用。


另外補充,根據 Velosa(2026.02.22)[1]比較,完成同一任務 Claude Code 消耗的 token 數約只有 Cursor 的五分之一。Context 方面 Cursor 完整效率上支援 70K–120K 大約是 Claude Code 的一半。

2. Claude Code

Claude 官方的 CLI 採用的是「每 5 小時重新計算一次上限」的機制。 如果一個 Sonnet 模型需要讀取大量的程式碼上下文,它內部的 Token 消耗權重計算,由價格反推大約是這樣:

  • Cache Read: $0.30/MTok (0.1x) ← 最便宜
  • Cache Write: $3.75/MTok (1.25x)
  • Input: $3.00/MTok (1.0x)
  • Output: $15.00/MTok (5.0x) ← 最貴

按照這個權重,可以用以下的例子來推算很快就撞到上限的原因。不過在 2026 年 5 月,Anthropic 官方把額度調高了兩倍。

如果要計算,以上對話範例消耗的 token 數到底可以用多久,其實有很難算的地方。實際體感就如前述 Velosa 說的一樣,對同樣模型、同樣輸入 Claude Code 會比 Cursor 還省,這是 IDE、extension 帶來的協作效果,整合得比較好的 Claude Code 效率顯而易見的好很多。


以上估計都相當粗略,另外可以參考 Gajie(2026.05.07)的一篇文章[2] ,如果純算 API 計價,單單只是一輪 5 小時的配額(Anthropic 5月新配額)改以 API 計價等同於花了 $62,他是訂閱 $125/每月 的方案。

可以得知如果自己接 API 來用,遠遠不會比訂閱划算。



P.S. 為了省點額度,這是一個小技巧:

  1. 5 分鐘內利用 Cache hit,參考 Claude Code Camp[3](2026.02.25),LLM 在讀取專案後,會把這些記憶在後台保留約 5 分鐘。如果你在這 5 分鐘內連續追問,模型就不需要重新讀取檔案,而是會走「Cache Read」(費用和算力只佔原本的十分之一)。
    「不要頻繁重開新對話視窗」是可以節省流量,但另一方面,如果你接下來的對話,跟之前的 Cache 內容完全無關,果斷開新視窗會更省。
  2. 非必要不開啟「自動同意模式(Auto-accept / -y)」:避免自動跑一些不必要執行。

總之

這兩個都是計流量。如果不開 On-Demand Usage,在 Claude Code 就會被暫時停用(5 小時),在 Cursor 就會被改 auto 模式並降速直到下個月。

實際上哪個比較適合自己,還是要看自己的開發時程和習慣,如果是一次寫一堆,然後停好幾天不寫,那 Cursor 的流量限制方式會比較適合你。 反之,如果是很平均的每天斷斷續續的寫,那 Claude Code 的每 5 小時重計的方式,就會比較適合。


至於 development experience 的部分,若比較 Cursor 和「Claude Code extension + vscode」這組合,我是覺得兩者都差不多優秀,有些超細節的部分有稍有不足。目前比較明顯的差異感是:

  1. Cursor 不論哪個模型,chat 都會有偏長的留言,反之 Claude Code 簡短很多,雖然這可以手動寫 rule,但在原生上 Claude Code 這點是蠻加分的。
  2. Cursor 蠻吃電腦 RAM,反之 Claude Code 純用 vscode,就好蠻多。
  3. Cursor 多模型可選,這優勢不用多說了。
  4. Cursor 修改結果區塊 accept/reject 介面比 Cluade Code 好很多。

延伸想想

本篇不僅是粗淺嘗試一下黑箱反推流量計算而已,也涵蓋到一點點競品比較,可以思考的是,Anysphere(Cursor 公司)和 Anthropic 這兩家公司盈利模式上有絕大的差異,導致這兩個產品的定價策略有上述的差異。

延伸閱讀