技術拆解/輸入指令與生成內容 均計作詞元

  圖:由Anthropic所開發的AI助手Claude,可以直接在電腦上執行多個步驟任務。
  圖:由Anthropic所開發的AI助手Claude,可以直接在電腦上執行多個步驟任務。

  Token是AI模型的最小單位,當用家在使用ChatGPT、Claude或Gemini時,每一次輸入與回覆,背後都在消耗一種看不見的單位「Token」。

  簡單來說,Token就是AI處理文字時的最小單位。在大型語言模型(LLM)中,所有輸入的句子都不會直接被「閱讀」,而是會先被拆解成一個個Token,接着再轉換成對應的數字編碼,模型才能進行後續的運算與預測。

  換句話說,人類看到的是完整語句,但AI真正處理的是「Token+數字」。這也是為什麼AI的核心運作並不是理解語意,而是透過大量資料訓練後,去預測下一個最可能出現的Token,進而產生看似合理的回答。

  因此,當內容越長、對話越多,Token就越多、成本也越高。在多數AI服務中,Token不只是資料處理單位,同時也是計算費用的基礎。無論是輸入的內容,還是模型產生的回覆,都會被計算成Token,並轉換為使用成本。

  這就是說,當輸入越長的指令,或是讓AI產生越多內容時,所消耗的Token就會越多,相對的費用也會提高。對於使用API(應用程式界面)或進階方案的使用者來說,這種影響會更加明顯,因為每一次互動背後都對應到實際的資源消耗。而所謂API,簡言之,是指可以幫助開發者節省精力,並很快地達到目的的界面。

  模型內部推理仍產生成本

  另外,在某些進階模型中,還可能存在額外的Token類型,例如用於加速回應的快取Token,或是模型內部推理過程所使用的Token。雖然一般使用者不一定會直接感受到這些差異,但它們會影響整體成本與效能。

  以ClaudeCode為例,是Anthropic推出的一款代理型(Agentic)AI工具,能控制用家的電腦終端機,擁有查看檔案、編輯程式碼、執行指令的權限,故所使用的Token也會更多,成本更高。