按量計費

文字模型最常見的計費方式，通常按輸入和輸出 Token 消耗計費

按量計費 是文字模型中最常見的計費方式。

簡單來說，就是：

為什麼大多數文字模型都按量計費

因為文字請求的長度差異很大。

例如：

所以按量計費會更公平，也更精細。

對新手來說，真正重要的不是死記計費公式，而是理解下面這件事：

輸入越長、上下文越多、輸出越長，通常花費就越高。

這也是為什麼很多人一開始覺得「明明只問了一個問題，為什麼費用不低」——因為模型看到的不一定只有最後那一句話，還可能包含：

提示詞越長、附帶材料越多，輸入 Token 越高。

模型回答越長，輸出 Token 越高。

在多輪對話場景下，用戶端可能會把前面的聊天記錄一起帶上。

不同模型的單價不同，即使 Token 數量相近，費用也可能不同。

同一個模型在不同分組下，價格策略也可能不同。

如果你想節省費用，最有效的辦法通常不是「少用模型」，而是「減少無效消耗」。

一句話理解

按量計費的核心，不是「發一次請求多少錢」，而是「這次請求一共消耗了多少輸入和輸出」。

如果你主要在用圖片、影片或固定動作型介面，可以再去看：