倍率理解
倍率設定是 MoleAPI 計費系統的核心配置。理解模型倍率、補全倍率、快取倍率和分組倍率後,你就能看懂定價頁上的倍率資訊,也能根據日誌快速核對一筆請求為什麼會扣這麼多。
倍率系統概述
MoleAPI 使用四類倍率來計算使用者的配額消耗:
- 模型倍率(
ModelRatio):定義模型本身的基礎計費倍數 - 補全倍率(
CompletionRatio):單獨調整輸出 token 的價格 - 快取倍率(
CacheRatio):單獨調整命中快取的輸入 token 價格 - 分組倍率(
GroupRatio):為不同分組設定差異化計費
配額與倍率的關係
在 MoleAPI 中,最終扣費會統一折算為配額點數。
1 美元 = 500,000 配額點數- 使用者餘額、消費紀錄本質上都是配額點數的增減
- 日誌裡常見的是美元形式的明細,後台最終會再換算成配額點數扣減
配額計算公式
按量計費模型(無快取命中)
配額消耗 = (輸入 token 數 + 輸出 token 數 × 補全倍率) × 模型倍率 × 分組倍率按量計費模型(有快取命中)
命中快取時,不是把「快取倍率」額外乘在總價上,而是只作用於那部分快取輸入 token。
配額消耗 = (一般輸入 token 數 + 快取 token 數 × 快取倍率 + 輸出 token 數 × 補全倍率) × 模型倍率 × 分組倍率按次計費模型(固定價格)
配額消耗 = 模型固定價格 × 分組倍率 × 500,000音訊模型(特殊處理,new-api 內部自動處理)
配額消耗 = (文字輸入 token + 文字輸出 token × 補全倍率 + 音訊輸入 token × 音訊倍率 + 音訊輸出 token × 音訊倍率 × 音訊補全倍率) × 模型倍率 × 分組倍率預消費與後消費機制
MoleAPI 採用預消費和後消費兩階段計費:
- 預消費:請求送出前按預估 token 先預扣
- 後消費:請求結束後按實際 token 重新計算
- 差額調整:實際費用與預扣費用不一致時自動補扣或退回
預消費配額 = 預估 token 數 × 模型倍率 × 分組倍率
實際配額 = 實際 token 數 × 模型倍率 × 分組倍率
配額調整 = 實際配額 - 預消費配額模型倍率設定
模型倍率定義了不同 AI 模型的基礎計費倍數,系統會為常見模型預設預設值。
常見模型倍率範例
| 模型名稱 | 模型倍率 | 補全倍率 | 官網價格(輸入) | 官網價格(輸出) |
|---|---|---|---|---|
| gpt-4o | 1.25 | 4 | $2.5/1M Tokens | $10/1M Tokens |
| gpt-3.5-turbo | 0.25 | 2 | $0.5/1M Tokens | $1.0/1M Tokens |
| gpt-4o-mini | 0.075 | 4 | $0.15/1M Tokens | $0.6/1M Tokens |
| o1 | 7.5 | 4 | $15/1M Tokens | $60/1M Tokens |
倍率含義可以這樣理解:
- 模型倍率越高,整體基礎成本越高
- 補全倍率越高,輸出 token 越貴
- 快取倍率越低,快取命中時越省
- 分組倍率越低,最終給使用者的實際扣費越低
補全倍率設定
補全倍率用於對輸出 token 進行額外計費,主要是為了反映「輸出比輸入更貴」的實際成本差異。
預設補全倍率
| 模型類型 | 官網價格(輸入) | 官網價格(輸出) | 補全倍率 | 說明 |
|---|---|---|---|---|
| gpt-4o | $2.5/1M Tokens | $10/1M Tokens | 4 | 輸出是輸入的 4 倍 |
| gpt-3.5-turbo | $0.5/1M Tokens | $1.0/1M Tokens | 2 | 輸出是輸入的 2 倍 |
| gpt-image-1 | $5/1M Tokens | $40/1M Tokens | 8 | 輸出是輸入的 8 倍 |
| gpt-4o-mini | $0.15/1M Tokens | $0.6/1M Tokens | 4 | 輸出是輸入的 4 倍 |
| 其他模型 | 1 | 1 | 1 | 輸入輸出等價計費 |
在定價頁怎麼看倍率
定價頁的模型卡片會直接顯示模型倍率、補全倍率和分組倍率。先看這三個值,就能快速判斷「同樣一次呼叫,為什麼這個模型比另一個模型更貴」。

快取倍率設定
快取倍率是很多人第一次看日誌時最容易誤解的地方。
快取倍率到底作用在哪裡
它只作用於命中快取的輸入 token,不會作用於:
- 未命中快取的一般輸入 token
- 輸出 token
- 整筆請求的總價
也就是說,一筆請求裡如果同時出現一般輸入和快取輸入,它們會分別按不同價格計算,然後再一起乘上分組倍率。
什麼時候你會在日誌裡看到快取倍率
當上游模型支援提示快取,且這次請求實際命中了快取時,日誌裡通常會額外看到:
快取 Tokens快取倍率快取價格
如果沒有命中快取,這幾行就不會參與最終費用計算。
分組倍率設定
分組倍率允許為不同 Channel 分組設定差異化價格,實現例如預設組、折扣組、轉發組、試用組等不同策略。
分組倍率配置
{
"default": 1,
"discount": 0.8,
"relay": 0.3,
"trial": 0.1
}Q:分組倍率如何生效?
A:分組倍率會在最後階段統一作用到整筆請求上。你可以把它理解為「最終面向使用者的價格係數」。
Q:補全倍率的作用是什麼?
A:補全倍率主要用來平衡輸入和輸出 token 的成本差異。很多模型的輸出價格明顯高於輸入價格,所以日誌裡會把輸出 token 單獨按補全倍率折算。
Q:快取倍率的作用是什麼?
A:快取倍率只影響快取命中的輸入 token。快取倍率越低,命中快取時這部分 token 的實際成本越低。
QA 計算範例
下面的例子不是抽象公式,而是直接按日誌中的欄位一步一步核算。
Q1:一筆帶快取的請求,為什麼日誌裡會多出「快取價格」這一行?
因為這次請求命中了快取,系統把輸入 token 拆成了兩部分:
- 一般輸入 token:按輸入價格計算
- 快取命中 token:按輸入價格再乘快取倍率計算
下面這張日誌就能看到 快取 Tokens 3072、快取倍率 1 和 快取價格:

根據日誌中的數字,計算過程是:
輸入費用 = 62 / 1M × $0.250000 = $0.0000155
快取費用 = 3072 / 1M × $0.250000 = $0.000768
輸出費用 = 1193 / 1M × $2.000000 = $0.002386
最終費用 = (輸入費用 + 快取費用 + 輸出費用) × 分組倍率 1
= $0.0031695
≈ $0.003170如果換算成配額點數,大約是:
$0.003170 × 500,000 ≈ 1,585 配額點數Q2:沒有快取命中時,費用應該怎麼核對?
沒有快取命中時,就只需要看一般輸入和輸出兩部分,不會出現快取價格。

日誌裡的欄位對應計算如下:
輸入費用 = 827 / 1M × $0.250000 = $0.00020675
輸出費用 = 338 / 1M × $2.000000 = $0.000676
最終費用 = (輸入費用 + 輸出費用) × 分組倍率 1
= $0.00088275
≈ $0.000883換算成配額點數,大約是:
$0.000883 × 500,000 ≈ 441 配額點數Q3:快取倍率和分組倍率同時存在時,應該先算哪一個?
先分別算出輸入、快取、輸出三部分的費用,再統一乘上分組倍率。下面這張日誌同時包含了:
- 模型倍率
1.25 - 快取倍率
0.1 - 輸出倍率
6 - 分組倍率
0.3

按日誌中的價格明細核算:
一般輸入費用 = 357360 / 1M × $2.500000 = $0.893400
快取費用 = 30208 / 1M × ($2.500000 × 0.1) = $0.007552
輸出費用 = 100 / 1M × $15.000000 = $0.001500
最終費用 = (一般輸入費用 + 快取費用 + 輸出費用) × 分組倍率 0.3
= ($0.893400 + $0.007552 + $0.001500) × 0.3
= $0.2707356
≈ $0.270736這也正是為什麼日誌裡會單獨顯示:
- 輸入價格:
$2.500000 / 1M tokens - 輸出價格:
$15.000000 / 1M tokens - 快取價格:
$2.500000 × 0.1 = $0.250000 / 1M tokens
Q4:怎麼從倍率反推一張模型卡片大概貴不貴?
最簡單的順序是:
- 先看模型倍率,判斷這個模型的基礎成本高不高
- 再看補全倍率,判斷輸出內容會不會明顯更貴
- 如果模型支援快取,再看快取倍率,判斷快取命中後能省多少
- 最後看分組倍率,判斷你目前分組下的實際面向使用者價格
如果你在定價頁看到某個模型:
- 模型倍率高
- 補全倍率高
- 分組倍率也高
那它在長輸出場景下通常會明顯更貴;反過來,如果快取倍率低且快取命中率高,這類請求的實際費用就會下降得更明顯。
有關更多計費規則,請查看常見問題
這篇文件對您有幫助嗎?
最後更新於