倍率理解

倍率設定是 MoleAPI 計費系統的核心配置。理解模型倍率、補全倍率、快取倍率和分組倍率後，你就能看懂定價頁上的倍率資訊，也能根據日誌快速核對一筆請求為什麼會扣這麼多。

倍率系統概述

MoleAPI 使用四類倍率來計算使用者的配額消耗：

模型倍率（ModelRatio）：定義模型本身的基礎計費倍數
補全倍率（CompletionRatio）：單獨調整輸出 token 的價格
快取倍率（CacheRatio）：單獨調整命中快取的輸入 token 價格
分組倍率（GroupRatio）：為不同分組設定差異化計費

配額與倍率的關係

在 MoleAPI 中，最終扣費會統一折算為配額點數。

1 美元 = 500,000 配額點數
使用者餘額、消費紀錄本質上都是配額點數的增減
日誌裡常見的是美元形式的明細，後台最終會再換算成配額點數扣減

配額計算公式

按量計費模型（無快取命中）

配額消耗 = (輸入 token 數 + 輸出 token 數 × 補全倍率) × 模型倍率 × 分組倍率

按量計費模型（有快取命中）

命中快取時，不是把「快取倍率」額外乘在總價上，而是只作用於那部分快取輸入 token。

配額消耗 = (一般輸入 token 數 + 快取 token 數 × 快取倍率 + 輸出 token 數 × 補全倍率) × 模型倍率 × 分組倍率

按次計費模型（固定價格）

配額消耗 = 模型固定價格 × 分組倍率 × 500,000

音訊模型（特殊處理，new-api 內部自動處理）

配額消耗 = (文字輸入 token + 文字輸出 token × 補全倍率 + 音訊輸入 token × 音訊倍率 + 音訊輸出 token × 音訊倍率 × 音訊補全倍率) × 模型倍率 × 分組倍率

預消費與後消費機制

MoleAPI 採用預消費和後消費兩階段計費：

預消費：請求送出前按預估 token 先預扣
後消費：請求結束後按實際 token 重新計算
差額調整：實際費用與預扣費用不一致時自動補扣或退回

預消費配額 = 預估 token 數 × 模型倍率 × 分組倍率
實際配額 = 實際 token 數 × 模型倍率 × 分組倍率
配額調整 = 實際配額 - 預消費配額

模型倍率設定

模型倍率定義了不同 AI 模型的基礎計費倍數，系統會為常見模型預設預設值。

常見模型倍率範例

模型名稱	模型倍率	補全倍率	官網價格（輸入）	官網價格（輸出）
gpt-4o	1.25	4	$2.5/1M Tokens	$10/1M Tokens
gpt-3.5-turbo	0.25	2	$0.5/1M Tokens	$1.0/1M Tokens
gpt-4o-mini	0.075	4	$0.15/1M Tokens	$0.6/1M Tokens
o1	7.5	4	$15/1M Tokens	$60/1M Tokens

倍率含義可以這樣理解：

模型倍率越高，整體基礎成本越高
補全倍率越高，輸出 token 越貴
快取倍率越低，快取命中時越省
分組倍率越低，最終給使用者的實際扣費越低

補全倍率設定

補全倍率用於對輸出 token 進行額外計費，主要是為了反映「輸出比輸入更貴」的實際成本差異。

預設補全倍率

模型類型	官網價格（輸入）	官網價格（輸出）	補全倍率	說明
gpt-4o	$2.5/1M Tokens	$10/1M Tokens	4	輸出是輸入的 4 倍
gpt-3.5-turbo	$0.5/1M Tokens	$1.0/1M Tokens	2	輸出是輸入的 2 倍
gpt-image-1	$5/1M Tokens	$40/1M Tokens	8	輸出是輸入的 8 倍
gpt-4o-mini	$0.15/1M Tokens	$0.6/1M Tokens	4	輸出是輸入的 4 倍
其他模型	1	1	1	輸入輸出等價計費

在定價頁怎麼看倍率

定價頁的模型卡片會直接顯示模型倍率、補全倍率和分組倍率。先看這三個值，就能快速判斷「同樣一次呼叫，為什麼這個模型比另一個模型更貴」。

MoleAPI 定價頁中的模型卡片，展示 gpt-3.5-turbo 的輸入輸出價格、模型倍率 0.25、補全倍率 2 和分組倍率 1

快取倍率設定

快取倍率是很多人第一次看日誌時最容易誤解的地方。

快取倍率到底作用在哪裡

它只作用於命中快取的輸入 token，不會作用於：

未命中快取的一般輸入 token
輸出 token
整筆請求的總價

也就是說，一筆請求裡如果同時出現一般輸入和快取輸入，它們會分別按不同價格計算，然後再一起乘上分組倍率。

什麼時候你會在日誌裡看到快取倍率

當上游模型支援提示快取，且這次請求實際命中了快取時，日誌裡通常會額外看到：

快取 Tokens
快取倍率
快取價格

如果沒有命中快取，這幾行就不會參與最終費用計算。

分組倍率設定

分組倍率允許為不同 Channel 分組設定差異化價格，實現例如預設組、折扣組、轉發組、試用組等不同策略。

分組倍率配置

{
  "default": 1,
  "discount": 0.8,
  "relay": 0.3,
  "trial": 0.1
}

Q：分組倍率如何生效？

A：分組倍率會在最後階段統一作用到整筆請求上。你可以把它理解為「最終面向使用者的價格係數」。

Q：補全倍率的作用是什麼？

A：補全倍率主要用來平衡輸入和輸出 token 的成本差異。很多模型的輸出價格明顯高於輸入價格，所以日誌裡會把輸出 token 單獨按補全倍率折算。

Q：快取倍率的作用是什麼？

A：快取倍率只影響快取命中的輸入 token。快取倍率越低，命中快取時這部分 token 的實際成本越低。

QA 計算範例

下面的例子不是抽象公式，而是直接按日誌中的欄位一步一步核算。

Q1：一筆帶快取的請求，為什麼日誌裡會多出「快取價格」這一行？

因為這次請求命中了快取，系統把輸入 token 拆成了兩部分：

一般輸入 token：按輸入價格計算
快取命中 token：按輸入價格再乘快取倍率計算

下面這張日誌就能看到 快取 Tokens 3072、快取倍率 1 和 快取價格：

帶快取命中的請求日誌，展示快取 Tokens 3072、模型倍率 0.125、快取倍率 1、輸出倍率 8，以及輸入價格、快取價格和最終金額

根據日誌中的數字，計算過程是：

輸入費用 = 62 / 1M × $0.250000 = $0.0000155
快取費用 = 3072 / 1M × $0.250000 = $0.000768
輸出費用 = 1193 / 1M × $2.000000 = $0.002386
最終費用 = (輸入費用 + 快取費用 + 輸出費用) × 分組倍率 1
         = $0.0031695
         ≈ $0.003170

如果換算成配額點數，大約是：

$0.003170 × 500,000 ≈ 1,585 配額點數

Q2：沒有快取命中時，費用應該怎麼核對？

沒有快取命中時，就只需要看一般輸入和輸出兩部分，不會出現快取價格。

不帶快取命中的請求日誌，展示模型倍率 0.125、快取倍率 1、輸出倍率 8，僅按一般輸入和輸出計算最終金額

日誌裡的欄位對應計算如下：

輸入費用 = 827 / 1M × $0.250000 = $0.00020675
輸出費用 = 338 / 1M × $2.000000 = $0.000676
最終費用 = (輸入費用 + 輸出費用) × 分組倍率 1
         = $0.00088275
         ≈ $0.000883

換算成配額點數，大約是：

$0.000883 × 500,000 ≈ 441 配額點數

Q3：快取倍率和分組倍率同時存在時，應該先算哪一個？

先分別算出輸入、快取、輸出三部分的費用，再統一乘上分組倍率。下面這張日誌同時包含了：

模型倍率 1.25
快取倍率 0.1
輸出倍率 6
分組倍率 0.3

帶分組倍率和快取倍率的請求日誌，展示快取 Tokens 30208、模型倍率 1.25、快取倍率 0.1、輸出倍率 6、分組倍率 0.3 與最終金額

按日誌中的價格明細核算：

一般輸入費用 = 357360 / 1M × $2.500000 = $0.893400
快取費用 = 30208 / 1M × ($2.500000 × 0.1) = $0.007552
輸出費用 = 100 / 1M × $15.000000 = $0.001500
最終費用 = (一般輸入費用 + 快取費用 + 輸出費用) × 分組倍率 0.3
         = ($0.893400 + $0.007552 + $0.001500) × 0.3
         = $0.2707356
         ≈ $0.270736

這也正是為什麼日誌裡會單獨顯示：

輸入價格：$2.500000 / 1M tokens
輸出價格：$15.000000 / 1M tokens
快取價格：$2.500000 × 0.1 = $0.250000 / 1M tokens

Q4：怎麼從倍率反推一張模型卡片大概貴不貴？

最簡單的順序是：

先看模型倍率，判斷這個模型的基礎成本高不高
再看補全倍率，判斷輸出內容會不會明顯更貴
如果模型支援快取，再看快取倍率，判斷快取命中後能省多少
最後看分組倍率，判斷你目前分組下的實際面向使用者價格

如果你在定價頁看到某個模型：

模型倍率高
補全倍率高
分組倍率也高

那它在長輸出場景下通常會明顯更貴；反過來，如果快取倍率低且快取命中率高，這類請求的實際費用就會下降得更明顯。

有關更多計費規則，請查看常見問題

本頁目錄