MoleAPIMoleAPI
文件快速開始站內基礎教學

倍率理解

倍率設定是 MoleAPI 計費系統的核心配置。理解模型倍率、補全倍率、快取倍率和分組倍率後,你就能看懂定價頁上的倍率資訊,也能根據日誌快速核對一筆請求為什麼會扣這麼多。

倍率系統概述

MoleAPI 使用四類倍率來計算使用者的配額消耗:

  1. 模型倍率(ModelRatio):定義模型本身的基礎計費倍數
  2. 補全倍率(CompletionRatio):單獨調整輸出 token 的價格
  3. 快取倍率(CacheRatio):單獨調整命中快取的輸入 token 價格
  4. 分組倍率(GroupRatio):為不同分組設定差異化計費

配額與倍率的關係

在 MoleAPI 中,最終扣費會統一折算為配額點數。

  • 1 美元 = 500,000 配額點數
  • 使用者餘額、消費紀錄本質上都是配額點數的增減
  • 日誌裡常見的是美元形式的明細,後台最終會再換算成配額點數扣減

配額計算公式

按量計費模型(無快取命中)

配額消耗 = (輸入 token 數 + 輸出 token 數 × 補全倍率) × 模型倍率 × 分組倍率

按量計費模型(有快取命中)

命中快取時,不是把「快取倍率」額外乘在總價上,而是只作用於那部分快取輸入 token。

配額消耗 = (一般輸入 token 數 + 快取 token 數 × 快取倍率 + 輸出 token 數 × 補全倍率) × 模型倍率 × 分組倍率

按次計費模型(固定價格)

配額消耗 = 模型固定價格 × 分組倍率 × 500,000

音訊模型(特殊處理,new-api 內部自動處理)

配額消耗 = (文字輸入 token + 文字輸出 token × 補全倍率 + 音訊輸入 token × 音訊倍率 + 音訊輸出 token × 音訊倍率 × 音訊補全倍率) × 模型倍率 × 分組倍率

預消費與後消費機制

MoleAPI 採用預消費和後消費兩階段計費:

  1. 預消費:請求送出前按預估 token 先預扣
  2. 後消費:請求結束後按實際 token 重新計算
  3. 差額調整:實際費用與預扣費用不一致時自動補扣或退回
預消費配額 = 預估 token 數 × 模型倍率 × 分組倍率
實際配額 = 實際 token 數 × 模型倍率 × 分組倍率
配額調整 = 實際配額 - 預消費配額

模型倍率設定

模型倍率定義了不同 AI 模型的基礎計費倍數,系統會為常見模型預設預設值。

常見模型倍率範例

模型名稱模型倍率補全倍率官網價格(輸入)官網價格(輸出)
gpt-4o1.254$2.5/1M Tokens$10/1M Tokens
gpt-3.5-turbo0.252$0.5/1M Tokens$1.0/1M Tokens
gpt-4o-mini0.0754$0.15/1M Tokens$0.6/1M Tokens
o17.54$15/1M Tokens$60/1M Tokens

倍率含義可以這樣理解:

  • 模型倍率越高,整體基礎成本越高
  • 補全倍率越高,輸出 token 越貴
  • 快取倍率越低,快取命中時越省
  • 分組倍率越低,最終給使用者的實際扣費越低

補全倍率設定

補全倍率用於對輸出 token 進行額外計費,主要是為了反映「輸出比輸入更貴」的實際成本差異。

預設補全倍率

模型類型官網價格(輸入)官網價格(輸出)補全倍率說明
gpt-4o$2.5/1M Tokens$10/1M Tokens4輸出是輸入的 4 倍
gpt-3.5-turbo$0.5/1M Tokens$1.0/1M Tokens2輸出是輸入的 2 倍
gpt-image-1$5/1M Tokens$40/1M Tokens8輸出是輸入的 8 倍
gpt-4o-mini$0.15/1M Tokens$0.6/1M Tokens4輸出是輸入的 4 倍
其他模型111輸入輸出等價計費

在定價頁怎麼看倍率

定價頁的模型卡片會直接顯示模型倍率、補全倍率和分組倍率。先看這三個值,就能快速判斷「同樣一次呼叫,為什麼這個模型比另一個模型更貴」。

MoleAPI 定價頁中的模型卡片,展示 gpt-3.5-turbo 的輸入輸出價格、模型倍率 0.25、補全倍率 2 和分組倍率 1

快取倍率設定

快取倍率是很多人第一次看日誌時最容易誤解的地方。

快取倍率到底作用在哪裡

它只作用於命中快取的輸入 token,不會作用於:

  • 未命中快取的一般輸入 token
  • 輸出 token
  • 整筆請求的總價

也就是說,一筆請求裡如果同時出現一般輸入和快取輸入,它們會分別按不同價格計算,然後再一起乘上分組倍率。

什麼時候你會在日誌裡看到快取倍率

當上游模型支援提示快取,且這次請求實際命中了快取時,日誌裡通常會額外看到:

  • 快取 Tokens
  • 快取倍率
  • 快取價格

如果沒有命中快取,這幾行就不會參與最終費用計算。

分組倍率設定

分組倍率允許為不同 Channel 分組設定差異化價格,實現例如預設組、折扣組、轉發組、試用組等不同策略。

分組倍率配置

{
  "default": 1,
  "discount": 0.8,
  "relay": 0.3,
  "trial": 0.1
}

Q:分組倍率如何生效?

A:分組倍率會在最後階段統一作用到整筆請求上。你可以把它理解為「最終面向使用者的價格係數」。

Q:補全倍率的作用是什麼?

A:補全倍率主要用來平衡輸入和輸出 token 的成本差異。很多模型的輸出價格明顯高於輸入價格,所以日誌裡會把輸出 token 單獨按補全倍率折算。

Q:快取倍率的作用是什麼?

A:快取倍率只影響快取命中的輸入 token。快取倍率越低,命中快取時這部分 token 的實際成本越低。

QA 計算範例

下面的例子不是抽象公式,而是直接按日誌中的欄位一步一步核算。

Q1:一筆帶快取的請求,為什麼日誌裡會多出「快取價格」這一行?

因為這次請求命中了快取,系統把輸入 token 拆成了兩部分:

  • 一般輸入 token:按輸入價格計算
  • 快取命中 token:按輸入價格再乘快取倍率計算

下面這張日誌就能看到 快取 Tokens 3072快取倍率 1快取價格

帶快取命中的請求日誌,展示快取 Tokens 3072、模型倍率 0.125、快取倍率 1、輸出倍率 8,以及輸入價格、快取價格和最終金額

根據日誌中的數字,計算過程是:

輸入費用 = 62 / 1M × $0.250000 = $0.0000155
快取費用 = 3072 / 1M × $0.250000 = $0.000768
輸出費用 = 1193 / 1M × $2.000000 = $0.002386
最終費用 = (輸入費用 + 快取費用 + 輸出費用) × 分組倍率 1
         = $0.0031695
         ≈ $0.003170

如果換算成配額點數,大約是:

$0.003170 × 500,000 ≈ 1,585 配額點數

Q2:沒有快取命中時,費用應該怎麼核對?

沒有快取命中時,就只需要看一般輸入和輸出兩部分,不會出現快取價格。

不帶快取命中的請求日誌,展示模型倍率 0.125、快取倍率 1、輸出倍率 8,僅按一般輸入和輸出計算最終金額

日誌裡的欄位對應計算如下:

輸入費用 = 827 / 1M × $0.250000 = $0.00020675
輸出費用 = 338 / 1M × $2.000000 = $0.000676
最終費用 = (輸入費用 + 輸出費用) × 分組倍率 1
         = $0.00088275
         ≈ $0.000883

換算成配額點數,大約是:

$0.000883 × 500,000 ≈ 441 配額點數

Q3:快取倍率和分組倍率同時存在時,應該先算哪一個?

先分別算出輸入、快取、輸出三部分的費用,再統一乘上分組倍率。下面這張日誌同時包含了:

  • 模型倍率 1.25
  • 快取倍率 0.1
  • 輸出倍率 6
  • 分組倍率 0.3

帶分組倍率和快取倍率的請求日誌,展示快取 Tokens 30208、模型倍率 1.25、快取倍率 0.1、輸出倍率 6、分組倍率 0.3 與最終金額

按日誌中的價格明細核算:

一般輸入費用 = 357360 / 1M × $2.500000 = $0.893400
快取費用 = 30208 / 1M × ($2.500000 × 0.1) = $0.007552
輸出費用 = 100 / 1M × $15.000000 = $0.001500
最終費用 = (一般輸入費用 + 快取費用 + 輸出費用) × 分組倍率 0.3
         = ($0.893400 + $0.007552 + $0.001500) × 0.3
         = $0.2707356
         ≈ $0.270736

這也正是為什麼日誌裡會單獨顯示:

  • 輸入價格:$2.500000 / 1M tokens
  • 輸出價格:$15.000000 / 1M tokens
  • 快取價格:$2.500000 × 0.1 = $0.250000 / 1M tokens

Q4:怎麼從倍率反推一張模型卡片大概貴不貴?

最簡單的順序是:

  1. 先看模型倍率,判斷這個模型的基礎成本高不高
  2. 再看補全倍率,判斷輸出內容會不會明顯更貴
  3. 如果模型支援快取,再看快取倍率,判斷快取命中後能省多少
  4. 最後看分組倍率,判斷你目前分組下的實際面向使用者價格

如果你在定價頁看到某個模型:

  • 模型倍率高
  • 補全倍率高
  • 分組倍率也高

那它在長輸出場景下通常會明顯更貴;反過來,如果快取倍率低且快取命中率高,這類請求的實際費用就會下降得更明顯。

有關更多計費規則,請查看常見問題

這篇文件對您有幫助嗎?

最後更新於

返回首頁網關