MoleAPIMoleAPI
DokumentationSchnellstartGrundlagen

Abrechnung pro Aufruf

Einige Modelle werden direkt pro Anfrage abgerechnet und eignen sich für Szenarien mit klaren Kosten pro einzelner Ausführung

Abrechnung pro Aufruf bedeutet, dass nach dem Absenden einer Anfrage pro einzelner Ausführung abgerechnet wird, anstatt wie bei Textmodellen primär linear nach Eingabe-/Ausgabe-Textabrechnungseinheiten zu berechnen.

So lässt es sich am besten verstehen

Du kannst es so verstehen:

  • Es kommt nicht primär darauf an, wie viel Text du eingegeben hast
  • Es kommt auch nicht primär darauf an, wie viel Text das Modell ausgegeben hat
  • Entscheidend ist vielmehr die Abrechnungsregel für „diese einzelne Anfrage selbst“

Diese Abrechnungsart ist häufiger bei Bildern, Videos und bestimmten speziellen Generierungsaufgaben zu finden.

In welchen Szenarien ist eine Abrechnung pro Aufruf wahrscheinlicher

Derzeit am häufigsten:

  • Bildgenerierung
  • Videogenerierung
  • Bestimmte APIs mit festen Aktionsabläufen

Ob tatsächlich pro Aufruf abgerechnet wird, richtet sich letztlich nach dem jeweiligen Modell oder der Anzeige in der Konsole.

Vorteile der Abrechnung pro Aufruf

1. Einzelkosten lassen sich leichter abschätzen

Wenn du Aufgaben mit geringer Aufruffrequenz hast, ist die Abrechnung pro Aufruf oft intuitiver:

  • Wie viel kostet ein einzelner Aufruf ungefähr?
  • Wie viel kostet die Erstellung eines Bildes ungefähr?
  • Wie viel kostet die Generierung eines Videos ungefähr?

2. Besser geeignet für Budgetplanung auf Business-Seite

Bei Aufgaben, deren Verbrauch bei textbasierter Abrechnung schwer abzuschätzen ist, lässt sich mit Abrechnung pro Aufruf direkter kalkulieren und das Budget besser steuern.

Für welche Fälle eignet sich die Abrechnung pro Aufruf

  • Seltene Aufrufe
  • Generierungsaufgaben für Bilder/Videos
  • Wenn du die Kosten pro Ausführung auf einen Blick verstehen möchtest
  • Wenn dich eher interessiert, „wie viel jede Aktion kostet“ statt „wie viel jede Textabrechnungseinheit kostet“

Nutzungsempfehlung

Wenn du hauptsächlich an Folgendem arbeitest:

  • Dialog
  • Textgenerierung
  • Embeddings
  • Verarbeitung langer Texte

dann solltest du in der Regel nicht die Abrechnung pro Aufruf, sondern eher die nutzungsbasierte Abrechnung beachten.

Kurz gesagt

Bei Generierungsaufgaben wie Bildern und Videos ist die Abrechnung pro Aufruf häufiger; bei Aufrufen von großen Sprachmodellen für Text ist dagegen meist die nutzungsbasierte Abrechnung üblicher.

War diese Anleitung hilfreich?

Zuletzt aktualisiert am

Zur StartseiteGateway