Abrechnung pro Aufruf
Einige Modelle werden direkt pro Anfrage abgerechnet und eignen sich für Szenarien mit klaren Kosten pro einzelner Ausführung
Abrechnung pro Aufruf bedeutet, dass nach dem Absenden einer Anfrage pro einzelner Ausführung abgerechnet wird, anstatt wie bei Textmodellen primär linear nach Eingabe-/Ausgabe-Textabrechnungseinheiten zu berechnen.
So lässt es sich am besten verstehen
Du kannst es so verstehen:
- Es kommt nicht primär darauf an, wie viel Text du eingegeben hast
- Es kommt auch nicht primär darauf an, wie viel Text das Modell ausgegeben hat
- Entscheidend ist vielmehr die Abrechnungsregel für „diese einzelne Anfrage selbst“
Diese Abrechnungsart ist häufiger bei Bildern, Videos und bestimmten speziellen Generierungsaufgaben zu finden.
In welchen Szenarien ist eine Abrechnung pro Aufruf wahrscheinlicher
Derzeit am häufigsten:
- Bildgenerierung
- Videogenerierung
- Bestimmte APIs mit festen Aktionsabläufen
Ob tatsächlich pro Aufruf abgerechnet wird, richtet sich letztlich nach dem jeweiligen Modell oder der Anzeige in der Konsole.
Vorteile der Abrechnung pro Aufruf
1. Einzelkosten lassen sich leichter abschätzen
Wenn du Aufgaben mit geringer Aufruffrequenz hast, ist die Abrechnung pro Aufruf oft intuitiver:
- Wie viel kostet ein einzelner Aufruf ungefähr?
- Wie viel kostet die Erstellung eines Bildes ungefähr?
- Wie viel kostet die Generierung eines Videos ungefähr?
2. Besser geeignet für Budgetplanung auf Business-Seite
Bei Aufgaben, deren Verbrauch bei textbasierter Abrechnung schwer abzuschätzen ist, lässt sich mit Abrechnung pro Aufruf direkter kalkulieren und das Budget besser steuern.
Für welche Fälle eignet sich die Abrechnung pro Aufruf
- Seltene Aufrufe
- Generierungsaufgaben für Bilder/Videos
- Wenn du die Kosten pro Ausführung auf einen Blick verstehen möchtest
- Wenn dich eher interessiert, „wie viel jede Aktion kostet“ statt „wie viel jede Textabrechnungseinheit kostet“
Nutzungsempfehlung
Wenn du hauptsächlich an Folgendem arbeitest:
- Dialog
- Textgenerierung
- Embeddings
- Verarbeitung langer Texte
dann solltest du in der Regel nicht die Abrechnung pro Aufruf, sondern eher die nutzungsbasierte Abrechnung beachten.
Kurz gesagt
Bei Generierungsaufgaben wie Bildern und Videos ist die Abrechnung pro Aufruf häufiger; bei Aufrufen von großen Sprachmodellen für Text ist dagegen meist die nutzungsbasierte Abrechnung üblicher.
War diese Anleitung hilfreich?
Zuletzt aktualisiert am