Facturación por uso

La forma de facturación más común en los modelos de texto; normalmente se cobra según el consumo de Token de entrada y salida

Facturación por uso es la forma de facturación más común en los modelos de texto.

En términos sencillos:

El contenido que envías al modelo consume una cierta cantidad de Token
El contenido que el modelo te devuelve también consume una cierta cantidad de Token
El sistema liquida el coste en función de ese consumo real

Por qué la mayoría de los modelos de texto usan facturación por uso

Porque la longitud de las solicitudes de texto varía mucho.

Por ejemplo:

Si envías una frase como “hola”, el consumo es muy bajo
Si envías una gran cantidad de contexto, prompts largos o documentos extensos, y además pides una respuesta larga, el consumo será mayor

Por eso, la facturación por uso es más justa y más precisa.

Qué es lo más importante en la facturación por uso

Para quienes empiezan, lo realmente importante no es memorizar fórmulas de facturación, sino entender esto:

Cuanto más larga sea la entrada, cuanto más contexto haya y cuanto más larga sea la salida, mayor será normalmente el coste.

Por eso muchas personas al principio piensan: “si solo hice una pregunta, ¿por qué el coste no es bajo?”; la razón es que el modelo no necesariamente ve solo la última frase, sino que también puede incluir:

Historial de conversación
Prompts del sistema
Contexto adicional
Contenido relacionado con llamadas a herramientas

Factores habituales que afectan al coste

1. Longitud de la entrada

Cuanto más largo sea el prompt y más material adjunto incluya, mayor será el número de Token de entrada.

2. Longitud de la salida

Cuanto más larga sea la respuesta del modelo, mayor será el número de Token de salida.

3. Contexto histórico

En escenarios de conversación multivuelta, el cliente puede enviar también los mensajes anteriores.

4. El propio modelo

Cada modelo tiene un precio unitario distinto; incluso con una cantidad de Token similar, el coste puede variar.

5. Estrategia de Group

El mismo modelo puede tener estrategias de precios distintas según el Group.

Cómo optimizar el coste de la facturación por uso

Si quieres ahorrar costes, la forma más eficaz normalmente no es “usar menos el modelo”, sino “reducir el consumo innecesario”.

Prácticas recomendadas

Simplifica los prompts y evita repetir explicaciones de contexto
Controla la longitud del historial de mensajes
No hagas que el modelo genere respuestas excesivamente largas sin necesidad
Asigna a cada caso de uso un modelo con el nivel de precio adecuado
Usa distintas Key y Group para separar el tráfico de pruebas del tráfico de producción

Errores habituales

Pensar que solo cuenta la última pregunta
No saber que el cliente está enviando en segundo plano una gran cantidad de contexto histórico
Usar repetidamente modelos caros con fines de prueba

Resumen en una frase

La clave de la facturación por uso no es “cuánto cuesta una solicitud”, sino “cuánto total de entrada y salida ha consumido esa solicitud”.

¿Cuándo debería revisar la facturación por solicitud?

Si usas principalmente interfaces de imágenes, vídeo o acciones fijas, puedes consultar también:

Facturación por solicitud

En esta página