Facturación por uso
La forma de facturación más común en los modelos de texto; normalmente se cobra según el consumo de Token de entrada y salida
Facturación por uso es la forma de facturación más común en los modelos de texto.
En términos sencillos:
- El contenido que envías al modelo consume una cierta cantidad de Token
- El contenido que el modelo te devuelve también consume una cierta cantidad de Token
- El sistema liquida el coste en función de ese consumo real
Por qué la mayoría de los modelos de texto usan facturación por uso
Porque la longitud de las solicitudes de texto varía mucho.
Por ejemplo:
- Si envías una frase como “hola”, el consumo es muy bajo
- Si envías una gran cantidad de contexto, prompts largos o documentos extensos, y además pides una respuesta larga, el consumo será mayor
Por eso, la facturación por uso es más justa y más precisa.
Qué es lo más importante en la facturación por uso
Para quienes empiezan, lo realmente importante no es memorizar fórmulas de facturación, sino entender esto:
Cuanto más larga sea la entrada, cuanto más contexto haya y cuanto más larga sea la salida, mayor será normalmente el coste.
Por eso muchas personas al principio piensan: “si solo hice una pregunta, ¿por qué el coste no es bajo?”; la razón es que el modelo no necesariamente ve solo la última frase, sino que también puede incluir:
- Historial de conversación
- Prompts del sistema
- Contexto adicional
- Contenido relacionado con llamadas a herramientas
Factores habituales que afectan al coste
1. Longitud de la entrada
Cuanto más largo sea el prompt y más material adjunto incluya, mayor será el número de Token de entrada.
2. Longitud de la salida
Cuanto más larga sea la respuesta del modelo, mayor será el número de Token de salida.
3. Contexto histórico
En escenarios de conversación multivuelta, el cliente puede enviar también los mensajes anteriores.
4. El propio modelo
Cada modelo tiene un precio unitario distinto; incluso con una cantidad de Token similar, el coste puede variar.
5. Estrategia de Group
El mismo modelo puede tener estrategias de precios distintas según el Group.
Cómo optimizar el coste de la facturación por uso
Si quieres ahorrar costes, la forma más eficaz normalmente no es “usar menos el modelo”, sino “reducir el consumo innecesario”.
Prácticas recomendadas
- Simplifica los prompts y evita repetir explicaciones de contexto
- Controla la longitud del historial de mensajes
- No hagas que el modelo genere respuestas excesivamente largas sin necesidad
- Asigna a cada caso de uso un modelo con el nivel de precio adecuado
- Usa distintas Key y Group para separar el tráfico de pruebas del tráfico de producción
Errores habituales
- Pensar que solo cuenta la última pregunta
- No saber que el cliente está enviando en segundo plano una gran cantidad de contexto histórico
- Usar repetidamente modelos caros con fines de prueba
Resumen en una frase
La clave de la facturación por uso no es “cuánto cuesta una solicitud”, sino “cuánto total de entrada y salida ha consumido esa solicitud”.
¿Cuándo debería revisar la facturación por solicitud?
Si usas principalmente interfaces de imágenes, vídeo o acciones fijas, puedes consultar también:
¿Te resultó útil esta guía?
Última actualización el
Facturación por solicitud
Algunos modelos se facturan directamente por cada solicitud, lo que resulta adecuado para escenarios con un coste unitario claro
Tutorial básico dentro de la plataforma
Sigue familiarizándote con las funciones de saldo, modelos, notificaciones y resolución de problemas en la consola de MoleAPI