종량 과금

텍스트 모델에서 가장 일반적인 과금 방식으로, 일반적으로 입력 및 출력 Token 사용량을 기준으로 과금됩니다

종량 과금은 텍스트 모델에서 가장 일반적인 과금 방식입니다.

간단히 말하면:

왜 대부분의 텍스트 모델은 종량 과금을 사용할까요

텍스트 요청의 길이 차이가 매우 크기 때문입니다.

예를 들어:

따라서 종량 과금이 더 공정하고, 더 세밀한 방식이라고 할 수 있습니다.

초보자에게 정말 중요한 것은 과금 공식을 외우는 것이 아니라, 아래 내용을 이해하는 것입니다:

입력이 길수록, 컨텍스트가 많을수록, 출력이 길수록 일반적으로 비용이 더 높아집니다.

이 때문에 많은 사용자가 처음에는 "분명 질문은 하나만 했는데 왜 비용이 낮지 않지?"라고 느끼게 됩니다. 모델이 실제로 보는 내용이 마지막 한 문장만이 아닐 수 있기 때문입니다. 다음이 함께 포함될 수 있습니다:

프롬프트가 길고 첨부 자료가 많을수록 입력 Token이 증가합니다.

모델의 답변이 길수록 출력 Token이 증가합니다.

멀티턴 대화 시나리오에서는 클라이언트가 이전 대화 기록을 함께 전송할 수 있습니다.

모델마다 단가가 다르므로, Token 수가 비슷하더라도 비용은 달라질 수 있습니다.

같은 모델이라도 서로 다른 Group에서는 가격 정책이 달라질 수 있습니다.

비용을 절감하고 싶다면, 가장 효과적인 방법은 보통 "모델 사용을 줄이는 것"이 아니라 "불필요한 소모를 줄이는 것"입니다.

한 문장으로 이해하기

종량 과금의 핵심은 "요청 1회에 얼마인가"가 아니라, "이번 요청에서 입력과 출력이 총 얼마나 소모되었는가"입니다.

주로 이미지, 비디오 또는 고정 동작형 인터페이스를 사용한다면, 다음 문서를 함께 확인해 보세요: