AI 사용료는 왜 글자 수가 아니라 토큰 기준으로 계산될까?
ChatGPT, Claude, Gemini 같은 생성형 AI를 사용하다 보면 토큰 Token이라는 말을 자주 보게 됩니다.
처음에는 토큰이 낯설게 느껴질 수 있습니다.
일반 사용자는 보통 “글자 수”, “문장 수”, “페이지 수”로 생각하기 때문입니다.
하지만 AI 모델은 글을 사람처럼 문장 단위로 읽는 것이 아니라, 텍스트를 잘게 나눈 토큰 단위로 처리합니다.
그래서 AI API를 사용할 때 가격도 대부분 다음처럼 표시됩니다.
입력 토큰 100만 개당 얼마
출력 토큰 100만 개당 얼마
이번 글에서는 AI에서 말하는 토큰이 무엇인지, 왜 중요한지, 그리고 가격은 어떻게 계산되는지 정리해 보겠습니다.
1. 토큰이란 무엇인가?
토큰은 AI가 문장을 이해하고 생성하기 위해 사용하는 텍스트의 최소 처리 단위입니다.
사람은 문장을 단어와 의미 중심으로 이해하지만, AI는 문장을 바로 그대로 처리하지 않습니다.
먼저 문장을 작은 조각으로 나누고, 그 조각들을 숫자 형태로 바꾼 뒤 계산합니다.
이때 나누어진 작은 조각이 바로 토큰입니다.
예를 들어 다음 문장이 있다고 가정해 보겠습니다.
AI는 업무 자동화에 유용합니다.
사람에게는 하나의 문장이지만, AI 내부에서는 여러 개의 토큰으로 나뉩니다.
토큰은 반드시 단어 하나와 정확히 일치하지는 않습니다.
단어 하나가 하나의 토큰일 수도 있고,
단어 하나가 여러 토큰으로 나뉠 수도 있고,
조사나 기호도 별도 토큰이 될 수 있습니다.
영어는 비교적 단어 단위와 비슷하게 나뉘는 경우가 많지만,
한국어는 조사, 어미, 띄어쓰기, 복합어 구조 때문에 체감상 토큰 수가 더 많이 나올 수 있습니다.
2. 토큰은 왜 중요한가?
토큰은 AI 사용에서 매우 중요합니다.
이유는 크게 세 가지입니다.
AI가 읽을 수 있는 양을 결정한다.
AI가 답변할 수 있는 양을 결정한다.
AI API 사용 비용을 결정한다.
즉, 토큰은 단순한 글자 수가 아니라 AI의 처리량과 비용을 결정하는 기준입니다.
예를 들어 AI에게 긴 문서를 넣으면 입력 토큰이 많이 사용됩니다.
AI가 긴 답변을 생성하면 출력 토큰이 많이 사용됩니다.
그래서 AI 비용은 단순히 “질문 한 번에 얼마”가 아니라,
얼마나 많이 입력하고 얼마나 길게 답변을 받았는지에 따라 달라집니다.
3. 입력 토큰과 출력 토큰
AI 비용을 이해하려면 입력 토큰과 출력 토큰을 구분해야 합니다.
입력 토큰
입력 토큰은 사용자가 AI에게 보내는 내용입니다.
예를 들면 다음이 모두 입력 토큰에 포함됩니다.
사용자의 질문
첨부 문서 내용
이전 대화 내용
시스템 지시문
개발자가 넣은 프롬프트
검색 또는 도구 결과
예를 들어 사용자가 이렇게 질문했다면,
MES에서 LOT 관리를 어떻게 구현하면 좋을까?
이 문장이 입력 토큰으로 계산됩니다.
또한 대화가 길어질수록 이전 대화 내용 일부가 함께 전달될 수 있기 때문에 입력 토큰이 늘어날 수 있습니다.
출력 토큰
출력 토큰은 AI가 생성한 답변입니다.
예를 들어 AI가 다음처럼 답변했다면,
LOT 관리는 생산 추적성과 품질 관리를 위해 중요합니다.
이 답변이 출력 토큰으로 계산됩니다.
대부분의 AI API는 입력 토큰보다 출력 토큰 가격이 더 비쌉니다.
그 이유는 출력은 AI가 직접 생성하는 과정이고, 더 많은 계산 자원이 필요하기 때문입니다.
4. 토큰과 글자 수의 관계
토큰 수는 정확히 글자 수와 일치하지 않습니다.
대략적으로 영어는 다음처럼 설명하는 경우가 많습니다.
영어 기준 1토큰 ≒ 3~4글자
영어 기준 100토큰 ≒ 약 75단어
하지만 한국어는 다릅니다.
한국어는 조사, 어미, 한글 음절, 띄어쓰기 방식에 따라 토큰 수가 달라질 수 있습니다.
예를 들어 같은 의미라도 표현 방식에 따라 토큰 수가 달라질 수 있습니다.
짧은 표현:
오류 수정해줘.
긴 표현:
첨부한 C# WinForms 소스에서 오류가 발생하는 부분을 점검하고,
프로그램이 종료되지 않도록 예외 처리를 추가해줘.
두 문장은 모두 요청이지만, 두 번째 문장이 훨씬 많은 토큰을 사용합니다.
그렇다고 무조건 짧게만 쓰는 것이 좋은 것은 아닙니다.
AI가 정확히 이해할 수 있도록 필요한 조건은 분명히 작성해야 합니다.
중요한 것은 불필요하게 긴 설명을 줄이고, 핵심 조건을 명확히 쓰는 것입니다.
5. AI 가격은 어떻게 계산될까?
대부분의 AI API 가격은 다음 구조로 계산됩니다.
입력 토큰 비용 + 출력 토큰 비용 = 전체 사용 비용
예를 들어 어떤 모델의 가격이 다음과 같다고 가정해 보겠습니다.
입력: 100만 토큰당 $1
출력: 100만 토큰당 $5
한 번의 요청에서 다음처럼 사용했다면,
입력 토큰: 10,000개
출력 토큰: 2,000개
비용은 다음과 같이 계산됩니다.
입력 비용 = 10,000 / 1,000,000 × $1 = $0.01
출력 비용 = 2,000 / 1,000,000 × $5 = $0.01
총 비용 = $0.02
즉, AI 사용료는 질문 횟수만으로 계산되지 않고,
각 요청에서 사용한 토큰 수에 따라 달라집니다.
6. 주요 AI 모델 가격 예시
AI 모델 가격은 회사와 모델에 따라 다릅니다.
2026년 6월 기준 공개 가격을 보면, OpenAI의 GPT-5.5는 표준 API 기준 입력 100만 토큰당 5달러, 출력 100만 토큰당 30달러이고, GPT-5.4는 입력 2.5달러, 출력 15달러입니다. GPT-5.4 mini는 입력 0.75달러, 출력 4.5달러로 더 저렴한 모델입니다.
Anthropic Claude의 경우 Claude Haiku 4.5는 입력 100만 토큰당 1달러, 출력 100만 토큰당 5달러로 공개되어 있습니다. Claude Code 문서에서는 Claude Code가 API 토큰 소비량 기준으로 과금되며, 모델 선택과 코드베이스 크기, 사용 방식에 따라 비용이 달라진다고 설명합니다.
Google Gemini API도 모델별로 입력과 출력 가격이 다르며, Gemini Flash 계열은 비교적 저렴한 입력/출력 가격을 제공합니다. Google의 공식 Gemini API 가격표는 모델별 입력, 출력, 캐싱, 검색 연동 비용을 구분해서 제시합니다.
아래 표는 이해를 돕기 위한 예시입니다.
회사모델 예시입력 100만 토큰출력 100만 토큰
| OpenAI | GPT-5.5 | $5.00 | $30.00 |
| OpenAI | GPT-5.4 | $2.50 | $15.00 |
| OpenAI | GPT-5.4 mini | $0.75 | $4.50 |
| Anthropic | Claude Haiku 4.5 | $1.00 | $5.00 |
| Gemini Flash 계열 | 모델별 상이 | 모델별 상이 |
정확한 가격은 모델 변경, 지역, 처리 방식, 캐싱, 배치 처리 여부에 따라 달라질 수 있습니다.
7. 캐시 토큰이란?
AI 가격표를 보면 Cached input 또는 Prompt caching이라는 항목이 보일 때가 있습니다.
캐시 토큰은 쉽게 말해 반복해서 사용하는 입력 내용을 더 저렴하게 처리하는 구조입니다.
예를 들어 매번 같은 시스템 지시문이나 긴 문서를 넣는다고 가정해 보겠습니다.
당신은 MES 전문 개발자입니다.
아래 기준 문서를 참고해서 답변하세요.
...
이런 내용이 매번 반복되면 비용이 많이 발생합니다.
하지만 캐싱을 사용하면 반복되는 입력 부분을 더 저렴하게 처리할 수 있습니다.
OpenAI 가격표에서도 GPT-5.5는 입력 100만 토큰당 5달러이지만 캐시된 입력은 0.5달러로 훨씬 낮게 책정되어 있습니다. GPT-5.4 역시 입력 2.5달러, 캐시 입력 0.25달러로 구분됩니다.
즉, 반복되는 문서나 고정 프롬프트가 많은 시스템에서는 캐시 활용이 비용 절감에 큰 도움이 됩니다.
8. 배치 처리란?
일부 AI 서비스는 Batch API 또는 배치 처리를 제공합니다.
배치 처리는 실시간 응답이 필요 없는 작업을 모아서 처리하는 방식입니다.
예를 들어 다음 작업은 실시간성이 낮습니다.
수천 건의 리뷰 요약
대량 문서 분류
엑셀 데이터 설명 생성
로그 메시지 자동 분류
제품 설명 자동 생성
이런 작업은 즉시 답변을 받을 필요가 없기 때문에 배치로 보내고 나중에 결과를 받는 방식이 가능합니다.
OpenAI의 가격표에서는 Batch 처리 시 일부 모델이 표준 가격보다 낮은 가격으로 제공됩니다. 예를 들어 GPT-5.5는 표준 입력 5달러, 출력 30달러이지만 Batch 기준으로는 입력 2.5달러, 출력 15달러로 표시됩니다.
즉, 실시간 응답이 필요 없는 대량 작업은 배치 처리를 사용하면 비용을 줄일 수 있습니다.
9. 토큰 비용이 많이 나오는 경우
AI 비용은 다음 상황에서 빠르게 증가할 수 있습니다.
긴 문서를 매번 전체 입력하는 경우
대화 이력이 계속 누적되는 경우
AI가 긴 답변을 생성하는 경우
코드베이스 전체를 반복해서 읽히는 경우
여러 명의 사용자가 동시에 사용하는 경우
API를 반복 호출하는 경우
검색, 이미지, 음성 등 추가 도구를 사용하는 경우
특히 개발용 AI 에이전트는 비용이 예상보다 커질 수 있습니다.
예를 들어 AI가 프로젝트 전체 소스를 분석하고, 여러 파일을 수정하고, 테스트를 반복하면 입력과 출력 토큰이 모두 많이 사용됩니다.
Claude Code 문서에서도 비용은 모델 선택, 코드베이스 크기, 여러 인스턴스 실행, 자동화 사용 패턴에 따라 크게 달라진다고 설명합니다.
따라서 개발용 AI를 사용할 때는 전체 프로젝트를 매번 읽히기보다, 필요한 파일과 오류 메시지를 중심으로 요청하는 것이 좋습니다.
10. 토큰 비용을 줄이는 방법
AI 비용을 줄이려면 다음 방법이 효과적입니다.
1) 질문을 짧고 명확하게 작성하기
불필요하게 긴 설명을 줄이고, 필요한 조건만 정리합니다.
나쁜 예:
프로그램이 이상한데 전체적으로 봐줘.
좋은 예:
frmBOM.cs에서 수정 버튼 클릭 시 NullReferenceException이 발생합니다.
btnEdit_Click, LoadBomDetail, SaveBomDetail 메서드 중심으로 원인을 확인해 주세요.
정확한 요청은 토큰도 줄이고, 결과 품질도 높입니다.
2) 필요한 파일만 전달하기
AI에게 전체 소스를 모두 주는 것보다 관련 파일만 주는 것이 좋습니다.
오류가 발생한 파일
관련 Designer 파일
DB Repository 파일
오류 메시지
실행 화면 캡처
이렇게 필요한 범위만 주면 비용과 분석 시간을 줄일 수 있습니다.
3) 긴 문서는 요약 후 사용하기
긴 제안서나 과업지시서를 매번 전체 입력하는 것은 비효율적입니다.
먼저 한 번 요약한 뒤, 이후에는 요약본을 기준으로 대화하는 것이 좋습니다.
원본 문서 → 핵심 요약 → 이후 작업에 요약본 활용
4) 출력 길이를 제한하기
AI에게 답변 길이를 지정하면 출력 토큰을 줄일 수 있습니다.
핵심만 10줄로 정리해줘.
표 중심으로 정리해줘.
코드는 수정 부분만 보여줘.
블로그 초안은 3,000자 내외로 작성해줘.
5) 캐싱과 배치 활용하기
서비스 개발에서는 반복 프롬프트 캐싱과 배치 처리를 적극적으로 고려해야 합니다.
반복되는 시스템 지시문 → 캐싱
대량 문서 처리 → Batch API
실시간 답변 불필요한 작업 → 비동기 처리
이 구조를 잘 설계하면 운영 비용을 크게 줄일 수 있습니다.
11. 실제 서비스 개발 시 비용 예시
예를 들어 제조업 MES 도움말 챗봇을 만든다고 가정해 보겠습니다.
사용자가 질문을 하면 시스템은 다음 내용을 AI에게 보낼 수 있습니다.
사용자 질문
관련 메뉴 설명
권한 정보
DB 용어 설명
기존 매뉴얼 일부
한 번의 질문에서 평균적으로 다음 토큰이 사용된다고 가정해 보겠습니다.
입력: 3,000 토큰
출력: 1,000 토큰
만약 입력 100만 토큰당 $1, 출력 100만 토큰당 $5인 모델을 사용하면 1회 비용은 다음과 같습니다.
입력 비용 = 3,000 / 1,000,000 × $1 = $0.003
출력 비용 = 1,000 / 1,000,000 × $5 = $0.005
1회 질문 비용 = $0.008
하루에 1,000회 질문이 발생하면,
$0.008 × 1,000회 = $8
한 달 30일이면,
$8 × 30일 = $240
이처럼 AI 서비스는 사용량이 적을 때는 부담이 작지만, 사용자 수와 호출 횟수가 늘어나면 비용 관리가 중요해집니다.
12. ChatGPT Plus 같은 월정액과 API 가격의 차이
많은 분들이 헷갈리는 부분이 있습니다.
ChatGPT Plus, Pro 같은 월정액 서비스와 API 사용료는 같은 개념이 아닙니다.
ChatGPT 월정액
→ 사람이 ChatGPT 화면에서 사용하는 요금제
API 요금
→ 내가 만든 프로그램에서 AI 모델을 호출할 때 발생하는 사용료
예를 들어 개인이 ChatGPT 화면에서 글을 작성하고 코드를 물어보는 것은 월정액 요금제 기준입니다.
하지만 내가 만든 앱, MES, ERP, 챗봇, RPA 시스템에서 OpenAI API를 호출하면 API 사용량 기준으로 별도 과금됩니다.
따라서 서비스 개발 시에는 반드시 API 토큰 비용을 기준으로 계산해야 합니다.
13. 개발자가 꼭 알아야 할 토큰 관리 포인트
AI를 실제 프로그램에 붙일 때는 다음을 고려해야 합니다.
질문 1회당 평균 입력 토큰
질문 1회당 평균 출력 토큰
하루 예상 호출 횟수
월 예상 사용자 수
모델별 단가
캐싱 가능 여부
배치 처리 가능 여부
최대 응답 길이 제한
로그 저장 방식
비용 초과 알림
특히 운영 서비스에서는 비용 제한 기능이 필요합니다.
예를 들어 다음처럼 구성할 수 있습니다.
사용자별 일일 질문 제한
조직별 월 사용량 제한
긴 문서 업로드 제한
최대 출력 토큰 제한
저가 모델과 고급 모델 분리
관리자 비용 모니터링 화면
이런 구조가 있어야 AI API 비용이 예상보다 크게 증가하는 것을 막을 수 있습니다.
14. 정리
AI에서 토큰은 단순한 글자 수가 아닙니다.
토큰은 AI가 문장을 읽고 답변을 생성하기 위해 사용하는 기본 계산 단위입니다.
AI 가격은 대부분 다음 기준으로 계산됩니다.
입력 토큰
출력 토큰
캐시 토큰
배치 처리 여부
도구 호출 여부
간단히 말하면 다음과 같습니다.
많이 입력하면 입력 비용이 늘어난다.
길게 답변받으면 출력 비용이 늘어난다.
반복 입력은 캐싱으로 줄일 수 있다.
대량 비실시간 작업은 배치로 줄일 수 있다.
고급 모델일수록 토큰 단가가 높다.
AI를 개인적으로 사용할 때는 토큰을 깊게 몰라도 큰 문제가 없습니다.
하지만 AI를 앱, ERP, MES, 챗봇, RPA 시스템에 붙여 서비스로 운영하려면 토큰 개념을 반드시 이해해야 합니다.
토큰을 이해해야 AI 비용을 예측할 수 있고,
비용을 예측해야 안정적인 AI 서비스를 운영할 수 있습니다.
결국 AI 서비스 개발에서 토큰은 단순한 기술 용어가 아니라,
성능과 비용을 동시에 결정하는 핵심 기준입니다.
'AI' 카테고리의 다른 글
| Claude Code와 ChatGPT Codex 비교 (0) | 2026.06.21 |
|---|---|
| ChatGPT 최신 기능 정리 (0) | 2026.06.21 |
| RPA란 무엇인가? (1) | 2026.06.19 |
| 전기차 충전기 칠러 “고장 예측/수명 예측” 을 AI로 (0) | 2026.06.18 |
| Codex에서 Plugin과 Skill은 무엇인가? (1) | 2026.06.11 |