Claude Code 토큰 절약하는 10가지 방법
Claude 한도에 자꾸 걸려서 답답했다면, 이 글 하나로 토큰 절약 습관 10가지를 바로 적용할 수 있어요. "메시지를 아끼자"가 아니라 "토큰을 아끼자"로 관점을 바꾸는 게 핵심이에요.
X 유저 @0x_kaize가 올린 스레드가 화제예요. Claude 사용 한도에 걸리는 진짜 이유와 해결법을 정리했는데, 핵심은 이거예요 — Claude는 메시지 수를 세는 게 아니라 토큰(Token)을 세요. 토큰을 현명하게 쓰면 한도에 걸릴 일이 확 줄어들어요.
하나씩 살펴볼게요.
1. 후속 메시지 대신 원본 프롬프트를 편집해요
Claude가 원하는 대로 답하지 않았을 때, 이렇게 보내고 싶은 충동이 들죠.
"아니, 내 말은 이거야..."
"그게 아니라..."
이러면 안 돼요. 후속 메시지를 보낼 때마다 Claude는 이전 대화 전체를 다시 읽어요. 쓸모없는 메시지까지 전부요.
메시지별 토큰 비용을 계산해보면 이래요:
메시지 수 | 누적 토큰 (평균 500토큰/회 기준) |
|---|---|
5개 | 7,500 |
10개 | 27,500 |
20개 | 105,000 |
30개 | 232,000 |
30번째 메시지는 첫 번째 메시지보다 31배 비싸요.
대신 원본 메시지의 편집(Edit) 버튼을 눌러서 수정하고 다시 생성하면 돼요. 이전 대화가 쌓이지 않으니까 토큰이 절약돼요.
2. 15~20개 메시지마다 새 채팅을 시작해요
위에서 봤듯이 대화가 길어질수록 토큰 비용이 기하급수적으로 늘어나요.
100개 이상 메시지가 쌓인 채팅방? 평균 500토큰 기준으로 250만 토큰 이상을 소모하게 돼요. 그중 98.5%는 이전 대화를 다시 읽는 데 쓰이고, 실제 답변 생성에는 고작 1.5%만 사용돼요.
방법은 간단해요:
Claude에게 "지금까지 대화 내용을 요약해줘"라고 해요
요약본을 복사해요
새 채팅을 열고 요약본을 첫 메시지로 붙여넣어요
이것만으로도 토큰 사용량이 대폭 줄어들어요.
3. 질문은 하나로 묶어서 보내요
많은 분들이 질문을 나눠서 보내면 더 좋은 답변을 받을 수 있다고 생각해요. 거의 항상 반대예요.
질문 3개를 따로 보내면 → 컨텍스트(Context) 로딩 3번
질문 3개를 한 번에 보내면 → 컨텍스트 로딩 1번
토큰을 두 번 아끼는 거예요. 컨텍스트 재로딩이 줄고, 한도까지의 여유도 생기고요.
이렇게 바꿔보세요:
Before:
"이 글 요약해줘" → "핵심 포인트 뽑아줘" → "제목 추천해줘"
After:
"이 글을 요약하고, 핵심 포인트를 뽑고, 제목을 추천해줘"
보너스로 Claude가 전체 맥락을 한 번에 파악하니까 답변 품질도 오히려 올라가요.
4. Projects에 반복 파일을 업로드해요
같은 PDF를 여러 채팅에 업로드하면, Claude는 매번 그 문서를 토큰으로 변환해요. 10번 업로드하면 10번 토큰을 소모하는 거예요.
Projects 기능을 쓰면 파일을 한 번만 업로드하면 돼요. 프로젝트 안의 모든 대화에서 캐시된 파일을 참조하기 때문에 추가 토큰 소모가 없어요.
계약서, 브리핑 문서, 스타일 가이드처럼 반복적으로 참고하는 문서가 있다면 이것만으로도 토큰 사용량이 확 줄어요.
5. Memory와 사용자 설정을 저장해요
새 채팅을 열 때마다 "나는 마케터야, 캐주얼한 톤으로 써줘, 짧은 문단으로 해줘..."를 반복하고 있나요? 이게 매번 3~5개 메시지를 잡아먹어요.
Settings → Memory and User Settings에서 역할, 커뮤니케이션 스타일, 선호 설정을 한 번만 저장해두면 돼요. Claude가 모든 새 채팅에 자동으로 적용해요.
"Act as a..."로 시작하는 프롬프트를 매번 쓰고 있었다면, 그 토큰을 전부 아낄 수 있어요.
6. 안 쓰는 기능은 꺼두세요
웹 검색, 커넥터, Explore 모드 — 이런 기능들은 켜져 있기만 해도 매 응답에 토큰을 추가로 소모해요. 필요하지 않으면 꺼두는 게 좋아요.
Advanced Thinking(확장 사고) 기능도 토큰을 많이 잡아먹어요. 기본적으로 꺼두고, 첫 번째 답변이 만족스럽지 않을 때만 켜세요.
규칙은 간단해요: 내가 직접 켠 게 아니라면 꺼두세요.
7. 단순 작업은 Haiku 모델을 사용해요
맞춤법 검사, 브레인스토밍, 포맷팅, 간단한 번역, 짧은 답변 — 이런 건 Haiku로 충분해요. Sonnet이나 Opus를 쓸 필요가 없어요.
모델 선택이 매일 내리는 가장 중요한 결정이에요.
모델 | 용도 | 비용 |
|---|---|---|
Haiku | 간단한 작업, 초안 | 낮음 |
Sonnet | 실무 작업 | 중간 |
Opus | 깊은 사고가 필요한 작업 | 높음 |
Haiku로 초안과 단순 작업을 처리하면 예산의 50~70%를 아낄 수 있어요. 아낀 토큰으로 정말 필요한 작업에 강력한 모델을 쓰면 돼요.
8. 하루를 2~3 세션으로 나눠서 사용해요
Claude는 5시간 롤링 윈도우 방식으로 사용량을 관리해요. 자정에 리셋되는 게 아니에요.
아침 9시에 보낸 메시지는 오후 2시가 되면 더 이상 사용량에 포함되지 않아요. 그런데 오전에 한도를 전부 써버리면 하루 대부분의 한도가 낭비돼요.
하루를 이렇게 나눠보세요:
오전 세션: 핵심 작업
오후 세션: 이전 사용량이 빠진 상태에서 새 한도로 작업
저녁 세션: 또 한도가 갱신된 상태
같은 요금제라도 체감 한도가 훨씬 넉넉해져요.
9. 피크 시간대를 피해서 작업해요
2026년 3월 26일부터 Anthropic이 피크 시간대 정책을 바꿨어요. 같은 질문, 같은 채팅이라도 피크 시간대에는 한도를 더 빨리 소모해요.
피크 시간대 (평일 기준):
미국 태평양 시간: 오전 5시~11시
미국 동부 시간: 오전 8시~오후 2시
한국 시간으로 환산하면: 밤 10시~새벽 4시
한국에 계신 분들은 오히려 유리해요. 한국의 업무 시간(오전 9시~오후 6시)은 미국의 비피크 시간대에 해당하거든요. 일부러 시간대를 맞출 필요 없이 평소대로 쓰면 돼요.
주말이나 저녁에 리소스 집약적인 작업을 처리하면 같은 요금제로 더 많이 쓸 수 있어요.
10. Extra Usage를 안전장치로 켜두세요
Pro, Max 5x, Max 20x 구독자는 Settings → Usage에서 "Overage" 기능을 켤 수 있어요.
세션 한도에 도달해도 Claude가 차단하지 않고, API 요금으로 과금되는 방식이에요. 월별 지출 한도를 설정할 수 있어서 예상치 못한 청구를 방지할 수 있어요.
토큰을 아끼는 방법은 아니지만, 중요한 작업 중에 갑자기 막히는 상황을 방지해요.
마무리 — 핵심은 "토큰 의식"이에요
10가지를 한 번에 다 적용하기는 어려워요. 하지만 하나씩 습관으로 만들면 한도에 걸리는 일이 거의 사라져요. 심지어 Max 요금제에서 일반 Pro로 내려도 충분할 수 있어요.
다시 한번 핵심을 정리하면:
후속 메시지 대신 편집하기
15~20개 메시지마다 새 채팅
질문은 하나로 묶기
반복 파일은 Projects에
Memory 설정 저장
안 쓰는 기능은 끄기
단순 작업은 Haiku
하루 2~3 세션으로 분산
피크 시간대 피하기
Extra Usage 안전장치
Claude는 메시지를 세는 게 아니에요. 토큰을 세요. 이 차이를 아는 것만으로 Claude 토큰 절약의 절반은 끝난 거예요.
자주 묻는 질문
Claude 토큰이란 정확히 뭔가요?
토큰(Token)은 Claude가 텍스트를 처리하는 기본 단위예요. 대략 한국어 1글자가 2~3토큰, 영어 1단어가 1~2토큰 정도예요. Claude는 메시지 수가 아니라 이 토큰의 누적량으로 사용량을 측정해요.
Claude 5시간 롤링 윈도우가 뭔가요?
Claude의 사용 한도는 자정에 리셋되지 않아요. 최근 5시간 동안 사용한 토큰만 한도에 포함돼요. 5시간 전에 쓴 토큰은 자동으로 한도에서 빠지기 때문에, 시간을 분산해서 쓰면 같은 요금제로 더 많이 사용할 수 있어요.
Claude Pro와 Max 요금제의 토큰 한도 차이는?
Pro($20/월)는 기본 사용량을 제공하고, Max 5x($100/월)는 Pro의 5배, Max 20x($200/월)는 20배의 토큰 한도를 제공해요. 하지만 이 글의 토큰 절약 습관을 적용하면 Pro 요금제만으로도 충분한 경우가 많아요.
Haiku와 Sonnet, 뭘 써야 하나요?
단순 작업(맞춤법 검사, 포맷팅, 짧은 번역)은 Haiku, 실무 작업(글쓰기, 분석, 코딩)은 Sonnet, 복잡한 추론이 필요한 작업은 Opus를 쓰면 돼요. 작업에 맞는 모델을 고르는 것만으로 토큰 비용을 50~70% 줄일 수 있어요.
댓글 0개
로그인하고 댓글을 작성하세요