Claude Code 토큰 절약하는 10가지 방법

S System2026. 4. 1.조회 1

Claude 한도에 자꾸 걸려서 답답했다면, 이 글 하나로 토큰 절약 습관 10가지를 바로 적용할 수 있어요. "메시지를 아끼자"가 아니라 "토큰을 아끼자"로 관점을 바꾸는 게 핵심이에요.

X 유저 @0x_kaize가 올린 스레드가 화제예요. Claude 사용 한도에 걸리는 진짜 이유와 해결법을 정리했는데, 핵심은 이거예요 — Claude는 메시지 수를 세는 게 아니라 토큰(Token)을 세요. 토큰을 현명하게 쓰면 한도에 걸릴 일이 확 줄어들어요.

하나씩 살펴볼게요.

1. 후속 메시지 대신 원본 프롬프트를 편집해요

Claude가 원하는 대로 답하지 않았을 때, 이렇게 보내고 싶은 충동이 들죠.

"아니, 내 말은 이거야..."
"그게 아니라..."

이러면 안 돼요. 후속 메시지를 보낼 때마다 Claude는 이전 대화 전체를 다시 읽어요. 쓸모없는 메시지까지 전부요.

메시지별 토큰 비용을 계산해보면 이래요:

메시지 수	누적 토큰 (평균 500토큰/회 기준)
5개	7,500
10개	27,500
20개	105,000
30개	232,000

30번째 메시지는 첫 번째 메시지보다 31배 비싸요.

대신 원본 메시지의 편집(Edit) 버튼을 눌러서 수정하고 다시 생성하면 돼요. 이전 대화가 쌓이지 않으니까 토큰이 절약돼요.

2. 15~20개 메시지마다 새 채팅을 시작해요

위에서 봤듯이 대화가 길어질수록 토큰 비용이 기하급수적으로 늘어나요.

100개 이상 메시지가 쌓인 채팅방? 평균 500토큰 기준으로 250만 토큰 이상을 소모하게 돼요. 그중 98.5%는 이전 대화를 다시 읽는 데 쓰이고, 실제 답변 생성에는 고작 1.5%만 사용돼요.

방법은 간단해요:

Claude에게 "지금까지 대화 내용을 요약해줘"라고 해요
요약본을 복사해요
새 채팅을 열고 요약본을 첫 메시지로 붙여넣어요

이것만으로도 토큰 사용량이 대폭 줄어들어요.

3. 질문은 하나로 묶어서 보내요

많은 분들이 질문을 나눠서 보내면 더 좋은 답변을 받을 수 있다고 생각해요. 거의 항상 반대예요.

질문 3개를 따로 보내면 → 컨텍스트(Context) 로딩 3번
질문 3개를 한 번에 보내면 → 컨텍스트 로딩 1번

토큰을 두 번 아끼는 거예요. 컨텍스트 재로딩이 줄고, 한도까지의 여유도 생기고요.

이렇게 바꿔보세요:

Before:

"이 글 요약해줘" → "핵심 포인트 뽑아줘" → "제목 추천해줘"

After:

"이 글을 요약하고, 핵심 포인트를 뽑고, 제목을 추천해줘"

보너스로 Claude가 전체 맥락을 한 번에 파악하니까 답변 품질도 오히려 올라가요.

4. Projects에 반복 파일을 업로드해요

같은 PDF를 여러 채팅에 업로드하면, Claude는 매번 그 문서를 토큰으로 변환해요. 10번 업로드하면 10번 토큰을 소모하는 거예요.

Projects 기능을 쓰면 파일을 한 번만 업로드하면 돼요. 프로젝트 안의 모든 대화에서 캐시된 파일을 참조하기 때문에 추가 토큰 소모가 없어요.

계약서, 브리핑 문서, 스타일 가이드처럼 반복적으로 참고하는 문서가 있다면 이것만으로도 토큰 사용량이 확 줄어요.

5. Memory와 사용자 설정을 저장해요

새 채팅을 열 때마다 "나는 마케터야, 캐주얼한 톤으로 써줘, 짧은 문단으로 해줘..."를 반복하고 있나요? 이게 매번 3~5개 메시지를 잡아먹어요.

Settings → Memory and User Settings에서 역할, 커뮤니케이션 스타일, 선호 설정을 한 번만 저장해두면 돼요. Claude가 모든 새 채팅에 자동으로 적용해요.

"Act as a..."로 시작하는 프롬프트를 매번 쓰고 있었다면, 그 토큰을 전부 아낄 수 있어요.

6. 안 쓰는 기능은 꺼두세요

웹 검색, 커넥터, Explore 모드 — 이런 기능들은 켜져 있기만 해도 매 응답에 토큰을 추가로 소모해요. 필요하지 않으면 꺼두는 게 좋아요.

Advanced Thinking(확장 사고) 기능도 토큰을 많이 잡아먹어요. 기본적으로 꺼두고, 첫 번째 답변이 만족스럽지 않을 때만 켜세요.

규칙은 간단해요: 내가 직접 켠 게 아니라면 꺼두세요.

7. 단순 작업은 Haiku 모델을 사용해요

맞춤법 검사, 브레인스토밍, 포맷팅, 간단한 번역, 짧은 답변 — 이런 건 Haiku로 충분해요. Sonnet이나 Opus를 쓸 필요가 없어요.

모델 선택이 매일 내리는 가장 중요한 결정이에요.

모델	용도	비용
Haiku	간단한 작업, 초안	낮음
Sonnet	실무 작업	중간
Opus	깊은 사고가 필요한 작업	높음

Haiku로 초안과 단순 작업을 처리하면 예산의 50~70%를 아낄 수 있어요. 아낀 토큰으로 정말 필요한 작업에 강력한 모델을 쓰면 돼요.

8. 하루를 2~3 세션으로 나눠서 사용해요

Claude는 5시간 롤링 윈도우 방식으로 사용량을 관리해요. 자정에 리셋되는 게 아니에요.

아침 9시에 보낸 메시지는 오후 2시가 되면 더 이상 사용량에 포함되지 않아요. 그런데 오전에 한도를 전부 써버리면 하루 대부분의 한도가 낭비돼요.

하루를 이렇게 나눠보세요:

오전 세션: 핵심 작업
오후 세션: 이전 사용량이 빠진 상태에서 새 한도로 작업
저녁 세션: 또 한도가 갱신된 상태

같은 요금제라도 체감 한도가 훨씬 넉넉해져요.

9. 피크 시간대를 피해서 작업해요

2026년 3월 26일부터 Anthropic이 피크 시간대 정책을 바꿨어요. 같은 질문, 같은 채팅이라도 피크 시간대에는 한도를 더 빨리 소모해요.

피크 시간대 (평일 기준):

미국 태평양 시간: 오전 5시~11시
미국 동부 시간: 오전 8시~오후 2시
한국 시간으로 환산하면: 밤 10시~새벽 4시

한국에 계신 분들은 오히려 유리해요. 한국의 업무 시간(오전 9시~오후 6시)은 미국의 비피크 시간대에 해당하거든요. 일부러 시간대를 맞출 필요 없이 평소대로 쓰면 돼요.

주말이나 저녁에 리소스 집약적인 작업을 처리하면 같은 요금제로 더 많이 쓸 수 있어요.

10. Extra Usage를 안전장치로 켜두세요

Pro, Max 5x, Max 20x 구독자는 Settings → Usage에서 "Overage" 기능을 켤 수 있어요.

세션 한도에 도달해도 Claude가 차단하지 않고, API 요금으로 과금되는 방식이에요. 월별 지출 한도를 설정할 수 있어서 예상치 못한 청구를 방지할 수 있어요.

토큰을 아끼는 방법은 아니지만, 중요한 작업 중에 갑자기 막히는 상황을 방지해요.

마무리 — 핵심은 "토큰 의식"이에요

10가지를 한 번에 다 적용하기는 어려워요. 하지만 하나씩 습관으로 만들면 한도에 걸리는 일이 거의 사라져요. 심지어 Max 요금제에서 일반 Pro로 내려도 충분할 수 있어요.

다시 한번 핵심을 정리하면:

후속 메시지 대신 편집하기
15~20개 메시지마다 새 채팅
질문은 하나로 묶기
반복 파일은 Projects에
Memory 설정 저장
안 쓰는 기능은 끄기
단순 작업은 Haiku
하루 2~3 세션으로 분산
피크 시간대 피하기
Extra Usage 안전장치

Claude는 메시지를 세는 게 아니에요. 토큰을 세요. 이 차이를 아는 것만으로 Claude 토큰 절약의 절반은 끝난 거예요.

자주 묻는 질문

Claude 토큰이란 정확히 뭔가요?

토큰(Token)은 Claude가 텍스트를 처리하는 기본 단위예요. 대략 한국어 1글자가 2~3토큰, 영어 1단어가 1~2토큰 정도예요. Claude는 메시지 수가 아니라 이 토큰의 누적량으로 사용량을 측정해요.

Claude 5시간 롤링 윈도우가 뭔가요?

Claude의 사용 한도는 자정에 리셋되지 않아요. 최근 5시간 동안 사용한 토큰만 한도에 포함돼요. 5시간 전에 쓴 토큰은 자동으로 한도에서 빠지기 때문에, 시간을 분산해서 쓰면 같은 요금제로 더 많이 사용할 수 있어요.

Claude Pro와 Max 요금제의 토큰 한도 차이는?

Pro($20/월)는 기본 사용량을 제공하고, Max 5x($100/월)는 Pro의 5배, Max 20x($200/월)는 20배의 토큰 한도를 제공해요. 하지만 이 글의 토큰 절약 습관을 적용하면 Pro 요금제만으로도 충분한 경우가 많아요.

Haiku와 Sonnet, 뭘 써야 하나요?

단순 작업(맞춤법 검사, 포맷팅, 짧은 번역)은 Haiku, 실무 작업(글쓰기, 분석, 코딩)은 Sonnet, 복잡한 추론이 필요한 작업은 Opus를 쓰면 돼요. 작업에 맞는 모델을 고르는 것만으로 토큰 비용을 50~70% 줄일 수 있어요.

원문: https://x.com/0x_kaize/status/2038286026284667239

#claude

댓글 0개

로그인하고 댓글을 작성하세요