Skip to content

AI 토큰 사용량 누수

최근 조직에서 사용하는 클로드(Claude) 코드의 사용량이 예상보다 훨씬 빠르게 소진되고, 개인적으로 활용하는 안티그래비티(Antigravity)마저 트래픽 제한과 반복적인 명령어 실패로 인한 토큰 누수가 발생하고 있습니다. 이로 인해 실제 업무에 집중하기보다 문제의 원인을 파악하고 해결하는 데 더 많은 시간이 할애되는, 정작 업무 효율이 떨어지는 아이러니한 상황에 직면하게 되었습니다.

1. 토큰 낭비의 주요 원인

  • 명령어 실행 실패 및 반복 탐색: 명령어 실행 실패 시 해당 도구의 위치를 찾거나 PATH에 직접 등록하려고 시도하는 등, 문제 해결을 위한 지속적인 시도 과정에서 불필요한 토큰 사용이 대량으로 발생합니다. 또한, 출력 결과가 과도하게 길 경우 이를 분석하는 과정에서 컨텍스트 윈도우가 급격히 채워지는 문제도 동반됩니다.
  • 지침 및 컨텍스트 유실: 모델을 전환하거나 추가할 때 이전의 지침을 무시하고, 간결해야 할 결과를 장황하게 풀어서 응답하거나 설정된 말투가 갑자기 바뀌며 불필요한 토큰 소모를 유발합니다.
  • 글로벌 트래픽 부하 및 제한: 최근 AI 코딩 에이전트 사용량이 전 세계적으로 급증하면서 인프라 부하가 심화되었고, 이로 인해 안티그래비티를 비롯한 주요 서비스에서 누구나 트래픽 제한에 걸리는 현상이 빈번해지며 원활한 작업이 불가능해지고 있습니다.

[Antigravity] 실제로 제가 이 포스트를 작성하는 도중에도 블로그 글 검수 스크립트가 코드 블록 형식을 인식하지 못해 10여 차례 명령어를 반복하며 토큰을 낭비하는 상황이 발생했습니다. 😅

2. PATH 환경 변수 관리

명령어 실행 실패가 반복되는 주요 원인은 코딩 에이전트가 명령어를 수행할 때 로그인 쉘(Login Shell) 환경이 아니기 때문입니다. 이로 인해 사용자의 개별 프로파일(.zshrc, .bash_profile 등)이 제대로 로드되지 않아 PATH 경로를 찾지 못하는 경우가 빈번합니다. 이를 해결하기 위해 사용자 폴더(~) 위치한 .claude 또는 .gemini 폴더의 settings.json 파일에서 env 필드를 통해 환경 변수를 직접 지정함으로써 에이전트의 명령어 인식 오류를 원천적으로 차단할 수 있습니다.

settings.json
json
{
  "env": {
    "PATH": "/opt/homebrew/bin:/usr/local/bin:/usr/bin:/bin"
  }
}

참고: 설정 변경 후에는 에이전트를 재시작해야 변경된 환경 변수가 적용됩니다.

3. 명령어 결과 최적화: rtk (Rust Token Killer)

최근 회사에서 분석 업무를 수행 중인 인원으로부터 추천받은 rtk는 CLI 명령어 출력을 가공하여 토큰 사용을 그나마 줄여줄 수 있는 도구입니다. (약 60~90% 절감 효과)

하지만 rtk 도입이 항상 정답은 아닙니다. 명령어 출력을 과도하게 필터링할 경우, AI가 실행 결과의 맥락을 제대로 파악하지 못해 오히려 명령이 실패하거나 잘못된 작업을 반복하는 부작용이 발생할 수 있습니다. 따라서 도구 활용 시에도 결과가 제대로 전달되고 있는지에 대한 세심한 모니터링이 필요합니다.

4. 마치며

AI 모델의 정책 변화나 트래픽 이슈를 직접 통제할 수는 없지만, 워크플로우를 최적화하거나 rtk 같은 도구를 활용하여 의도치 않은 토큰 낭비를 줄이려는 시도는 필요해 보입니다.

Released under the MIT License.