Plugins
비용 최적화
- Effective context engineering for AI agents
- Anthropic Applied AI 팀이 프롬프트 엔지니어링을 넘어, 추론 시점에 들어가는 전체 토큰 구성을 다루는
context engineering 관점을 정리
- 컨텍스트는 유한한 attention budget으로 보고, 원하는 행동을 이끌어내는 가장 작은 고신호 토큰 집합을 유지하는 것이 핵심 원칙
- 시스템 프롬프트, 도구, 예시, 메시지 히스토리를 모두 간결하지만 충분하게 설계하고, 런타임에는 파일 경로·쿼리·링크 같은 식별자로 필요한 정보만 just-in-time으로 가져오라고 제안
- 장기 작업에는 compaction, structured note-taking/agentic memory, sub-agent architecture를 과제 특성에 맞게 조합하는 전략을 소개
- Claude ‘구독형’ 요금제가 API보다 최대 36배 저렴한 이유와 ‘Max 5x’가 진짜 최적 구간인 이유
- 클로드 코드 3일간 소스코드 뜯어본 개발자가 찾은 토큰 틀어막기 TOP 7
- auto-compact 전에 clear
- 한번에 다 시키기
- 끊지말고 몰아서 시키기
- 생각과 실행을 나누기 : 한 세션에서는 하나의 목표
- 안 쓰는 도구 끄기
- 정확한 지시 : 이 코드 개선해줘 -> @src/auth.ts 의 무엇무엇을 고쳐줘.
- Claude Code 토큰 사용량 90% 절감하는 3가지 실전 기법 (qmd, 3-에이전트)
- .claudeignore 파일 추가
- CLAUDE.md 간결하게 유지. 200줄 이내. 상세 파일은 별로 파일로 분해
- 인덱싱
- 디폴트로는 Glob + Grep(키워드 검색)이라서 반복 탐색에는 토큰 낭비
- qmd 활용
- 3 agent team : Architect, Builder, Reviwer
- 명확한 역할/범위/규칙
- Claude Code 비용 80% 절감하는 settings.json 3줄과 14만명이 쓰는 everything-claude-code 설정법
- 디폴트 SONNET 추천
- everything-claude-code의 skill 승격 기능
- 클로드 코드 공식 플러그인 4개로 토큰 절약 끝 (하네스 실무 포함)
- Session Report: 토큰 사용량과 캐시 적중 여부를 HTML 리포트로 시각화해 누수 지점을 찾는 플러그인
- Claude MD Management: 비대해진
CLAUDE.md를 정리하고 기준별로 평가해 컨텍스트 낭비를 줄이는 플러그인
- Serena MCP: 코드 의미 기반 검색으로 반복적인 텍스트 검색 토큰을 줄이는 MCP 플러그인
- Hookify: 반복 실수를 훅으로 차단해 같은 오류로 인한 토큰 낭비를 막는 하네스 엔지니어링 플러그인
- Claude Code Pricing: Optimize Your Token Usage & Costs
- 바이브 코딩의 토큰 관리 전략
- 클로드 코드 에이전트 팀 비용 50% 줄이는 4가지 비법!
- 팀원 vs 서브 에이전트 구분: 팀원은 새 세션으로 실행되며 모든 스킬/메모리/MCP를 자동 로드. 서브 에이전트는 격리 컨텍스트에서 필요한 스킬만 주입. 스킬이 많다면 서브 에이전트가 더 깔끔
- 계획 승인 모드(Plan Approval): 팀 생성 시 "변경 전 계획 승인을 받도록 해줘"를 붙여, 팀원이 플랜 모드로 시작해 리드 승인 후에만 구현하도록 함. 잘못된 방향으로 토큰 낭비 방지
- 모델 믹싱: 리드는 Opus, 실제 코드를 수정하는 팀원들은 Sonnet. "팀원 모두 Sonnet을 사용해" 한 줄로 비용 대폭 절감
- 훅(Hook) 자동 품질 게이트: Teammate Idle Hook으로 팀원 유휴 시 요약 보고 자동화, Task Completed Hook으로 결과물 부족 시 자동 재작업 지시
- 추가 팁: 팀원 간 소통이 필요 없으면 서브 에이전트로, 팀원은 3~5명 적정, 작업 끝난 팀원은 즉시 종료
- Using Claude Code: session management and 1M context
- 세션 한도 문제를 1M 컨텍스트 부족이 아니라 컨텍스트를 끊는 타이밍 문제로 설명
- 컨텍스트가 커질수록 토큰 비용이 지수적으로 늘고 Context Rot로 정확도도 떨어진다고 강조
- Continue, Rewind, Clear, Compact, Subagent를 상황별로 고르는 공식 5가지 분기점을 소개
- Rewind는 잘못된 방향으로 간 대화를 되돌려 불필요한 컨텍스트 누적을 막는 1순위 습관으로 제안
- auto-compaction을 기다리지 말고 힌트를 붙인
/compact나 Subagent로 중간 과정 토큰을 분리하라고 권장
- Claude 세션 간 Context Handoff: 맥락을 잃지 않는 4계층 전략
- context rot, auto-compact 비대칭성, context amnesia를 동시에 푸는 4계층 핸드오프 전략 정리
- Tier 1은
/rewind로 실패 시도를 컨텍스트에서 지우고, /compact는 focus 지시 없이는 쓰지 않는 in-session 관리
- Tier 2 Document & Clear는 명령형 대신 상태 서술형으로 핸드오프
.md를 쓰고 /clear 후 새 세션에 검증 지시와 함께 이어붙이는 패턴
- Tier 3 영구 메모리는
CLAUDE.md엔 불변 규약만 두고, .claude/reports/ registry로 50줄 인덱스만 main에 올린 뒤 필요한 리포트만 on-demand로 로드
- Tier 4 Cross-Session 조율은 spec/ADR/커밋 메시지를 핸드오프 매체로 활용하고, subagent를 쪼개기보다 main이 자기 복제본에 위임하는 Master-Clone 구조를 권장
- 클로드 코드 토큰 녹는 분들, 이 6가지만 바꿔보세요
- 기본 모델 설정 변경: 설정 파일에서 디폴트 모델을 sonnet으로 고정하여 나도 모르게 Opus가 실행되는 것을 방지합니다.
- Opus Plan 활용: 계획 단계에서는 Opus를 쓰고, 실행 단계에서는 자동으로 Sonnet으로 전환해주는 기능을 사용합니다.
- 세션 초기화(Clear): 하나의 작업이 끝나면 /clear 명령어로 컨텍스트를 비워줍니다. (이전 대화가 필요하면 /rename 후 /resume 활용).
- 확장된 사고(Thinking) 조절: 깊게 생각하는 기능은 출력 토큰으로 과금되므로, 간단한 수정 시에는 이 기능을 끄거나 예산을 낮춥니다.
- 구체적인 프롬프트 작성: "코드 개선해줘" 대신 "특정 파일의 특정 함수를 수정해줘"라고 명확히 지시하여 불필요한 파일 탐색을 줄입니다.
- 메모리 관리: claude.md 파일은 500줄 이하로 유지하고, 상세한 지식은 필요할 때만 로드되는 **'스킬(Skill)'**로 분리합니다.
- Claude 4.7 토크나이저 비용 측정 결과 | GeekNews
- Claude 4.7은 이전 버전보다 평균 1.3
1.45배 더 많은 토큰을 생성, 세션당 2030% 비용 증가 발생
- 영어·코드 콘텐츠에서 토큰 증가가 두드러지고, CJK(한·중·일) 콘텐츠는 거의 변화 없음
- 더 세분화된 토큰화 덕에 명령어 준수도(Instruction Following)는 약 5%p 향상
- Opus 4.6과 Opus 4.7의 토큰 비용 계산기 | GeekNews
- 새 토크나이저 때문에 같은 프롬프트가 콘텐츠 유형별로 1.0~1.35배 더 많은 토큰으로 집계
- 실측에서 Opus 4.7은 Opus 4.6 대비 평균 요청 토큰·비용이 +37.4% 증가
- 요청을 바꾸지 않아도 비용이 늘어나므로, 사전에 비용 영향을 추정하는 데 활용 가능
Agent platform
- The Secrets of Claude's Agent Platform From the Team Who Built It
- Every의 AI & I 인터뷰로, Anthropic Claude Platform 제품·엔지니어링 리더가 Managed Agents 방향을 설명
- 목표와 예산만 주면 클라우드 컴퓨터 위 Claude를 실행·확장·관리하는 형태를 지향하며, 에이전트 제품의 운영 인프라 부담을 플랫폼이 맡는다는 관점
- 하네스와 모델이 하나의 단위로 가까워지는 흐름, 팀용 에이전트 형태, 장시간 실행 에이전트의 프로덕션 안정성 이슈를 다룸
- 법무팀의 마케팅 문구 리뷰 에이전트 사례, advisor/adversarial pair/swarm 같은 멀티 에이전트 오케스트레이션, outcome·budget 기반 성공 측정도 언급