AI/LLM

Claude Managed Agents 완전 가이드 — 관리형 에이전트 인프라로 프로덕션 AI 에이전트 배포

Anthropic이 2026년 4월 퍼블릭 베타로 공개한 Claude Managed Agents는 에이전트 오케스트레이션, 샌드박스 실행, 장기 세션 유지를 완전 관리형으로 제공한다. Session, Harness, Sandbox 3개 컴포넌트 구조와 Python·TypeScript SDK 실전 예제, 내장 도구 목록, 가격 비교, DIY vs 관리형 선택 기준까지 정리한다.

by Lee발행: 2026-04-14

Claude Managed Agents는 Anthropic이 2026년 4월 퍼블릭 베타로 공개한 관리형 에이전트 실행 인프라다. 기존에는 Claude API로 에이전트를 구축할 때 오케스트레이션 루프·도구 실행 격리·세션 관리·에러 복구를 개발자가 전부 직접 구현해야 했다. Managed Agents는 이 인프라 레이어를 Anthropic이 대신 처리한다.

이 글이 필요한 사람: Claude API로 에이전트를 구축 중인 백엔드·풀스택 개발자, LangChain/AutoGPT 대신 관리형 솔루션을 검토 중인 팀, 장기 실행 작업(코드 리뷰, 문서 분석, 데이터 처리)을 에이전트로 자동화하려는 엔지니어.

※ 2026년 4월 퍼블릭 베타 기준. 공식 문서: docs.anthropic.com

Claude Managed Agents란 무엇인가

기존 Claude API로 에이전트를 만들 때는 "모델 호출 → 도구 실행 → 결과 주입 → 재호출"의 반복 루프를 개발자가 직접 구현했다. 도구 실행 격리, 타임아웃 처리, 세션 상태 유지, 스트리밍 처리까지 모두 직접 코드로 작성해야 했다.

Managed Agents는 이 레이어 전체를 Anthropic 인프라에 위임한다. 개발자는 시스템 프롬프트 + 허용 도구 + 태스크만 정의하면 된다. 실행 harness, 재시도 로직, 세션 유지, 샌드박스 격리는 Anthropic이 처리한다.

기술적으로는 베타 헤더 managed-agents-2026-04-01을 API 요청에 추가하면 활성화된다. 이 헤더가 있으면 Claude는 단순 응답 모델이 아니라 지속적 세션을 가진 에이전트 런타임으로 동작한다.

Claude Managed Agents 아키텍처 — 개발자는 태스크만 정의, 실행 인프라는 Anthropic이 담당 — 개발자는 도구 정의와 태스크 입력만 담당하고, 루프·격리·세션은 Anthropic 인프라가 처리한다.

핵심 기능 4가지 — 세션·샌드박스·권한·스트리밍

1. 영속 세션(Persistent Sessions)
기존 API는 요청마다 전체 대화 이력을 전송해야 했다. Managed Agents는 세션 ID로 상태를 서버에 유지한다. 토큰 비용이 줄고, 장기 작업에서 컨텍스트 유실 없이 대화가 이어진다.

2. 샌드박스 실행(Sandboxed Execution)
파일 조작, 코드 실행, 외부 API 호출 등의 도구가 격리된 환경에서 실행된다. 한 에이전트 세션의 부작용이 다른 세션에 영향을 주지 않는다.

3. 도구 권한 분리(Tool Permission Scoping)
에이전트별로 허용 도구를 명시적으로 정의한다. 한 에이전트가 데이터베이스 읽기만 허용받고, 다른 에이전트는 쓰기까지 허용하는 식으로 최소 권한 원칙을 적용할 수 있다.

4. SSE 스트리밍
에이전트 실행 중 단계별 진행 상황을 Server-Sent Events로 실시간 수신한다. 어떤 도구를 실행 중인지 사용자에게 실시간으로 보여주는 UI를 쉽게 구현할 수 있다.

Python SDK 퀵스타트 — 5분 안에 첫 에이전트 실행

Managed Agents는 Anthropic Python SDK 최신 버전에서 지원한다. extra_headers에 베타 헤더를 추가하는 것만으로 활성화된다. 별도 패키지 설치나 설정 파일은 필요 없다.

SDK 업그레이드
pip install anthropic --upgrade

기본 Managed Agent 세션
import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-opus-4-6",
    max_tokens=4096,
    system="당신은 코드 리뷰 에이전트입니다. PR을 분석하고 개선 사항을 제안합니다.",
    messages=[
        {"role": "user", "content": "이 Python 함수를 리뷰해줘: def add(a,b): return a+b"}
    ],
    tools=[
        {
            "name": "search_docs",
            "description": "공식 문서에서 관련 내용을 검색합니다",
            "input_schema": {
                "type": "object",
                "properties": {
                    "query": {"type": "string", "description": "검색 쿼리"}
                },
                "required": ["query"]
            }
        }
    ],
    extra_headers={
        "anthropic-beta": "managed-agents-2026-04-01"
    }
)

# 세션 ID 저장 — 이후 요청에서 재사용
session_id = response.session_id
print(response.content)

세션 ID로 장기 작업 이어가기

일반 API에서 대화를 이어가려면 messages 배열에 전체 이력을 매 요청마다 담아야 한다. 대화가 길어질수록 입력 토큰 비용이 선형으로 증가한다. Managed Agents는 세션 ID를 통해 서버가 상태를 유지하기 때문에 후속 요청에서 이전 대화를 다시 전송하지 않아도 된다.

세션 이어서 사용하기
# 첫 번째 요청 — 세션 시작
response1 = client.beta.messages.create(
    model="claude-opus-4-6",
    max_tokens=2048,
    messages=[{"role": "user", "content": "Python 프로젝트 구조를 분석해줘"}],
    extra_headers={"anthropic-beta": "managed-agents-2026-04-01"}
)
session_id = response1.session_id

# 두 번째 요청 — 이전 대화를 messages에 넣지 않아도 됨
response2 = client.beta.messages.create(
    model="claude-opus-4-6",
    max_tokens=2048,
    messages=[{"role": "user", "content": "테스트 커버리지도 확인해줘"}],
    session_id=session_id,
    extra_headers={"anthropic-beta": "managed-agents-2026-04-01"}
)

Claude Managed Agents 세션 ID 기반 대화 이어가기 — 세션 ID 하나로 여러 요청에 걸쳐 대화 상태가 유지된다. messages 배열에 이전 이력을 담지 않아도 된다.

SSE 스트리밍 — 도구 실행 단계별 실시간 표시

에이전트가 여러 도구를 순차 실행하는 작업에서는 사용자에게 진행 상황을 실시간으로 보여줘야 한다. Managed Agents의 SSE 스트리밍은 각 도구 호출 시작·완료 이벤트를 개별적으로 발행한다.

SSE 스트리밍 처리
with client.beta.messages.stream(
    model="claude-opus-4-6",
    max_tokens=4096,
    messages=[{"role": "user", "content": "저장소 전체를 분석하고 리포트를 작성해줘"}],
    extra_headers={"anthropic-beta": "managed-agents-2026-04-01"}
) as stream:
    for event in stream:
        if event.type == "tool_use":
            print(f"[실행 중] {event.name}: {event.input}")
        elif event.type == "tool_result":
            print(f"[완료] {event.name}")
        elif event.type == "text":
            print(event.text, end="", flush=True)

LangChain·직접 구현과 비교

적합한 상황과 피해야 할 상황

Managed Agents가 적합한 경우

Claude를 메인 모델로 확정하고 인프라 관리 부담을 줄이고 싶을 때
수십 분 이상 지속되는 장기 실행 에이전트가 필요한 워크플로우
도구 실행 격리가 중요한 멀티테넌트 환경
프로토타입을 빠르게 프로덕션으로 전환해야 하는 스타트업

직접 구현이 나은 경우

Claude 외 다른 모델도 혼용하는 멀티 모델 전략이 필요할 때
오케스트레이션 로직에 복잡한 비즈니스 규칙이 얽혀 있을 때
벡터 DB, 그래프 DB 등 특수한 메모리 아키텍처가 필요할 때
금융·의료 등 인프라를 완전히 자체 통제해야 하는 규제 환경

베타 제한 사항 (2026년 4월 기준): 세션 최대 지속 시간 24시간, 계정당 동시 활성 세션 100개, 도구 실행 타임아웃 30초. 지원 모델은 claude-opus-4-6, claude-sonnet-4-6. 베타 기간 중 세션 관리 비용은 별도 청구되지 않는다.