Google Gemini Managed Agents API 완전 가이드 — API 한 번으로 만드는 AI 에이전트
Google I/O 2026에서 발표된 Gemini Managed Agents는 API 호출 하나로 격리된 Linux 환경에서 코드 실행·파일 관리·웹 탐색이 가능한 AI 에이전트를 생성한다. Antigravity 기반 구조, 커스텀 에이전트 정의법(AGENTS.md·SKILL.md), 가격($0.08/session-hour), 직접 구현과의 비교를 정리했다.
Google I/O 2026에서 가장 주목받은 개발자 발표 중 하나가 Managed Agents in the Gemini API다. 에이전트를 만들려면 보통 오케스트레이션 프레임워크 선택, 샌드박스 환경 구성, 툴 등록 등 적지 않은 설정이 필요했다. Gemini Managed Agents는 이 과정을 API 호출 한 번으로 줄인다.
에이전트가 실행되는 격리된 Linux 환경, 코드 실행·파일 관리·웹 탐색 기능이 기본 탑재된 구조, 커스텀 명령과 스킬을 마크다운 파일로 정의하는 방식까지 — 실제 구조가 어떻게 동작하는지, 가격은 어떻게 되는지, 직접 구현 방식과 비교했을 때 언제 써야 하는지를 정리했다.
Managed Agents란? — API 한 번으로 올라오는 완전 관리형 에이전트
Managed Agents in the Gemini API는 구글이 Google I/O 2026에서 프리뷰 공개한 서비스다. 개발자가 복잡한 오케스트레이션 코드를 짜지 않고도, API 호출 하나로 추론·코드 실행·파일 관리·웹 탐색이 가능한 에이전트 인스턴스를 생성할 수 있다.
기존 방식과의 가장 큰 차이는 실행 환경 관리의 위치다. LangGraph나 AutoGen 같은 프레임워크를 쓸 때는 개발자가 직접 실행 환경, 툴 등록, 상태 관리를 구성해야 한다. Managed Agents는 이 레이어를 구글 인프라가 처리한다. 개발자는 "무엇을 시킬지"에만 집중하면 된다.
핵심 구성 요소는 세 가지다:
Antigravity 에이전트: 실제 작업을 수행하는 에이전트 코어. Gemini 3.5 Flash 기반.
격리된 ephemeral Linux 환경: 에이전트 실행용 샌드박스. 세션 종료 시 폐기.
Interactions API: 에이전트와 대화하고 결과를 받는 진입점.
Managed Agents는 Antigravity 에이전트와 격리 Linux 환경을 API 단에서 묶어 제공한다 — ⓒ Google
Antigravity 에이전트와 실행 환경 — 샌드박스 안에서 무엇을 할 수 있나
Managed Agents의 실행 환경은 구글 인프라가 관리하는 격리된 Linux 컨테이너다. 각 세션마다 독립적으로 생성되며, 세션이 끝나면 폐기된다(ephemeral). 아래 기능이 기본 탑재되어 있다.
코드 실행: Python, Bash 등 코드를 환경 내에서 직접 실행. 외부 패키지 설치도 가능.
파일 관리: 파일 생성, 읽기, 수정, 삭제. 세션 중 생성한 파일은 API로 다운로드 가능.
웹 탐색: 에이전트가 외부 URL을 직접 방문하고 내용을 수집할 수 있다.
멀티턴 대화: 세션 ID를 유지하면 이전 맥락을 이어받아 연속 작업이 가능하다.
보안 관점에서 샌드박스는 호스트 시스템과 완전히 분리된다. 다만 웹 탐색이 허용되므로 에이전트가 외부 API를 호출하거나 데이터를 내보낼 수 있다는 점은 설계 시 고려해야 한다. 민감한 데이터를 환경 변수로 주입할 경우 접근 권한 설정에 주의가 필요하다.
Antigravity 에이전트 자체는 Gemini 3.5 Flash를 기반으로 하며, 구글이 Google AI Studio를 통해서도 접근할 수 있도록 공개했다. AI Studio에서 프로토타이핑 후 Interactions API로 프로덕션 통합하는 흐름이 의도된 워크플로우다.
커스텀 에이전트 만들기 — AGENTS.md와 SKILL.md로 정의하는 방식
기본 Antigravity 에이전트를 그대로 쓰는 것 외에, 자체 에이전트를 커스터마이즈하거나 저장해 재사용할 수 있다. 커스텀 에이전트는 두 가지 방식으로 정의한다.
1. 인라인 커스터마이즈: API 호출 시 지침, 스킬, 데이터를 직접 전달. 매번 정의를 새로 넣는 방식이라 일회성 태스크에 적합.
2. 저장된 Managed Agent: 구성을 한 번 등록하고 ID로 호출. 반복 사용되는 에이전트에 적합.
커스텀 에이전트 정의 방식이 독특하다. 복잡한 SDK 설정 대신 마크다운 파일로 정의한다. AGENTS.md에 에이전트의 역할과 행동 지침을 작성하고, SKILL.md에 특정 도메인 스킬이나 반복 패턴을 정의한다.
Managed Agent 호출 예시 (Python SDK)
import google.genai as genai
client = genai.Client()
# 기본 Antigravity 에이전트 호출
response = client.agents.interactions.create(
model='gemini-3.5-flash',
prompt='현재 디렉토리에 있는 CSV 파일을 분석하고 요약 리포트를 작성해줘'
)
print(response.output)
# 저장된 커스텀 에이전트 호출
response = client.agents.interactions.create(
agent_id='my-data-analyst-agent',
prompt='이번 달 판매 데이터를 분석해줘',
session_id=response.session_id # 이전 세션 이어받기
)
Google AI Studio에서 Managed Agents를 프로토타이핑한 뒤 API로 통합하는 흐름 — ⓒ Google
Managed Agents vs 직접 구현 에이전트 — 어떤 상황에 맞나
Managed Agents가 가장 빛나는 경우는 에이전트 인프라를 직접 관리하고 싶지 않은 소규모 팀이나 1인 개발자가 빠르게 에이전트 기능을 프로덕션에 붙일 때다. 반대로 멀티에이전트 오케스트레이션, 특정 모델 요구사항, 온프레미스 실행, 세밀한 보안 정책이 필요한 경우라면 직접 구현이 현실적이다.
가격 구조 — 프리뷰 기간에 알아야 할 비용 항목
Managed Agents는 현재 프리뷰 상태이며, 가격 구조는 두 가지 요소로 나뉜다.
환경 컴퓨팅 비용 ($0.08/session-hour): 격리된 Linux 환경이 실행되는 시간에 대한 요금. 프리뷰 기간에는 환경 컴퓨팅 비용이 무료이며, 모델 토큰 요금만 적용된다(구글 공식 발표 기준).
모델 토큰 요금: 내부적으로 Gemini 3.5 Flash를 사용하므로 일반 Gemini 3.5 Flash 토큰 가격이 적용된다. 입력 토큰 기준 $1.50/M, 출력 토큰 기준 $3.50/M 수준이다(2026년 5월 공개 가격 기준, 프리뷰 이후 변경 가능).
저장된 세션 메모리 비용: 2026년 1월 28일부터 세션 이벤트와 메모리를 저장할 경우 $0.25/1,000개 요금이 적용된다. 단기 에이전트 태스크라면 메모리를 저장하지 않는 방식으로 비용을 낮출 수 있다.
엔터프라이즈 환경에서는 Gemini Enterprise Agent Platform에서도 Managed Agents를 프리뷰로 지원한다. 엔터프라이즈 가격은 별도 협의 기반이다.
원화로 환산하면(1 USD ≒ 1,380 KRW 기준): 환경 컴퓨팅 비용은 시간당 약 110원. 프리뷰 무료 기간 이후 요금이 확정되면 체크가 필요하다.
Managed Agents 비용은 환경 컴퓨팅 + 토큰 두 요소로 구성된다 — ⓒ Google
잘 맞는 워크플로우와 주의할 한계
Managed Agents가 실제로 잘 맞는 워크플로우 유형을 정리한다.
데이터 처리 파이프라인: CSV·JSON 파일을 받아 코드를 실행하고 가공된 결과를 반환하는 흐름. 샌드박스에서 라이브러리를 설치하고 실행할 수 있어 셋업 없이 pandas, scipy 등을 바로 쓸 수 있다.
리서치 태스크 자동화: 웹 탐색 기능을 활용해 특정 주제 정보를 수집·요약하는 작업. 단순 RAG 파이프라인보다 설정이 적다.
코드 생성 및 실행 검증: 에이전트가 코드를 작성하고 즉시 실행해 결과를 확인하는 반복 루프. CI 없이 빠른 프로토타이핑에 적합.
한계와 주의사항:
모델이 Gemini 3.5 Flash로 고정 — 특정 작업에서 더 강력한 추론 모델이 필요한 경우 제약이 된다.
ephemeral 환경이므로 영구 저장이 필요한 데이터는 외부로 내보내야 한다.
프리뷰 상태라 API 스펙이 정식 출시 전 변경될 수 있다.
멀티에이전트 오케스트레이션은 현재 직접 지원하지 않는다. 복수 에이전트를 조율하려면 별도 로직이 필요하다.
기존 Gemini API는 모델에 텍스트를 보내고 응답을 받는 구조다. Managed Agents는 여기에 격리된 실행 환경(코드 실행·웹 탐색·파일 관리)과 상태를 유지하는 세션 레이어가 추가된다. 모델이 직접 코드를 짜고 실행해 결과를 확인하는 루프를 API 하나로 처리할 수 있다는 점이 다르다.
Python 외 다른 언어 SDK도 지원하나?
공식 문서 기준으로 Python과 Node.js SDK를 지원한다. REST API 직접 호출도 가능하다. 프리뷰 기간에는 지원 언어가 추가될 수 있으므로 공식 문서를 확인하는 것이 좋다.
세션이 끝나면 파일이 사라지나?
맞다. 실행 환경이 ephemeral이라 세션 종료 시 파일이 함께 폐기된다. 세션 중 생성한 파일은 API를 통해 다운로드해 외부 스토리지에 저장해야 한다. 세션 간 데이터를 유지하려면 외부 데이터베이스나 파일 스토리지와 연동이 필요하다.
Antigravity IDE와 Managed Agents API는 같은 것인가?
다르다. Antigravity는 구글이 공개한 에이전트 퍼스트 개발 환경(IDE)이고, Managed Agents in the Gemini API는 프로그래밍 방식으로 에이전트를 생성하고 제어하는 API 서비스다. 두 제품 모두 Antigravity 에이전트와 격리 환경 인프라를 공유하지만, 사용 방식이 다르다. Antigravity IDE는 인터랙티브 개발 환경이고, Managed Agents API는 앱에 에이전트 기능을 통합하기 위한 프로그래밍 인터페이스다.
보안에 민감한 데이터를 에이전트에 전달해도 괜찮나?
격리 샌드박스이므로 호스트 시스템과 분리되어 있다. 하지만 에이전트에게 웹 탐색 권한이 있으므로 에이전트가 외부로 데이터를 전송할 가능성을 완전히 배제할 수 없다. 민감한 데이터(API 키, 개인정보 등)는 에이전트 프롬프트에 직접 넣지 않는 것이 원칙이다. 구글 클라우드의 엔터프라이즈 버전(Gemini Enterprise Agent Platform)은 VPC 내부 실행 등 추가 격리 옵션을 제공할 예정이다.
프리뷰 이후 가격이 크게 오를 가능성이 있나?
프리뷰 중에는 환경 컴퓨팅 비용($0.08/session-hour)이 무료다. 정식 출시 이후 이 요금이 적용되면 장시간 실행 세션에서 비용이 올라간다. 모델 토큰 요금은 Gemini 3.5 Flash 기준이므로 현재 수준에서 크게 변하지 않을 가능성이 높다. 저장된 세션 메모리 비용($0.25/1,000개)은 멀티턴 대화를 많이 유지하는 앱에서 누적될 수 있다. 정식 가격 발표 전에 사용량 패턴을 측정해두는 것이 좋다.