호스팅Google Cloud
Vertex AI
Google Cloud's enterprise platform to build, deploy, and scale AI with Gemini and 200+ models
버텍스 AI(Vertex AI)는 구글 클라우드가 운영하는 엔터프라이즈용 생성 AI 플랫폼으로, 제미나이 2.5/3.x 계열과 클로드·라마 같은 서드파티 모델까지 하나의 API로 호출할 수 있습니다. 무료 토큰 제공량은 없고 입력·출력 토큰 단위로 후불 과금하는 종량제(pay-as-you-go)이며, 신규 가입 시 90일간 쓸 수 있는 300달러 크레딧이 제공됩니다. 같은 제미나이 모델을 쓰더라도, 빠른 프로토타이핑·무료 한도가 있는 구글 AI 스튜디오(Gemini Developer API)와 달리 버텍스 AI는 IAM 권한 관리·VPC·데이터 미학습 보장·SLA 등 운영 기능을 얹은 프로덕션용입니다. 제가 한국에서 결제해 보면 구글 클라우드 청구서에 부가세 10%가 별도로 붙고, 토큰 가격은 모두 USD 기준이라 환율까지 같이 봐야 실제 비용이 잡힙니다.
타입
-
가격
무료 토큰 제공량 없는 종량제. 제미나이 2.5 Flash-Lite 입력 $0.10·출력 $0.40/1M tokens부터, 신규 $300 크레딧(90일)
무료 티어
-
리전
-
요금제
신규 가입 무료 크레딧
$300 / 90일 (약 ₩41만, VAT 별도)
- 구글 클라우드 전 서비스 공통 크레딧
- 버텍스 AI 토큰 비용에도 사용 가능
- 90일 또는 소진 시 종료
- 전용 무료 토큰 한도는 아님
Gemini 2.5 Flash-Lite (종량제)
입력 $0.10 · 출력 $0.40 /1M tokens (약 ₩138·₩552, VAT 별도)
- 가장 저렴한 경량 모델
- 대용량 분류·요약·번역 워크로드
- 오디오 입력은 $0.30/1M
- 컨텍스트 캐싱 입력 $0.01/1M
Gemini 2.5 Flash (종량제)
입력 $0.30 · 출력 $2.50 /1M tokens (약 ₩414·₩3,450, VAT 별도)
- 가성비 범용 모델
- 오디오 입력은 $1.00/1M
- 캐싱 입력 $0.03/1M
- 대부분의 1인 개발 작업에 적정
Gemini 2.5 Pro (종량제)
입력 $1.25 · 출력 $10.00 /1M tokens (약 ₩1,725·₩13,800, VAT 별도)
- 플래그십 추론 모델
- 200K 토큰 초과 시 입력 $2.50·출력 $15로 상향
- 캐싱 입력 $0.13/1M
- 1M 토큰 컨텍스트
Gemini 3.x 최신 (종량제)
3.5 Flash 입력 $1.50·출력 $9.00 / 3.1 Pro 입력 $2.00·출력 $12.00 /1M tokens
- 3.1 Pro는 200K 초과 시 입력 $4·출력 $18
- 3.5 Flash 캐싱 입력 $0.15/1M
- Global 리전 기준, Non-global은 약 10% 가산
- 프리뷰 포함 — 가격 변동 잦음
비용 절감 옵션
배치 50% 할인 / 컨텍스트 캐싱 / Provisioned Throughput 약정 할인
- 배치(24시간 SLA) 표준가 50% 할인
- 컨텍스트 캐싱으로 반복 입력 토큰 대폭 절감
- 월/연 약정 시 Provisioned 처리량 할인
- Priority Tier는 표준가 1.8배
핵심 기능
멀티 모델 API
제미나이 2.5/3.x, 클로드, 라마 등 200여 모델을 단일 엔드포인트로 호출
종량제 토큰 과금
입력·출력 토큰 단위 후불 과금, 모델별 1M tokens 기준 단가
비용 절감 기능
배치 50% 할인·컨텍스트 캐싱·약정 할인으로 단가 인하
엔터프라이즈 보안
IAM·VPC·CMEK·데이터 미학습 보장·SLA
AI 스튜디오 연계
무료 AI 스튜디오에서 프로토타입 후 동일 모델 프로덕션 이전
MLOps·에이전트
파인튜닝·평가·Agent Engine 등 모델 운영 전 주기 지원
장점
- 제미나이·클로드·라마 등 200여 모델을 하나의 API로 호출 — 모델 갈아끼우기 쉬움
- 무료 토큰 한도는 없지만 신규 $300 크레딧(90일)으로 초기 테스트 비용 0원 가능
- 데이터를 학습에 쓰지 않음을 명시 보장 — 프로덕션·민감 데이터에 안심
- 배치 50% 할인·컨텍스트 캐싱(반복 입력 대폭 절감)으로 종량제 비용을 깎을 수 있음
- IAM 권한·VPC·SLA 등 구글 클라우드 운영 기능을 그대로 활용
- 구글 AI 스튜디오에서 프로토타이핑 후 동일 모델을 그대로 프로덕션 이전 가능
단점
- 무료 토큰 제공량이 없어 첫 토큰부터 과금 — 가벼운 실험엔 AI 스튜디오 무료 티어가 유리
- 토큰 가격이 모두 USD라 한국 결제 시 환율 + 부가세 10%까지 더해 실비를 계산해야 함
- 200K 토큰 초과 장문 컨텍스트는 입력·출력 단가가 올라가는 롱컨텍스트 가산이 붙음
- GCP 프로젝트·IAM·결제 계정 설정이 필요해 단순 API 키 한 줄보다 진입장벽이 높음(러닝커브 hard)
- 프리뷰 모델·가격이 자주 바뀌어 견적을 자주 다시 떠야 함 — 발행 시점 기준 공식 페이지 재확인 필요
- 리전을 Global이 아닌 곳으로 두면 약 10% 단가 가산이 붙는 점이 놓치기 쉬움