LLM 모델Zhipu AI

GLM-5V-Turbo

Design mockup to code in seconds — vision-native coding agent

GLM-5V-Turbo는 Zhipu AI(국제 브랜드 Z.ai)가 2026년 4월 1일 출시한 네이티브 멀티모달 비전-코딩 에이전트 모델이다. 744B 파라미터 MoE 아키텍처(토큰당 40B 활성)에 신규 시각 인코더 CogViT를 탑재하고, 이미지·비디오·텍스트 입력을 동시에 처리한다. 핵심 기능은 디자인 목업(스크린샷·Figma 내보내기·손 스케치)을 HTML/CSS/JavaScript 실행 코드로 직접 변환하는 것으로, Z.ai 자체 테스트에서 Design2Code 벤치마크 94.8%를 기록해 Claude Opus 4.8(77.3%)을 17.5포인트 상회한다. BrowseComp 에이전틱 브라우징 벤치마크에서도 Claude Opus 4.5를 앞선다. 30개 이상 태스크 유형에 걸친 강화학습과 INT8 양자화로 추론 속도를 최적화했다. OpenClaw·고용량 에이전틱 엔지니어링 워크플로우에 최적화되어 있으며, 203K 토큰 컨텍스트를 지원한다. Z.ai 플랫폼 및 API로 제공된다.

컨텍스트

203K tokens

입력 가격

API 문의

출력 가격

API 문의

멀티모달

text, image, video

핵심 역량

Design2Code

94.8% — Claude Opus 4.8 대비 +17.5p

비전 입력

이미지·비디오·텍스트 네이티브 멀티모달

에이전틱

OpenClaw + 고용량 워크플로우 최적화

추론 속도

INT8 양자화 고속 추론

컨텍스트

203K 토큰

SWE-bench

GLM-5.1 대비 -3.1포인트

장점

Design2Code 94.8% — Claude Opus 4.8(77.3%) 대비 17.5포인트 상회
디자인 목업(스크린샷·Figma·스케치) → 실행 코드 직변환
BrowseComp 에이전틱 브라우징 Claude Opus 4.5 초과
네이티브 멀티모달 — 이미지·비디오·텍스트 동시 처리
INT8 양자화 + CogViT 인코더로 빠른 추론 속도
203K 컨텍스트, chat.z.ai 무료 사용

단점

SWE-bench 코딩 태스크에서 GLM-5.1 대비 3.1포인트 열위
744B MoE — 셀프호스팅 시 대규모 인프라 필요
API 가격 비공개 — 대규모 API 사용 비용 예측 어려움
생태계가 GPT·Claude 대비 작음

공식 링크

공식 사이트 ↗문서 ↗