LLM 모델Zhipu AI
GLM-5V-Turbo
Design mockup to code in seconds — vision-native coding agent
GLM-5V-Turbo는 Zhipu AI(국제 브랜드 Z.ai)가 2026년 4월 1일 출시한 네이티브 멀티모달 비전-코딩 에이전트 모델이다. 744B 파라미터 MoE 아키텍처(토큰당 40B 활성)에 신규 시각 인코더 CogViT를 탑재하고, 이미지·비디오·텍스트 입력을 동시에 처리한다. 핵심 기능은 디자인 목업(스크린샷·Figma 내보내기·손 스케치)을 HTML/CSS/JavaScript 실행 코드로 직접 변환하는 것으로, Z.ai 자체 테스트에서 Design2Code 벤치마크 94.8%를 기록해 Claude Opus 4.6(77.3%)을 17.5포인트 상회한다. BrowseComp 에이전틱 브라우징 벤치마크에서도 Claude Opus 4.5를 앞선다. 30개 이상 태스크 유형에 걸친 강화학습과 INT8 양자화로 추론 속도를 최적화했다. OpenClaw·고용량 에이전틱 엔지니어링 워크플로우에 최적화되어 있으며, 203K 토큰 컨텍스트를 지원한다. Z.ai 플랫폼 및 API로 제공된다.
컨텍스트
203K tokens
입력 가격
API 문의
출력 가격
API 문의
멀티모달
text, image, video
핵심 역량
Design2Code
94.8% — Claude Opus 4.6 대비 +17.5p
비전 입력
이미지·비디오·텍스트 네이티브 멀티모달
에이전틱
OpenClaw + 고용량 워크플로우 최적화
추론 속도
INT8 양자화 고속 추론
컨텍스트
203K 토큰
SWE-bench
GLM-5.1 대비 -3.1포인트
장점
- Design2Code 94.8% — Claude Opus 4.6(77.3%) 대비 17.5포인트 상회
- 디자인 목업(스크린샷·Figma·스케치) → 실행 코드 직변환
- BrowseComp 에이전틱 브라우징 Claude Opus 4.5 초과
- 네이티브 멀티모달 — 이미지·비디오·텍스트 동시 처리
- INT8 양자화 + CogViT 인코더로 빠른 추론 속도
- 203K 컨텍스트, chat.z.ai 무료 사용
단점
- SWE-bench 코딩 태스크에서 GLM-5.1 대비 3.1포인트 열위
- 744B MoE — 셀프호스팅 시 대규모 인프라 필요
- API 가격 비공개 — 대규모 API 사용 비용 예측 어려움
- 생태계가 GPT·Claude 대비 작음