LLM 모델Google

Gemma 4

Best open model per parameter — Apache 2.0, multimodal

Gemma 4는 Google DeepMind가 2026년 4월 2일 출시한 오픈 모델 시리즈다. Effective 2B(E2B), Effective 4B(E4B), 26B MoE(활성 파라미터 ~4B), 31B Dense 4종으로 구성된다. 모든 사이즈가 텍스트·이미지·오디오 멀티모달을 기본 지원한다. 컨텍스트 윈도우는 E2B·E4B 128K, 26B·31B 256K. Apache 2.0 라이선스로 상업적 이용·수정·재배포 무제한 허용. 31B 모델은 Arena AI 텍스트 리더보드 오픈 모델 3위, 26B MoE는 6위. 추론·에이전틱 워크플로우 최적화, 파라미터 대비 최고 수준의 지능 밀도를 목표로 한다. Hugging Face·Kaggle·Google AI Studio에서 즉시 다운로드 가능.

컨텍스트

256K tokens

입력 가격

무료 (오픈소스)

출력 가격

무료 (오픈소스)

멀티모달

text, image, audio

핵심 역량

오픈소스

Apache 2.0 — 상업 이용 무제한

멀티모달

텍스트·이미지·오디오 입력

사이즈 다양성

E2B~31B — 엣지부터 서버까지

추론 성능

31B: 오픈 모델 세계 3위

컨텍스트 윈도우

26B/31B: 256K

비용 효율

26B MoE: 활성 4B → 서빙 비용 낮음

장점

Apache 2.0 — 상업적 이용·수정·재배포 완전 허용
4종 사이즈 — E2B·E4B·26B MoE·31B Dense
31B: 오픈 모델 Arena AI 3위, 26B MoE: 6위
텍스트·이미지·오디오 멀티모달 기본 지원
26B MoE: 활성 파라미터 ~4B로 추론 비용 낮음
128K~256K 컨텍스트 윈도우

단점

Gemini 3.1 Pro·GPT-5.4 등 폐쇄형 최상위 모델 대비 성능 열위
31B: 로컬 실행 시 GPU 메모리 요구량 높음
음성 출력 미지원 (입력만)
에이전틱 태스크는 Qwen 3.6-Plus·GPT-5.3-Codex 대비 미흡

공식 링크

공식 사이트 ↗문서 ↗GitHub ↗