LLM 모델Meta
Llama 4 Maverick
Open source AI for everyone
Llama 4는 Meta가 2025년 4월 공개한 오픈소스 Mixture-of-Experts(MoE) 모델 계열이다. Scout(17B 활성 파라미터)는 10M 토큰 컨텍스트로 단일 H100 GPU에서 실행 가능하며, Maverick(17B 활성, 128 전문가)는 멀티모달 벤치마크에서 GPT-4o를 앞선다. 완전 오픈소스로 상용 가능하고 파인튜닝이 자유롭다.
컨텍스트
1M tokens
입력 가격
무료 (셀프호스팅)
출력 가격
무료 (셀프호스팅)
멀티모달
text, image
핵심 역량
컨텍스트 윈도우
10M 토큰 (Scout)
오픈소스
완전 오픈, 상용 가능
멀티모달
텍스트+이미지 (Maverick)
가격
무료 (GPU 인프라만)
프라이버시
로컬/온프레미스 실행
셋업 난이도
GPU 필요, 설정 필요
장점
- Scout: 10M 토큰 컨텍스트 (오픈소스 최대)
- Maverick: 멀티모달 벤치마크 GPT-4o 초과
- MoE 아키텍처 — 효율적 추론
- 완전 오픈소스 + 상용 라이선스
- API 비용 없음, 파인튜닝 자유
- 로컬/온프레미스 프라이버시 완전 보장
단점
- 클라우드 API 모델 대비 셋업 복잡
- Maverick은 다중 GPU 필요
- 공식 지원·SLA 없음
- Claude/GPT 대비 도구 생태계 부족