컨텍스트 윈도우

오픈소스

멀티모달

가격

프라이버시

셋업 난이도

Llama 4는 Meta가 2025년 4월 공개한 오픈소스 Mixture-of-Experts(MoE) 모델 계열이다. Scout(17B 활성 파라미터)는 10M 토큰 컨텍스트로 단일 H100 GPU에서 실행 가능하며, Maverick(17B 활성, 128 전문가)는 멀티모달 벤치마크에서 GPT-4o를 앞선다. 완전 오픈소스로 상용 가능하고 파인튜닝이 자유롭다.

Llama 4 Maverick

무료 오픈소스 (셀프호스팅 GPU 비용 별도)

Meta의 오픈소스 MoE 모델 (2025.04). Scout는 10M 컨텍스트, Maverick은 멀티모달로 GPT-4o 수준.

Llama 4 Maverick

핵심 역량

장점

단점

공식 링크