TechFeedTechFeed
LLM 모델Meta

Llama 4 Scout

Open source AI for everyone

Llama 4 Scout는 Meta가 2026년 4월 5일 공개한 경량 오픈소스 MoE 모델이다. 17B 활성 파라미터(109B 총합, 16 전문가)로 설계되어 Int4 양자화 시 단일 H100 GPU에서 실행 가능하다. 오픈소스 모델 중 최대인 10M 토큰 컨텍스트 윈도우를 제공하며, 텍스트·이미지·비디오 입력을 네이티브로 지원한다. Apache 스타일 라이선스로 상용 활용 및 파인튜닝이 자유롭고, Hugging Face와 llama.com에서 바로 내려받을 수 있다.

컨텍스트
1M tokens
입력 가격
무료 (셀프호스팅)
출력 가격
무료 (셀프호스팅)
멀티모달
text, image, video

핵심 역량

컨텍스트 윈도우
10M 토큰 (오픈소스 최대)
오픈소스
완전 오픈, Apache 상용 가능
멀티모달
텍스트+이미지+비디오 입력
경량성
단일 H100 실행 가능 (Int4)
가격
무료 (GPU 인프라만)

장점

  • 10M 토큰 컨텍스트 — 오픈소스 최대
  • 단일 H100 GPU 실행 가능 (Int4 양자화)
  • 텍스트·이미지·비디오 네이티브 멀티모달
  • 완전 오픈소스 + Apache 상용 라이선스
  • API 비용 없음, 파인튜닝 자유

단점

  • 클라우드 API 모델 대비 셋업 복잡
  • 공식 지원·SLA 없음
  • Maverick 대비 규모 작아 복잡한 추론 한계

공식 링크