TechFeedTechFeed
LLM 모델Mistral AI

Mistral Small 4

Small model, big performance

Mistral Small 4는 Mistral AI가 2026년 3월 16일 출시한 오픈웨이트 경량 MoE 모델이다. 128개 전문가 중 4개가 활성화되는 구조로, 119B 총 파라미터에서 토큰당 6B만 활성화된다. 256K 토큰 컨텍스트를 지원하며, 이전 세대 대비 지연 40% 감소·처리량 3배 향상을 달성했다. 추론 강도를 사용자가 직접 조절할 수 있어 빠른 응답과 심층 추론 사이를 유연하게 전환 가능하다. 텍스트·이미지 멀티모달을 지원하며 코딩·에이전트·장문 문서 처리에 최적화됐다. Apache 2.0 라이선스로 셀프호스팅·파인튜닝이 자유롭고, API 가격은 입력 $0.15/1M으로 성능 대비 업계 최저가급이다.

컨텍스트
256K tokens
입력 가격
$0.15/1M tokens
출력 가격
$0.60/1M tokens
멀티모달
text, image

핵심 역량

컨텍스트 윈도우
256K 토큰
가격 효율
입력 $0.15/1M — 경량 오픈웨이트 최저가급
추론 조절
속도/품질 트레이드오프 가변 설정
처리량
Small 3 대비 3배 향상
오픈소스
Apache 2.0, 상용 가능
멀티모달
텍스트+이미지

장점

  • Mistral Small 3 대비 지연 40% 감소·처리량 3배 향상
  • 입력 $0.15/1M — Mistral Large 3의 30% 비용
  • 추론 강도 가변 설정 — 속도와 품질 트레이드오프 조절
  • 256K 토큰 컨텍스트 — 장문 문서·코드베이스 처리 가능
  • Apache 2.0 오픈웨이트 — 상용 이용·파인튜닝 자유
  • 텍스트+이미지 멀티모달 지원

단점

  • Mistral Large 3 대비 복잡한 추론·코딩 성능 열위
  • 256K 컨텍스트 — 1M급 모델(Claude/GPT/DeepSeek) 대비 짧음
  • 에이전트 생태계는 Claude/GPT 대비 미비

공식 링크