LLM 모델Mistral AI

Mistral Small 4

Small model, big performance

Mistral Small 4는 Mistral AI가 2026년 3월 16일 출시한 오픈웨이트 경량 MoE 모델이다. 128개 전문가 중 4개가 활성화되는 구조로, 119B 총 파라미터에서 토큰당 6B만 활성화된다. 256K 토큰 컨텍스트를 지원하며, 이전 세대 대비 지연 40% 감소·처리량 3배 향상을 달성했다. 추론 강도를 사용자가 직접 조절할 수 있어 빠른 응답과 심층 추론 사이를 유연하게 전환 가능하다. 텍스트·이미지 멀티모달을 지원하며 코딩·에이전트·장문 문서 처리에 최적화됐다. Apache 2.0 라이선스로 셀프호스팅·파인튜닝이 자유롭고, API 가격은 입력 $0.15/1M으로 성능 대비 업계 최저가급이다.

컨텍스트

256K tokens

입력 가격

$0.15/1M tokens

출력 가격

$0.60/1M tokens

멀티모달

text, image

핵심 역량

컨텍스트 윈도우

256K 토큰

가격 효율

입력 $0.15/1M — 경량 오픈웨이트 최저가급

추론 조절

속도/품질 트레이드오프 가변 설정

처리량

Small 3 대비 3배 향상

오픈소스

Apache 2.0, 상용 가능

멀티모달

텍스트+이미지

장점

Mistral Small 3 대비 지연 40% 감소·처리량 3배 향상
입력 $0.15/1M — Mistral Large 3의 30% 비용
추론 강도 가변 설정 — 속도와 품질 트레이드오프 조절
256K 토큰 컨텍스트 — 장문 문서·코드베이스 처리 가능
Apache 2.0 오픈웨이트 — 상용 이용·파인튜닝 자유
텍스트+이미지 멀티모달 지원

단점

Mistral Large 3 대비 복잡한 추론·코딩 성능 열위
256K 컨텍스트 — 1M급 모델(Claude/GPT/DeepSeek) 대비 짧음
에이전트 생태계는 Claude/GPT 대비 미비

공식 링크

공식 사이트 ↗문서 ↗