LLM 모델Xiaomi
MiMo-V2-Flash
#1 open-source SWE-bench — Sonnet-level coding at 3.5% of the cost
MiMo-V2-Flash는 Xiaomi가 2026년 2월 출시한 오픈소스 Mixture-of-Experts 언어 모델이다. 총 309B 파라미터, 토큰당 15B 활성 파라미터를 가지며 슬라이딩 윈도우·풀 어텐션 하이브리드(5:1) 아키텍처를 채택했다. 262K 토큰 컨텍스트 윈도우를 지원하고 150 tokens/sec의 빠른 추론 속도를 제공한다. SWE-bench Verified 73.4%로 오픈소스 모델 글로벌 1위를 기록하며, Claude Sonnet 4.5 수준의 에이전틱 코딩 성능을 3.5% 비용으로 제공한다. SWE-bench Multilingual에서도 오픈소스 1위. GitHub에 가중치 공개, Xiaomi API 및 OpenRouter를 통해 접근 가능하다.
컨텍스트
262K tokens
입력 가격
$0.09/1M
출력 가격
$0.29/1M
멀티모달
text
핵심 역량
코딩 강도
SWE-bench 73.4% — 오픈소스 1위
비용 효율
$0.09/1M — 동급 최저가
오픈소스
GitHub 가중치 공개, Apache 2.0
추론 속도
150 tokens/sec 고속
컨텍스트
262K 토큰
멀티모달
텍스트 전용
장점
- SWE-bench Verified 73.4% — 오픈소스 글로벌 1위
- Claude Sonnet 4.5 동급 코딩 성능을 3.5% 비용으로
- 오픈소스 가중치 공개 — 자체 서버 실행 가능
- 입력 $0.09/1M — 오픈소스 최저가 수준
- 150 tokens/sec 고속 추론
- 262K 컨텍스트 윈도우
단점
- 코딩·에이전틱 태스크 외 범용 성능 검증 데이터 부족
- GPT-5.4, Claude Opus 4.6 최상위 대비 코딩 열위
- 멀티모달 미지원 (텍스트 전용)
- Xiaomi 생태계 기반 — 서드파티 지원 제한적