LLM 모델Xiaomi

MiMo-V2-Flash

#1 open-source SWE-bench — Sonnet-level coding at 3.5% of the cost

MiMo-V2-Flash는 Xiaomi가 2026년 2월 출시한 오픈소스 Mixture-of-Experts 언어 모델이다. 총 309B 파라미터, 토큰당 15B 활성 파라미터를 가지며 슬라이딩 윈도우·풀 어텐션 하이브리드(5:1) 아키텍처를 채택했다. 262K 토큰 컨텍스트 윈도우를 지원하고 150 tokens/sec의 빠른 추론 속도를 제공한다. SWE-bench Verified 73.4%로 오픈소스 모델 글로벌 1위를 기록하며, Claude Sonnet 4.5 수준의 에이전틱 코딩 성능을 3.5% 비용으로 제공한다. SWE-bench Multilingual에서도 오픈소스 1위. GitHub에 가중치 공개, Xiaomi API 및 OpenRouter를 통해 접근 가능하다.

컨텍스트

262K tokens

입력 가격

$0.09/1M

출력 가격

$0.29/1M

멀티모달

text

핵심 역량

코딩 강도

SWE-bench 73.4% — 오픈소스 1위

비용 효율

$0.09/1M — 동급 최저가

오픈소스

GitHub 가중치 공개, Apache 2.0

추론 속도

150 tokens/sec 고속

컨텍스트

262K 토큰

멀티모달

텍스트 전용

장점

SWE-bench Verified 73.4% — 오픈소스 글로벌 1위
Claude Sonnet 4.5 동급 코딩 성능을 3.5% 비용으로
오픈소스 가중치 공개 — 자체 서버 실행 가능
입력 $0.09/1M — 오픈소스 최저가 수준
150 tokens/sec 고속 추론
262K 컨텍스트 윈도우

단점

코딩·에이전틱 태스크 외 범용 성능 검증 데이터 부족
GPT-5.4, Claude Opus 4.8 최상위 대비 코딩 열위
멀티모달 미지원 (텍스트 전용)
Xiaomi 생태계 기반 — 서드파티 지원 제한적

공식 링크

공식 사이트 ↗문서 ↗GitHub ↗