LLM 모델MiniMax

MiniMax M2.7

Chain-of-thought reasoning MoE — agentic workflows on NVIDIA

MiniMax M2.7은 MiniMax가 2026년 3월 18일 출시한 추론 특화 MoE 언어 모델이다. 총 230B 파라미터, 토큰당 10B 활성 파라미터를 가지며 확장된 사고(Extended Thinking)·체인-오브-소트(Chain-of-Thought) 추론을 기본 지원한다. 200K 토큰 컨텍스트 윈도우와 49.8 tokens/sec 속도를 제공한다. Artificial Analysis Intelligence Index 기준 50점으로 동급 오픈소스 대비 상위권(중앙값 27점). 에이전틱 워크플로우·NVIDIA 플랫폼 최적화가 이루어져 있으며, 입력 $0.30/1M · 출력 $1.20/1M. MiniMax M2.5의 추론 특화 후속 모델 포지션이다.

컨텍스트

200K tokens

입력 가격

$0.30/1M

출력 가격

$1.20/1M

멀티모달

text

핵심 역량

추론 강도

Extended Thinking, CoT 기본 지원

에이전틱

NVIDIA 플랫폼 워크플로우 최적화

비용 효율

$0.30/1M — 추론 모델 저가

컨텍스트

200K 토큰

추론 속도

49.8 tokens/sec

멀티모달

텍스트 전용

장점

Extended Thinking / Chain-of-Thought 추론 기본 지원
Artificial Analysis Intelligence Index 50점 — 오픈소스 상위권
230B/10B MoE — 추론 품질 vs 비용 균형
NVIDIA 플랫폼 에이전틱 워크플로우 최적화
입력 $0.30/1M — 추론 모델 중 경쟁력 있는 가격
200K 컨텍스트 윈도우

단점

멀티모달 미지원 (텍스트 전용)
M2.5 대비 추론 속도 느림 (49.8 vs 100 tokens/sec)
GPT-5.4, Gemini 3 Deep Think 최상위 추론 대비 열위
파인튜닝 미지원

공식 링크

공식 사이트 ↗문서 ↗