TechFeedTechFeed
LLM 모델MiniMax

MiniMax M2.7

Chain-of-thought reasoning MoE — agentic workflows on NVIDIA

MiniMax M2.7은 MiniMax가 2026년 3월 18일 출시한 추론 특화 MoE 언어 모델이다. 총 230B 파라미터, 토큰당 10B 활성 파라미터를 가지며 확장된 사고(Extended Thinking)·체인-오브-소트(Chain-of-Thought) 추론을 기본 지원한다. 200K 토큰 컨텍스트 윈도우와 49.8 tokens/sec 속도를 제공한다. Artificial Analysis Intelligence Index 기준 50점으로 동급 오픈소스 대비 상위권(중앙값 27점). 에이전틱 워크플로우·NVIDIA 플랫폼 최적화가 이루어져 있으며, 입력 $0.30/1M · 출력 $1.20/1M. MiniMax M2.5의 추론 특화 후속 모델 포지션이다.

컨텍스트
200K tokens
입력 가격
$0.30/1M
출력 가격
$1.20/1M
멀티모달
text

핵심 역량

추론 강도
Extended Thinking, CoT 기본 지원
에이전틱
NVIDIA 플랫폼 워크플로우 최적화
비용 효율
$0.30/1M — 추론 모델 저가
컨텍스트
200K 토큰
추론 속도
49.8 tokens/sec
멀티모달
텍스트 전용

장점

  • Extended Thinking / Chain-of-Thought 추론 기본 지원
  • Artificial Analysis Intelligence Index 50점 — 오픈소스 상위권
  • 230B/10B MoE — 추론 품질 vs 비용 균형
  • NVIDIA 플랫폼 에이전틱 워크플로우 최적화
  • 입력 $0.30/1M — 추론 모델 중 경쟁력 있는 가격
  • 200K 컨텍스트 윈도우

단점

  • 멀티모달 미지원 (텍스트 전용)
  • M2.5 대비 추론 속도 느림 (49.8 vs 100 tokens/sec)
  • GPT-5.4, Gemini 3 Deep Think 최상위 추론 대비 열위
  • 파인튜닝 미지원

공식 링크