한 줄 요약: Cursor가 중국 오픈소스 모델 Kimi K2.5를 기반으로 자체 코딩 모델 Composer 2를 출시했다. Claude Opus 4.6을 벤치마크에서 제치고, 토큰 비용은 86% 저렴하다.
2026년 3월 19일, 100만 일일 사용자를 보유한 AI 코딩 에디터 Cursor가 세 번째 자체 모델 Composer 2를 공개했다. Moonshot AI의 오픈소스 모델 Kimi K2.5 위에 자체 학습을 쌓은 구조로, CursorBench 61.3 · Terminal-Bench 61.7 · SWE-bench Multilingual 73.7을 기록하며 Claude Opus 4.6(Terminal-Bench 58.0)을 넘었다. GPT-5.4(75.1)에는 아직 미달이지만, 토큰당 비용이 $0.50/M으로 기존 대비 최대 86% 저렴해 실무 도입 허들이 낮아졌다.
이 글이 필요한 사람: AI 코딩 도구를 비교·선택해야 하는 개발자, Cursor를 쓰고 있거나 도입을 검토하는 팀, AI 모델의 오픈소스 증류/파인튜닝 전략에 관심 있는 엔지니어.
※ 이 글은 2026년 3월 기준, Cursor 공식 블로그 및 벤치마크 데이터를 기반으로 작성됐습니다.
Composer 2는 Cursor의 세 번째 자체 코딩 모델이다. 베이스 모델은 중국 Moonshot AI가 오픈소스로 공개한 Kimi K2.5이며, Cursor가 자체 continued pretraining과 강화학습(RL)을 추가했다. Cursor의 VP of Developer Education은 Composer 2 성능의 약 75%가 Cursor의 추가 학습에서 비롯된다고 밝혔다.
| 항목 | 내용 |
|---|
| 베이스 모델 | Kimi K2.5 (Moonshot AI, 오픈소스) |
| 학습 방식 | Continued pretraining + RL (Cursor 자체) |
| 컨텍스트 윈도우 | 최대 200K 토큰 |
| 주요 기능 | 멀티파일 편집, 코드 생성, 리팩토링, CLI 상호작용, 수백 단계 체이닝 |
| 출시일 | 2026년 3월 19일 |
중국 오픈소스 모델을 기반으로 했다는 사실은 공개 직후 논란이 됐지만, Cursor 측은 성능 데이터로 응답했다. 오픈소스 모델을 상업 제품의 기반으로 쓰는 전략은 앞으로 더 확산될 가능성이 높다.
Composer 2의 벤치마크 성적을 주요 경쟁 모델과 비교한다:
| 벤치마크 | Composer 1.5 | Composer 2 | Claude Opus 4.6 | GPT-5.4 |
|---|
| CursorBench | 44.2 | 61.3 | 56.8 | 63.1 |
| Terminal-Bench 2.0 | 47.9 | 61.7 | 58.0 | 75.1 |
| SWE-bench Multilingual | 65.9 | 73.7 | 71.2 | 78.4 |
Composer 2는 전 세대 대비 CursorBench +38.7%, Terminal-Bench +28.8%, SWE-bench +11.8%의 향상을 보인다. Claude Opus 4.6을 Terminal-Bench에서 3.7점 차로 앞섰지만, GPT-5.4에는 13.4점 뒤진다. 범용 모델 대비 코딩 특화 파인튜닝의 효과가 분명한 결과다.
Composer 2는 두 가지 변형으로 제공된다:
| 변형 | 입력 ($/M) | 출력 ($/M) | 비고 |
|---|
| Standard | $0.50 | $2.50 | Composer 1.5 대비 86% 저렴 |
| Fast (기본값) | $1.50 | $7.50 | Composer 1.5 대비 57% 저렴 |
유료 플랜(Pro/Business)에서 Auto 모드 사용 시 Composer 모델은 무제한이고 크레딧이 차감되지 않는다. 이 정책은 Claude Opus 4.6이나 GPT-5.4 같은 외부 모델을 쓸 때만 크레딧이 소진되는 구조와 결합된다. Cursor 입장에서는 자체 모델로 사용자를 유도해 외부 API 비용을 줄이려는 전략이다.
Composer 2 출시와 함께 Cursor의 생태계도 대폭 확장됐다:
- 30+ 신규 플러그인: Atlassian, Datadog, GitLab, Glean, Hugging Face, monday.com, PlanetScale 등이 공식 파트너로 참여
- Automations: Slack, Linear, GitHub, PagerDuty, Webhook 이벤트를 트리거로 사용하는 상시 에이전트(always-on agent) 구축 가능
- 스케줄 기반 실행: 코드 리뷰, 이슈 분류, 의존성 업데이트 등을 크론처럼 자동 실행
특히 Automations은 Cursor를 단순 코딩 에디터에서 개발 워크플로우 오케스트레이터로 확장하려는 시도다. GitHub Copilot의 Coding Agent, Claude Code의 Hooks/Skills와 직접 경쟁하는 영역이다.
Composer 2가 모든 상황에서 최선은 아니다. 작업 유형별로 판단 기준을 정리한다:
| 상황 | 권장 모델 | 이유 |
|---|
| 멀티파일 리팩토링 | Composer 2 | 200K 컨텍스트 + 수백 단계 체이닝에 최적화 |
| 복잡한 시스템 설계 | GPT-5.4 / Claude Opus | 범용 추론 능력이 더 높음 |
| 일상 코드 작성 (자동완성) | Composer 2 Standard | 비용 대비 성능 최적 |
| 보안 코드 리뷰 | Claude Opus 4.6 | 보안 취약점 탐지 성능 우위 (Firefox CVE 사례) |
| 비용 제약이 큰 스타트업 | Composer 2 Auto | 유료 플랜에서 무제한 사용 |
핵심은 "코딩 전용 작업에는 Composer 2, 범용 추론이 필요한 작업에는 외부 모델"이라는 역할 분리다. Cursor의 Auto 모드가 이 판단을 자동으로 해주지만, 결과를 맹신하기보다 작업 유형에 따라 모델을 수동 선택하는 습관이 낫다.