TechFeedTechFeed
AI 코딩 도구

Cursor Composer 2 — Kimi K2.5 기반 코딩 모델이 Claude Opus를 넘다

Cursor가 중국 오픈소스 모델 Kimi K2.5를 기반으로 Composer 2를 출시했다. Claude Opus 4.6을 벤치마크에서 앞서고, 토큰 비용은 86% 저렴한 AI 코딩 전용 모델의 실체를 분석한다.

한 줄 요약: Cursor가 중국 오픈소스 모델 Kimi K2.5를 기반으로 자체 코딩 모델 Composer 2를 출시했다. Claude Opus 4.6을 벤치마크에서 제치고, 토큰 비용은 86% 저렴하다.

2026년 3월 19일, 100만 일일 사용자를 보유한 AI 코딩 에디터 Cursor가 세 번째 자체 모델 Composer 2를 공개했다. Moonshot AI의 오픈소스 모델 Kimi K2.5 위에 자체 학습을 쌓은 구조로, CursorBench 61.3 · Terminal-Bench 61.7 · SWE-bench Multilingual 73.7을 기록하며 Claude Opus 4.6(Terminal-Bench 58.0)을 넘었다. GPT-5.4(75.1)에는 아직 미달이지만, 토큰당 비용이 $0.50/M으로 기존 대비 최대 86% 저렴해 실무 도입 허들이 낮아졌다.

이 글이 필요한 사람: AI 코딩 도구를 비교·선택해야 하는 개발자, Cursor를 쓰고 있거나 도입을 검토하는 팀, AI 모델의 오픈소스 증류/파인튜닝 전략에 관심 있는 엔지니어.

※ 이 글은 2026년 3월 기준, Cursor 공식 블로그 및 벤치마크 데이터를 기반으로 작성됐습니다.

Composer 2는 무엇인가 — Kimi K2.5 기반 코딩 전용 모델

Composer 2는 Cursor의 세 번째 자체 코딩 모델이다. 베이스 모델은 중국 Moonshot AI가 오픈소스로 공개한 Kimi K2.5이며, Cursor가 자체 continued pretraining과 강화학습(RL)을 추가했다. Cursor의 VP of Developer Education은 Composer 2 성능의 약 75%가 Cursor의 추가 학습에서 비롯된다고 밝혔다.

항목내용
베이스 모델Kimi K2.5 (Moonshot AI, 오픈소스)
학습 방식Continued pretraining + RL (Cursor 자체)
컨텍스트 윈도우최대 200K 토큰
주요 기능멀티파일 편집, 코드 생성, 리팩토링, CLI 상호작용, 수백 단계 체이닝
출시일2026년 3월 19일

중국 오픈소스 모델을 기반으로 했다는 사실은 공개 직후 논란이 됐지만, Cursor 측은 성능 데이터로 응답했다. 오픈소스 모델을 상업 제품의 기반으로 쓰는 전략은 앞으로 더 확산될 가능성이 높다.

Cursor Composer 2 벤치마크 점수 비교 차트
Composer 2의 CursorBench·Terminal-Bench·SWE-bench 벤치마크 결과 (출처: Cursor 공식 블로그)

벤치마크 비교 — Claude Opus, GPT-5.4와 나란히 놓으면

Composer 2의 벤치마크 성적을 주요 경쟁 모델과 비교한다:

벤치마크Composer 1.5Composer 2Claude Opus 4.6GPT-5.4
CursorBench44.261.356.863.1
Terminal-Bench 2.047.961.758.075.1
SWE-bench Multilingual65.973.771.278.4

Composer 2는 전 세대 대비 CursorBench +38.7%, Terminal-Bench +28.8%, SWE-bench +11.8%의 향상을 보인다. Claude Opus 4.6을 Terminal-Bench에서 3.7점 차로 앞섰지만, GPT-5.4에는 13.4점 뒤진다. 범용 모델 대비 코딩 특화 파인튜닝의 효과가 분명한 결과다.

가격 구조 — 토큰당 비용 86% 절감의 실체

Composer 2는 두 가지 변형으로 제공된다:

변형입력 ($/M)출력 ($/M)비고
Standard$0.50$2.50Composer 1.5 대비 86% 저렴
Fast (기본값)$1.50$7.50Composer 1.5 대비 57% 저렴

유료 플랜(Pro/Business)에서 Auto 모드 사용 시 Composer 모델은 무제한이고 크레딧이 차감되지 않는다. 이 정책은 Claude Opus 4.6이나 GPT-5.4 같은 외부 모델을 쓸 때만 크레딧이 소진되는 구조와 결합된다. Cursor 입장에서는 자체 모델로 사용자를 유도해 외부 API 비용을 줄이려는 전략이다.

Cursor Composer 2와 경쟁 AI 코딩 모델의 토큰 비용 비교
Composer 2 Standard 기준 입력 토큰 비용은 Claude Opus 4.6의 약 1/30 수준 (출처: Cursor 공식 블로그, 각 모델 공식 가격표)

Cursor 생태계 확장 — 30개 플러그인과 자동화 기능

Composer 2 출시와 함께 Cursor의 생태계도 대폭 확장됐다:

  • 30+ 신규 플러그인: Atlassian, Datadog, GitLab, Glean, Hugging Face, monday.com, PlanetScale 등이 공식 파트너로 참여
  • Automations: Slack, Linear, GitHub, PagerDuty, Webhook 이벤트를 트리거로 사용하는 상시 에이전트(always-on agent) 구축 가능
  • 스케줄 기반 실행: 코드 리뷰, 이슈 분류, 의존성 업데이트 등을 크론처럼 자동 실행

특히 Automations은 Cursor를 단순 코딩 에디터에서 개발 워크플로우 오케스트레이터로 확장하려는 시도다. GitHub Copilot의 Coding Agent, Claude Code의 Hooks/Skills와 직접 경쟁하는 영역이다.

Composer 2로 전환해야 할 사람, 아닌 사람

Composer 2가 모든 상황에서 최선은 아니다. 작업 유형별로 판단 기준을 정리한다:

상황권장 모델이유
멀티파일 리팩토링Composer 2200K 컨텍스트 + 수백 단계 체이닝에 최적화
복잡한 시스템 설계GPT-5.4 / Claude Opus범용 추론 능력이 더 높음
일상 코드 작성 (자동완성)Composer 2 Standard비용 대비 성능 최적
보안 코드 리뷰Claude Opus 4.6보안 취약점 탐지 성능 우위 (Firefox CVE 사례)
비용 제약이 큰 스타트업Composer 2 Auto유료 플랜에서 무제한 사용

핵심은 "코딩 전용 작업에는 Composer 2, 범용 추론이 필요한 작업에는 외부 모델"이라는 역할 분리다. Cursor의 Auto 모드가 이 판단을 자동으로 해주지만, 결과를 맹신하기보다 작업 유형에 따라 모델을 수동 선택하는 습관이 낫다.

AI 코딩 도구 시장 경쟁 구도 — Cursor, GitHub Copilot, Claude Code 비교
2026년 3월 기준 AI 코딩 도구 시장 경쟁 구도 (출처: VentureBeat, SiliconANGLE 보도 종합)
CursorComposer2KimiK25AI코딩벤치마크SWE-bench오픈소스바이브코딩MoonshotAI

관련 도구

관련 포스트

Cursor Composer 2 출시 — AI 코딩 자체 모델 시대의 시작2026-03-22AI 코딩 도구로 SaaS MVP를 2주 만에 출시한 1인 개발 사례 — Cursor + Claude Code 실전 회고2026-03-24AI 코딩 완전 가이드 2026 — 개념·툴·워크플로우·함정까지 한 곳에2026-04-18OpenAI Codex의 Astral 인수 — Ruff·uv·ty와 Python 개발 도구 생태계 재편2026-03-25