AI 코딩 도구

Cursor Composer 2 — Kimi K2.5 기반 코딩 모델이 Claude Opus를 넘다

한 줄 요약: Cursor가 중국 오픈소스 모델 Kimi K2.5를 기반으로 자체 코딩 모델 Composer 2를 출시했다. Claude Opus 4.6을 벤치마크에서 제치고, 토큰 비용은 86% 저렴하다. Composer 2는 Cursor의 세 번째 자체 코딩 모델이다. 베이스 모델은 중국 Moonshot AI가 오픈소스로 공개한 Kimi K2.5 이며, Cursor가 자체 continued pretraining과 강화학습(RL)을 추가했다.

by Lee발행: 2026-03-26

한 줄 요약: Cursor가 중국 오픈소스 모델 Kimi K2.5를 기반으로 자체 코딩 모델 Composer 2를 출시했다. Claude Opus 4.6을 벤치마크에서 제치고, 토큰 비용은 86% 저렴하다.

2026년 3월 19일, 100만 일일 사용자를 보유한 AI 코딩 에디터 Cursor가 세 번째 자체 모델 Composer 2를 공개했다. Moonshot AI의 오픈소스 모델 Kimi K2.5 위에 자체 학습을 쌓은 구조로, CursorBench 61.3 · Terminal-Bench 61.7 · SWE-bench Multilingual 73.7을 기록하며 Claude Opus 4.6(Terminal-Bench 58.0)을 넘었다. GPT-5.4(75.1)에는 아직 미달이지만, 토큰당 비용이 $0.50/M으로 기존 대비 최대 86% 저렴해 실무 도입 허들이 낮아졌다.

이 글이 필요한 사람: AI 코딩 도구를 비교·선택해야 하는 개발자, Cursor를 쓰고 있거나 도입을 검토하는 팀, AI 모델의 오픈소스 증류/파인튜닝 전략에 관심 있는 엔지니어.

※ 이 글은 2026년 3월 기준, Cursor 공식 블로그 및 벤치마크 데이터를 기반으로 작성됐습니다.

Composer 2는 무엇인가 — Kimi K2.5 기반 코딩 전용 모델

Composer 2는 Cursor의 세 번째 자체 코딩 모델이다. 베이스 모델은 중국 Moonshot AI가 오픈소스로 공개한 Kimi K2.5이며, Cursor가 자체 continued pretraining과 강화학습(RL)을 추가했다. Cursor의 VP of Developer Education은 Composer 2 성능의 약 75%가 Cursor의 추가 학습에서 비롯된다고 밝혔다.

항목	내용
베이스 모델	Kimi K2.5 (Moonshot AI, 오픈소스)
학습 방식	Continued pretraining + RL (Cursor 자체)
컨텍스트 윈도우	최대 200K 토큰
주요 기능	멀티파일 편집, 코드 생성, 리팩토링, CLI 상호작용, 수백 단계 체이닝
출시일	2026년 3월 19일

중국 오픈소스 모델을 기반으로 했다는 사실은 공개 직후 논란이 됐지만, Cursor 측은 성능 데이터로 응답했다. 오픈소스 모델을 상업 제품의 기반으로 쓰는 전략은 앞으로 더 확산될 가능성이 높다.

Cursor Composer 2 벤치마크 점수 비교 차트 — Composer 2의 CursorBench·Terminal-Bench·SWE-bench 벤치마크 결과 (출처: Cursor 공식 블로그)

벤치마크 비교 — Claude Opus, GPT-5.4와 나란히 놓으면

Composer 2의 벤치마크 성적을 주요 경쟁 모델과 비교한다:

벤치마크	Composer 1.5	Composer 2	Claude Opus 4.6	GPT-5.4
CursorBench	44.2	61.3	56.8	63.1
Terminal-Bench 2.0	47.9	61.7	58.0	75.1
SWE-bench Multilingual	65.9	73.7	71.2	78.4

Composer 2는 전 세대 대비 CursorBench +38.7%, Terminal-Bench +28.8%, SWE-bench +11.8%의 향상을 보인다. Claude Opus 4.6을 Terminal-Bench에서 3.7점 차로 앞섰지만, GPT-5.4에는 13.4점 뒤진다. 범용 모델 대비 코딩 특화 파인튜닝의 효과가 분명한 결과다.

가격 구조 — 토큰당 비용 86% 절감의 실체

Composer 2는 두 가지 변형으로 제공된다:

변형	입력 ($/M)	출력 ($/M)	비고
Standard	$0.50	$2.50	Composer 1.5 대비 86% 저렴
Fast (기본값)	$1.50	$7.50	Composer 1.5 대비 57% 저렴

유료 플랜(Pro/Business)에서 Auto 모드 사용 시 Composer 모델은 무제한이고 크레딧이 차감되지 않는다. 이 정책은 Claude Opus 4.6이나 GPT-5.4 같은 외부 모델을 쓸 때만 크레딧이 소진되는 구조와 결합된다. Cursor 입장에서는 자체 모델로 사용자를 유도해 외부 API 비용을 줄이려는 전략이다.

Cursor Composer 2와 경쟁 AI 코딩 모델의 토큰 비용 비교 — Composer 2 Standard 기준 입력 토큰 비용은 Claude Opus 4.6의 약 1/30 수준 (출처: Cursor 공식 블로그, 각 모델 공식 가격표)

Cursor 생태계 확장 — 30개 플러그인과 자동화 기능

Composer 2 출시와 함께 Cursor의 생태계도 대폭 확장됐다:

30+ 신규 플러그인: Atlassian, Datadog, GitLab, Glean, Hugging Face, monday.com, PlanetScale 등이 공식 파트너로 참여
Automations: Slack, Linear, GitHub, PagerDuty, Webhook 이벤트를 트리거로 사용하는 상시 에이전트(always-on agent) 구축 가능
스케줄 기반 실행: 코드 리뷰, 이슈 분류, 의존성 업데이트 등을 크론처럼 자동 실행

특히 Automations은 Cursor를 단순 코딩 에디터에서 개발 워크플로우 오케스트레이터로 확장하려는 시도다. GitHub Copilot의 Coding Agent, Claude Code의 Hooks/Skills와 직접 경쟁하는 영역이다.

Composer 2로 전환해야 할 사람, 아닌 사람

Composer 2가 모든 상황에서 최선은 아니다. 작업 유형별로 판단 기준을 정리한다:

상황	권장 모델	이유
멀티파일 리팩토링	Composer 2	200K 컨텍스트 + 수백 단계 체이닝에 최적화
복잡한 시스템 설계	GPT-5.4 / Claude Opus	범용 추론 능력이 더 높음
일상 코드 작성 (자동완성)	Composer 2 Standard	비용 대비 성능 최적
보안 코드 리뷰	Claude Opus 4.6	보안 취약점 탐지 성능 우위 (Firefox CVE 사례)
비용 제약이 큰 스타트업	Composer 2 Auto	유료 플랜에서 무제한 사용