TechFeedTechFeed
AI/LLM

Anthropic Claude Mythos 유출 — Opus 위의 새로운 티어, 사이버보안 능력이 방어를 추월한다

Anthropic CMS 설정 오류로 유출된 차세대 모델 Claude Mythos(Capybara). Opus 상위 4번째 티어, 코딩·추론·사이버보안에서 극적 성능 향상, AI 보안 군비경쟁 우려까지 정리한다.

한 줄 요약: Anthropic의 차세대 AI 모델 Claude Mythos(내부명 Capybara)가 CMS 설정 오류로 유출됐다. Opus 위의 새로운 티어로, 코딩·추론·사이버보안에서 "극적으로 높은 점수"를 기록했다고 한다.

왜 중요한가: Mythos는 단순한 성능 향상이 아니라 Anthropic이 "단계적 변화(step change)"라고 부르는 수준이다. 특히 사이버보안 능력이 "방어자가 패치하는 속도보다 빠르게 취약점을 공격할 수 있는 수준"이라는 내부 평가가 유출되면서 소프트웨어·사이버보안 업계에 파장이 퍼지고 있다.

이 글이 필요한 사람: AI 모델 생태계를 추적하는 개발자, 사이버보안 엔지니어, AI 기반 제품의 모델 선택을 결정하는 기술 의사결정자.

※ 이 글은 2026년 3월 30일 기준, Fortune·CoinDesk·The Decoder·Futurism 등 다수 매체의 보도를 종합하여 작성됐습니다. Anthropic은 아직 공식 발표를 하지 않은 상태입니다.

무엇이 유출됐는가

2026년 3월 26일, Fortune이 단독 보도했다. Anthropic의 콘텐츠 관리 시스템(CMS) 설정 오류로 미공개 블로그 초안이 외부에 노출된 것이다.

유출 규모가 상당했다. 블로그에 연결된 약 3,000개의 미공개 자산이 공개적으로 접근 가능한 상태였다. 그중 하나가 Claude Mythos 모델의 소개 블로그 초안이었다.

Anthropic은 "CMS 설정의 인적 오류"로 인해 초안이 접근 가능해졌다고 인정했다. 모델 자체의 코드나 가중치가 유출된 것은 아니지만, 내부 성능 평가와 전략적 판단이 담긴 문서가 공개된 셈이다.

Anthropic Mythos 모델 유출 사건 타임라인
Mythos 유출 사건 보도 타임라인 (출처: Fortune, CoinDesk 종합)

Capybara는 어떤 티어인가

유출된 초안에 따르면 Capybara는 Anthropic의 완전히 새로운 모델 티어다. 기존 Claude 라인업은 Haiku(소형) → Sonnet(중형) → Opus(대형)의 3단 구조였다. Capybara는 Opus 위에 위치한다.

핵심 내용을 정리한다:

항목내용
내부 코드명Capybara
외부 명칭Claude Mythos
티어 위치Opus 상위 (4번째 티어)
크기Opus보다 대형
가격"고객에게 매우 비쌀 것" (정확한 가격 미공개)
현재 상태소수 얼리 액세스 고객과 테스트 중

Anthropic 내부에서는 Mythos를 "지금까지 구축한 것 중 가장 뛰어난 모델"이자 "단계적 변화(step change)"로 평가한다고 한다.

성능 — Opus 4.6 대비 얼마나 올랐나

유출 문서에서 확인된 성능 관련 주장을 정리한다. 정확한 벤치마크 수치는 공개되지 않았지만, 정성적 표현은 명확하다.

  • 소프트웨어 코딩: Opus 4.6 대비 "극적으로 높은 점수(dramatically higher scores)"
  • 학술 추론: 동일하게 "극적으로 높은 점수"
  • 사이버보안: "현재 어떤 AI 모델보다도 사이버 능력에서 크게 앞서 있음"

구체적인 벤치마크 번호가 빠져 있다는 점은 주의해야 한다. 유출된 것은 마케팅 초안이지 기술 보고서가 아니다. 다만 Anthropic이 내부 문서에서 자사 모델에 대해 이 정도 표현을 쓴다는 것 자체가 의미 있는 신호다.

Claude 모델 라인업 Haiku Sonnet Opus Capybara 티어 구조
Claude 모델 티어 구조 변화 (출처: lowcode.agency 종합)

사이버보안 파장이 큰 이유

유출의 가장 큰 파장은 Mythos의 사이버보안 능력에 대한 Anthropic의 자체 평가다. 유출 문서에는 다음과 같은 문장이 포함되어 있었다:

"[Mythos는] 방어자가 패치할 수 있는 속도보다 빠르게 취약점을 공격할 수 있는 AI 모델의 도래를 예고한다."

이 문장 하나가 시장을 흔들었다. CoinDesk 보도에 따르면, 유출 직후 소프트웨어·사이버보안 관련 주식이 하락세를 보였다.

핵심 우려를 정리하면:

  • 공격-방어 비대칭: AI가 취약점을 찾는 속도가 인간 방어자의 패치 속도를 추월할 수 있다
  • 자동화된 공격 체인: 취약점 발견 → 익스플로잇 생성 → 실행까지의 자동화 가능성
  • 사이버 군비경쟁: Anthropic 스스로 "향후 모델들이 방어 노력을 크게 앞지르는 방식으로 취약점을 공격할 수 있는 파도"를 경고

Anthropic은 이 우려 때문에 사이버 방어 목적의 조직에만 얼리 액세스를 제한하고 있다고 한다. 방어자들이 먼저 시스템을 강화할 시간을 주겠다는 전략이다.

AI 사이버보안 공격-방어 비대칭 구조 다이어그램
AI 기반 공격과 방어의 속도 비대칭 개념도

개발자에게 의미하는 것

1. 모델 선택 전략의 변화

Capybara가 출시되면 Claude 사용자는 4단계 모델 중 선택해야 한다. Opus는 현재 대부분의 고성능 작업에 쓰이지만, Capybara는 "매우 비싸다"는 점이 명시돼 있다. 비용 대비 성능 최적화가 더 복잡해진다.

2. 보안 코드 리뷰의 중요성 증가

AI가 취약점을 더 빠르게 찾을 수 있다면, 방어 측도 AI를 활용한 코드 리뷰를 강화해야 한다. 이미 Claude Code를 활용한 보안 감사가 진행되고 있는데(보안 & 권한 관리 가이드 참조), 이런 워크플로우의 중요성이 더 커진다.

3. AI Safety 논의의 구체화

추상적이던 AI 안전 논의가 구체적인 능력치로 실체화됐다. Anthropic이 자사 모델의 위험성을 내부 문서에서 명시적으로 경고한 것은, AI Safety가 마케팅이 아니라 실제 엔지니어링 문제라는 점을 보여준다.

아직 답이 없는 질문들

유출 문서는 마케팅 초안이므로 기술적 세부사항이 빠져 있다. 아직 확인되지 않은 핵심 질문들을 정리한다:

  • 정확한 벤치마크 수치는? — "극적으로 높은 점수"의 실체가 SWE-bench 90%인지, GPQA 95%인지 알 수 없다
  • 컨텍스트 윈도우는? — Opus 4.6의 1M 토큰을 넘기는지 미확인
  • 가격 구조는? — "매우 비쌀 것"이라는 표현 외 구체적 가격 미공개
  • 출시 시기는? — 현재 얼리 액세스 단계이며, 일반 출시 일정은 불명
  • Claude Code 통합은? — Capybara 티어가 Claude Code에서 선택 가능해지는지 여부 미확인

Anthropic은 4월 7일부터 월간 "What We Shipped" 라이브스트림을 시작한다고 발표했다. 이 자리에서 추가 정보가 공개될 가능성이 있다.

AnthropicClaude MythosCapybaraAI모델사이버보안AI Safety유출Opus프론티어모델AI보안

관련 도구

관련 포스트

Claude Mythos Preview 완전 분석 — SWE-bench 93.9%, Project Glasswing, 개발자 보안 대응 가이드2026-04-21Claude Opus 4.7 완전 분석 — xhigh 노력 레벨, Task Budget, 토크나이저 마이그레이션 가이드2026-04-17Anthropic Claude Partner Network — $100M 투자로 엔터프라이즈 AI 생태계 구축2026-03-22Morgan Stanley AI 브레이크스루 경고 — 세계가 준비되지 않은 AI 대도약2026-03-23