한 줄 핵심: 앤트로픽이 AI 사이버보안 협력 프로그램 '프로젝트 글래스윙'을 15개국 이상·150개 신규 기관으로 확대하면서 한국이 합류했다. KISA(한국인터넷진흥원), 삼성전자, SK하이닉스, SK텔레콤이 클로드 미토스(Claude Mythos)를 활용해 핵심 코드베이스의 취약점을 탐색하는 프로그램에 참여한다. 이미 글래스윙에서 1만 건 이상의 심각·치명적 취약점이 발견됐다. AI가 사이버보안 공격자의 도구에서 방어자의 도구로 전환되는 흐름을 보여주는 사례다.
이 글이 필요한 사람- AI 기반 코드 보안 감사를 서비스·인프라에 적용하려는 개발자·보안 엔지니어
- 미토스(Mythos)가 일반 AI와 다른 점과 보안 분야 활용 방식이 궁금한 분
- 국내 반도체 기업과 정부 기관이 AI 사이버보안 협력에 참여한 배경이 궁금한 분
※ 이 글은 TechCrunch·Korea Times·헤럴드경제 보도와 앤트로픽 공식 발표를 근거로 작성했습니다. 참여 기관 목록 일부는 공식 확인이 아닌 보도 기반임을 참고하세요.
프로젝트 글래스윙(Project Glasswing)은 앤트로픽이 2026년 4월 출범한 사이버보안 협력 프로그램이다. 핵심 소프트웨어의 보안 결함을 찾고 패치를 지원하는 것을 목적으로 한다. 이름은 반투명한 날개를 가진 나비 글래스윙에서 따왔다 — 취약점을 투명하게 드러내 보인다는 의미를 담은 것으로 풀이된다.
글래스윙의 핵심 도구는 클로드 미토스 프리뷰(Claude Mythos Preview)다. 앤트로픽이 공개한 것 중 가장 강력한 모델로, 사이버보안 취약점 탐지에 특화된 방식으로 운용된다. 제로데이(zero-day) 취약점 — 아직 알려지지 않은 보안 구멍 — 을 수천 개씩 수 주 만에 발견하는 것으로 알려졌다.
글래스윙의 운영 방식:
- 참여 기관이 소스코드·바이너리·인프라 설정을 앤트로픽의 보안 환경에 제출한다.
- 미토스가 이 코드를 분석해 알려지지 않은 취약점(제로데이)과 심각도 높은 기존 취약점을 탐색한다.
- 발견된 취약점 보고서와 패치 권고를 참여 기관에 전달한다.
- 데이터는 참여 기관의 동의 없이 학습에 쓰이지 않는다고 앤트로픽은 밝혔다.
6월 3일 발표 기준, 글래스윙에서 이미 심각도 높거나 치명적인 취약점 1만 건 이상이 발견됐다. 한 회사의 취약점이 얼마나 심각한지를 가늠하는 기준으로, 앤트로픽은 "대부분의 파트너에서 주요 공격이 발생하면 1억 명 이상에게 영향을 미칠 수 있다"고 밝혔다.
이번 확대에서 한국은 과학기술정보통신부가 KISA를 통해 참여하는 형태다. 정부 기관이 직접 나선 것은 외국 AI 모델이 국가 사이버보안 인프라에 접근하는 것에 대한 신중한 입장을 반영하면서도, 보안 위협이 그만큼 심각하다는 현실 인식이 반영된 것이다.
왜 삼성전자·SK하이닉스인가
반도체 기업이 AI 보안 감사를 받는 것은 이제 흔한 일이 됐다. 삼성전자와 SK하이닉스는 HBM·낸드·파운드리 등 AI 인프라의 핵심 부품을 공급한다. 이 기업들의 설계 소프트웨어, 팹 자동화 코드, 공급망 시스템에 취약점이 있다면 전 세계 AI 생산 라인이 멈출 수 있다.
반도체 보안은 크게 두 영역으로 나뉜다. 칩 자체의 하드웨어 취약점(사이드채널 공격 등)과, 반도체 설계·생산·공급망을 관리하는 소프트웨어의 취약점이다. 글래스윙은 후자 — 소프트웨어 계층 — 에 집중한다.
왜 SKT인가
SK텔레콤은 국내 최대 이동통신사다. 가입자 수천만 명의 통신 데이터가 흐르는 인프라를 운영한다. 통신사의 코어 네트워크 소프트웨어는 사이버 공격의 주요 표적이며, 취약점 하나가 광범위한 통신 장애나 데이터 유출로 이어질 수 있다. SKT는 2025년에도 대규모 사이버 공격을 경험한 이력이 있어 보안 강화 필요성이 컸다.
KISA의 역할
KISA(한국인터넷진흥원)는 국내 사이버보안 정책과 실행을 총괄하는 준정부기관이다. KISA가 직접 미토스를 활용하는 것은 국가 사이버보안 역량에 AI를 도입한다는 선언이기도 하다. 국방·금융·통신·에너지 등 주요 인프라의 보안 감사 역량이 강화될 수 있다.
클로드 미토스가 보안 취약점 탐지에서 일반 AI 모델보다 뛰어나다고 평가받는 이유가 있다. 단순히 성능이 더 높은 것이 아니라, 취약점 탐지 자체가 다른 유형의 추론 능력을 필요로 하기 때문이다.
보안 취약점 탐지가 어려운 이유
제로데이 취약점을 찾으려면 코드 한 줄을 보는 게 아니라 수천·수만 줄의 코드 흐름 전체를 추적해야 한다. 특정 입력이 어떤 경로를 따라 어떤 메모리 주소에 닿는지, 함수 호출 체인이 어디서 의도치 않은 조건을 만나는지를 이해해야 한다. 이는 단기적 답변 생성이 아니라 장기 문맥 추론이 요구되는 작업이다.
미토스는 이 방향으로 훈련·평가됐다. 앤트로픽이 공개한 것에 따르면, 미토스는 일반 사이버보안 벤치마크에서 기존 클로드 시리즈와 다른 AI를 크게 상회하며, 특히 공격자 입장에서 코드를 바라보는 '오펜시브 시큐리티' 사고방식을 모사하도록 설계됐다.
AI 보안 감사의 실체
AI가 코드를 분석해 취약점을 찾는다는 것이 실제로 어떻게 이루어지는지 이해하는 것이 중요하다.
- 정적 분석: 코드를 실행하지 않고 구조를 분석해 잠재적 위험 패턴(미인증 입력 처리, 버퍼 범위 초과 등)을 찾는다.
- 의미론적 분석: 코드의 의도와 실제 동작 사이의 간극을 파악해 로직 오류나 경쟁 조건(race condition)을 탐지한다.
- 취약점 체이닝: 개별적으로는 낮은 위험도인 여러 취약점을 조합해 심각한 공격 경로가 되는지를 추론한다.
이 세 가지를 동시에 대규모로 수행하는 것이 기존 사람 중심 보안 감사의 한계다. AI는 24시간 쉬지 않고 수백만 줄의 코드를 일관된 기준으로 분석할 수 있다.
글래스윙 같은 최상위 AI 보안 감사는 아직 대형 기관 중심이다. 하지만 일반 개발팀도 AI를 보안에 적용하는 방법이 지금 당장 있다.
지금 쓸 수 있는 AI 보안 도구
- 클로드 API + 코드 분석 프롬프트 — 현재 공개된 클로드 모델(Sonnet 계열)로도 코드 보안 리뷰를 자동화할 수 있다. 함수 단위로 "이 코드에서 SQL 인젝션, XSS, 인증 취약점이 있을 수 있는 경로를 분석해줘" 같은 프롬프트로 초기 스크리닝이 가능하다.
- GitHub Advanced Security + AI — 깃허브가 코파일럿 기반으로 제공하는 보안 스캔 기능이다. 커밋마다 자동으로 보안 이슈를 탐지한다.
- CodeRabbit, Snyk, Semgrep — AI 기반 코드 리뷰 도구들이다. 풀 리퀘스트마다 자동 보안 검토를 붙일 수 있다.
- OWASP LLM Top 10 체크리스트 — AI가 생성한 코드의 보안 위험을 점검하는 표준 가이드라인이다.
프로덕션 코드 보안 감사 순서
소규모 팀에서 AI를 보안에 적용할 때 현실적인 순서는 다음과 같다. 첫째, 기존 정적 분석 도구(Semgrep, Bandit 등)로 알려진 패턴을 자동 검출한다. 둘째, AI 코드 리뷰로 논리적 취약점과 경계 조건을 검토한다. 셋째, 중요 API 엔드포인트와 인증 로직은 수동 검토로 보완한다. 넷째, 주기적으로 의존성 취약점(npm audit, pip check 등)을 확인한다. AI는 이 과정에서 첫 번째·두 번째 단계의 효율을 크게 높이지만, 세 번째 단계를 완전히 대체하지는 못한다.
국내에서도 공공 부문과 주요 인프라 기업에 AI 보안 감사가 확산되는 것은 시간문제다. KISA가 글래스윙에 참여한 것은 그 방향을 공식화한 신호다.
프로젝트 글래스윙에 일반 기업이나 개발팀도 참여할 수 있나요?
현재 글래스윙은 '공격받으면 1억 명 이상에게 영향을 미칠 수 있는' 핵심 인프라 기관을 우선 대상으로 합니다. 참여는 초대 방식으로 운영되며 공개 신청 절차가 명시되지 않았습니다. 앤트로픽이 참여 범위를 확대하는 방향이지만, 당장 중소 개발팀이 참여하기보다는 대형 기관 중심 프로그램입니다. 유사한 AI 보안 감사를 원한다면 공개된 클로드 API나 깃허브 Advanced Security, Snyk 같은 도구를 활용하는 것이 현실적입니다.
클로드 미토스는 언제 일반에 공개되나요?
미토스는 현재 '프리뷰(Preview)' 상태로, 글래스윙 참여 기관에만 제한 접근됩니다. 앤트로픽은 일반 출시 시기를 '몇 주 내'라고 발표했지만 정확한 날짜는 공개되지 않았습니다. API 가격과 일반 접근 방법은 공식 릴리즈 발표 시 확인해야 합니다. 미토스 출시 후에는 보안 전문가들이 취약점 탐지 작업에 본격적으로 활용할 수 있을 것으로 예상됩니다.
AI가 보안 취약점을 찾으면 해당 코드가 앤트로픽의 학습 데이터로 쓰이나요?
앤트로픽은 글래스윙 참여 기관의 데이터를 동의 없이 모델 학습에 사용하지 않는다고 밝혔습니다. 민감한 소스코드와 취약점 정보는 보안상 매우 민감하므로, 실제로 참여를 결정하기 전에 앤트로픽의 데이터 처리 계약(DPA)과 보안 약정을 꼼꼼히 검토해야 합니다. 이는 어떤 AI 보안 서비스를 쓸 때도 마찬가지입니다.
삼성전자·SK하이닉스 참여가 반도체 공급망 보안에 어떤 의미인가요?
반도체 설계·제조 소프트웨어는 공급망 공격의 주요 표적입니다. 팹(fab) 자동화 코드나 EDA 도구에 취약점이 있으면 생산되는 칩 전체에 백도어가 심어질 위험이 있습니다. 삼성전자와 SK하이닉스가 AI 보안 감사를 선택한 것은, 글로벌 AI 인프라의 핵심 부품 공급자로서 공급망 보안에 대한 책임이 그만큼 크다는 현실을 반영합니다. 실제로 반도체 기업들은 최근 몇 년간 국가 주도 사이버 공격의 표적이 되는 사례가 늘었습니다.
OWASP LLM Top 10은 무엇이고 어디서 확인하나요?
OWASP LLM Top 10은 대형 언어 모델(LLM)을 활용한 애플리케이션에서 자주 발생하는 10가지 보안 위험을 정의한 가이드라인입니다. 프롬프트 인젝션, 과도한 에이전트 권한, 훈련 데이터 오염 등이 포함됩니다. owasp.org에서 무료로 확인할 수 있으며, AI 기능을 앱에 통합할 때 설계 단계에서 참고하면 보안 리스크를 사전에 줄일 수 있습니다.
AI가 찾은 취약점 1만 건은 어떤 기준으로 분류되나요?
취약점 심각도는 일반적으로 CVSS(Common Vulnerability Scoring System) 점수로 분류됩니다. 9.0~10.0이 치명적(Critical), 7.0~8.9가 높음(High), 4.0~6.9가 중간(Medium)입니다. 글래스윙에서 발견된 1만 건 이상은 '심각도 높거나 치명적' 기준이므로 CVSS 7.0 이상의 취약점을 의미합니다. 이 수치가 얼마나 많은지는 분석한 코드베이스 규모에 따라 다르지만, 인프라 소프트웨어 기준으로 상당한 규모입니다.