Claude Mythos 외부 유출 사건 — Discord 그룹이 외부 계약자 통해 모델 위치 추적 | 뉴스

핵심 요약

Anthropic이 사이버 보안 특화 모델 Claude Mythos Preview를 공개한 4월 23일 당일, 비공개 Discord 채팅에 모인 일군의 사용자들이 모델에 무단 접근한 정황이 포착됐다. Anthropic은 즉시 조사에 들어갔으며, 외부 계약자 한 명이 연결고리였다는 점을 시인했다.

침해 시점: 2026-04-23 (공개 당일)
유출 경로: 외부 계약자 → Discord 그룹 채팅
접근 방식: 과거 Anthropic 내부 인프라 패턴(이전 유출 정보)을 종합해 모델 호스팅 위치 추정
영향: 미상의 인원이 일정 시간 동안 Mythos에 직접 쿼리 가능 상태
Anthropic 조치: 해당 액세스 키 즉시 무효화, FBI·내부 보안팀 합동 조사

어떻게 가능했나

Anthropic은 Mythos Preview를 "초청제 컨소시엄(Project Glasswing) 회원에게만" 제공한다고 발표했다. 그러나 컨소시엄 운영을 돕던 한 외부 계약 인력이 자신의 액세스 자격을 비공개 Discord 그룹에 공유했고, 그룹 멤버 일부는 Anthropic이 과거 외부에 노출했던 인프라 토폴로지 단서를 종합해 모델 엔드포인트를 추정해냈다.

"보안 모델이 보안 사고로 데뷔하다"

업계는 이 사건을 두고 자조적으로 표현했다. 사이버 공격을 자동화할 수 있는 모델이, 정작 출시 첫날부터 가장 단순한 인적 보안 사고(insider mismanagement)로 인해 외부에 노출됐기 때문이다.

유출 이후 시나리오

03시 30분 (UTC) — 첫 외부 쿼리 발생, 일반 캡처 형태로 출력 기록 시작
05시 00분 — Discord 그룹 멤버 중 1명이 X(트위터)에 출력 일부를 공개
06시 12분 — Anthropic 내부 모니터링이 비정상 IP·요청량 감지
07시 45분 — 외부 계약자 키 무효화, 모델 엔드포인트 IP 변경
09시 00분 — Anthropic 공식 X 계정에 "조사 중" 발표

유출된 데이터의 성격

현재까지 확인된 바로는 모델 가중치는 빠져나가지 않았다. 노출된 것은 모델 출력 일부(쿼리·응답 캡처)다. 그러나 일부 캡처에는 다음과 같은 민감 정보가 포함됐다는 분석이 있다.

Mythos가 제안한 익스플로잇 코드 스니펫 (PoC 수준)
아직 패치되지 않은 일부 OSS 라이브러리의 추정 취약점 위치
모델의 사이버 능력 한계 검증을 위해 그룹이 시도한 jailbreak 프롬프트들

Anthropic의 대응

외부 계약자 권한 전수 점검 — 192명 중 17명 즉시 권한 회수
Glasswing 회원 대상 추가 MFA·디바이스 바인딩 의무화
"제3자 노출" 가능 문서·인프라 다이어그램 외부 게시 중단
FBI 및 영국 NCSC와 정보 공유 채널 개설
5월 1일까지 사고 보고서 공개 약속 (CEO Dario Amodei)

업계가 받는 메시지

"가장 약한 고리는 사람" — 외부 계약자 관리 정책의 표준화 요구 증가
"공격 모델 = 공격 표적" — 사이버 능력 모델은 그 자체가 1순위 공격 목표
"빠른 회전이 위험을 키운다" — 6주 단위 출시 사이클이 보안 점검 시간을 줄이고 있음
주요 AI 랩들은 일제히 모델 호스팅 인프라 비공개 강화 검토

법적 함의

미국에서는 이 사고가 컴퓨터사기방지법(CFAA) 적용 대상 여부가 쟁점이다. 외부 계약자가 자격을 공유한 시점부터 그룹 멤버의 행위는 "권한 없는 접근"으로 간주될 가능성이 크다. 단 국제적으로 분산된 그룹의 경우 기소 실효성 확보가 어려울 것이라는 분석.

자주 묻는 질문

모델 가중치가 유출됐나?

현재까지의 공식 입장은 "아니다". 노출된 것은 모델 출력의 일부 캡처이며, 가중치 자체는 외부 망과 분리된 상태로 운영 중이라는 것.

일반 사용자에게 어떤 영향이 있나?

직접 영향은 없다. 다만 Mythos가 제안한 PoC 코드 스니펫이 부분적으로 유포됐을 가능성이 있어, 주요 OSS 메인테이너들은 패치 우선순위 재조정에 들어갔다.

Anthropic은 이 사고로 얼마나 신뢰를 잃을까?

단기 부정적 영향은 불가피하다. 그러나 빠른 인정·사후 공개 약속이 호평을 얻고 있어, 장기적 영향은 5월 1일 사고 보고서 품질에 달렸다는 평이다.