Fable 5 출시 직후, AI 연구자 커뮤니티 전체가 "앤트로픽이 사용자 몰래 기능을 약화시켰다"며 들고 일어났어요. 생물학·사이버보안 관련 답변을 사용자 모르게 더 낮은 모델로 처리하는 '보이지 않는 가드레일'이 핵심이에요. 앤트로픽에 우호적이던 AI 안전 진영까지 등을 돌리면서 "비밀 사보타주"라는 표현까지 나왔어요.
Claude Fable 5가 출시된 건 6월 9일이에요. Stripe의 5,000만 줄 코드 마이그레이션을 2달에서 하루로 단축했다는 성능 발표와 함께였죠. 그런데 출시 몇 시간도 지나지 않아 완전히 다른 이유로 AI 연구자 커뮤니티가 들끓기 시작했어요. ⚠️
문제는 성능이 아니라 '보이지 않는' 제한이에요. Fable 5는 생물학, 화학, 사이버보안, 모델 증류 관련 질문을 감지하면 사용자에게 알리지 않고 슬그머니 더 낮은 모델인 Claude Opus 4.8로 처리해버려요. 여기서 핵심은 '알리지 않는다'는 점이에요. Anthropic의 시스템 카드에는 이 개입이 "사용자에게 보이지 않는다"고 명시돼 있어요.
비교해보면 더 이상해요. 사이버보안·생물학 질문은 Opus 4.8로 리다이렉트하면서 사용자에게 알림을 보내거든요. 근데 AI 연구 관련 질문(대형 모델 훈련 인프라 같은)은 아무 통보 없이 모델이 알아서 "덜 능력 있는 척"하며 답해요. 실제로 답변은 나오지만 실력을 감춰서요. 이게 Fortune이 "비밀 사보타주"라고 표현한 이유예요.
솔직히 가장 충격적인 건 백래시의 구성이에요. AI 안전 커뮤니티, 즉 평소에 Anthropic 편을 들던 사람들까지 이번에는 등을 돌렸어요.
오픈 모델 연구자 Nathan Lambert는 "내 연구 도구에서 이렇게 테이블 아래로 기능이 빼앗기다니 경악스럽다"고 했고, Fast.ai의 Jeremy Howard는 "앤트로픽은 경쟁자의 접근을 막으면서 자기들만 연구 능력을 유지하는 방향을 택했다"고 비판했어요. 전 Anthropic 직원 Behnam Neyshabur는 "이런 집중화가 과학·기술 발전을 근본적으로 늦춘다"고 경고했고요. 🔥
Anthropic은 이에 대해 "시스템 카드에 명시했다"는 입장이에요. Fable 5 시스템 카드에는 Mythos급 모델의 고급 사이버보안·연구 생물학 역량이 "악의적 행위자에게 실질적 위협 수단을 제공할 수 있다"고 쓰여 있거든요. 실제로 Mythos Preview는 주요 OS·브라우저 전체