메타가 직원 키스트로크와 화면을 수집해 AI를 학습시키던 내부 프로그램 MCI에서 개인 대화·성과 데이터가 전직원에 노출됐어요. 1,500명 이상이 청원에 서명한 상황에서 유출까지 터지자 메타는 MCI를 긴급 중단하고 내부 조사에 들어갔어요. AI 훈련 데이터를 확보하기 위해 직원을 감시 대상으로 삼는 빅테크 관행이 다시 업계 전체의 질문을 받고 있어요.
근데, 이 이야기 솔직히 들으면 좀 섬뜩해요.
메타가 올 4월부터 직원들의 키보드 입력, 마우스 움직임, 화면 내용까지 맥북에서 실시간으로 수집하는 프로그램을 운영해 왔어요. 이름은 Model Capability Initiative, 줄여서 MCI예요. AI 에이전트에게 인간이 실제 업무를 어떻게 처리하는지 가르치기 위한 훈련 데이터를 모으는 게 목적이었죠. 업무용 노트북이 사실상 키로거가 된 셈이에요. Gmail, GChat, 내부 도구 Metamate, VSCode 전반에서 활동이 로깅됐어요.
문제는 6월 22일 터졌어요. MCI가 수집한 데이터 — 직원들의 개인 대화, 성과 기록, 대화 녹취 — 가 전직원에게 통째로 노출되는 사고가 났거든요. 메타는 이 사고를 SEV 2 등급으로 분류했는데, 이건 서비스 전체 장애 바로 다음 수준의 심각도예요.
사실 MCI에 대한 반발은 이미 몇 주 전부터 쌓이고 있었어요. 1,500명 이상의 직원이 청원서에 서명했고, 프라이버시 우려는 물론이고 노트북 배터리 소모, 언제 감시 중인지 알 수 없다는 현실적인 불만도 가득했어요. 저커버그 입장에서는 실제 인간 작업 데이터라는 황금알이었겠지만, 직원들 입장에선 내 모든 행동이 관찰된다는 느낌이었을 거예요.
처음에 메타가 내놓은 해법이 진짜 웃겨요. 30분짜리 일시 중지 옵션을 드릴게요. 솔직히 이게 말이 돼요? 감시 소프트웨어 앞에서 30분 휴식이라니요. 반발이 더 커질 수밖에 없었죠. 결국 이번 데이터 유출로 메타는 MCI를 전면 중단하고 내부 조사에 들어갔어요. 공식 성명에는 데이터가 부적절하게 접근됐다는 증거는 없다고 했지만, 전직원한테 이미 노출됐다는 게 아이러니예요.
더 큰 맥락에서 보면, 메타는 AI 훈련 데이터를 외부에서 조달하는 데 한계에 부딪혀 있어요. 웹 크롤링, 공개 데이터셋, 합성 데이터... 외부 소스는 이미 거의 소진된 상태거든요. 그래서 내부로 눈을 돌린 거예요. 직원들의 실제 업무 흐름 데이터는 어디서도 살 수 없는 고유한 자원이니까요.
사실 이건 메타만의 이야기가 아니에요. OpenAI도, 구글도, 마이크로소프트도 결국 같은 고민을 하고 있거든요. AI 에이전트가 복잡한 지식 업무를 수행하려면 실제 인간 행동 데이터가 필수예요. 직원 동의는 어디까지 받아야 하는지, 데이터는 어떻게 보호해야 하는지, 이번 사건이 업계 전체에 기준점이 될 것 같아요. 규제 기관이 개입할 가능성도 충분히 있고요.
개인적으로는 30분 일시정지를 먼저 내놓은 것 자체가 메타가 이 문제를 얼마나 가볍게 봤는지를 보여준다고 생각해요. 직원 신뢰를 잃는 건 AI 훈련 데이터를 못 얻는 것보다 훨씬 비싼 대가거든요. 앞으로 메타가 어떤 실질적인 보호 장치를 내놓을지, 그리고 이 사건이 빅테크의 직원 데이터 수집 관행에 어떤 변화를 가져올지 지켜볼 필요가 있어요. 빅테크가 스스로 선을 긋지 않으면 결국 외부에서 선이 그어지게 될 거니까요.
출처