구글이 6월 9일 실시간 음성 통역 AI 'Gemini 3.5 Live Translate'를 전 세계에 출시했어요. 70개 이상 언어를 거의 지연 없이 통역하면서 화자의 목소리 톤·속도·높낮이까지 살려줘요. Google Translate·Meet에 즉시 통합됐고, 동남아 최대 앱 Grab이 월 1,000만 통화에 테스트 중이에요.
말이 끝날 때까지 기다렸다가 통역하는 시대는 끝났어요. 구글이 6월 9일 Android·iOS 구글 번역 앱에 Gemini 3.5 Live Translate를 전 세계 동시 출시했는데, 이건 단순한 번역 기능 업데이트가 아니에요. 화자의 말이 이어지는 동안 실시간으로 번역 음성을 생성하면서 원래 말투·속도·음높이까지 재현하는 완전히 새로운 AI 모델이에요. 📊
근데 여기서 핵심은 '지연 시간'이에요. 기존 통역 앱들은 발화가 끝난 뒤 처리하거나, 문장 단위로 끊어서 번역했잖아요. Live Translate는 화자 뒤로 몇 초만 따라가면서 음성을 연속으로 생성해요. 회의나 강의에서 쓰기엔 충분한 속도예요.
솔직히 이 기능이 가장 빛나는 건 다국어 회의 환경이에요. Google Meet 기업 고객은 현재 비공개 미리 보기로 사용할 수 있고, 한 회의에서 2,000가지 이상 언어 조합을 처리할 수 있어요. 영어로 말하면 일본어로 바뀌고, 스페인어로 답하면 독일어로 동시에 나오는 식이에요.
특히 흥미로운 건 SynthID 워터마킹이에요. Live Translate가 생성하는 모든 번역 음성에 구글의 SynthID 기술이 자동으로 삽입돼요. 나중에 그 음성이 퍼지더라도 AI가 만든 거라는 걸 추적할 수 있다는 얘기예요. 딥페이크 음성이 넘쳐나는 시대에 이건 꽤 중요한 안전장치예요. 🔬
사실 가장 눈에 띄는 실제 적용 사례는 동남아 최대 라이드헤일링 앱 Grab이에요. Grab은 현재 이 기술을 드라이버-승객 간 커뮤니케이션에 테스트하고 있는데, 매달 1,000만 건 이상의 음성 통화가 이루어지거든요. 단일 서비스로는 이 정도 규모의 실전 테스트는 처음이에요. 운전기사가 승객의 목적지를 알아듣지 못해도 AI가 즉시 통역해주는 시나리오인데, 말하자면 동남아 전역에서 동시에 열리는 대형 베타 테스트예요.
Gemini Live API를 통해 개발자들도 직접 통합할 수 있어요. Google AI Studio에서 오늘부터 공개 미리 보기로 사용 가능하고요. 라이브 스트리밍