Google DeepMind, AI-생성 텍스트 탐지를 돕기 위한 오픈소스 워터마크 도구를 출시
서두르시나요? 이것이 핵심 정보입니다!
- Google DeepMind가 새로운 무료 오픈소스 도구인 SynthID-Text를 출시했습니다
- SynthID 기술은 이제 AI가 생성한 텍스트, 오디오, 비디오, 이미지를 감지할 수 있습니다
- 이 연구는 Nature에 더욱 기술적인 세부사항과 함께 발표되었습니다
Google DeepMind는 이번 수요일에 AI로 생성된 텍스트를 감지하는 데 도움이 되는 오픈 소스 워터마크 도구인 SynthID-Text를 출시했습니다. 이 도구는 무료로 기업과 개발자에게 제공되며, 생성 과정에서 단어의 확률을 변경함으로써 인간의 눈에는 감지할 수 없는 보이지 않는 워터마크를 텍스트에 삽입하는 방식으로 작동합니다.
“여기에서는 텍스트 품질을 보존하고 높은 감지 정확도를 가능하게 하며 최소한의 대기 시간 오버헤드를 가진 생산 준비가 완료된 텍스트 워터마킹 체계인 SynthID-Text를 설명합니다.”라고 Nature에 발표된 연구의 초록에 기재되어 있습니다. “대규모 워터마킹을 가능하게 하기 위해, 우리는 생산 시스템에서 자주 사용되는 효율성 기법인 추측적 샘플링과 워터마킹을 통합하는 알고리즘을 개발했습니다.”
MIT Technology Review에 따르면, 기술 거인의 AI 연구실은 SynthID 기술을 개발하여 이제 AI가 생성한 텍스트, 음악, 비디오, 이미지를 인식할 수 있는 여러 AI 워터마크 도구를 만들었습니다. Google DeepMind는 이 기술이 어떻게 다양한 미디어에서 작동하는지 설명하는 비디오를 공유했습니다.
Here’s how SynthID watermarks AI-generated content across modalities. ↓ pic.twitter.com/CVxgP3bnt2
— Google DeepMind (@GoogleDeepMind) 2024년 10월 23일
SynthID는 Google의 책임감 있는 생성 AI 툴킷을 통해 이용할 수 있으며, 연구자들은 Hugging Face와 협력하여 이를 그들의 사이트에 공유하고 있습니다. Hugging Face는 LeRobot의 집에서 AI로 작동하는 로봇을 만들기 위한 튜토리얼과 같은 다른 오픈소스 프로젝트를 호스팅하는 개발자들을 위한 협력 플랫폼입니다.
“이제 다른 [생성] AI 개발자들이 이 기술을 사용하여 텍스트 출력이 자신들의 [대규모 언어 모델]에서 나온 것인지 감지하는 데 도움을 줄 수 있게 되어, 더 많은 개발자들이 AI를 책임감 있게 만드는 데 도움이 될 것입니다.”라고 Google DeepMind의 연구 부사장인 Pushmeet Kohli가 MIT Technology Review에 전했습니다.
SynthID는 구글의 제미니 제품에서 테스트되었으며, 수백만 명의 사용자들이 워터마크가 있는 컨텐츠와 없는 컨텐츠를 구분하지 못했습니다. 그러나, 연구자들은 텍스트가 편집되거나 번역될 경우 이 도구의 한계를 인정하면서도, 이 도구가 잘못된 정보를 막고 AI의 안전성을 향상시키는 데 도움이 될 것이라는 낙관적인 견해를 유지하고 있습니다.
지난 몇 달 동안 여러 기술 회사들이 AI 라벨링 전략을 발표해 왔습니다. Meta는 2월에 Instagram, Facebook, 그리고 Threads에서 AI 콘텐츠를 식별하는 시스템을 발표했고, Google은 3월에 사용자들이 AI 콘텐츠를 라벨링하도록 요구했습니다. 그리고 Tiktok은 5월에 AI로 생성된 콘텐츠에 라벨을 추가했습니다.
댓글 달기
취소