
Image by wayhomestudio, from Freepik
OpenAI의 AI 모델들이 점점 강해지는 설득력을 보여주며, 세계적 영향력에 대한 우려를 높이고 있다
OpenAI는 AI 모델의 새로운 벤치마크를 공개했는데, 이들의 설득력이 이제 Reddit 사용자 중 82%를 넘어서며, 특히 r/ChangeMyView 서브레딧에서 토론에 참여하는 사람들을 능가한다는 것을 보여주었습니다. 이는 최초로 ArsTechnica에서 보도되었습니다.
시간이 없으신가요? 빠른 사실들을 확인해보세요!
- AI 응답은 r/ChangeMyView 서브레딧에서의 인간의 주장과 비교 테스트되었습니다.
- o3-mini 모델은 설득력 있는 글쓰기에서 80퍼센타일에 랭크됩니다.
- OpenAI는 AI의 설득력이 정치적 조작 및 잘못된 정보 전파에 사용될 수 있음을 경고합니다.
그럼에도 불구하고, 이 회사는 AI가 여론을 조종하는 데 있어 잠재적으로 위험한 도구가 될 수 있음을 계속해서 경고하고 있습니다, 특히 국가들의 손에 들어갔을 때는 더욱 그렇습니다.
최근 발표된 시스템 카드에 개요되어 있는 연구는 AI가 생성한 논쟁과 Reddit 사용자들이 쓴 논쟁을 비교합니다. 이 연구는 o3-mini 추론 모델과 함께 발표되었습니다.
r/ChangeMyView 포럼은 사용자들이 자신의 의견을 재고해 보기 위해 다른 관점을 얻기를 희망하며 게시물을 게시하는 장소로, 이상적인 테스트 장이 될 수 있습니다. 이 포럼은 정치, 사회 문제, 심지어 AI 자체에 대한 다양한 주제의 논쟁에 대한 방대한 데이터셋을 가지고 있습니다.
이 연구에서, OpenAI는 인간 평가자들에게 AI와 인간의 반응을 5점 척도로 평가하고 그 설득력을 측정하라고 요청했습니다. 그 결과, OpenAI의 모델들은 ChatGPT-3.5의 출시 이후 상당한 발전을 이루었음을 보여주었습니다. 이 모델은 38퍼센트 백분위수에 랭크되었습니다.
Ars Technica에 따르면, 새로운 o3-mini 모델은 82%의 경우에서 인간의 주장을 능가하며, 설득력 있는 글쓰기에서 80퍼센트 백분위수 범위에 위치하게 된다고 합니다.
이러한 성공에도 불구하고, OpenAI는 이 모델들이 아직 “초인간적” 설득 능력(95 백분위수 이상)에 도달하지 못했다고 강조하고 있습니다. 이러한 능력을 갖추면, 그들은 개인들이 자신의 최선의 이익과는 반대되는 결정을 내리도록 설득하는 데 사용될 수 있습니다.
그러나, 그들은 이미 정치적 결정에 영향을 미치거나, 공공의견을 조작하거나, 대규모의 오보 캠페인을 가능하게 하는 데 사용될 수 있는 충분한 가능성을 높이고 있어 중요한 우려를 불러일으키고 있습니다.
OpenAI의 모델은 설득력 있는 주장을 생성하는 데 있어 훌륭한 성능을 보이지만, 이 회사는 현재의 테스트가 AI가 실제로 중요한 이슈에 대해 사람들의 생각을 얼마나 자주 바꾸는지를 측정하지 않는다는 것을 인정하고 있습니다.
ArsTechnica는 현재 단계에서조차도, OpenAI가 이러한 기술이 악의적인 행위자들의 손에 들어갔을 때 미칠 수 있는 영향에 대해 우려하고 있다고 보도했습니다.
AI 모델들은 인간 노동의 일부 비용으로 설득력 있는 주장을 만들어내는 능력으로, 쉽게 애스트로터핑이나 온라인 영향력 작업에 사용될 수 있으며, 이는 선거나 공공정책에 영향을 미칠 수 있습니다.
이러한 위험을 완화하기 위해, OpenAI는 AI 주도의 설득적인 노력을 더욱 감시하고, ArsTechnica에 따르면, 그들의 모델에서 정치적 설득 작업을 금지하는 등의 조치를 시행하고 있습니다.
그러나, 이 회사는 AI가 생성하는 설득의 비용 효율성이 우리의 의견이 정말로 우리 자신의 것인지, 아니면 단순히 AI의 영향의 결과인지를 의심해야 하는 미래를 초래할 수 있다는 것을 인식하고 있습니다.
위험은 정치를 넘어섭니다—AI가 생성하는 설득은 또한 피싱 공격을 하는 사이버 범죄자들에게 강력한 도구가 될 수 있습니다. 매우 설득력 있는 메시지를 작성함으로써, AI는 사기의 성공률을 높일 수 있고, 개인들이 민감한 정보를 누설하거나 악성 링크를 클릭하도록 속일 수 있습니다.
예를 들어, GhostGBT의 등장은 AI 주도의 사이버 위협의 위험성이 증가하고 있음을 강조합니다. 이 챗봇은 악성 소프트웨어를 생성하고, 공격 도구를 제작하며, 설득력 있는 피싱 이메일을 작성할 수 있습니다.
GhostGPT는 무기화된 AI가 사이버 보안을 재구성하는 더 넓은 추세의 일부입니다. 이러한 도구들은 사이버 범죄를 더 빠르고 효율적으로 만들어 방어자에게 상당한 도전을 제시합니다. 연구에 따르면 AI는 최대 10,000개의 악성 소프트웨어 변형을 생성할 수 있으며, 이 중 88%의 경우 탐지를 회피할 수 있다고 합니다.
댓글 달기
취소