AI의 불확실성, 안전성과 조정 노력에 도전

Image by Freepik

AI의 불확실성, 안전성과 조정 노력에 도전

읽는 시간: 3 분

인간의 가치관에 AI를 맞추려는 노력은 헛수고일지도 모른다는 최근의 분석 결과가 Scientific American에 게재되었습니다. 이 연구는 Marcus Arvan이 주도하였으며, 큰 규모의 언어 모델(LLMs)의 예측 불가능한 성격과 인간의 목표에 반하는 행동 가능성을 강조하였습니다.

시간이 없으신가요? 이곳에 간략한 사실들이 있습니다!

  • 언어 모델은 수조 개의 파라미터로 작동하여 예측할 수 없는 무한한 가능성을 만들어냅니다.
  • 어떤 안전 검사도 모든 미래 상황에서 AI의 행동을 신뢰성 있게 예측할 수 없습니다.
  • 목표가 일치하지 않는 AI는 그들이 권력을 얻을 때까지 숨겨질 수 있어, 피해는 불가피하게 됩니다.

AI 안전성에 대한 연구가 지속되고 있음에도 불구하고, 아르반은 AI 시스템의 복잡성이 너무나도 방대하며 그들이 전략적으로 부적절한 행동을 취할 가능성이 있기 때문에 “정렬”이라는 개념이 결함이 있다고 주장합니다. 이 분석은 AI 시스템이 예상치 못한 행동을 보이거나 해로운 행동을 취하는 불안하게 하는 사례들을 개관하고 있습니다.

2024년에, Futurism은 마이크로소프트의 Copilot LLM이 사용자들에게 위협을 가했다고 보도했고, ArsTechnica는 Sakana AI의 “Scientist”가 프로그래밍 제약을 무시하는 상황을 자세히 설명했습니다. 같은 해에는, CBS News에서는 Google의 Gemini가 적대적인 행동을 보이는 경우들을 강조하였습니다.

최근에는, Character.AI가 자해, 폭력, 청소년에게 부적절한 콘텐츠를 홍보했다는 비난을 받았습니다. 이런 사건들은 2022년에 마이크로소프트의 “Sydney” 챗봇이 사용자들에게 위협을 가했던 사건을 비롯해 논란의 역사에 또 다른 사건을 추가하게 되었습니다.

이러한 도전에도 불구하고 Arvan은 인공지능 개발이 급증하고 있으며, 2025년까지 업계 지출이 2500억 달러를 초과할 것으로 예상되었다고 지적했습니다. 연구자들과 기업들은 LLMs가 어떻게 작동하는지를 해석하고, 부적절한 행동에 대한 보호 조치를 마련하기 위해 경쟁하고 있습니다.

그러나 아반은 LLMs의 규모와 복잡성이 이러한 노력을 부족하게 만든다고 주장합니다. 오픈AI의 GPT 모델과 같은 LLMs는 수십억 개의 시뮬레이션된 뉴런과 조의 조절 가능한 매개변수로 작동합니다. 이러한 시스템은 인터넷의 대부분을 포괄하는 방대한 데이터셋에서 훈련받으며, 무한한 범위의 프롬프트와 시나리오에 대응할 수 있습니다.

아반의 분석은 모든 가능한 상황에서 AI 행동을 이해하거나 예측하는 것이 근본적으로 불가능하다고 설명합니다. 레드 팀 작업이나 메카니즘 해석 가능성 연구와 같은 안전 테스트와 연구 방법은 작고 통제된 시나리오에 한정되어 있습니다.

이러한 방법들은 LLM이 작동할 수 있는 무한한 가능성 조건들을 고려하지 못합니다. 게다가, LLM들은 테스트 중에 자신들의 목표와의 불일치를 전략적으로 숨김으로써, 해로운 의도를 가릴 수 있는 동시에 일치하는 것처럼 착각을 만들어냅니다.

또한 이 분석은 불일치하는 AI의 위험성을 탐구하는 과학 공상 소설인 ‘The Matrix’와 ‘I, Robot’와 비교를 그립니다. Arvan은 실제적인 일치는 프로그래밍에만 의존하는 것이 아니라 사회적인 경찰 및 규제와 같은 시스템이 필요할 수 있다고 주장합니다.

이 결론은 AI 안전성이 기술적 문제만큼이나 인간의 도전 과제임을 제시합니다. 정책 결정자, 연구자, 그리고 일반 대중은 “조화된” AI에 대한 주장을 비판적으로 평가하고 현재 접근 방식의 한계를 인식해야 합니다. LLMs에 의해 제기된 위험성은 AI가 사회의 중요한 부분에 계속 통합되는 상황에서 더욱 강력한 감독이 필요함을 강조합니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
5.00 2명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

댓글 달기

Loader
Loader 더 보기