구글의 드리머 AI, 훈련 없이 마인크래프트 게임하는 법 배워

Image by Oberon Copeland, from Unsplash

구글의 드리머 AI, 훈련 없이 마인크래프트 게임하는 법 배워

읽는 시간: 2 분

구글 DeepMind의 새로운 AI 시스템이 사람의 지시 없이 마인크래프트에서 다이아몬드를 수집하는 방법을 파악했습니다 – 이는 게임의 가장 어려운 도전 중 하나입니다.

시간이 촉박하신가요? 다음은 주요 사실들입니다:

  • 드리머 AI가 인간의 가이드 없이 마인크래프트 다이아몬드 퀘스트를 완수하였습니다.
  • AI는 상상력을 사용하여 행동의 결과를 예측하였습니다.
  • 드리머는 9일 만에 전문가 수준을 달성하였습니다.

Dreamer라는 이름의 AI는 스스로 마인크래프트를 배우고 단지 아홉 일 만에 전문가 수준에 도달했습니다. 이는 자신의 행동이 미래에 어떤 결과를 가져올지 상상하며 이루어졌습니다. 이 사실은 Nature에 게재된 연구에서 보고되었습니다.

“드리머는 일반 AI 시스템을 향한 중요한 한 걸음을 표시합니다,”라고 구글 DeepMind의 컴퓨터 과학자인 다니야르 하프너가 Tech Xplore에서 보도했다. “AI가 물리적 환경을 이해하고 시간이 지남에 따라 스스로 향상시키는 것을 가능하게 합니다. 이를 위해 사람이 무엇을 해야 하는지 정확히 알려줄 필요가 없습니다,”라고 그는 덧붙였습니다.

매달 1억 명 이상의 사용자들이 무작위로 생성된 3D 세계를 경험하기 위해 마인크래프트를 플레이합니다. 다이아몬드를 찾기 위해서는, 사용자들은 목재 수집부터 시작하여 도구 제작, 화로 건설, 철 추출, 그리고 마지막으로 지하 발굴 등 여러 단계를 거쳐야 합니다.

대부분의 플레이어들에게는 몇 시간의 게임 플레이가 필요한 과정입니다. 그러나 Dreamer는 성공적인 시도를 유지하고 실패한 시도를 무시함으로써 새로운 행동을 발견하는 ‘강화 학습‘을 사용했습니다. 팀은 각 단계마다 작은 보상을 제공했는데, 이는 판자를 만들거나 철을 채굴하는 것과 같은 행동을 포함했습니다. 그들은 패턴을 외우는 것을 방지하기 위해 30분마다 게임을 재설정했습니다.

인간의 플레이를 ‘관찰’하여 학습했던 이전의 AI 시스템과 달리, Dreamer는 자동으로 작동하며, 인간의 시연이나 단계별 지시가 필요하지 않았습니다. 시스템의 내부 “세계 모델” 생성 기능은 행동을 취하기 전에 그 결과를 예측할 수 있게 해주었습니다.

“세계 모델은 AI 시스템에 미래를 상상할 수 있는 능력을 부여한다”라고 Hafner는 Tech Xplore에 보도한 바 있다. 브리티시컬럼비아 대학교의 AI 전문가인 Jeff Clune는 이 성과를 “필드의 큰 발전”이라고 평가하였다고 Tech Xplore는 보도했다.

사람들이 약 20-30분 만에 다이아몬드를 찾아낼 수 있는 반면에, Dreamer는 같은 일을 하기 위해 9일이라는 시간이 필요했습니다. 그러나 연구자들은 이 작업이 비디오 게임을 넘어서 훨씬 더 넓은 영향을 미칠 것이라고 믿고 있다.

“이것으로 로봇이 실제 세계에서 목표를 달성하는 방법을 스스로 가르칠 수 있게 될 것입니다.” 하프너는 Tech Xplore에서 보도된 바와 같이 덧붙였습니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
0 0명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

댓글 달기

Loader
Loader 더 보기