OpenAI, 신규 “Reasoning” AI 모델인 o1 출시

Image by Ishmael Daro, from Flickr

OpenAI, 신규 “Reasoning” AI 모델인 o1 출시

읽는 시간: 2 분

OpenAI는 오늘 자사의 최신 AI 모델인 o1을 발표했습니다. 이 모델은 이전 모델들보다 복잡한 문제를 더 빠르고 정확하게 처리할 수 있도록 설계된 “추론” 모델의 새로운 계열 중 첫 번째입니다.

OpenAI는 o1 외에도 더 작고 저렴한 버전인 o1-mini를 함께 출시하고 있습니다. 이 출시는 “미리보기”라고 설명되어 있어, 해당 기술이 아직 초기 단계에 있다는 것을 의미합니다.

이전에 “Strawberry”라는 코드명으로 알려져 있던 o1은 OpenAI가 출시할 예정인 “추론” 모델의 첫 번째로, TechCrunch에서 보도했습니다.

OpenAI의 연구 책임자인 Jerry Tworek는 The Verge에게 o1의 훈련 과정은 이전 모델들과 크게 다르다고 말했지만, 회사 측은 구체적인 사항에 대해 명확하게 밝히지 않았습니다.

기존의 시스템들이 훈련 데이터의 패턴을 모방하도록 설계되었던 것과는 달리, o1은 강화 학습을 사용합니다. 이 방법은 시스템에게 보상과 처벌을 통해 문제를 해결하는 방법을 가르칩니다.

o1의 가장 눈에 띄는 특징 중 하나는 다단계 문제를 해결하고, 이전 모델들에 비해 더 높은 정확도로 코드를 작성하는 능력입니다.

예를 들어, 국제 수학 올림피아드 자격 시험에서 o1은 OpenAI의 이전 GPT-4o 모델을 능가하여 문제의 83%를 해결했습니다. 반면 GPT-4o는 문제의 13%만 해결했습니다.

이러한 성능 향상은 o1의 새로운 훈련 과정에 기인하는데, 이 과정은 OpenAI가 “사고의 연쇄” 메커니즘이라고 부르는 것을 포함하고 있습니다. 이 메커니즘은 모델에게 문제를 단계별로 분해하고 해결하는 능력을 부여합니다.

트워렉은 이 모델이 “환상”을 일으키거나, 즉 부정확한 정보를 제공하는 경향이 줄었지만, 이 문제가 완전히 해결되지 않았다고 The Verge에서 보도했다고 지적했습니다.

수학적 역량 외에도, o1은 경쟁 프로그래밍 대회에서 89 백분위에 랭크되어 개발자와 연구자 모두에게 유용한 도구가 될 가능성을 보여주었습니다.

The Verge에 따르면, o1이 인간 같은 생각을 의도적으로 흉내내는 방식이 독특하다는 것이 눈에 띄었습니다. “궁금하네요,” “생각 중이에요,” 그리고 “잠깐 보게요”와 같은 표현들은 실제로는 생각하지 않는 모델이 생각하는 것처럼 보이게 만들었습니다. 그렇다면 왜 그렇게 보이게 만들었을까요?

The Verge는 Tworek이 이 인터페이스가 모델이 문제를 더 깊게 처리하고 탐색하는데 더 많은 시간을 소요하는 것을 보여주기 위한 것이라고 설명한다고 보도했습니다.

이런 발전에도 불구하고, OpenAI는 o1이 여전히 한계를 가지고 있다는 것을 인정합니다. 복잡한 문제 해결에는 뛰어나지만, 세계에 대한 사실적인 지식을 다루는 데는 덜 능숙합니다. 또한, 웹을 탐색하거나 파일과 이미지를 처리하는 기능과 같이 GPT-4o를 매우 다양하게 만드는 일부 기능이 부족합니다.

게다가, o1의 새로운 능력은 비용을 수반합니다. 이 모델은 GPT-4o보다 사용 비용이 훨씬 많이 듭니다. OpenAI의 API에서, o1-preview는 1백만 개의 입력 토큰당 $15이고, 1백만 개의 출력 토큰당 $60이며, 이는 GPT-4o의 비용보다 세 배에서 네 배 더 높습니다.

아직 기술이 초기 단계에 있지만, o1의 출시는 AI가 복잡한 작업을 해결하는 능력에서의 지속적인 발전을 강조하며, 고급 문제 해결 능력이 필요한 다양한 분야에서 잠재적인 혜택을 제공합니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
0 0명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

댓글 달기

Loader
Loader 더 보기