알리바바, 새로운 ‘큐엔 AI 모델’ 출시하며 딥시크-V3를 뛰어넘는 성능을 자랑한다고 주장

Photo by John Schnobrich on Unsplash

알리바바, 새로운 ‘큐엔 AI 모델’ 출시하며 딥시크-V3를 뛰어넘는 성능을 자랑한다고 주장

읽는 시간: 2 분

중국의 거대 기업인 알리바바가 이번 수요일에 자사의 주력 AI 모델인 Qwen의 최신 버전을 출시했습니다. 이 회사는 이 모델이 대중적인 DeepSeek-V3보다 더 좋은 성능을 보일 수 있다고 주장했습니다.

시간이 촉박하신가요? 여기 빠른 사실들이 있습니다!

  • 알리바바는 이번 주 수요일에 최신 추론 모델인 Qwen 2.5-Max를 공개했습니다.
  • 이 중국의 거대 기업은 자신들의 모델이 DeepSeek-V3, GPT-4o, 그리고 Llama-3.1-405B와 같은 인기 모델들을 능가한다고 주장하고 있습니다.
  • 또한 이번 주에는 이미지 처리 기능을 가진 AI 모델인 Qwen2.5-VL을 출시하여, 컴퓨터와 모바일을 사용해 작업을 수행하는 AI 에이전트로서의 역할을 수행할 수 있습니다.

로이터에 따르면, 알리바바는 중국의 음력 새해 휴일 동안 새로운 추론 모델인 Qwen 2.5-Max를 출시하여 지난 몇 일 동안의 대규모 AI 개발에 동참하고 국내 경쟁을 더욱 두드러지게 하였습니다.

월요일에, DeepSeek이 미국 Apple 앱 스토어에서 첫번째 자리를 차지하였으며, 이는 ChatGPT를 넘어섰다는 사실이 AI 산업의 다른 회사들을 걱정하게 하고 투자자들을 놀라게 했습니다—Nvidia 주식이 단 하루만에 17% 하락하였습니다.

이제, Alibaba는 자사의 Qwen 모델의 최신 버전을 발표하였습니다—작년 9월에는 Qwen 제품군을 위한 100개의 오픈소스 AI 모델을 출시하였습니다—이는 유명한 첨단 모델들보다 더 나은 결과를 약속합니다.

“Qwen 2.5-Max는 거의 모든 분야에서 GPT-4o, DeepSeek-V3 그리고 Llama-3.1-405B를 뛰어넘는 성능을 보여주었습니다.”라고 회사는 공식 WeChat 계정에 글을 남겼습니다.

새로운 추론 모델 Qwen 2.5-Max의 API는 알리바바의 클라우드를 통해 사용할 수 있으며, 사용자들은 또한 모델을 채팅 페이지에서 테스트해볼 수도 있습니다.

“우리는 20조 개가 넘는 토큰에 대해 사전 학습된 대규모 MoE 모델인 Qwen2.5-Max를 개발하고 있으며, 이 모델은 Supervised Fine-Tuning (SFT) 및 Reinforcement Learning from Human Feedback (RLHF) 방법론으로 추가적인 후속 학습이 이루어졌습니다.”라고 Github의 Qwen 팀이 썼습니다.

이 중국 거대 기업은 월요일에 이미지 처리와 모바일 및 컴퓨터 접근을 가능하게 하는 다중 모달 AI 모델인 Qwen2.5-VL을 또한 출시했습니다. OpenAI도 유사한 기능인 Operator를 발표하였는데, 이를 통해 ChatGPT가 사용자의 컴퓨터를 제어하여 자동으로 작업을 수행할 수 있게 되었습니다.

알리바바 팀에 따르면, 모든 Qwen 모델들은 OpenAI, Microsoft, Google, Meta, 그리고 DeepSeek에서 나온 유사한 버전들을 뛰어넘는 성능을 보여준다고 합니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
0 0명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

댓글 달기

Loader
Loader 더 보기