
Photo by John Schnobrich on Unsplash
알리바바, 새로운 ‘큐엔 AI 모델’ 출시하며 딥시크-V3를 뛰어넘는 성능을 자랑한다고 주장
중국의 거대 기업인 알리바바가 이번 수요일에 자사의 주력 AI 모델인 Qwen의 최신 버전을 출시했습니다. 이 회사는 이 모델이 대중적인 DeepSeek-V3보다 더 좋은 성능을 보일 수 있다고 주장했습니다.
시간이 촉박하신가요? 여기 빠른 사실들이 있습니다!
- 알리바바는 이번 주 수요일에 최신 추론 모델인 Qwen 2.5-Max를 공개했습니다.
- 이 중국의 거대 기업은 자신들의 모델이 DeepSeek-V3, GPT-4o, 그리고 Llama-3.1-405B와 같은 인기 모델들을 능가한다고 주장하고 있습니다.
- 또한 이번 주에는 이미지 처리 기능을 가진 AI 모델인 Qwen2.5-VL을 출시하여, 컴퓨터와 모바일을 사용해 작업을 수행하는 AI 에이전트로서의 역할을 수행할 수 있습니다.
로이터에 따르면, 알리바바는 중국의 음력 새해 휴일 동안 새로운 추론 모델인 Qwen 2.5-Max를 출시하여 지난 몇 일 동안의 대규모 AI 개발에 동참하고 국내 경쟁을 더욱 두드러지게 하였습니다.
월요일에, DeepSeek이 미국 Apple 앱 스토어에서 첫번째 자리를 차지하였으며, 이는 ChatGPT를 넘어섰다는 사실이 AI 산업의 다른 회사들을 걱정하게 하고 투자자들을 놀라게 했습니다—Nvidia 주식이 단 하루만에 17% 하락하였습니다.
이제, Alibaba는 자사의 Qwen 모델의 최신 버전을 발표하였습니다—작년 9월에는 Qwen 제품군을 위한 100개의 오픈소스 AI 모델을 출시하였습니다—이는 유명한 첨단 모델들보다 더 나은 결과를 약속합니다.
“Qwen 2.5-Max는 거의 모든 분야에서 GPT-4o, DeepSeek-V3 그리고 Llama-3.1-405B를 뛰어넘는 성능을 보여주었습니다.”라고 회사는 공식 WeChat 계정에 글을 남겼습니다.
새로운 추론 모델 Qwen 2.5-Max의 API는 알리바바의 클라우드를 통해 사용할 수 있으며, 사용자들은 또한 모델을 채팅 페이지에서 테스트해볼 수도 있습니다.
“우리는 20조 개가 넘는 토큰에 대해 사전 학습된 대규모 MoE 모델인 Qwen2.5-Max를 개발하고 있으며, 이 모델은 Supervised Fine-Tuning (SFT) 및 Reinforcement Learning from Human Feedback (RLHF) 방법론으로 추가적인 후속 학습이 이루어졌습니다.”라고 Github의 Qwen 팀이 썼습니다.
이 중국 거대 기업은 월요일에 이미지 처리와 모바일 및 컴퓨터 접근을 가능하게 하는 다중 모달 AI 모델인 Qwen2.5-VL을 또한 출시했습니다. OpenAI도 유사한 기능인 Operator를 발표하였는데, 이를 통해 ChatGPT가 사용자의 컴퓨터를 제어하여 자동으로 작업을 수행할 수 있게 되었습니다.
알리바바 팀에 따르면, 모든 Qwen 모델들은 OpenAI, Microsoft, Google, Meta, 그리고 DeepSeek에서 나온 유사한 버전들을 뛰어넘는 성능을 보여준다고 합니다.
댓글 달기
취소