DeepSeek, 지금까지 나온 가장 강력한 오픈 소스 AI인 3V 모델을 공개합니다.
이번 주, 중국의 인공지능 회사 딥씨크(DeepSeek)가 그들의 최신 오픈소스 모델인 ‘딥씨크-V3’를 공개했습니다. 이 스타트업은 새롭게 개발한 이 대형 모델이 671B의 매개변수를 포함하고 있으며, 오픈AI의 GPT-4o와 앤트로픽의 Claude-Sonnet-3.5와 같은 최전선 모델보다 더 나은 성능을 발휘할 수 있다고 주장하고 있습니다.
바쁘신가요? 여기 빠른 사실들을 확인하세요!
- DeepSeek가 자사의 최신 AI 모델인 DeepSeek-V3를 출시하며 이 모델이 GPT 4o와 Claude-Sonnet-3.5보다 성능이 뛰어나다고 주장하였습니다.
- 이 중국 AI 회사는 새 모델이 671B의 파라미터를 포함하며 이전 모델보다 3배 빠르다고 설명했습니다.
- DeepSeek-V3는 현재 시장에서 가장 강력한 오픈 소스 AI 모델입니다
사용자들은 공식 웹사이트를 통해 이 모델과 상호 작용할 수 있으며, 회사의 논문을 읽고 Hugging Face를 통해 모델에 접근할 수 있습니다. DeepSeek는 이 새로운 모델이 지난 11월에 출시된 이전 버전보다 세 배 빠르며, 강화된 기능과 API 호환성을 가지고 있다고 밝혔습니다.
🚀 DeepSeek-V3를 소개합니다!
지금까지 가장 큰 도약:
⚡ 초당 60 토큰 (V2보다 3배 빠름!)
💪 강화된 기능들
🛠 API 호환성이 그대로 유지되었습니다
🌍 완전히 오픈 소스인 모델 & 논문🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 2024년 12월 26일
“우리는 DeepSeek-V3를 소개합니다. 이것은 총 671B개의 매개변수를 가진 강력한 Mixture-of-Experts (MoE) 언어 모델로, 각 토큰마다 37B가 활성화되어 있습니다.”라고 회사는 GitHub에서 썼습니다. “포괄적인 평가 결과, DeepSeek-V3는 다른 오픈 소스 모델들을 뛰어넘고, 선두를 달리는 클로즈드 소스 모델들과 비교할 수 있는 성능을 보여줍니다.”
많은 사용자들, 기관들, 그리고 회사들이 DeepSeek의 성과를 축하하였습니다. Hugging Face는 “탁월한 릴리즈를 축하합니다!”라며 X에서 적었습니다, “모델 체크포인트와 상세한 보고서 – 진짜 크리스마스가 왔군요!”
Andrej Karpathy—오픈AI의 전 연구원이자 테슬라의 AI 팀장—도 몇 가지 생각을 공유했습니다. “DeepSeek (중국 AI 회사)은 오늘 프론티어급 LLM 훈련을 위한 오픈 웨이트 릴리즈를 통해 쉽게 보이게 만들었습니다. (2개월 동안 2048개의 GPU, 600만 달러 예산으로도 농담처럼 쉽게 처리했습니다.)”
DeepSeek-V3는 현재 시장에서 가장 강력한 오픈 소스 AI 모델 중 하나이며, 유료 API는 시장에서 가장 저렴한 것 중 하나로 남아 있습니다.
댓글 달기
취소