DeepSeek, 지금까지 나온 가장 강력한 오픈 소스 AI인 3V 모델을 공개합니다.

Photo by Mimi Thian on Unsplash

DeepSeek, 지금까지 나온 가장 강력한 오픈 소스 AI인 3V 모델을 공개합니다.

읽는 시간: 2 분

이번 주, 중국의 인공지능 회사 딥씨크(DeepSeek)가 그들의 최신 오픈소스 모델인 ‘딥씨크-V3’를 공개했습니다. 이 스타트업은 새롭게 개발한 이 대형 모델이 671B의 매개변수를 포함하고 있으며, 오픈AI의 GPT-4o와 앤트로픽의 Claude-Sonnet-3.5와 같은 최전선 모델보다 더 나은 성능을 발휘할 수 있다고 주장하고 있습니다.

바쁘신가요? 여기 빠른 사실들을 확인하세요!

  • DeepSeek가 자사의 최신 AI 모델인 DeepSeek-V3를 출시하며 이 모델이 GPT 4o와 Claude-Sonnet-3.5보다 성능이 뛰어나다고 주장하였습니다.
  • 이 중국 AI 회사는 새 모델이 671B의 파라미터를 포함하며 이전 모델보다 3배 빠르다고 설명했습니다.
  • DeepSeek-V3는 현재 시장에서 가장 강력한 오픈 소스 AI 모델입니다

사용자들은 공식 웹사이트를 통해 이 모델과 상호 작용할 수 있으며, 회사의 논문을 읽고 Hugging Face를 통해 모델에 접근할 수 있습니다. DeepSeek는 이 새로운 모델이 지난 11월에 출시된 이전 버전보다 세 배 빠르며, 강화된 기능과 API 호환성을 가지고 있다고 밝혔습니다.

“우리는 DeepSeek-V3를 소개합니다. 이것은 총 671B개의 매개변수를 가진 강력한 Mixture-of-Experts (MoE) 언어 모델로, 각 토큰마다 37B가 활성화되어 있습니다.”라고 회사는 GitHub에서 썼습니다. “포괄적인 평가 결과, DeepSeek-V3는 다른 오픈 소스 모델들을 뛰어넘고, 선두를 달리는 클로즈드 소스 모델들과 비교할 수 있는 성능을 보여줍니다.”

많은 사용자들, 기관들, 그리고 회사들이 DeepSeek의 성과를 축하하였습니다. Hugging Face는 “탁월한 릴리즈를 축하합니다!”라며 X에서 적었습니다, “모델 체크포인트와 상세한 보고서 – 진짜 크리스마스가 왔군요!”

Andrej Karpathy—오픈AI의 전 연구원이자 테슬라의 AI 팀장—도 몇 가지 생각을 공유했습니다. “DeepSeek (중국 AI 회사)은 오늘 프론티어급 LLM 훈련을 위한 오픈 웨이트 릴리즈를 통해 쉽게 보이게 만들었습니다. (2개월 동안 2048개의 GPU, 600만 달러 예산으로도 농담처럼 쉽게 처리했습니다.)”

DeepSeek-V3는 현재 시장에서 가장 강력한 오픈 소스 AI 모델 중 하나이며, 유료 API는 시장에서 가장 저렴한 것 중 하나로 남아 있습니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
0 0명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

댓글 달기

Loader
Loader 더 보기