중국 딥시크, 차세대 AI 모델 DeepSeek V3로 시장 도전장
중국의 딥시크(DeepSeek)가 새로운 오픈소스 AI 모델 DeepSeek V3를 출시하며 업계의 관심을 모으고 있다. 이 모델은 상업적 활용을 포함한 다양한 용도로 무료 다운로드 및 수정이 가능한 관대한 라이선스를 통해 공개되었다.
12월 26일(현지시간) 테크크런치(TechCrunch)에 따르면 DeepSeek V3는 코드 작성, 번역, 에세이 작성 등 텍스트 기반 작업에서 강력한 성능을 발휘하며, 기존의 오픈소스 및 비공개 AI 모델들을 뛰어넘는 결과를 보여주고 있다. 특히 프로그래밍 대회 플랫폼인 Codeforces에서 메타의 Llama 3.1 405B, 오픈AI의 GPT-4o, 알리바바의 Qwen 2.5 등을 능가하는 성능을 나타냈다.
DeepSeek V3의 주요 스펙과 성능
DeepSeek V3는 6710억 개의 매개변수를 자랑하며, 이는 메타의 Llama 3.1 405B 모델보다 약 1.6배 더 큰 규모다. 이 모델은 약 14조 8천억 개의 고품질 데이터 토큰을 사용해 훈련되었으며, 코드 통합 및 텍스트 생성 작업에서 탁월한 성능을 발휘한다. 또한, 초당 60개의 토큰을 처리하는 속도를 보이며 이전 버전보다 3배 빠르게 작동한다.
저예산으로 대규모 AI 개발 성공
DeepSeek은 훈련 과정에서 Nvidia H800 GPU를 활용, 단 2개월간 약 550만 달러(약 77억 원)의 비용으로 모델 개발에 성공했다. 이는 AI 모델 개발 비용으로 일반적으로 예상되는 수천억 원의 예산에 비하면 매우 적은 액수다. 특히 미국 상무부가 중국 기업들의 이러한 GPU 구매를 제한한 상황에서 이루어진 성과라는 점에서 더욱 주목받고 있다.
정치적 한계와 규제 대응
하지만 DeepSeek V3는 민감한 정치적 질문에 답하지 않는 제한점을 가지고 있다. 이는 중국 인터넷 규제 기관의 지침에 따라 ‘사회주의 핵심 가치’를 반영해야 하는 규정에 따른 것이다. 딥시크는 규제 요구사항을 충족시키기 위해 모델의 일부 응답을 제한한 것으로 보인다.
딥시크와 하이플라이어 캐피털의 협력
DeepSeek은 중국의 양자 헤지펀드 하이플라이어 캐피털(High-Flyer Capital Management)의 후원을 받고 있다. 이 펀드는 AI를 활용한 거래 전략 수립에 특화되어 있으며, 자체 서버 클러스터를 구축해 AI 모델 훈련에 사용하고 있다. 하이플라이어 캐피털은 최근 1,000대 이상의 Nvidia A100 GPU를 사용한 클러스터를 구축하며 AI 개발에 대한 적극적인 투자를 아끼지 않고 있다.
글로벌 AI 경쟁에서의 전망
DeepSeek V3는 기술적 성과와 비용 효율성 면에서 주목할 만하지만, 규제와 관련된 제한사항이 글로벌 시장에서의 경쟁력에 영향을 미칠 수 있다. 그럼에도 불구하고 오픈소스 방식으로 공개된 이 모델은 AI 분야의 새로운 가능성을 제시하며 업계 내 경쟁과 발전을 촉진할 것으로 기대된다.