▲ 딥시크(DeepSeek)가 공개한 신규 AI 모델 'V3.2'와 'V3.2-스페셜(Speciale)'의 코드를 심층 분석하고 있는 글로벌 개발팀의 모습.
미국 빅테크 모델에 필적하는 성능을 오픈소스로 공개하면서 전 세계 AI 연구자들의 이목이 집중되고 있다. [사진 = 코리아비즈니스리뷰 DB]
중국 딥시크 V3.2 및 스페셜(Speciale) 모델 공개, 압도적 가성비와 성능으로 글로벌 AI 판도 뒤집기 시도
중국의 인공지능(AI) 스타트업 딥시크(DeepSeek)가 지난 일요일, 미국의 빅테크 기업들을 긴장시키는 강력한 신규 AI 모델 2종을 전격 공개했다.
이번에 발표된 '딥시크-V3.2(DeepSeek-V3.2)'와 '딥시크-V3.2-스페셜(DeepSeek-V3.2-Speciale)'은 오픈AI(OpenAI)의 GPT-5와 구글(Google)의 제미나이-3.0-프로(Gemini-3.0-Pro)에 필적하거나 이를 능가하는 성능을 갖춘 것으로 주장되고 있다.
특히, 미국의 대중국 반도체 수출 규제라는 악조건 속에서도 오픈소스(Open Source) 전략과 혁신적인 비용 절감 기술을 앞세워 글로벌 AI 시장의 새로운 경쟁 구도를 형성하고 있다.
딥시크가 이번 발표에서 가장 강조한 경쟁력은 바로 압도적인 비용 효율성이다.
그 중심에는 '딥시크 희소 어텐션(DeepSeek Sparse Attention, DSA)'이라 불리는 새로운 아키텍처 혁신이 자리 잡고 있다.
기존의 AI 어텐션 메커니즘은 입력되는 데이터의 길이가 길어질수록 연산량이 기하급수적으로 증가하는 구조적 한계를 가지고 있었다. 예를 들어, 처리 문서를 두 배로 늘리면 연산량은 네 배로 급증한다. 그러나 딥시크는 '라이트닝 인덱서(Lightning Indexer)' 기술을 통해 각 쿼리에 가장 적합한 문맥 부분만을 식별하고 나머지는 무시하는 방식으로 이러한 제약을 극복했다.
딥시크의 기술 보고서에 따르면, DSA 기술은 긴 시퀀스를 처리할 때 이전 모델 대비 추론 비용을 절반 수준으로 줄였다. 구체적으로 12만 8,000토큰(약 300페이지 분량의 책)을 처리하는 데 드는 디코딩 비용은 100만 토큰당 약 0.70달러에 불과하다. 이는 이전 모델인 V3.1-터미너스(Terminus)의 2.40달러 대비 70%에 달하는 비용 절감을 달성한 것이다.
딥시크의 주장이 단순한 마케팅 수사가 아님은 구체적인 수치와 국제 대회 성적을 통해 입증되고 있다. 특히 추론 능력을 극대화한 'V3.2-스페셜' 모델은 수학과 코딩 분야에서 미국의 최상위 모델들과 대등하거나 앞선 결과를 보여주었다.
-
미국 수학 경시대회(AIME 2025): 스페셜 모델은 96.0%의 합격률을 기록하며 GPT-5-High(94.6%)와 제미나이-3.0-프로(95.0%)를 모두 제쳤다.
-
하버드-MIT 수학 토너먼트(HMMT): 스페셜 모델은 99.2%라는 경이로운 점수를 기록, 제미나이의 97.5%를 상회했다.
-
국제 대회 성과: 2025 국제 수학 올림피아드(IMO)에서 42점 만점에 35점을 획득해 금메달 등급을 달성했으며, 국제 정보 올림피아드(IOI)에서도 전체 10위(금메달)에 해당하는 성적을 거두었다.
코딩 능력 또한 주목할 만하다. 실제 소프트웨어 버그 수정 능력을 평가하는 'SWE-Verified' 벤치마크에서 딥시크 V3.2는 73.1%의 해결률을 보여 GPT-5-High(74.9%)와 대등한 수준을 유지했으며, 복잡한 코딩 워크플로우를 측정하는 '터미널 벤치 2.0(Terminal Bench 2.0)'에서는 46.4%를 기록해 GPT-5-High(35.2%)를 큰 폭으로 따돌렸다.
단순한 연산 능력을 넘어, 딥시크 V3.2는 '도구 사용 중 사고(Thinking in Tool-use)'라는 새로운 패러다임을 제시했다. 이는 AI가 웹 검색이나 코드 실행과 같은 외부 도구를 사용하는 동안에도 추론의 흐름을 잃지 않고 문제를 해결하는 능력을 의미한다.
기존 AI 모델들은 외부 도구를 호출할 때마다 사고 과정이 단절되어 추론을 처음부터 다시 시작해야 하는 한계가 있었다. 딥시크는 이를 해결하기 위해 1,800개 이상의 고유한 작업 환경과 85,000개의 복잡한 지침으로 구성된 방대한 합성 데이터 파이프라인을 구축하여 모델을 훈련시켰다. 이를 통해 예산 제약이 있는 여행 계획 수립이나 다국어 프로그래밍 버그 수정과 같은 복합적인 문제 해결 능력을 획기적으로 향상시켰다.
딥시크의 약진에도 불구하고 글로벌 확장은 순탄치 않을 전망이다. 데이터 보안과 국가 안보를 이유로 한 서방 세계의 견제가 심화되고 있기 때문이다.
독일 베를린 데이터 보호 위원회는 딥시크의 사용자 데이터 중국 전송이 EU 규정에 위배된다며 불법으로 규정했고, 이탈리아 역시 앱 차단을 명령했다. 미국 의회는 국가 안보 우려를 이유로 정부 기기 내 서비스 사용 금지를 추진 중이다.
또한, 미국의 대중국 반도체 수출 통제가 지속되는 가운데, 딥시크가 어떻게 이러한 고성능 모델을 훈련시켰는지에 대한 의문도 제기된다. 딥시크는 구형 엔비디아 H800 칩 약 2,000개를 활용해 초기 모델을 훈련했다고 알려졌으나, 이번 V3.2 모델 훈련에 사용된 하드웨어는 구체적으로 공개하지 않았다. 다만 회사 측은 화웨이 등 중국산 칩과의 호환성을 언급하며, 미국의 제재가 중국의 AI 발전을 완전히 저지하지 못했음을 시사했다.
딥시크의 이번 발표는 "중국이 미국의 AI 기술을 따라잡을 수 있을까?"라는 질문을 "미국 기업들이 무료로 제공되는 중국의 고성능 기술과 경쟁하며 우위를 지킬 수 있을까?"로 바꾸어 놓았다.
오픈소스 모델이 프론티어급 성능을 달성하고, 효율성 혁신으로 비용을 획기적으로 낮춘 지금, AI 시장은 거대 자본이 필요한 '치킨 게임'에서 효율성과 개방성을 앞세운 '전략 게임'으로 변화하고 있다.
딥시크 V3.2는 단순한 신제품 출시를 넘어, 글로벌 AI 기술 패권 경쟁이 제2막에 접어들었음을 알리는 신호탄이다.

