DeepSeek, 미국 주도의 AI 리더십에 균열을 내다
투이컨설팅 디지털연구소
구정 연휴에 IT 종사자들을 깜짝 놀라게 하는 뉴스가 연일 언론을 장식하고 있다. 중국의 인공지능 스타트업인 DeepSeek가 OpenAI의 ChatGPT를 제치고 미국 앱스토어에서 가장 많이 다운로드된 무료 애플리케이션이 되었다. 이런 결과는 전 세계 AI 업계에 충격을 주었고, 그동안 세계 최강으로 주목받던 미국 AI 기업들이 선두 자리를 유지할 수 있을지에 대한 의구심을 불러일으켰다.
2022년 말 OpenAI의 ChatGPT가 출시되자 중국 기술 기업들은 생성 인공지능 기반 챗봇을 서둘러 개발하기 시작했다. 그러나 Baidu가 만든 최초의 중국 AI 챗봇은 기대 이하의 평가를 받았고 미국 AI 기업과는 격차가 큰 것으로 평가받았다. 하지만 딥시크가 선보인 DeepSeek-V3와 DeepSeek-R1은 실리콘밸리 경영진과 미국 기술 기업 엔지니어들로부터 o1이나 라마3에 결코 뒤지지 않는다는 찬사를 받고 있다.
딥시크(DeepSeek)가 2025년 1월 20일 공개한 DeepSeek-R1은 오픈AI o1의 성능과 맞먹고, 비용은 경쟁 모델의 3~5%에 불과해 뛰어난 가성비를 가진 추론 모델로 평가받고 있다. 사용자들은 X를 통해 DeepSeek의 검색 기능이 OpenAI나 Perplexity 같은 경쟁자들보다 우수하며, Google의 Gemini Deep Research와 어깨를 나란히 하고 있다고 평가하고 있다.
딥시크-R1은 AIME 2024 수학 벤치마크에서는 o1의 79.2%보다 약간 높은 79.8%의 Pass@1 점수를 달성했으며 MATH-500에서는 97.3%로 o1의 96.4%보다 뛰어난 성능을 보여줬다.
LLM을 훈련시키는 데는 고도로 숙련된 연구팀과 막대한 컴퓨팅 파워가 필요하다. 샘 알트먼이 이끄는 OpenAI는 GPT-4 모델을 훈련하는 데 무려 1억 달러를 지출한 반면 딥시크는 600만 달러의 비용으로 두 달 만에 초기 모델인 V3를 개발한 것으로 알려졌다. 딥시크는 AI 개발에 천문학적 비용이 필요할 것이라는 사람들의 생각을 뒤집은 것이다. 이를 계기로 그 동안 수십억 달러의 자금이 들어간 미국이 자랑하는 첨단 AI 모델들이 '알고보니 거품'이라는 인식이 시장에 퍼지면서 엔비디아 등 나스닥 기업은 물론 코인 시장에도 영향을 주고 있다. 1월 27일 엔비디아 주가는 17% 가량 급락하며 시가총액이 무려 5,890억달러(847조원)가 증발했다. 리플 등 대장주 코인 역시 한때 12% 넘게 하락하였다.
미국의 첨단 반도체 접근을 제한하는 제재에도 불구하고, 어떻게 딥시크는 뛰어난 AI 모델을 만들 수 있었을까? 딥시크는 미국의 첨단 반도체 수출 규제 이전에 지금은 중국 수출이 금지된 엔비디아 A100 칩 5만개를 비축한 것으로 알려졌다. 그리고 이를 저전력 칩과 결합해 자체적인 AI 모델을 개발할 수 있었다. 물론 OpenAI나 Google 등이 500,000개 이상의 고사양 GPU를 보유한 것과 비교하면 제한된 자원이지만 이러한 제약 속에서도 DeepSeek는 한정된 자원으로 고성능 LLM 개발에 도전해서 성공했다. 창업자인 량원펑(Liang Wenfeng)은 언론과의인터뷰에서 "우리의 최종 목표는 AGI"라며 "이는 제한된 자원으로 더 강력한 모델 기능을 실현하기 위해 새로운 모델 구조를 연구해야 한다는 것을 의미한다"라고 말했다.
딥시크측은 아카이브에 게재한 논문(DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning)에서 GPT-4o가 50개 이상의 다양한 언어를 지원하는 반면 "DeepSeek-R1은 현재 중국어와 영어에 최적화되어 있어, 다른 언어로 된 쿼리를 처리할 때 언어 혼합 문제가 발생할 수 있다"고 한계를 밝혔다.
예를 들어, 쿼리가 중국어나 영어가 아닌 경우에도 영어로 추론하거나 응답을 생성할 가능성이 있다. 이러한 문제를 해결하기 위해 딥시크는 향후 업데이트에서 다국어 지원을 강화할 예정이다. 반면 실제 딥시크를 사용해본 결과 한글도 잘 지원하는 것을 확인하였다. 단, 영어로 먼저 답변을 제시한 후 이어서 한글로 번역해줬다.
사실 일반인들에게 잘 알려지지는 않았지만 딥시크 AI 모델은 이미 2024년부터 국내에서도 많이 사용하고 있다. LLM 구축 업체들은 PoC 프로젝트에서 성능 검증시 비용이 적게 들어가는 딥시크 V3모델을 적용하고 실제 구축시에는 라마 또는 GPT 모델을 사용하고 있다.
딥시크의 기술적 특징은 다음 3가지로 요약할 수 있다.
- MoE (Mixture of Experts) 아키텍처
DeepSeek은 MoE (전문가 혼합) 아키텍처를 채택하여 모델의 효율성을 크게 향상시켰다. 이 방식은 특정 작업에 필요한 연산만 선택적으로 활성화하여 계산 비용을 절감시킨다. 그리고 이러한 설계를 통해 성능 저하 없이 최적의 처리를 가능하게 만들었다.
- MLA (Multi-Head Latent Attention)
미국의 AI 기업들이 NVIDIA H100 와 같은 고사양 GPU를 활용하고 있을 때에도 딥시크는 저사양인 H800 GPU를 사용했다. DeepSeek이 개발한 Multi-head Latent Attention(MLA)은 메모리 사용량을 87~95% 감소시키며, 이는 하드웨어 의존도를 크게 낮출 수 있음을 보여준다. 구세대 GPU의 효율성을 극대화하기 위해 딥시크는 MLA 및 MoE와 같은 기술 설계를 통해 메모리 사용량을 기존 대비 5~13% 수준으로 줄이는 데 성공했다. 이는 모델의 비용 효율성을 크게 높이는 요인이 되었다.
- 강화 학습 (Reinforcement Learning) 중심의 훈련 방식
DeepSeek-R1 Zero 모델은 경쟁 모델과 달리 대규모 데이터 학습 없이 순수한 강화 학습(Reinforcement Learning)만을 사용하여 훈련되었다. 이는 인간의 피드백이나 지도 감독 미세 조정 없이도 높은 성능을 달성할 수 있음을 보여준다. 이러한 접근 방식은 모델이 자체적으로 문제 해결 전략을 개발하고 개선하는 능력을 향상시켰다. 정리하면 딥시크는 저사양 GPU를 사용하여 AI를 훈련시키는 더 스마트한 방법을 찾았고, 그 중 하나는 인간을 모방하는 대신 강화 학습을 통해 문제를 단계별로 '사고'하도록 하는 새로운 기술을 채택하여 성공할 수 있었다. 이 조합을 통해 딥시크 모델은 훨씬 적은 컴퓨팅 파워와 비용을 사용하면서도 최고 수준의 성능을 달성할 수 있었다.
DeepSeek는 어떤 회사인가?
DeepSeek은 중국의 헷지펀드 High Flyer에 의해 설립된 연구소로, AGI 개발을 목표로 설립되었다. 당시 CEO인 량원펑(Liang Wenfeng)은 “세계에서 가장 어려운 문제를 해결하자”라는 비전을 내세우며, 수익을 추구하지 않고 젊은 컴퓨터 공학 연구자들을 고용했다고 전해진다. 1985년 중국 광둥성에서 태어난 량원펑은 저장대학교에서 전자정보공학 학사와 정보통신공학 석사 학위를 취득했다. 졸업 후 쓰촨성 청두로 이주해 AI를 다양한 분야에 적용하는 실험을 진행한 것으로 알려졌다.
딥시크의 성공은 이미 중국 정계에서도 주목받고 있다. 중국 신화통신에 따르면 딥시크-R1이 일반에 공개된 날인 1월 20일, 창업자 량은 리챵 중국 총리가 주최한 기업인 및 전문가 대상 비공개 심포지엄에 참석했다. 이는 딥시크의 성공이 미국의 수출 규제를 극복하고 AI 같은 전략 산업에서 자급자족을 달성하려는 중국의 정책 목표에 중요할 수 있음을 시사하고 있다.
DeepSeek 주요 연혁
연도 | 주요 이벤트 | 세부 내용 |
---|---|---|
2023 | 창립 | 중국 항저우에서 AI 기술 개발을 목표로 설립. |
2023 | DeepSeek-R1 LLM 출시 | 텍스트 생성/분석에 특화된 초기 대규모 언어 모델 공개. |
2023 | DeepSeek-V1 챗봇 출시 | 사용자 인터랙션 중심의 첫 번째 AI 챗봇 서비스 시작. |
2023 | 오픈소스 생태계 구축 | 개발자 커뮤니티를 위한 AI 툴킷 및 데이터셋 공개. |
2023 | B2B 시장 진출 | 제조·금융 분야 기업과 협력해 맞춤형 AI 솔루션 제공. |
2024 | DeepSeek-V3 출시 | 이미지·텍스트 통합 지원 멀티모달 모델로 기능 확장. |
2024 | 글로벌 클라우드 서비스 시작 | 미국·동남아 시장 대상 AI 클라우드 플랫폼 론칭. |
2024 | 산업별 전용 모델 개발 | 의료 진단, 금융 리스크 관리 등 분야별 맞춤형 AI 모델 공개. |
2024 | AI 윤리 프레임워크 발표 | 데이터 편향성 감소 및 투명성 강화를 위한 가이드라인 제시. |
딥시크는 오픈AI 기술을 무단 도용했나?
해외 언론에서 OpenAI와 최대 투자자인 Microsoft가 딥시크가 OpenAI의 지적 자산을 무단으로 사용하여 서비스 약관을 위반한 증거를 조사하고 있다고 보도했다.
OpenAI 대변인은 "DeepSeek가 우리 모델을 부적절하게 증류(Distilling)했을 수 있다는 징후를 인지하고 검토하고 있으며, 더 많은 정보를 알게 되는 대로 공유할 것"이라고 언급했다. 아이너리하게도 딥시크의 무단 도용을 주장하는 오픈AI 역시 저작권이 있는 외부 자료를 자사의 대규모언어모델에 훈련시켰다는 혐의로 뉴욕타임스를 비롯한 여러 콘텐츠 제작자와 소송에 휘말려 있는 처지이다. 물론 OpenAI는 해당 자료의 사용을 부인하지는 않지만 콘텐츠가 '공정 사용'이라는 법적 원칙에 해당하므로 저작권 침해가 아니라고 주장하고 있다.
따지고 보면 OpenAI가 언론사 등 다른 곳에서 빌려온(사실은 그냥 가져온) 데이터를 딥시크가 다시 가져간 것으로 볼 수 있는 것이다. 기술 벤처 캐피털리스트 빌 걸리는 X에 "생성 AI 분야에서 모든 기업이 사용하는 핵심 알고리즘은 구글의 AI 연구소인 딥마인드에서 개발했지만 아무도 현재 AI 기업들이 구글의 IP를 훔쳤다고 생각하지는 않는다"고 말하면서 "현재 대부분의 LLM 인사이트와 혁신은 사실은 어딘가에서 '빌려온 것'이다"고 언급했다.
이에 대해 AI 컨설턴트인 잭 카스(Zack Kass)는 "증류는 AI 분야에서 일반적인 관행이지만 일반적으로 두 모델을 모두 소유한 동일한 조직 내에서 이루어진다. 만약 DeepSeek가 대규모로 ChatGPT를 쿼리하고 그 응답을 사용하여 자체 모델을 학습시켰다면 이는 OpenAI의 API 무단 사용에 해당하는지에 대한 조사가 필요하다"고 말했다.
딥시크가 오픈AI 기술을 가져온 것인지, 베낀 것인지 현재는 정확히 사실을 알기 어렵지만 AI 커뮤니티가 공정 사용과 무단 복제에 대해 보다 명확한 규범을 정의해야 하는 단계에 접어들고 있다.
딥시크가 전 세계 AI 시장에 미칠 영향은?
딥시크의 등장은 구글, 오픈AI, 메타 등 미국 AI 기업에 충격을 주고 있다. 폐쇄형을 고집하는 오픈AI와는 대조적으로 딥시크는 AI 모델을 오픈소스로 공개하여 글로벌 영향력을 확대하고 있다. 오픈소스의 특성상 개발자들은 딥시크의 가중치에 액세스할 수 있으며, 이를 통해 자체적인 AI 모델을 구축하고 쉽게 개선할 수 있다.
이는 지금까지 미국만이 달성할 수 있었던 첨단 기술 분야에 중국 기업들이 글로벌 AI 기술 생태계에 편입될 수 있음을 시사한다. 폐쇄형이 아닌 같은 오픈소스 모델을 지향한다는 점에서 딥시크와 공통점이 많은 Meta는 2025년 AI 인프라에 650억 달러를 투자할 계획을 세웠으며, 이미 딥시크의 모델을 분석하기 위해 네 개의 워 룸(war rooms)을 설치한 것으로 알려졌다. 이는 중국 기업이 어떻게 그렇게 낮은 비용으로 AI 모델을 훈련시켰는지 파악하고, 이를 통해 자사의 오픈소스 Llama 모델을 개선하려는 시도로 보인다.
최고의 가성비 AI 모델을 들고 나온 딥시크와 같은 중국 AI 기업의 등장으로 AI 시장은 미국과 중국이 양분화하는 방향으로 바뀔 것으로 보인다. 딥시크의 출시는 비용 절감과 오픈 액세스를 통해 기업들에게 OpenAI 같은 고가의 독점 모델에 대한 적절한 대안을 제공하며 AI 기능을 민주화하여 개인이나 소규모 조직도 AI 경쟁에서 대기업들과 효과적으로 경쟁할 수 있는 가능성을 열어주고 있다.
그동안 미국의 AI 리더십이 천하무적이라는 신화는 이미 산산조각이 났다. 딥시크는 AI 혁신이 꼭 막대한 자금이나 뛰어난 인프라에 대한 접근성 때문이 아니라는 것을 증명해 냈다. 이는 또한 미국이 AI 생태계에서 지금과 같은 리더십을 유지하려면 더 빠르게 적응하고 변화해야 한다는 점을 시사한다.
딥시크의 등장은 단순히 자본만으로는 AI 분야에서 최고가 될 수 없다는 것을 증명했으며 이는 장기적으로 우리가 알고 있는 AI 산업을 재편할 수 있음을 의미하고 있다. 대규모의 인프라 투자나 막대한 자금없이도 스타트업도 기술 혁신을 통해 거대 기업들과 당당하게 경쟁할 수 있으며, 심지어는 기존의 선두 주자들을 무너뜨릴 수 있다는 기회가 있음을 잘 보여주고 있다. 딥시크의 등장은 빅테크에게는 쟁쟁한 경쟁상대가 나타났다는 점에서, 그리고 AI 스타트업에게는 경쟁력있는 오픈소스 모델을 사용할 수 있다는 점에서 모두에게 희소식이 될 수 있을 것이다.