저가형 AI의 본격등장 인가
반도체 가성비 논란의 신호탄
“AI 혁명은 더 이상 거대 기업들만의 전유물이 아니다.” 구정 명절 충격적인 뉴스가 글로벌 AI 시장을 강타했다. 불과 80억 원으로 ChatGPT에 버금가는 AI를 개발했다는 소식이었다. 주인공은 중국의 AI 스타트업 딥시크(DeepSeek). 이 회사는 수조 원의 투자금과 최첨단 반도체가 필수라는 AI 업계의 ‘상식’을 하루아침에 뒤엎었다.
엔비디아 주가는 하루 만에 17% 폭락했고, AI 업계는 패닉에 빠졌다. “이게 가능한 일인가?” 실리콘밸리가 충격에 휩싸인 사이, 딥시크는 한 걸음 더 나아갔다. 이달 초 공개한 경량화 모델 R1 시리즈는 오픈AI의 최신 모델과 맞먹는 성능을 보이면서도 비용은 4분의 1에 불과했다. 출시 직후 애플 앱스토어에서 ChatGPT를 제치고 무료 앱 다운로드 1위에 오르며, AI 혁명의 새로운 장을 열었다는 평가를 받고 있다.
80억 원으로 만든 세계적 수준의 AI
딥시크가 주목받는 가장 큰 이유는 개발 비용이다. 이 회사는 ChatGPT에 버금가는 성능의 V3 모델을 개발하는 데 단 80억 원(557만 달러)을 투자했다고 밝혔다. 이는 수천억 원 이상을 투자한 기존 AI 기업들의 개발 비용과 비교하면 충격적인 수준이다. 특히 이달 출시한 경량화 모델 R1 시리즈는 OpenAI의 추론 모델인 o1과 비슷한 성능을 보이면서도 추론 비용은 4분의 1 수준에 불과하다.
더욱 충격적인 것은 개발에 사용된 컴퓨팅 자원이다. 딥시크는 V3 모델 개발에 총 279만 시간 분량의 H800 GPU를 사용했다고 밝혔다. 이는 메타가 보유한 35만 개, xAI가 보유한 10만 개의 H100에 비하면 놀라울 정도로 적은 양이다.
이는 AI 산업의 핵심 공식을 뒤흔드는 사건이었다. 지금까지 AI 업계는 “더 강력한 AI를 만들려면 더 많은 GPU가 필요하다”는 공식을 철칙처럼 믿어왔다. 실제로 엔비디아의 고성능 GPU는 품귀 현상을 빚었고, 이는 엔비디아의 주가 상승을 이끈 핵심 동력이었다.
그러나 딥시크는 이 공식이 틀렸음을 증명했다. 적은 수의 GPU로도 고성능 AI를 만들 수 있다는 사실이 입증되자, 시장은 즉각 반응했다. 지난달 27일 엔비디아 주가는 16.97% 폭락했다.
퀀트 헤지펀드에서 시작된 혁신
(창업자 량원펑의 사진)
(딥시크사 직원들 사진, 해외유학파는 전무하며, 전부 중국국내파들로 구성되어 있다)
딥시크의 성공은 우연이 아니다. 창업자 량원펑은 중국 저장대 출신으로, 2015년부터 AI를 활용한 퀀트 헤지펀드 ‘환팡퀀트’를 운영해왔다. 환팡퀀트는 운용 자산 규모를 2016년 1988억 원에서 현재 11조 6000억 원으로 성장시켰고, 이 과정에서 AI 학습과 추론의 중요성을 깊이 이해하게 되었다.
량원펑은 2021년 약 1980억 원을 투자해 엔비디아 A100 1만 개를 구매했다. H100으로 환산하면 2500~5000개 정도다. 이듬해 미국이 중국에 대한 AI 칩 수출을 통제하면서, 환팡퀀트는 중국에서 가장 많은 GPU를 보유한 기업이 되었다. 이러한 경험을 바탕으로 2023년 5월 딥시크를 창업했고, 연이어 혁신적인 AI 모델을 발표했다.
세 가지 핵심 기술로 이룬 혁신
딥시크가 이처럼 효율적인 AI 모델을 개발할 수 있었던 비결은 세 가지 혁신적인 기술에 있다.
첫째, 자동 평가 시스템을 통해 인간 피드백 기반 강화 학습(RLHF)을 최소화했다. 일반적으로 AI 학습은 사전 학습, 미세 조정, 인간 피드백 기반 강화 학습 순으로 이루어진다. 딥시크는 인건비를 최소화하기 위해 자동 평가 시스템을 개발했다.
둘째, 효과적인 전문가 모델(Mixture of Experts, MoE) 시스템을 구축했다. 사용자의 질문이 들어오면 게이팅 메커니즘이 작동해 적절한 전문가 모델 2~4개만 활성화되는 구조다. 비활성화된 모델은 계산에 참여하지 않아 연산량을 대폭 줄일 수 있다
셋째, 컴퓨터 양자화 기술을 통해 데이터 처리의 효율성을 극대화했다. 일반적인 AI 모델이 사용하는 32비트 부동소수점 대신 8비트 정수 연산을 활용해 계산량을 줄이고 속도를 높였다
데이터 무단 논란과 검열문제
딥시크의 급격한 성장은 다양한 논란과 도전과제에 직면해 있다. 가장 뜨거운 쟁점은 데이터 수집 의혹이다. 2025년 1월 29일, OpenAI와 마이크로소프트는 딥시크의 데이터 무단 수집 가능성에 대한 공식 조사에 착수했다. 이들은 중국 기반 기관들이 자사의 AI 도구에서 대량의 데이터를 빼내려는 시도를 다수 포착했다고 주장했다.
특히 OpenAI는 딥시크가 ‘증류(distillation)’ 기술을 통해 ChatGPT의 지식을 무단으로 추출했을 가능성을 제기했다. 증류는 한 AI 모델이 다른 모델의 출력 결과를 학습해 유사한 기능을 개발하는 기술이다. 마이크로소프트 보안 연구원들은 2024년 가을, 딥시크와 연관된 것으로 보이는 주체들이 OpenAI의 API를 통해 대량의 데이터를 수집하는 정황을 포착했다고 밝혔다.
이에 대해 AI 업계에서는 흥미로운 반론도 제기됐다. “온갖 사이트의 데이터를 크롤링해 AI를 학습시킨 OpenAI가 이제 와서 데이터 무단 수집을 문제 삼는 것은 모순”이라는 지적이다. 실제로 딥시크가 사용한 기술의 진위 여부는 현재 여러 검증 프로젝트를 통해 확인되고 있다.
국제적 제재도 이어지고 있다. 이탈리아는 세계 최초로 개인정보 보호 문제를 들어 딥시크 서비스 차단을 결정했으며, 20일 이내에 개인정보 관리 방안에 대한 소명을 요구했다. 대만은 더 강경한 입장을 보였다. 국가 안보를 이유로 공공기관과 주요 시설 근무자의 서비스 사용을 전면 금지했다.
가장 근본적인 문제는 중국 정부의 검열이다. 딥시크는 중국의 ‘생성형 인공지능 서비스 관리 잠정 방법’에 따라 엄격한 검열을 적용받고 있다. 천안문 사태, 대만 독립, 위구르 문제 등 정치적으로 민감한 주제에 대해서는 답변이 제한되거나 거부된다. 특히 시진핑 주석 관련 질문에는 중국어는 물론 한국어로 물어봐도 검열되는 경우가 많다.
다만 이러한 검열은 웹 서비스에만 적용되는 제한적인 것으로 확인됐다. 실제로 딥시크의 모델을 로컬 환경에서 실행할 경우, 검열 없이 자유로운 답변이 가능하다. 이는 검열이 모델 자체가 아닌 웹 서비스 단계에서 이루어진다는 것을 의미한다. 이러한 특성 때문에 일각에서는 딥시크를 ‘진정한 오픈소스 AI’로 평가하기도 한다.
AI 산업의 미래를 바꾸다
딥시크의 충격은 단순한 기술 혁신을 넘어 AI 산업의 패러다임을 완전히 뒤바꾸고 있다. “고성능 AI 개발은 거대 기업만의 전유물”이라는 공식이 깨지면서, 스타트업과 중소기업들의 AI 시장 진입이 가속화될 전망이다.
실리콘밸리 벤처캐피털 a16z의 공동창업자 마크 앤드리슨은 “딥시크 R1은 AI 분야의 ‘스푸트니크 모멘트'”라고 평가했다. 1950년대 소련의 스푸트니크 발사가 미국의 우주 개발 경쟁을 촉발했듯, 딥시크의 혁신이 전 세계 AI 기술 발전을 가속화할 것이라는 전망이다.
“이제 AI 개발의 핵심은 하드웨어의 양이 아닌 알고리즘의 효율성이 될 것입니다.” 한 AI 전문가의 말이다. “딥시크는 우리에게 ‘더 적은 것으로 더 많은 것을 할 수 있다’는 가능성을 보여줬습니다. 이는 AI 기술의 대중화와 혁신 가속화로 이어질 것입니다.”
결국 딥시크가 연 새로운 장은 AI개발의 ‘대중화’다. 수조 원의 투자금과 최첨단 장비가 필수라는 진입장벽이 무너지면서, AI 개발은 이제 아이디어와 기술력으로 승부하는 영역이 됐다. 이는 더 많은 혁신가들이 AI 개발에 뛰어들 수 있는 기회를 제공하며, 궁극적으로 AI 기술 발전의 새로운 전기가 될 것으로 전망된다.