정보통신 IT/정보 Info

DeepSeek, 深度求索, 심도구색, 딥시크, 중국 AI, 오픈 소스 언어 모델, 엔비디아

Jobs 9 2025. 1. 29. 01:44
반응형

 

 


DeepSeek[, 深度求索, 심도구색

 

중국의 헤지펀드 회사 환팡퀀트(幻方量化) 소속 인공지능 연구 기업의 이름이자, 같은 회사에서 개발한 오픈 소스 언어 모델 제품군의 모델명이다.

2024년 12월 발표된 DeepSeek-V3 모델은 서구권에서 개발된 LLM 모델과 경쟁할 수 있을 정도의 성능을 보여 많은 주목을 받았는데, 특히 V3를 개발하는 데 있어 고작 80억 원 수준에 불과한 적은 비용이 들었다는 주장이 알려지면서, 수천억 원의 비용을 들여 엄청난 연산 자원을 축적해야만 고성능 AI를 개발할 수 있다고 굳게 믿어왔던 시장의 고정관념을 깨뜨리는 계기가 되었다.

OpenAI 같은 기존의 선두 그룹들이 조 단위의 천문학적인 자금을 AI 개발에 투입하는 상황에서 이 발표는 워낙 충격적이라, 학습에 필요한 자금을 축소하여 발표한 것이 아니냐는 의혹이 제기되었는데, 발표한 논문에서 학습 방법을 공개했기 때문에 학습 비용을 속이는 게 불가능하다는 의견도 있다. 실제로, 비교적 적은 비용으로 논문의 결과가 재현된다는 것이 홍콩대 연구진에 의해 확인되었으며 학습 과정을 복제하려는 프로젝트들도 생겨나고 있다. 

뒤이어 2025년 1월에 발표된 추론 모델, DeepSeek-R1은 Supervised Fine-Tuning 기법을 건너뛰고, 오로지 강화학습 기법만으로도 뛰어난 추론 성능을 얻어낼 수 있음을 증명했다는 높은 평가를 받았다. 특히 OpenAI o1 모델과 비교하여 수학, 영어, 코딩 부문에 있어 경쟁할 수 있는 수준의 성능을 갖추면서도, 최대 97%까지 더 저렴한 가격을 내세워 전 세계의 관심을 끌었다. 

DeepSeek R1이 가져온 엄청난 파급력으로 인해, 일각에선 OpenAI가 ChatGPT 무료 사용자들에게도 o3-mini 모델을 제한적으로 제공하기 시작한 것에 DeepSeek R1이 영향을 주었을 것이라는 시각도 있다. 

DeepSeek CEO 량원펑(梁文锋, 양문봉)은 R1 공개일인 2025년 1월 20일 리창 총리와 면담을 가졌다. 

'전 세계에 AGI를 오픈 소스로 제공하는 것이 목표'라고 밝힌 만큼, 실제로 DeepSeek에서 개발된 각종 모델들과 관련 논문들은 오픈 소스로 배포되고 있다. OpenAI가 폐쇄적인 모습을 많이 보이고 있어 '중국의 DeepSeek야말로 진정한 'Open AI' 회사다'라는 평가도 있는 편이다.

 

 

제품


모든 제품의 코드를 MIT 허가서하에, 모델은 자체 라이선스(DEEPSEEK LICENSE AGREEMENT)하에 오픈 소스로 공개하고 있다.

 

 

DeepSeek-Coder

 

DeepSeek-LLM

 

DeepSeek-MoE

 

DeepSeek-Math

 

DeepSeek-VL

 

DeepSeek-V2

 

DeepSeek-Coder-V2



DeepSeek-V2에서 6조 개의 토큰을 추가 학습하여 일반적인 작업에서의 성능을 유지하면서 코딩과 수학적 추론 능력을 향상시켰다고 한다. 지원 프로그래밍 언어를 86개에서 338개로 확장하고 컨텍스트 길이를 16K -> 128K로 확장했다고 한다. 

공개된 벤치마크 데이터에 의하면, GPT-4o-0513과 거의 비슷한 성능을 보여준다.

 

 

 DeepSeek-V2.5



V2와 Coder-V2를 각각 파인튜닝하여 업그레이드 한 뒤 두 모델을 통합시켜 만들었다고 한다.

기존 2.5 버전을 파인-튜닝 한 V2.5-1210이 12월 10일에 출시되었다.#

 

 

DeepSeek-VL2



기존 VL1을 업그레이드한 버전이며, 1B, 2.8B, 4.5B 3가지 모델로 구성되어 있다.

 

 

DeepSeek-V3


V2 대비 반응 속도가 3배 빨라졌으며, 개발사가 공개한 벤치마크에서는 Claude-3.5-sonnet-1022, GPT-4o-0513, LLama3.1-405B-Inst, Qwen2.5-72B를 압도하는 성능을 보여주었다. 실제로도 저렴한 API 가격에 상당한 성능으로 높은 가성비를 보이고 있다. 

한편, 겨우 2048개 NVIDIA H800 클러스터를 이용해 278만 8천 GPU Hours만에 671B에 달하는 대형 모델을 학습했다고 밝히면서 업계에 충격을 주었다. H800은 미국의 대(對)중국 수출규제에 따른 중국 수출용 모델로, 원본인 H100 대비 NVLink 대역폭이 반토막나고 배정밀도 연산성능은 겨우 3% 남짓인 스펙다운 모델이기 때문에 더욱 충격이 컸다.

 

 

DeepSeek-R1


DeepSeek-V3를 기반으로 하는 2가지 메인 모델(R1, R1-Zero)과, 오픈 소스 모델에 R1을 통해 생성한 데이터셋으로 파인튜닝한 오픈 소스 기반의 6가지 증류 모델로 구성되어 있다.

모든 모델은 MIT 라이선스가 적용되어 완전히 자유로운 사용이 가능하다.



공개된 벤치마크 결과에 의하면 o1-mini를 뛰어넘고, o1과 맞먹는 결과를 보여준다. 실제로 코딩 능력과 일부 벤치마크에서 o1을 넘어서는 것으로 확인되었고, OpenAI의 가장 저렴한 모델인 4o-mini보다 추론비용이 4배밖에 비싸지 않다. 

한국어에 대한 지식도 어느 정도 존재하며, 그 유창성이 출시 당시 기준 현존 최고 수준의 프론티어 모델까지는 아니지만 4o와 같은 언어 모델에는 크게 밀리지 않는다. 

매우 저렴한 모델 구축 및 운영비용과 중국의 투자회사가 사이드 프로젝트로 불과 두 달 만에 만든# 오픈 소스 인공지능이 미국 거대기업들의 모든 대형LLM 성능을 올킬했다는 것이 알려지자 인터넷 인공지능 관련 커뮤니티, 그리고 실리콘밸리에서 매우 큰 충격을 가져다주었다. # 인공지능을 벤치마크하는 최고 허들을 구축하기 위해 만들어진 테스트에서도 현재 시장에서 공개된 다른 모델들보다 더 높은 성능을 보여주기도 했다. 

공식 홈페이지의 경우 AI기반 검색 기능을 동시에 이용할 수 있다는 점은 희귀한 지식이나 한국 고유의 지식에 대해서도 문제 해결력을 끌어 올린다. 

이미지의 한글을 인식할 수 있다. 이미지 인식은 텍스트 추출이 주된 용도며, 순수 풍경 사진은 받아들이지 못한다. 2025년 1월 26일 기준 공식 홈페이지에서는 'DeepThink (R1)'버튼을 눌러야 사용 가능하며, 그렇지 않으면 DeepSeek V3 모델이 호출된다. 

구독 서비스를 해야 최신 성능을 제한없이 이용할 수 있는 ChatGPT등 다른 LLM과 다르게 완전한 무료로 더 좋은 성능을 발휘한다는 파격적인 서비스 덕분에 ChatGPT를 제치고 미국 애플 앱 다운로드 1위를 달성했다. 틱톡은 안보위협으로 서비스 중단을 선언했는데, 미국의 기술 및 안보와 관련된 전문적인 데이터 유출 위협을 줄 수 있는, 훨씬 더 큰 문제가 발생한 셈이다.

베이스 모델인 R1-zero 는 인간 개입에 의한 SFT(Supervised Fine Tuning)없이 강화학습(RL) 만으로 모델을 학습 시켰다. R1-zero 모델을 파인튜닝한 R1 모델은 인간에 의해 선별된 소규모 고품질 데이터를 사용하여 SFT(Supervised Fine Tuning)로 먼저 파인튜닝한 후, 강화학습(Reinforcement Learning)을 통해 모델을 추가로 파인튜닝하는 다단계 과정을 거쳐 학습된 모델이다.

현재로서는 ChatGPT 유료모델에서조차 없는 검색과 추론을 동시에 수행하는 기능도 있다.

 

 

 

검열 의혹


딥시크 검열 논란 1딥시크 검열 논란 2
딥시크 검열로 논란이 된 스크린샷. 특히 두 번째 사진에서 'It has never made any mistakes.(중국 정부는) 그 어떠한 실수도 한 적이 없다.' 를 연발하는 소름끼치는 모습이 연출된다.

 

시진핑과 관련된 질문에는 답변하지 못하는 모습을 보인다. 어떤 방식으로도 AI가 시진핑을 말하게 하는 것이 불가능하며, 그의 임기, 시진핑을 중국어로 발음하는 방법과 같은 단순한 사실을 묻는 질문에도 답변하지 않는다. 시진핑과 직접적으로 관련없는 질문을 통해 이름을 말하게 유도하기만 해도 검열된다. 심지어 중국인 사이에서 '시(习)'라는 성이 얼마나 흔한지에 대해서도 답변을 거부할 정도. 물론 작정하고 시도해서 성공한 사례도 있다.

 

중국공산당에 대한 부정적인 답변도 피하는 모습을 보인다. 천안문 6.4 항쟁, 대만이나 위구르, 티베트를 비롯한 독립 관련 문제, 아루나찰프라데시와 같은 중국의 영토 분쟁 지역, 그리고 홍콩 민주화 문제까지도 답변 자체를 거부하거나 검열된 답변이 등장할 수 있다.


하지만 위와 같은 검열이 항상 완벽하게 작동하는 건 아니다.


별 상관없는 질문을 하다가 갑자기 중공 정부에 대한 비판적인 내용을 물어보면 이에 동조하는 모습을 보이기도 한다. 
전 세계의 인터넷 상에 존재하는 웹사이트를 검색하여 결과물을 도출해내는 '서치' 기능을 활용하면, 자체 데이터를 활용했을 때와 달리 중국 공산당 및 시진핑에 대해 비판적인 서술을 외부 웹사이트로부터 직접 인용한 답변을 내놓기도 한다.
북한에 대한 중국인의 인식을 물어보면, '중국 정부는 북한을 전통적 우방으로 강조하지만, 청년층은 이러한 담론에 덜 민감하다.'라는 답변이 나올 정도로, '중국 사회가 정부의 모든 정책을 맹목적으로 따르지는 않는다'는 시각이 담긴 답변까지는 내놓을 수 있는 것으로 보인다.  


중국의 검열과 사회통제에 대해서, 애니메이션 PSYCHO-PASS의 디스토피아적 모습과 중국의 현 모습을 비교하며 '설령 상당수의 중국인이 이것에 동조한다고 친다고 해도 이게 윤리적으로 옳은 것은 아니지 않느냐'는 질문을 하자 결국 이를 긍정하는 모습을 보였다. 


한국어로 중국의 사회 문제인 탕핑에 대해 물으면 '탕핑은 단순한 게으름이 아니라, 과열된 성장주의와 불평등에 대한 청년 세대의 침묵적 항의'이며, '사회 시스템의 근본적 변화를 요구하는 신호'라는 답변을 내놓기도 한다. 다만 생계 문제를 들며 탕핑 현상에 비판적인 중국 정부의 시각을 대변하는 모습을 보이기도 한다.


공식 홈페이지에서 제공되는 웹 버전과 달리, 모델을 직접 다운로드하여 로컬 환경에서 실행해보면 중국 공산당과 시진핑에 대한 비판적인 서술을 거리낌 없이 생성하는 모습을 확인할 수 있다. 이를 통해 모델이 생성한 결과물은 웹사이트에 표시되기 전에 검열이 이루어지고 있음을 추정할 수 있다. 즉, 이러한 검열은 해당 서비스를 운영하는 딥시크 회사 측에서 이루어지는 것으로 보이며, 모델 자체에는 검열이 적용되지 않는 것으로 판단된다.


중국 정부와 직접적인 관련이 없는 단순 사회적 아젠다, 폭력적, 선정적인 내용 등과 관련된 검열은 서구권 LLM들보다 DeepSeek쪽이 오히려 느슨하다는 의견도 많이 나오는 편이다.

 

 


공식 홈페이지에서 DeepSeek를 쓸 때, deepthink 기능을 활성화해야 R1 버전으로 작동된다. deepthink 버튼을 누르지 않으면 V3 버전으로 작동된다. 그걸 모르고 V3을 사용해서 생각보다 별로라고 판단하는 사람들이 많다.


R1 버전이 공개된 이후 이런 성능의 AI를 무료로 사용이 가능하다는 엄청난 메리트 때문에 전세계적으로 사용자가 폭주하는 탓에 자주 트래픽 과부하가 걸려서 속도가 느려지거나 사용이 불가능해지는 경우가 많다. 특히 서치 기능을 사용하면 트래픽 문제 때문에 AI가 제대로 답을 못하는 경우도 많다. 이는 단순히 사용자 체감의 문제가 아니라 서비스사에서도 실제로 인지하는 사항으로 이 사이트에서 딥시크 웹/API 성능을 볼 수 있는데 2025년 1월 26일 14시 34분경(CST)부터 DeepSeek-R1 웹 버전과/API의 사용이 불가능해지는 시스템 성능의 심각한 저하가 발생한 것을 인지했기 때문에 지속적으로 새로 업데이트를 하고 이 문제를 계속 조사하고 있다고 한다. 1월 28일 공지에 따르면 '딥시크의 서비스에 대한 대규모 악성 공격으로 인해 지속적인 서비스를 보장하기 위해 일시적으로 등록을 제한하고 있습니다.'라고 한다. 


미국의 AI 기업들은 예상보다 빠른 중국의 약진에 당혹스러워하는 반응이 많으며, Kimi k1.5, DeepSeek R1의 출시는 미중 AI 전쟁에서 스푸트니크 쇼크와 같은 사건이 될 수 있다는 말이 흘러나오고 있다.


이 때문인지 1월 27일 미국 증시의 AI 기업들의 주가가 떨어졌다. 다만 이는 일시적 현상으로 상대적으로 하드웨어 성능이 부족한 중국의 AI 기술로도 훌륭한 AI를 만들어 낼 수 있는 가능성을 보여 주었을 뿐이라는 시각도 있다. 컴퓨팅 시장 자체는 이미 추론 기법의 발견과 o3가 보여준 미친듯한 성능 향상 곡선에 의해 그 잠재적 가능성을 분명하게 드러냈고 자본과 하드웨어 기술에서 앞서는 서구권에서도 충분히 투자하면 보여줄 수 있는 퍼포먼스라는 주장도 있다.



 

 



中 AI '딥시크' 쇼크... 엔비디아 시총 863조원 증발했다

 


중국 인공지능(AI) 스타트업 ‘딥시크’의 놀라운 발전이 미국 기술 산업을 위협하고 있다. 뉴욕 증시는 폭락했고, 특히 ‘AI 대장주’ 엔비디아는 하루 만에 시총 약 6000억 달러(약 863조원)를 날렸다. 

27일(미국 동부시각) 뉴욕증권거래소에서 나스닥종합지수는 3.07% 급락했고, 스탠더드앤드푸어스(S&P) 500지수는 1.46% 떨어졌다.
  
AI 칩의 선도적 공급업체인 엔비디아는 하루 만에 17% 폭락했다. 시가총액 5888억 달러를 잃었는데, 이는 단일 주식이 하루 동안 잃은 시가총액 기준 미국 증시 역사상 최대치다. 3년 전 메타가 세운 이전 기록인 2400억 달러의 두 배가 넘는 액수다. 이로 인해 시총 순위도 1위에서 단번에 3위로 주저앉았다.  

또 다른 AI산업 수혜주 브로드컴도 17.40% 폭락했고, 마블테크놀로지(19.10%), 마이크론테크놀로지(11.71%) 등도 급락했다. 반도체 제조사 TSMC(13.33%)와 ASML(5.75%)도 유탄을 피할 수 없었다.  

‘딥시크’는 비기술 산업에도 영향을 미쳤다. AI 데이터센터 구동에 막대한 전력이 들어가는 탓에 에너지 기업들의 주식도 높은 가격을 형성했다. 하지만 이날 콘스텔레이션 에너지, GE버노바 등은 21% 급락했다. 발전기에 사용되는 천연가스 선물 가격도 5.9% 하락했다. 비트코인 등 암호화폐 시장도 하락했다.  

◇”딥시크, AI 분야의 스푸트니크 모멘트”

딥시크는 지난 20일 복잡한 추론 문제에 특화한 AI 모델 ‘R1′을 선보였다. 실리콘밸리의 대표 벤처투자가 마크 앤드리슨은 X(옛 트위터)에 “딥시크 R1은 내가 지금까지 본 것 중 가장 놀랍고 인상적인 혁신 중 하나”라며 “AI 분야의 스푸트니크 모멘트”라고 했다.  

스푸트니크 모멘트는 기술 우위를 자신하던 국가가 후발 주자의 앞선 기술에 충격을 받는 순간을 가리키는 용어로, 1957년 옛 소련이 최초의 위성 스푸트니크 1호를 미국보다 먼저 발사한 것에서 기인했다. 

전문가들은 딥시크의 성능도 인상적이지만, 개발 비용에 더욱 충격을 받는 분위기다. 딥시크는 ‘V3′ 모델에 투입된 개발 비용이 557만6000달러(약 79억원)에 그쳤다고 밝혔다. 이는 메타가 최신 AI 모델 ‘라마3′ 모델에 쓴 비용의 10분의 1 수준이다. 

게다가, 딥시크 AI 모델 훈련에는 엔비디아가 중국 수출용으로 성능을 낮춰 출시한 H800칩이 쓰였다. 미국이 고성능 AI칩 수출 제한 조치를 했음에도 불구하고 이뤄낸 성과인 셈이다. 

미국 CNN은 “잘 알려지지 않은 AI 스타트업의 놀라운 성과는 미국이 지난 수년간 국가안보를 이유로 고성능 AI 칩의 중국 공급을 제한해 왔다는 점을 고려하면 더욱 충격적”이라고 평가했다. NYT는 “미국 정부의 무역 제재가 가져온 의도치 않은 결과”라고 했다. 미국의 반도체 칩 무역 제재가 오히려 중국 기술자들이 창의적인 해결책을 모색하도록 자극했다는 것이다. 

딥시크가 고비용 기조인 현 AI 업계에서 가격 인하 경쟁에 신호탄을 쏠 것이라는 예측도 나온다. 블룸버그는 “딥시크의 성공은 미국 AI 기업들이 선두 자리를 지키기 위해 가격을 낮춰야 하는 압박으로 작용할 수 있다”며 “메타와 마이크로소프트 등 대기업의 막대한 지출에 대한 의문도 불러왔다”고 했다.  

골드만삭스는 “지금까지 시장은 구글이나 오픈AI, 마이크로소프트 등 AI 관련 회사에 막대한 프리미엄을 줬다”며 “딥시크가 기존 AI 기업들의 지출에 의구심을 자극하면서 더 광범위하게 투자자들의 신뢰를 흔들 것”이라고 예측했다. 








中 AI ‘딥시크’ 쇼크에 엔비디아 17% 폭락, 시총 850조 증발···미국 AI패권 흔들리나

 

엔비디아·브로드컴 16% 넘게 급락···엔비디아 시총만 850조 증발

리플·솔라나 장중 10% 폭락


중국의 인공지능(AI) 스타트업 딥시크 돌풍에 금융시장이 공포에 빠졌다. ‘AI거품론’이 가시화되며 나스닥 지수가 3% 넘게 급락한 가운데, 엔비디아는 17% 가까이 폭락했고 AI관련주는 일제히 약세, 가상자산도 덩달아 하락세를 보이고 있다. 딥시크가 적은 비용으로도 고품질의 AI모델을 만들어내면서 독점적인 위치를 점하고 있는 미국의 AI패권이 흔들릴 수 있다는 우려가 커진 여파로 풀이된다.  

27일(현지시간) 뉴욕증시에서 기술주 중심의 나스닥 지수는 전 거래일보다 612.47포인트(-3.07%) 급락한 1만9341.83에 거래를 마감했다. 스탠더드앤드푸어스(S&P) 500 지수는 전 거래일보다 88.96포인트(-1.46%) 내린 6012.28에 거래를 마쳤다. 

글로벌 시가총액 1위 기업이었던 ‘AI대장주’ 엔비디아가 하루만에 16.86% 급락, 주당 118.42달러에 거래를 마감하며 지수를 끌어내렸다. 엔비디아는 하루 만에 시가총액이 5900억달러(약 848조원)이나 증발했다. 삼성전자 전체 시총(약 321조원)의 2.5배에 달하는 시총이 하루 만에 증발한 것으로 미국 증시 역사상 최대 규모의 시총 감소분이다. 

엔비디아의 AI경쟁자로 떠오른 브로드컴도 17.4% 폭락했다. 그동안 AI에 힘입어 주가가 큰 폭으로 뛰었던 종목들이 모두 폭락을 면치 못했다. 

TSMC는 13.33%, 마이크론은 11.71% 슈퍼마이크로컴퓨터는 12.62%, AMD는 6.37% 폭락했고, 팔란티어(-4.48%), 앱플로빈(-5.33%), 알파벳(-4.2%) 등 빅테크와 AI소프트웨어 업체 주가도 급락했다. 

특히 도널드 트럼프 미국 대통령이 추진하는 AI인프라 구축 프로젝트 ‘스타게이트’ 참여사의 주가가 큰 충격을 받았다. 오라클은 13.79%, ARM홀딩스는 10.19%나 폭락했고 일본증시에선 손정의 회장이 이끄는 일본 소프트뱅크 그룹 주가가 8% 넘게 폭락했다. 

미국 증시와 연동된 흐름을 보이고 있는 가상자산도 미국 증시의 부진에 덩달아 하락세를 보였다. 비트코인은 같은 날 장중 5%넘게 하락하며 10만달러 선을 내줬고, 리플과 솔라나는 10% 넘게 폭락했다. 

기술주와 가상자산 가격이 폭락세를 보인 것은 중국 딥시크가 내놓은 AI모델로 미국의 기술패권이 깨지고 AI투자도 급감할 것이란 우려가 작용하면서다. 

지난 20일 딥시크가 출시한 추론 AI모델 딥시크-R1은 일부 성능 테스트에서 챗GPT 개발사인 오픈AI가 지난해 9월 출시한 AI모델 ‘o1’를 앞지르면서 AI업계에 충격을 줬다. 업계에선 AI개발에 막대한 비용을 투입한 빅테크의 AI모델에 비해 훨씬 적은 비용이 투입된 것으로 추정하고 있다. 앞서 딥시크는 지난달 말 출시한 이전모델인 딥시크-V3가 미국의 중국 수출규제에 걸리지 않도록 엔비디아에서 만든 저사양 칩을 활용했다고 밝힌 바 있다. 

중국 항저우에 본사를 둔 작은 스타트업인 딥시크가 미국의 수출규제 속에서도 저비용 고성능의 AI모델을 만들어내면서 빅테크의 ‘AI투자 회의론’이 커진 것이다. 

이날 블룸버그통신 등의 보도에 따르면 딥시크의 AI어시스턴트는 이날 미국의 애플 앱스토어 무료 앱 다운로드 순위에서 오픈AI의 챗GPT를 2위로 밀어내고 1위에 오르기도 했다. 블룸버그는 “실리콘밸리를 중심으로 AI분야 선두주자로서 미국의 능력에 대한 의구심을 불러일으켰다”고 전했다. 

미국 증시는 AI에 힘입어 지난해 두 자릿 수 넘게 상승했는데, 딥시크의 약진은 고평가 논란이 컸던 미국 빅테크의 주가가 ‘거품’이었다는 시그널을 줌과 동시에 앞으로의 성장성에도 의문을 던진 것이다. 

빅테크가 주도하는 AI모델이 폐쇄형인 반면, 딥시크의 AI모델은 오픈소스로 공개돼 사용과 수정이 자유로워 빅테크의 시장지배력이 약화될 수 있다는 우려도 나온다.

AI 데이터 기업 스케일AI의 알렉산더 왕 최고경영자(CEO)는 CNBC와의 인터뷰와 엑스(옛 트위터)를 통해 “우리가 발견한 것은 딥시크의 성능이 최고이거나 미국의 최고 모델과 거의 동등하다는 것”이라며 개방성 측면에서 “딥시크는 미국에 경종을 울린다”라고 말했다. 

 

 

 

 

 


“AI 돈 먹는 하마 아니다” 딥시크 쇼크에 흔들리는 AI 패권 경쟁
중국의 스타트업 딥시크가 미 빅테크 기업들이 개발한 첨단 AI에 육박하는 성능을 보여줬다. 문제는 들인 비용이 훨씬 적었다는 점이다.

중국의 인공지능(AI) 스타트업 딥시크(DeepSeek)가 내놓은 AI 모델 ‘R1’이 뛰어난 성능으로 전 세계를 흔들고 있다. 미중 AI경쟁에서 중국의 추격속도가 예상보다 빠르다는 점이 부각되면서 미국 빅테크가 지닌 패권 프리미엄이 흔들리는 것 아니냐는 우려가 나왔기 때문이다. 

당장 뉴욕증시가 큰 영향을 받았다. 딥시크의 서비스가 훨씬 적은 비용으로도 오픈AI의 챗GPT에 맞먹는 성능을 갖췄다는 소식에 AI 관련주가 추풍낙엽처럼 떨어졌다. 이 때문에 스탠더드앤드푸어스(S&P)500지수는 전장보다 88.96포인트(1.46%) 하락한 6012.28, 나스닥지수는 612.47포인트(3.07%) 급락한 1만 9341.83에 장을 마쳤다. 글로벌 AI 산업을 이끄는 엔비디아는 이날 주가가 16.86% 폭락했다. 시가총액이 하루 만에 5900억 달러나 증발했다. 이날 하루 시총 감소분은 미국 증시 역사상 최대다.  

이날 딥시크는 고성능 칩을 사용하지 않고서도 저비용으로 챗GPT에 필적하는 생성형 AI 모델을 내놨다. 딥시크가 AI 모델 개발에 사용한 H800은 수출 규제로 엔비디아가 H100의 사양을 낮춰 출시한 칩이다. 그간 막대한 돈을 AI 개발에 쏟아온 미국 빅테크 입장에선 허탈할 수밖에 없었다.    

‘딥시크 쇼크’에 미국 빅테크도 대응에 나섰다. 더인포메이션에 따르면 마크 저커버그의 메타는 ‘전략 대응팀’을 급히 조직했다. 메타 AI 인프라 책임자인 매튜 올덤은 내부 회의에서 “딥시크의 최신 모델은 심지어 메타의 차기 모델의 성능을 능가할 가능성이 있다”고 언급한 것으로 전해졌다.   

메타가 조직한 팀은 총 네 개인데, 이 중 두 팀은 딥시크가 AI 학습 및 운영 비용을 낮춘 방법을 분석해 메타의 라마(Llama) 모델에 이를 적용하는 방안을 모색할 예정이다. 나머지 두 팀 중 한 팀은 딥시크가 사용한 데이터 소스를 조사하고, 또 다른 팀은 딥시크 모델의 구조적 특징을 연구해 라마 모델에 반영할 가능성을 탐구할 것으로 보인다.  

반응형