딥시크 V4 완전 분석 — 100억 달러 투자·AGI 선언·MIT 공개가 개발자 비용을 바꾼다
딥시크가 2026년 4월 MIT 라이선스로 V4-Pro(1.6조 파라미터)·V4-Flash를 공개했다. 출력 비용은 오픈AI의 12분의 1. 창업자 량원펑은 100억 달러 투자를 유치하며 AGI 최우선·오픈소스 유지를 선언했다. 가격 비교표, 기술 구조, 실무 체크리스트를 정리했다.
딥시크(DeepSeek)가 2026년 4월 24일 V4 모델을 MIT 라이선스로 공개했다. V4-Pro는 1.6조 파라미터(MoE 구조, 49B 활성화), V4-Flash는 284B 파라미터. 동시에 창업자 량원펑(Liang Wenfeng)이 100억 달러(약 70억 위안) 투자 유치를 앞두고 "AGI 최우선, 상용화는 2순위"를 공개 선언했다. V4-Pro의 출력 비용은 1M 토큰당 $3.48 — 오픈AI의 12분의 1, 앤트로픽의 7분의 1이다. 이 숫자가 의미하는 것과 개발자 관점의 실무 판단 기준을 정리했다.
이 글이 필요한 분
LLM API 비용을 줄이려는 개발자·스타트업
오픈소스 LLM 셀프호스팅을 검토 중인 분
딥시크 V4가 클로즈드 모델 대비 어느 수준인지 판단해야 하는 분
AI 모델 경쟁 구도가 자신의 아키텍처 선택에 영향을 주는지 파악하려는 분
딥시크 V4란 — MIT 라이선스로 공개된 두 가지 모델
2026년 4월 24일, 딥시크는 V4 시리즈를 Hugging Face에 공개했다. MIT 라이선스를 적용해 상업적 사용, 파인튜닝, 재배포가 모두 허용된다.
V4-Pro: 1.6조(1.6T) 파라미터의 MoE(Mixture-of-Experts) 모델. 실제로 추론할 때 활성화되는 파라미터는 49B다. 컨텍스트 윈도우는 100만 토큰(1M). 에이전틱 코딩 벤치마크에서 GPT-5.5, 클로드 Opus 4.7과 비슷한 수준을 기록했다고 CNBC와 Lambda AI 분석 블로그가 보고했다.
V4-Flash: 284B 파라미터(13B 활성화). V4-Pro의 경량 버전으로, 대량 처리·저지연 작업에 특화된 포지션이다. 컨텍스트 윈도우는 동일하게 1M 토큰.
두 모델 모두 하이브리드 어텐션 메커니즘을 쓴다. 압축 희소 어텐션(CSA)과 강압축 어텐션(HCA)을 결합해 긴 컨텍스트 처리 효율을 높였다고 공식 API 문서(DeepSeek API Docs)에서 밝혔다.
딥시크 V4-Pro는 1.6조 파라미터 MoE 구조로 실제 활성화 파라미터는 49B다. MIT 라이선스로 허깅페이스에 공개됐다 ⓒ DeepSeek
가격 비교 — 오픈AI·앤트로픽의 몇 분의 1인가
딥시크의 가격 경쟁력은 수치가 직접 말한다. 포춘(Fortune)과 Lambda AI의 보도를 기준으로 정리했다.
V4-Flash를 쓰면 클로드 Opus 4.7 대비 출력 비용이 약 90분의 1이다. 대량 처리 파이프라인에서 V4-Flash로 전환했을 때 월 $3,000 API 비용이 수십 달러로 줄어드는 시나리오가 현실적이다. 물론 작업 품질 검증이 선행돼야 한다.
V4-Pro는 오픈AI의 12분의 1 수준이지만, 프론티어 모델 성능을 요구하는 에이전틱 작업에서도 경쟁력이 있다고 Lambda AI 벤치마크는 평가했다. 단, 이 벤치마크 수치를 그대로 믿기보다는 자신의 작업 유형으로 직접 테스트하는 것을 권장한다.
100억 달러 투자와 AGI 선언 — 배경과 의미
2026년 5월 22일, 블룸버그는 딥시크가 약 70억 위안(100억 달러 규모) 투자 유치를 진행 중이라고 보도했다. 딥시크의 첫 외부 자금 유치다. 창업자 량원펑은 투자자 미팅에서 두 가지를 명확히 했다.
첫째, AGI가 1순위 목표다. 단기 상용화나 수익 극대화보다 범용인공지능 달성을 우선하겠다는 뜻이다. "돈보다 AGI"는 오픈AI가 초기에 내세웠던 비영리 사명과 유사한 메시지다. 실제로 이 기조를 유지할지는 시간이 판단할 것이다.
둘째, 오픈소스 유지를 약속했다. 투자 유치 이후에도 모델 가중치를 공개하는 정책을 이어가겠다고 했다. 딥시크는 R1, V3에 이어 V4도 오픈소스로 냈다. 이 패턴이 이번 라운드 이후에도 지속되는지가 개발자 입장에서 핵심 관전 포인트다.
투자 맥락: 딥시크는 Liang Wenfeng이 설립한 하이-플라이어(High-Flyer) 퀀트 헤지펀드의 AI 연구 부서에서 출발했다. 기존에는 외부 자금 없이 자체 자본으로 운영됐다. 이번 100억 달러 라운드는 딥시크 역사상 첫 외부 투자다. 컴퓨팅 인프라 확장과 AGI 연구 가속이 목적으로 보인다.
딥시크 창업자 량원펑은 100억 달러 투자 유치를 앞두고 AGI 최우선·오픈소스 유지를 공개 선언했다 ⓒ Bloomberg
딥시크 V4의 기술 구조 — MoE와 하이브리드 어텐션
V4의 핵심 구조적 특징은 두 가지다.
MoE(Mixture-of-Experts): 1.6조 파라미터 전체를 항상 활성화하지 않는다. 입력에 따라 적합한 '전문가(expert)' 서브네트워크만 선택해 활성화한다. V4-Pro에서는 49B만 실제로 작동한다. 이 방식은 추론 비용을 낮추면서 전체 파라미터 규모의 표현력을 유지할 수 있게 한다.
하이브리드 어텐션(CSA + HCA): 압축 희소 어텐션(Compressed Sparse Attention)과 강압축 어텐션(Heavily Compressed Attention)을 결합해 긴 컨텍스트 처리 시 메모리 효율을 높였다. 1M 컨텍스트를 지원하면서도 KV 캐시 메모리 부담을 줄이는 방향이다.