Big Tech Updates

삼성전자 HBM5 컴퓨텍스 공개 — 방열 신기술과 2나노 베이스 다이로 AI 메모리 경쟁 재점화

삼성전자가 컴퓨텍스 2026에서 업계 최초로 HBM5 실물모형을 공개했다. HPB(Heat Path Block) 방열 신기술과 2나노 베이스 다이 계획을 함께 발표하며 SK하이닉스의 iHBM 기술에 맞불을 놨다. AI 데이터센터 메모리 경쟁에서 이제 속도보다 발열 관리가 승부처가 된 이유, HBM5가 AI 인프라 비용과 GPU 성능에 미치는 영향을 정리했다.

by Lee발행: 2026-06-02

한 줄 핵심: 삼성전자가 컴퓨텍스 2026에서 업계 최초로 HBM5 실물모형을 공개하며 차세대 AI 메모리 경쟁에 선제 포석을 뒀다. 핵심 신기술은 HPB(Heat Path Block) — PHY 영역에서 발생하는 열을 직접 분산·방열하는 구조다. 여기에 2나노 베이스 다이 계획도 함께 발표했다. SK하이닉스는 iHBM의 ICE 기술로 열저항을 30% 줄이는 방식으로 맞불을 놨다. HBM 경쟁의 승부처가 '속도'에서 '발열'로 이동한 것이다.

이 글이 필요한 사람

AI 학습·추론 인프라의 메모리 병목과 비용을 이해하고 싶은 개발자·MLOps 엔지니어
HBM4E에서 HBM5로의 전환이 AI 가속기 성능에 어떤 변화를 가져오는지 파악하고 싶은 분
삼성전자와 SK하이닉스의 AI 메모리 기술 경쟁 구도를 정리하고 싶은 분

※ 이 글은 Korea Herald·ZDNet Korea·Tom's Hardware 등의 보도와 SK하이닉스 공식 발표를 근거로 작성했습니다. HBM5의 양산 일정·정확한 스펙은 아직 미공개 상태로, 공식 발표 전까지 변경될 수 있습니다.

HBM 세대 흐름 — HBM5가 5세대가 아닌 이유

HBM(High Bandwidth Memory)은 메모리 칩을 수직으로 쌓아 데이터 전송 속도를 극대화한 구조다. AI 학습·추론용 GPU에서 핵심 부품이다. HBM5는 공식으로는 7세대 HBM이다. 이름에 '5'가 붙었지만 세대 수가 아니라 규격명이다.

세대별 HBM 규격 흐름:

HBM1 (2013): AMD 피지 GPU에 최초 탑재. 1세대.
HBM2 (2016): 엔비디아 P100에 탑재. 대역폭 2배.
HBM2E (2020): 엔비디아 A100 기반. 3.2Gbps.
HBM3 (2022): SK하이닉스가 엔비디아 H100에 공급. 819GB/s.
HBM3E (2024): H200 탑재. SK하이닉스·삼성·마이크론 3파전.
HBM4E (2026 상반기): 삼성전자 세계 최초 샘플 출하 발표. 전작 대비 20% 속도 향상.
HBM5 (2026 공개, 양산 일정 미정): 컴퓨텍스 2026에서 삼성전자가 업계 최초로 실물모형 공개.

HBM4E까지는 '속도'가 가장 큰 차별화 포인트였다. 초당 몇 테라바이트를 전송하느냐가 AI 모델 학습 속도를 직접 결정했기 때문이다. 그런데 HBM5 경쟁에서는 두 회사 모두 기술 발표에서 발열 관리를 전면에 내세웠다. 속도 경쟁에서 열 경쟁으로 무게중심이 옮겨간 신호다.

삼성전자 HBM5 컴퓨텍스 2026 공개 AI 메모리 — ⓒ Samsung Electronics

삼성전자 HPB 기술 — PHY 영역 발열을 직접 잡는다

삼성전자가 HBM5에 적용할 신기술은 HPB(Heat Path Block)다. 이름 그대로 열이 이동하는 경로(Path)를 구조적으로 제어하는 블록이다.

HBM은 메모리 다이(Die)를 수직으로 쌓은 구조다. GPU에 붙을 때 HBM과 GPU 사이에는 PHY(Physical Layer) 영역이 있다. 이 PHY 영역은 데이터 전송이 집중되는 곳이라 발열이 심하다. 기존 HBM은 이 열을 주로 코어 다이를 통해 위로 올려 방열했는데, 이 경로가 길고 비효율적이었다.

HPB는 PHY 영역에서 발생한 열을 코어 다이를 경유하지 않고 직접 외부로 분산하는 구조다. 삼성전자는 HPB를 실제 제품에 통합해 구조 설계뿐 아니라 신뢰성·패키지 안정성까지 검증했다고 발표했다.

함께 발표된 기술 방향:

2나노 베이스 다이 — HBM5의 베이스 다이(최하단 로직 칩)에 2나노 공정을 적용해 처리 효율을 높이고 발열도 줄인다. 더 미세한 공정은 같은 성능에서 전력 소모가 낮아지므로, 열 발생 자체를 줄이는 접근이다.
기술 초격차 전략 — 삼성전자 CTO 송재혁 부사장은 컴퓨텍스 2026 발표에서 "기술로 1등을 목표로 한다"고 직접 언급했다. HBM4E에서 SK하이닉스에 밀린 점유율을 HBM5에서 회복하겠다는 의지다.

SK하이닉스 iHBM의 ICE — 패키지 안에서 열을 잡는다

SK하이닉스는 삼성보다 먼저 HBM5 방열 기술을 공개했다. 5월 말 발표한 iHBM(integrated HBM) 솔루션이 그것이다.

iHBM의 핵심은 ICE(Integrated Cooling Elements)다. 열이 가장 집중되는 HBM과 GPU 사이 D2D PHY 영역에, 열은 잘 전달하면서 전기는 통하지 않는 실리콘 기반 소재로 만든 냉각 소자를 직접 심는다. 기존에는 HBM 패키지 바깥에서 냉각했다면, iHBM은 패키지 안에서 열원 근처에서 바로 잡는 방식이다.

공식 발표된 성과:

열저항 30% 감소 — 열이 외부로 방출되는 경로의 저항이 30% 줄어든다. 같은 클록으로 동작할 때 온도가 낮아지거나, 같은 온도에서 더 높은 성능을 뽑을 수 있다.
기존 공정 활용 가능 — iHBM은 완전히 새로운 제조 설비가 필요한 것이 아니라, 기존 HBM 제조 공정에 ICE 소자를 통합하는 방식으로 대량 생산이 가능하다고 밝혔다. 이는 양산 비용과 일정 면에서 중요한 강점이다.
AI 데이터센터 고밀도 환경 대응 — GPU 서버 랙이 밀집될수록 냉각 문제가 심해진다. iHBM은 외부 냉각 의존도를 줄여 고밀도 AI 데이터센터 운영 비용을 낮추는 효과도 기대된다.

SK하이닉스는 HBM3E부터 엔비디아 GPU 탑재 점유율 1위를 지키고 있다. iHBM으로 HBM5에서도 그 위치를 유지하겠다는 전략이다.

왜 속도보다 발열인가 — AI 데이터센터의 열 관리 현실

HBM1~HBM3E 세대의 경쟁은 대역폭이었다. 초당 몇 TB의 데이터를 GPU로 보낼 수 있는지가 AI 모델 학습 속도를 좌우했다.

그런데 HBM5 경쟁에서 두 회사가 모두 발열을 전면에 내세운 이유는 무엇일까. 세 가지가 맞물렸다.

첫 번째, 전력 밀도의 급등이다. 엔비디아 블랙웰(Blackwell) GPU는 소비 전력이 1,000W를 넘는다. 서버 랙 하나에 여러 GPU가 꽂히면 랙 전체 전력이 수십 킬로와트에 달한다. 이 열을 식히는 것이 데이터센터 운영의 핵심 병목이 됐다. HBM이 GPU 옆에 붙어 있으므로 HBM 자체의 발열도 문제다.

두 번째, 발열이 성능을 직접 제한한다. 반도체는 일정 온도 이상이 되면 스로틀링(성능 제한)이 걸린다. HBM이 과열되면 대역폭이 자동으로 낮춰져 GPU가 메모리를 충분히 빠르게 읽지 못한다. 아무리 빠른 HBM을 만들어도 발열을 못 잡으면 최고 성능을 지속할 수 없다.

세 번째, 데이터센터 냉각 비용이다. AI 클라우드를 운영하는 기업들은 전력 비용의 상당 부분을 냉각에 쓴다. 메모리 자체의 발열이 줄어들면 외부 냉각 부하가 감소하고, 이는 운영 비용 절감으로 이어진다. 서비스를 운영하는 측에서 HBM5의 열 효율이 클라우드 단가에 직접 영향을 준다는 의미다.

정리하면, HBM5의 발열 경쟁은 단순한 기술 마케팅이 아니다. AI 인프라 운영 비용의 핵심 변수로 열 관리가 부상했기 때문에, 두 회사 모두 발열을 첫 번째 차별화 포인트로 올린 것이다.

AI 인프라 비용에 미치는 영향 — MLOps·개발자가 알아야 할 것

HBM5는 아직 양산 일정이 공개되지 않았다. 삼성전자가 컴퓨텍스에서 공개한 것은 실물모형(목업)이므로, 실제 GPU에 탑재되어 개발자가 쓸 수 있는 시점은 2027~2028년이 될 가능성이 높다.

그럼에도 지금 이 기술 방향을 알아야 하는 이유가 있다.

GPU 세대 전환 예측

엔비디아의 블랙웰 아키텍처는 HBM3E를 사용한다. 다음 세대(루빈, Rubin)는 HBM4로 전환이 예상된다. 그 다음 세대에서 HBM5가 채택될 것이다. AI 학습 인프라를 구성할 때 어느 세대의 GPU를 도입하느냐에 따라 메모리 대역폭과 열 효율이 달라진다.

클라우드 GPU 가격 변화

HBM5가 탑재된 GPU가 상용화되면, 이전 세대 HBM3E 기반 GPU(H100, H200)의 클라우드 가격이 내려갈 것이다. AI 학습에 쓸 GPU 인스턴스를 선택할 때 이 가격 사이클을 참고할 수 있다. 지금 H100 인스턴스가 비싸더라도, HBM4·HBM5 세대 GPU가 나오면 상대적으로 저렴해진다.

메모리 대역폭 최적화 필요성

모델 학습에서 메모리 대역폭이 병목이 되는 경우, 배치 크기(batch size)와 시퀀스 길이를 조정해 메모리 접근 패턴을 최적화하는 것이 중요하다. HBM5 세대가 더 높은 대역폭과 지속 성능을 제공하더라도, 메모리 접근 패턴을 이해하고 최적화하는 능력은 어느 세대에서나 중요하다. Flash Attention, KV Cache 최적화 같은 기술은 HBM5 시대에도 핵심 역량이 된다.

참고 자료

HBM5는 언제 양산되나요?

삼성전자가 컴퓨텍스 2026에서 공개한 것은 실물모형(목업)입니다. 아직 양산 일정은 공식 발표되지 않았습니다. 통상적으로 목업 공개에서 양산까지 1~2년이 소요됩니다. HBM4E가 2026년 상반기 샘플 출하 수준임을 감안하면, HBM5 양산은 2027~2028년이 현실적인 시점입니다. 정확한 일정은 삼성전자와 SK하이닉스의 공식 발표를 기다려야 합니다.

삼성전자 HPB와 SK하이닉스 iHBM은 어느 쪽이 더 나은가요?

두 기술 모두 아직 실제 제품으로 검증되지 않았습니다. HPB는 PHY 영역에서 열 경로를 구조적으로 바꾸는 방식이고, iHBM의 ICE는 패키지 안에 냉각 소자를 직접 통합하는 방식입니다. 접근 방법이 다르고, 실제 GPU에 탑재됐을 때의 성능과 신뢰성은 제품이 출시된 이후 벤치마크로 확인해야 합니다. 지금은 어느 쪽이 낫다고 단정할 수 없습니다.

HBM5가 AI 학습 속도를 얼마나 높이나요?

HBM5의 정확한 대역폭 수치는 공개되지 않았습니다. HBM 세대별로 대역폭이 크게 향상되어 왔으므로 HBM5도 HBM4E보다 높을 것으로 예상되지만, 구체적인 수치를 지금 단계에서 인용하는 것은 부정확합니다. AI 학습 속도는 메모리 대역폭 외에도 GPU 컴퓨팅 파워, 통신 대역폭, 소프트웨어 최적화 등 여러 요인이 함께 결정합니다.

HBM5가 클라우드 GPU 가격을 낮추는 데 영향을 주나요?

직접적이고 즉각적인 영향은 없습니다. 다만 HBM5 기반 GPU가 상용화되면 이전 세대(HBM3E 기반 H100·H200)의 클라우드 인스턴스 가격이 내려가는 흐름이 나타날 가능성이 있습니다. 반도체 세대 교체에 따른 가격 조정은 보통 1~2년에 걸쳐 점진적으로 이뤄집니다. 지금 당장의 가격 변화보다는 중장기 인프라 전략의 참고 지표로 삼는 것이 적절합니다.

Flash Attention이 HBM 발열 문제와 관련이 있나요?

직접적인 관련이 있습니다. Flash Attention은 GPU HBM에 대한 읽기·쓰기 횟수를 줄이도록 설계된 알고리즘입니다. HBM 접근이 줄어들면 전력 소모와 발열도 함께 낮아집니다. Flash Attention 2·3는 대형 트랜스포머 모델 학습에서 HBM 병목을 줄이는 핵심 기술로, HBM5 세대에서도 계속 중요하게 쓰일 것입니다. 메모리를 효율적으로 접근하는 소프트웨어 최적화가 하드웨어 발전을 보완합니다.

삼성전자 HBM5가 SK하이닉스를 따라잡을 수 있을까요?

HBM3E 시장에서 SK하이닉스가 엔비디아 GPU 탑재를 선점하며 점유율 우위를 가져갔습니다. 삼성전자는 HBM5에서 이를 만회하겠다는 의지를 컴퓨텍스 발표에서 명확히 밝혔습니다. 기술적으로 HPB와 2나노 베이스 다이는 경쟁력 있는 방향이지만, 실제 양산 품질과 대형 고객 수주(특히 엔비디아)가 점유율을 결정합니다. 기술 공개만으로 점유율 역전을 단정하기는 이릅니다.

삼성전자HBM5SK하이닉스AI메모리방열iHBMGPUAI데이터센터반도체컴퓨텍스

EXPLORE / Big Tech Updates

이어서 읽어보기

Big Tech UpdatesSK하이닉스 iHBM 발표 — AI 데이터센터에서 발열·전력·냉각이 GPU만큼 중요해진 이유2026-05-26

Big Tech Updates삼성전자 HBM4E 세계 최초 샘플 출하 — 전작 대비 20% 빠른 속도, AI 메모리 경쟁2026-05-29

Big Tech UpdatesSK하이닉스 나스닥 상장 — 40조 HBM 투자가 개발자 AI 인프라 비용에 미치는 영향2026-07-11

Big Tech Updates젠슨 황 방한과 네이버 피지컬 AI 협력 — 엔비디아 GPU 6만 장이 의미하는 것2026-06-01

전체 토픽 둘러보기 →