TechFeedTechFeed
Big Tech Updates

퓨리오사AI·브로드컴 2나노 AI 칩 공동 개발 완전 분석 — 메타 거절 이후, RNGD 성과, 3세대 아키텍처

퓨리오사AI 메타 $8억 인수 거절 배경, RNGD 추론 칩 성능, 브로드컴 3세대 2nm+HBM4+이더넷 패브릭 파트너십 구조, 2028 샘플링 타임라인, NVIDIA 대항마로서의 의미까지.

by

2025년 3월 퓨리오사AI(FuriosaAI)는 메타(Meta)의 $8억(약 1조 1천억 원) 인수 제안을 거절했다. 가격 문제가 아니라 인수 후 사업 방향과 조직 구조에 대한 이견이었다. 1년여 뒤인 2026년 5월, 퓨리오사AI는 브로드컴(Broadcom)과 3세대 AI 가속기 공동 개발 파트너십을 발표했다.


핵심 스펙은 2나노 컴퓨트 다이, HBM4/4E 메모리, 브로드컴의 이더넷 기반 스케일업 기술이다. 에이전틱 AI 시대 프론티어 모델 추론을 하이퍼스케일 환경에서 처리하는 것이 목표다. 샘플링은 2028년 상반기 예정이다. 메타 거절 이후 독립 노선을 선택한 퓨리오사AI가 어떤 칩을 만들어왔고, 이번 파트너십이 AI 인프라 지형에서 무엇을 의미하는지 다룬다.


퓨리오사AI 배경 — 메타 $8억 거절까지

퓨리오사AI는 2017년 백준호 대표가 삼성전자와 AMD 경력을 바탕으로 설립한 AI 반도체 팹리스 스타트업이다. 임직원 약 140명의 90% 이상이 개발자이며, 구글·퀄컴·삼성 출신 엔지니어들로 구성됐다.


2025년 3월, 메타가 $8억 규모의 인수를 제안했다. 퓨리오사AI는 이를 거절했다. TechCrunch 보도에 따르면 결렬 원인은 가격이 아닌 인수 후 사업 전략·조직 구조에 대한 이견이었다. 메타 내부 AI 칩 팀에 흡수되는 것보다 독립 회사로 글로벌 하이퍼스케일 시장을 직접 공략하는 노선을 택했다.


거절 이후 퓨리오사AI는 LG AI 리서치, 아람코(Aramco)와 파트너십을 체결하고 2세대 칩 RNGD의 상용 검증을 이어갔다. 이번 브로드컴 파트너십은 그 연장선이다.


퓨리오사AI AI 반도체 칩 스타트업
ⓒ FuriosaAI

칩 세대 이력 — Warboy → RNGD → 3세대

세 세대 모두 공통된 철학이 있다. GPU가 아닌 추론(inference) 특화 아키텍처다. 학습(training)보다 추론에 최적화하면 전력 대비 처리량이 유리하다. AI 서비스가 학습보다 추론을 훨씬 더 많이 수행한다는 수요 구조에 맞춘 선택이다.


퓨리오사AI의 자체 아키텍처는 TCP(Tensor Contraction Processor)다. 행렬 곱셈 중심의 트랜스포머 연산을 하드웨어 수준에서 최적화한 구조다. 3세대에서는 이 TCP를 멀티다이(Multi-die) 기반 칩렛 시스템으로 확장한다.


RNGD 레네게이드 — 추론 특화 칩의 검증 결과

RNGD(발음: Renegade, 레네게이드)는 TSMC 5nm 공정, 듀얼 HBM3 메모리를 탑재한 2세대 AI 추론 가속기다.


퓨리오사AI의 자체 주장에 따르면 RNGD는 경쟁 GPU 대비 추론 성능이 2.25배 높다. 이 수치는 LG AI 리서치와의 공동 검증에서 나왔다. 추론에 특화된 아키텍처 덕분에 추론 모델(reasoning model)에서 특히 강점이 있다는 설명이다.


파트너 현황으로 확인된 곳은 LG AI 리서치와 아람코(사우디아라비아 국영 석유기업)다. 아람코는 자체 AI 인프라 독립성 확보 차원에서 퓨리오사AI에 투자하고 검증 파트너로 참여하고 있다.


주의: "추론 성능 2.25배" 수치는 퓨리오사AI의 자체 벤치마크 기반 주장입니다. 독립 3자 검증 결과가 아닙니다. 비교 기준 GPU 모델과 측정 조건이 공개되지 않아 직접 검증이 어렵습니다.


AI 반도체 추론 칩 RNGD
ⓒ FuriosaAI

3세대 칩 기술 스펙 — 2나노·HBM4·이더넷 패브릭

브로드컴과 공동 개발하는 3세대 AI 가속기의 핵심 기술 구성이다.


이더넷 선택이 주목받는 이유가 있다. NVIDIA는 GPU 간 통신에 자체 NVLink(칩 간)와 InfiniBand(노드 간)를 쓴다. 퓨리오사AI + 브로드컴은 표준 이더넷 패브릭을 고도화해 AI 클러스터를 구성한다. 이더넷 기반이면 스위치·어댑터 생태계가 더 넓고 벤더 중립적 인프라를 구성하기 쉽다. 브로드컴은 AI 이더넷 패브릭 시장에서 NVIDIA Spectrum-X와 경쟁하는 Jericho·Tomahawk 스위치 라인업을 보유하고 있다.


브로드컴이 퓨리오사AI를 선택한 이유 — 커스텀 ASIC 전략

브로드컴은 구글 TPU, 메타 MTIA, 애플 뉴럴 엔진 등 대형 테크 기업의 커스텀 AI 칩 설계를 수탁해온 ASIC 파트너다. 이번 퓨리오사AI와의 파트너십은 단순 파운드리가 아니라 공동 설계·패키징·네트워킹까지 포함한 수직통합형 협력이다.


브로드컴의 전략은 명확하다. NVIDIA GPU가 지배하는 AI 훈련 시장에서 추론 특화 칩 생태계를 별도로 구축하는 것이다. 추론 칩 시장은 AI 서비스가 확산될수록 훈련 칩보다 규모가 커질 가능성이 높다. 고객사 하나하나에게 맞춤형 ASIC을 제공하면서 자체 AI 패브릭(이더넷 스위치·SerDes)까지 판매하는 것이 브로드컴의 수익 구조다.


The Register는 이번 파트너십을 "Broadcom lands FuriosaAI as latest custom AI chip partner"라고 표현했다. 이미 구글·메타·애플·바이트댄스 등을 ASIC 고객으로 두고 있는 브로드컴이 퓨리오사AI를 새로운 하이퍼스케일 AI 칩 파트너로 편입한 것이다.


브로드컴 AI 반도체 칩 패키징
ⓒ Broadcom

개발자가 봐야 할 의미 — NVIDIA 대항마로서의 추론 칩

퓨리오사AI·브로드컴 파트너십이 개발자 관점에서 중요한 이유는 세 가지다.


① AI 추론 비용 경쟁이 하드웨어 레벨로 내려온다: GPT, 클로드, 제미나이 같은 AI API의 가격 경쟁은 궁극적으로 칩 레벨 추론 비용으로 귀결된다. NVIDIA H100/H200이 사실상 독점하는 현재 구조에서 RNGD·3세대 칩 같은 대안이 실제로 하이퍼스케일에 채택되면 API 가격 하락 압력이 생긴다.


② 이더넷 기반 AI 클러스터가 주류가 될 수 있다: InfiniBand 없이 이더넷으로 AI 클러스터를 구성하는 것이 현실화되면 기존 네트워크 인프라를 AI에 활용하는 문이 넓어진다. 클라우드 비용 절감이나 온프레미스 AI 인프라 구축에도 영향을 줄 수 있다.


③ 2028년 샘플링이라는 현실적 타임라인: 3세대 칩은 2028년 상반기 샘플링, 상용화는 그 이후다. 지금 당장 인프라 선택에 영향을 주지 않는다. RNGD(2세대) 기반 서비스가 실제로 출시되어 안정적 성능을 보일지가 단기 지표다.


참고 자료


자주 묻는 질문

퓨리오사AI가 메타 인수를 거절한 이유가 뭔가요?

TechCrunch 보도에 따르면 가격 문제가 아닌 인수 후 사업 전략과 조직 구조에 대한 이견이었습니다. 메타 내부 AI 칩 팀에 흡수되면 독립적인 칩 로드맵을 유지하기 어렵다고 판단한 것으로 분석됩니다. 거절 이후 LG AI 리서치·아람코·브로드컴 등 더 큰 파트너십 계약들을 성사시켰습니다.


TCP(Tensor Contraction Processor) 아키텍처가 GPU와 어떻게 다른가요?

GPU는 원래 그래픽 렌더링을 위한 범용 병렬 연산 구조입니다. AI 훈련·추론에도 쓰이지만, 트랜스포머 연산 전용으로 설계된 것은 아닙니다. TCP는 행렬 곱셈(matrix multiplication)과 텐서 축약(tensor contraction) 연산에 특화된 아키텍처로, 트랜스포머 기반 LLM 추론에서 불필요한 연산 오버헤드를 줄이도록 설계됐습니다. 특화 아키텍처의 단점은 다양한 워크로드 유연성이 GPU보다 낮을 수 있다는 점입니다.


3세대 칩이 2028년 샘플링이면 실제 서비스 적용은 언제인가요?

반도체 업계에서 "샘플링"은 설계 완료 후 소량의 칩을 고객에게 제공해 검증하는 단계입니다. 샘플링 이후 설계 수정, 대량 생산(MP), 고객 통합 테스트를 거쳐야 합니다. 통상 샘플링에서 실제 상용 서비스까지 1~2년이 더 걸립니다. 즉, 3세대 칩 기반 AI 서비스는 빠르면 2029년, 안정화는 2030년 전후로 전망됩니다.


브로드컴은 NVIDIA와 어떤 관계인가요?

브로드컴은 AI 칩 시장에서 두 가지 역할을 합니다. 첫째, 커스텀 ASIC 설계 수탁: 구글 TPU, 메타 MTIA 등 빅테크의 전용 AI 칩을 설계·패키징합니다. NVIDIA의 직접 경쟁자는 아닙니다. 둘째, AI 패브릭 네트워크: 브로드컴의 이더넷 스위치 칩은 AI 클러스터 내부 통신에 쓰이며, 이 영역에서는 NVIDIA의 InfiniBand·Spectrum-X와 경쟁합니다. 퓨리오사AI와의 파트너십은 두 번째 역할(이더넷 AI 패브릭)을 강화하는 방향입니다.


RNGD는 현재 어디서 살 수 있나요?

RNGD는 현재 일반 판매 제품이 아닙니다. LG AI 리서치, 아람코 등 전략 파트너와의 B2B 검증 단계에 있습니다. 퓨리오사AI는 하이퍼스케일 기업 및 대형 AI 인프라 고객을 대상으로 영업 중이며, 공개 구매는 제공되지 않습니다. 클라우드 서비스 형태로 접근할 수 있는 파트너가 생기면 개발자 접근성이 생길 전망입니다.


2나노 공정은 왜 중요한가요?

공정 노드(nm)가 작을수록 같은 면적에 더 많은 트랜지스터를 넣을 수 있고 전력 소비가 줄어듭니다. TSMC 2나노는 현재 개발 중인 최전선 공정으로, N2 노드라고 불립니다. 전 세대(3nm, 4nm) 대비 성능 향상과 전력 절감을 동시에 달성할 수 있습니다. AI 칩에서 전력 효율은 데이터센터 전기요금과 냉각 비용에 직결되기 때문에 중요합니다. 다만 2nm 공정은 수율과 생산 비용이 높아 단가도 올라갑니다.


AI 가속기 반도체 칩 아키텍처
ⓒ FuriosaAI / Broadcom
퓨리오사AIFuriosaAI브로드컴Broadcom2나노AI반도체RNGD추론칩AI인프라칩렛

관련 포스트

SK하이닉스 iHBM 발표 — AI 데이터센터에서 발열·전력·냉각이 GPU만큼 중요해진 이유2026-05-26NHN클라우드 팩토리X 완전 분석 — B200 7,656장 AI 클러스터, 개발자가 알아야 할 것2026-05-27메타 AMD 최대 $1000억 칩 딜 — NVIDIA 독점 균열과 AI 인프라 전쟁의 새 국면2026-05-26xAI 콜로서스 완전 분석 — GPU 20만 장을 122일 만에 구축한 방법과 AI 인프라 전쟁의 새 기준2026-05-28