한 줄 핵심: 인텔이 컴퓨텍스 2026에서 코어 울트라 시리즈3를 앞세워 AI PC 시장 주도권 사수에 나섰다. 자체 공정 인텔 18A로 제조된 이 칩은 CPU·GPU·NPU를 통합해 최대 150 TOPS의 플랫폼 AI 파워를 제공한다. 특히 퍼플렉시티(Perplexity)와 협력해 로컬 추론과 클라우드 추론을 동적으로 분배하는 하이브리드 AI를 최초로 시연했다. 엔비디아 RTX Spark, 퀄컴 스냅드래곤 X2 Plus와 함께 AI PC 3파전이 본격화됐다.
이 글이 필요한 사람- 인텔 코어 울트라 시리즈3 탑재 노트북에서 온디바이스 AI 앱 개발을 검토하는 개발자
- 하이브리드 AI(로컬+클라우드 동적 분배) 아키텍처가 실제로 어떻게 구현되는지 궁금한 분
- AI PC 세 플랫폼(인텔·엔비디아·퀄컴)의 개발자 도구와 전략을 비교하고 싶은 분
※ 이 글은 인텔 공식 뉴스룸 발표와 퍼플렉시티 컴퓨텍스 시연 보도를 근거로 작성했습니다. 성능 수치는 인텔 발표 기준이며 실제 환경에서는 다를 수 있습니다.
인텔 코어 울트라 시리즈3는 인텔이 자체 개발한 인텔 18A(1.8나노급) 공정으로 제조된 첫 번째 소비자용 PC 칩이다. CES 2026에서 처음 공개됐고 컴퓨텍스 2026에서 생태계 확장을 발표했다.
핵심 특징:
- 인텔 18A 공정 — TSMC에 위탁하지 않고 인텔이 직접 설계·제조한다. 인텔 파운드리(Intel Foundry) 전략의 핵심 성과물이다. 18A는 백게이트(Backside Power Delivery Network)를 채택해 전력 효율을 높였다.
- CPU + GPU + NPU 통합 — 시스템온칩(SoC) 구조로, AI 연산을 위한 별도 NPU를 내장했다.
- 150 TOPS 플랫폼 AI 파워 — NPU 단독이 아닌 CPU·GPU·NPU를 합산한 플랫폼 단위 수치다. 마이크로소프트 코파일럿 플러스 기준인 40 TOPS를 크게 상회한다.
- 325개 이상의 소비자·기업용 PC 설계 — 에이서, ASUS, 레노버, 삼성전자 등 주요 제조사가 코어 울트라 시리즈3 기반 AI PC를 출시하거나 출시 예정이다.
대표 제품 사례로 에이서 트래블메이트 P6 14 AI는 1kg 미만 무게에 최대 30시간 배터리를 표방한다. 인텔 vPro 기업용 보안 플랫폼을 지원해 기업 환경 도입에 적합하다.
컴퓨텍스 2026에서 가장 주목받은 인텔 발표 중 하나는 AI 검색 엔진 퍼플렉시티(Perplexity)와의 협력이었다. 퍼플렉시티는 코어 울트라 시리즈3 위에서 하이브리드 로컬 서버를 최초로 시연했다.
이 시연의 핵심 기술:
- 추론 오케스트레이션 — AI 질문이 들어오면 로컬 NPU/CPU에서 처리할지, 클라우드 서버로 보낼지를 실시간으로 판단한다. 디바이스 상태(배터리, 메모리, 온도)와 질문 복잡도를 함께 고려한다.
- 로컬 우선 정책 — 간단한 질문이나 개인 컨텍스트가 필요한 질문은 로컬에서 처리해 속도와 프라이버시를 동시에 확보한다.
- 클라우드 스케일아웃 — 복잡한 추론이나 최신 정보가 필요한 경우 클라우드로 스케일아웃한다.
퍼플렉시티 CEO 아라빈드 스리니바스는 컴퓨텍스 무대에서 "이 기능은 현재 인텔 프로세서와 윈도우용 퍼플렉시티 앱에서만 가능하다"고 강조했다. 특정 플랫폼 독점 기능으로 인텔 AI PC의 차별화를 부각한 것이다.
인텔이 이 하이브리드 방식을 강조하는 이유는 명확하다. 엔비디아 RTX Spark나 퀄컴 스냅드래곤 X2 Plus가 순수 온디바이스 AI를 강조하는 것과 달리, 인텔은 로컬과 클라우드의 최적 조합을 인텔 AI PC의 전략적 포지션으로 삼고 있다.
인텔코리아 사장이 언급한 "녹는 토큰(melting/consuming tokens)" 개념은 AI 사용이 늘수록 클라우드 API 비용이 눈에 보이지 않게 쌓인다는 문제를 표현한 말이다.
AI 서비스를 클라우드 API로만 운영할 때의 비용 구조:
- 사용자가 AI를 많이 쓸수록 API 호출 비용이 그대로 서비스 운영비로 이어진다.
- 대화 맥락이 길어질수록 입력 토큰이 기하급수적으로 증가한다(클로드·GPT 모두 이전 대화를 컨텍스트로 넣어야 하므로).
- MAU가 늘수록 클라우드 GPU 비용이 매출을 잠식하는 'AI 래퍼 스타트업의 함정'에 빠지기 쉽다.
하이브리드 AI가 이 문제에 대응하는 방식:
- 간단한 질문은 로컬 NPU에서 처리 → 클라우드 API 호출 횟수 감소 → 비용 절감.
- 개인 컨텍스트(로컬 파일, 이전 사용 이력)는 클라우드로 내보내지 않아 프라이버시 보호와 비용 절약을 동시에 달성.
- 사용자가 많아져도 클라우드 비용이 선형적으로 증가하지 않아 마진 구조가 개선될 수 있다.
퍼플렉시티의 하이브리드 시연이 정확히 이 방향이다. "토큰 사용을 극대화하는 방법은 클라우드와 로컬 하드웨어 모두에서 하이브리드로 실행하는 것"이라는 퍼플렉시티 CEO의 발언은 이 비용 구조를 직접적으로 언급한 것이다.
인텔은 개발자가 코어 울트라 시리즈3 AI PC에 최적화된 앱을 만들 수 있도록 여러 도구를 제공한다.
오픈비노(OpenVINO)
인텔의 AI 추론 최적화 툴킷이다. PyTorch, ONNX, TensorFlow 등 다양한 프레임워크에서 학습한 모델을 인텔 CPU·GPU·NPU에 최적화된 형태로 변환하고 배포한다.
- ONNX Runtime의 인텔 실행 공급자로 바로 통합할 수 있다.
- 정밀도 캘리브레이션(INT8, FP16)으로 모델 크기를 줄이면서 성능을 유지한다.
- 무료 오픈소스로, 상업 라이선스 걱정 없이 사용 가능하다.
인텔 개발자 클라우드(Intel Developer Cloud)
코어 울트라 시리즈3 환경을 클라우드에서 테스트할 수 있는 개발자 접근 서비스다. 실제 하드웨어가 없어도 인텔 NPU 환경에서 모델 성능을 확인하고 최적화 작업을 진행할 수 있다.
인텔 AI PC 개발 프로그램
컴퓨텍스 2026에서 인텔은 AI PC 개발자 지원 프로그램 확대를 발표했다. ISV(독립 소프트웨어 벤처) 파트너십, 기술 지원, 공동 마케팅 등을 포함한다.
국내 기업 중에도 인텔 코어 울트라 시리즈3 기반 기기 탑재 계획이 있는 곳이 있다. 삼성전자 갤럭시 북 시리즈가 대표적인 사례다.
코어 울트라 시리즈3 발표로 AI PC 시장은 세 플랫폼이 각기 다른 전략으로 경쟁하는 구도가 됐다.
| 구분 | 인텔 코어 울트라 시리즈3 | 엔비디아 RTX Spark | 퀄컴 스냅드래곤 X2 |
|---|
| 공정 | 인텔 18A (자체) | 미공개 (TSMC 예상) | TSMC 3nm |
| AI 전략 | 하이브리드 AI (로컬+클라우드) | 온디바이스 AI 집중 | 온디바이스 AI 집중 |
| 호환성 | x86 완전 호환 | ARM64 (에뮬레이션 필요) | ARM64 (에뮬레이션 필요) |
| 개발 도구 | 오픈비노(OpenVINO) | 엔비디아 실행 공급자 (예정) | 퀄컴 AI Hub, QNN |
| 출시 상태 | 출시 진행 중 | 2026년 가을 예정 | 출시 진행 중 |
개발자 선택 기준: 기존 x86 코드베이스를 최대한 유지해야 한다면 인텔이 유리하다. AI 연산에서 최대 성능을 뽑고 엔비디아 생태계(CUDA, RTX 등)를 활용하고 싶다면 RTX Spark를 기다리는 것이 맞다. 퀄컴은 이미 성숙한 AI Hub와 안정적인 ARM64 환경을 제공한다.
인텔 코어 울트라 시리즈3의 150 TOPS는 퀄컴·엔비디아와 비교해 어느 수준인가요?
150 TOPS는 플랫폼 AI 파워(CPU+GPU+NPU 합산) 기준입니다. 퀄컴 스냅드래곤 X2 Plus는 NPU만 80 TOPS이며, 전체 플랫폼 기준은 더 높습니다. 엔비디아 RTX Spark의 구체적인 수치는 아직 공개되지 않았습니다. TOPS 수치를 플랫폼 전체 합산으로 표기하는 인텔 방식과 NPU 단독으로 표기하는 방식이 혼용되어 직접 비교가 어렵습니다. 실제 AI 앱 성능은 TOPS 수치보다 소프트웨어 최적화에 더 크게 의존합니다.
하이브리드 AI 앱을 직접 개발하려면 어떤 도구가 필요한가요?
인텔 플랫폼에서 하이브리드 AI 앱을 만들려면 오픈비노(OpenVINO)와 ONNX Runtime을 조합하는 것이 출발점입니다. 로컬 추론 부분은 OpenVINO로 인텔 NPU에 최적화하고, 클라우드 연결 부분은 Azure OpenAI, 오픈AI API 등을 사용합니다. 어떤 조건에서 로컬과 클라우드를 전환할지 판단하는 오케스트레이션 로직이 핵심이며, 이 부분은 직접 설계해야 합니다. 퍼플렉시티처럼 완성된 하이브리드 SDK를 제공하는 도구는 아직 표준화되지 않았습니다.
인텔 18A 공정이 TSMC와 비교해 어떤 의미가 있나요?
인텔 18A는 TSMC N3(3나노급)와 경쟁하는 인텔의 자체 공정입니다. 백게이트 전원 공급(Backside Power Delivery)을 적용해 칩 면적 대비 성능과 전력 효율을 높였습니다. 인텔이 자체 공정으로 경쟁력 있는 PC 칩을 만들었다는 것은 인텔 파운드리(IFS) 전략의 가시적 성과입니다. 다만 인텔 18A 양산 수율이 TSMC 수준으로 안정화됐는지는 외부에서 검증하기 어렵습니다.
오픈비노(OpenVINO)는 무료로 사용할 수 있나요?
네, OpenVINO는 Apache 2.0 라이선스로 공개된 오픈소스 툴킷입니다. 상업 프로젝트에도 무료로 사용할 수 있으며 GitHub에서 소스코드를 확인할 수 있습니다(github.com/openvinotoolkit/openvino). 인텔 CPU·GPU·NPU 외에도 ARM, NVIDIA GPU에서도 동작하지만, 인텔 하드웨어에서 최적화 효과가 가장 큽니다. 인텔 AI PC 외 환경에서도 사용 가능하지만 인텔 플랫폼에서 성능 이점이 큽니다.
기존 x86 윈도우 앱이 코어 울트라 시리즈3에서 바로 AI 기능을 쓸 수 있나요?
기존 x86 앱은 수정 없이 코어 울트라 시리즈3에서 동작합니다. x86 호환성이 인텔의 가장 큰 강점입니다. AI 기능을 추가하려면 ONNX Runtime + OpenVINO 실행 공급자를 앱에 통합하는 작업이 필요합니다. 기존 앱에 AI 추론을 추가하는 경우, 마이크로소프트의 Windows AI API(Windows ML, DirectML)를 통해 인텔 NPU에 접근하는 방법도 있습니다. 완전히 새로운 앱보다는 기존 앱에 AI 기능을 점진적으로 추가하는 방식이 가장 현실적입니다.
하이브리드 AI를 쓰면 사용자 데이터가 로컬에 남는다는 게 항상 보장되나요?
그렇지 않습니다. 하이브리드 AI는 개발자가 어떻게 구현하느냐에 달려 있습니다. "로컬 처리"가 기본이더라도, 앱이 특정 쿼리를 클라우드로 전송하면 그 데이터는 외부 서버로 나갑니다. 사용자 데이터 보호를 보장하려면 개발자가 어떤 데이터가 언제 클라우드로 전송되는지 명확히 공개하고, 사용자에게 선택권을 줘야 합니다. 하이브리드 AI는 프라이버시에 유리한 구조를 제공하지만, 자동으로 프라이버시를 보장하지는 않습니다.