엑사원 4.5는 자체 개발 비전 인코더와 LLM을 단일 구조로 통합한 비전-언어 모델(VLM)이다. PDF, PPT, 기술 도면, 재무제표 같은 문서를 이미지와 텍스트를 동시에 읽고 추론한다. 기존 대형 모델 대비 약 7분의 1 크기(33B)로 유사한 성능을 낸다고 LG AI 리서치는 설명한다.
LG CNS 에이전틱 AI 전략 완전 분석 — 엑사원 4.5, AgenticWorks, 멀티 LLM 기업 도입 가이드
LG AI 리서치 엑사원 4.5 STEM 77.3·LiveCodeBench 81.4 벤치마크, AgenticWorks 6개 모듈 구조, 멀티 LLM 아키텍처, Ollama·vLLM 직접 실행법, 셀프호스팅 vs 상용 API 선택 기준까지.
LG AI 리서치가 2026년 4월 엑사원(EXAONE) 4.5를 공개했다. STEM 벤치마크 평균 77.3점으로 GPT-5-mini(73.5), 클로드 소네트 4.5(74.6)를 앞서는 멀티모달 오픈웨이트 모델이다. HuggingFace에서 내려받아 vLLM으로 OpenAI 호환 API 서버를 직접 띄울 수 있다.
LG CNS는 이 모델을 기반으로 AgenticWorks 플랫폼을 출시했다. 특정 LLM에 종속되지 않는 멀티 LLM 구조가 핵심이다. Router 모듈이 작업 성격에 따라 엑사원, 외부 모델을 동적으로 선택한다. LG Display에 도입해 생산성 10% 향상이 확인됐고, LG 그룹 내 8만 명이 챗엑사원을 쓴다. 개발자가 직접 엑사원을 돌리는 방법과 AgenticWorks 아키텍처를 다룬다.
엑사원 4.5 — 멀티모달 오픈웨이트 모델 핵심 스펙
상업적 활용에는 별도 라이선스가 필요하다. 연구·학술·교육 목적이라면 HuggingFace(LGAI-EXAONE/EXAONE-4.5-33B)에서 바로 내려받을 수 있다. OpenAI 호환 API 서버도 공식 지원한다.

AgenticWorks 플랫폼 6개 모듈 구조
LG CNS의 AgenticWorks는 기업이 AI 에이전트를 개발·배포·운영·관리하는 전 과정을 지원하는 풀스택 플랫폼이다. 6개 모듈이 레이어별로 나뉜다.
Router 모듈이 멀티 LLM 아키텍처의 핵심이다. 동일 플랫폼 안에서 엑사원, Jiphyeon(지현, Cohere와 공동 개발한 한국어 특화 모델), 외부 모델을 작업별로 전환한다. 단순 요약은 경량 모델로, 기술 문서 분석은 멀티모달 모델로 라우팅하는 방식이다.

멀티 LLM 아키텍처 — 특정 모델에 종속되지 않아야 하는 이유
AgenticWorks가 단일 LLM 대신 멀티 LLM 구조를 택한 이유는 기업 환경의 작업 다양성 때문이다. 제조 공정 최적화, 법무 계약서 검토, 고객 상담, IT 운영 감시는 각각 요구하는 모델 특성이 다르다. 하나의 모델이 모든 작업에서 비용 대비 최고 성능을 내기 어렵다.
개발자 관점에서 이 구조의 의미는 벤더 락인(vendor lock-in) 완화다. 특정 AI 기업의 API 가격이나 정책이 바뀌어도 Router 설정만 변경하면 대체 모델로 전환할 수 있다. 기업 AI 도입에서 가장 큰 리스크 중 하나인 단일 공급자 의존을 구조적으로 줄이는 접근이다.
LG CNS가 사용하는 주요 모델 라인업은 세 갈래다. 엑사원(EXAONE) — LG AI 리서치가 개발한 한국어·영어 멀티모달 모델. Jiphyeon(지현) — Cohere와 공동 개발한 한국어 특화 모델. 외부 상용 모델 — 작업 특성에 따라 Router가 선택한다.
개발자가 엑사원을 직접 쓰는 방법 — Ollama, vLLM, HuggingFace
엑사원 3.5는 Ollama에서 바로 실행할 수 있다. 엑사원 4.5는 HuggingFace에서 모델 가중치를 내려받아 vLLM 또는 TensorRT-LLM으로 배포한다.
Ollama로 엑사원 3.5 실행 (로컬 간편 실행)# Ollama 설치 후 (https://ollama.com) ollama pull exaone3.5 # 대화 시작 ollama run exaone3.5 # API 서버로 사용 (기본 포트 11434) ollama serve curl http://localhost:11434/api/generate \ -d '{"model": "exaone3.5", "prompt": "Python으로 피보나치 수열 작성해줘"}'
vLLM으로 엑사원 4.5 배포 (OpenAI 호환 API 서버)# HuggingFace에서 모델 다운로드 전 LG AI 리서치 라이선스 동의 필요 # https://huggingface.co/LGAI-EXAONE/EXAONE-4.5-33B # vLLM 설치 pip install vllm # OpenAI 호환 API 서버 실행 python -m vllm.entrypoints.openai.api_server \ --model LGAI-EXAONE/EXAONE-4.5-33B \ --port 8000 # 기존 OpenAI SDK로 호출 (base_url만 변경) from openai import OpenAI client = OpenAI(base_url="http://localhost:8000/v1", api_key="dummy") response = client.chat.completions.create( model="LGAI-EXAONE/EXAONE-4.5-33B", messages=[{"role": "user", "content": "안녕하세요"}] )
엑사원 4.5는 33B 파라미터 모델이므로 FP16 기본 실행에 약 66GB VRAM이 필요하다. RTX 4090(24GB) 단일 GPU로는 부족하다. 4비트 양자화(AWQ 또는 GGUF Q4)를 적용하면 약 17~20GB로 줄어 RTX 4090에서 실행 가능하지만 성능 차이가 발생한다. A100 80GB 단일 GPU가 실용적 기준이다.
엑사원 3.5(2B~32B)는 요구사항이 훨씬 낮다. 7.8B 모델은 8GB VRAM GPU(RTX 3080 등)에서 실행된다.

기업 도입 결과 — LG Display, 챗엑사원 8만 명
AgenticWorks의 공개된 도입 결과는 두 가지다.
LG Display: AgenticWorks 도입 초기 생산성 10% 향상. 3년 내 30% 향상을 목표로 한다. 구체적인 공정 적용 내역은 공개되지 않았다.
ChatEXAONE(챗엑사원): LG 그룹 내 8만 명 이상의 임직원이 사용하는 사내 AI 어시스턴트. 석유화학 공장에서는 AI 에이전트가 협력해 원료 수급·혼합·생산 일정을 최적화하는 데 활용된다. 보험 설계, 금융 상담, 고객 서비스, IT 운영 감시 등 다양한 업무에 에이전트가 배치됐다.
LG CNS는 2026년 5월 IoT Tech Expo 2026에서 북미 제조업 진출도 공개했다. 스마트팩토리 솔루션 Factova를 앞세워 북미 중소 제조사를 타깃으로 삼는다.
셀프호스팅 vs 상용 API — 엑사원 선택 기준
판단 기준을 단순하게 정리하면 이렇다. 일 요청 수가 수만 건 이상이고 데이터 외부 전송이 불가한 환경(금융, 의료, 제조)이라면 셀프호스팅이 유리하다. MVP·프로토타입 단계이거나 트래픽이 예측 불가한 초기라면 상용 API가 현실적이다. 엑사원 4.5 상업 이용은 LG AI 리서치에 별도 문의가 필요하다(contact_us@lgresearch.ai).
참고 자료
- 멀티모달 AI 엑사원 4.5 공개 — LG 공식 보도자료
- EXAONE 4.5 HuggingFace 모델 페이지 (LGAI-EXAONE)
- EXAONE 3.5 공식 GitHub 레포지토리
- LG CNS AgenticWorks 플랫폼 발표 — AIM Research
- Ollama 엑사원 3.5 라이브러리 페이지
자주 묻는 질문
엑사원(EXAONE) 4.5는 무료로 사용할 수 있나요?
연구·학술·교육 목적이라면 HuggingFace에서 무료로 내려받아 사용할 수 있습니다. 상업적 목적으로 사용하려면 LG AI 리서치에 별도 라이선스를 문의해야 합니다(contact_us@lgresearch.ai). 엑사원 3.5는 Ollama를 통해 더 간편하게 로컬 실행이 가능합니다.
AgenticWorks를 외부 개발자도 직접 사용할 수 있나요?
AgenticWorks는 LG CNS의 기업 대상 서비스 플랫폼입니다. 일반 개발자가 직접 가입해 쓰는 SaaS 형태가 아니라, LG CNS와 계약한 기업 고객이 컨설팅·구축 형태로 도입합니다. 기술 문의는 LG CNS 공식 채널(lgcns.com)을 통해야 합니다.
엑사원 4.5를 RTX 4090 단일 GPU로 돌릴 수 있나요?
FP16 기본 실행에는 약 66GB VRAM이 필요해 RTX 4090(24GB) 단일 GPU로는 부족합니다. 4비트 양자화(AWQ 또는 GGUF Q4)를 적용하면 약 17~20GB로 줄어 실행 가능하지만 성능 차이가 발생합니다. A100 80GB 단일 GPU가 실용적 기준이며, RTX 4090 3~4장 멀티 GPU 구성도 가능합니다.
멀티 LLM 라우팅을 개인 프로젝트에 적용하려면?
LiteLLM을 쓰면 OpenAI, Anthropic, Ollama(로컬), HuggingFace 엔드포인트를 동일한 인터페이스로 추상화할 수 있습니다. 작업 유형에 따라 다른 모델로 라우팅하는 로직을 직접 작성하거나, LangGraph의 조건 분기 노드로 구현할 수 있습니다. 단순 프로젝트에서는 LiteLLM, 복잡한 에이전트 그래프는 LangGraph를 조합하는 방식이 실용적입니다.
엑사원 3.5와 4.5의 차이는 무엇인가요?
엑사원 3.5(2024년 12월 출시)는 텍스트 전용 언어 모델로 2.4B, 7.8B, 32B 세 가지 크기를 제공합니다. 엑사원 4.5(2026년 4월 출시)는 자체 개발 비전 인코더를 통합한 멀티모달 모델(33B)로 이미지와 텍스트를 동시에 처리합니다. 실제 활용 면에서 엑사원 3.5는 Ollama로 바로 로컬 실행 가능해 접근성이 높고, 4.5는 문서 이미지 처리가 필요한 엔터프라이즈 용도에 적합합니다.
EXAONE Deep은 일반 EXAONE과 어떻게 다른가요?
EXAONE Deep은 LG AI 리서치가 수학·과학 추론에 특화해 별도 공개한 모델입니다. GitHub(LG-AI-EXAONE/EXAONE-Deep)에서 확인할 수 있습니다. 일반 대화나 문서 처리보다 수치 추론·수학 문제 풀이에 최적화된 용도입니다. 엑사원 4.5가 범용 멀티모달 모델이라면 EXAONE Deep은 추론 특화 변형체입니다.
