LLM 모델Alibaba Cloud

Qwen 3.5

Open-source hybrid MoE model with 1M context

Qwen 3.5는 Alibaba Cloud의 Qwen 팀이 2026년 2월 출시한 오픈소스 플래그십 모델이다. 397B 총 파라미터 중 17B만 활성화하는 Gated DeltaNet+MoE 하이브리드 아키텍처로, 활성 메모리를 95% 절감하면서 1M 토큰 컨텍스트를 지원한다. 256K 컨텍스트 기준 Qwen3-Max 대비 8.6배, 256K 기준 19배 빠른 디코딩 속도를 달성했다. 201개 언어를 지원하며, 네이티브 멀티모달(텍스트+이미지+비디오)을 갖췄다. Apache 2.0 라이선스로 셀프호스팅·파인튜닝이 자유롭고, API도 입력 $0.20/1M으로 업계 최저가급이다.

컨텍스트

1M tokens

입력 가격

$0.20/1M tokens

출력 가격

$1.56/1M tokens

멀티모달

text, image, video

핵심 역량

컨텍스트 윈도우

1M 토큰 (Gated DeltaNet 근선형 스케일링)

코딩 강도

우수

추론 강도

하이브리드 추론 지원

가격 효율

입력 $0.20/1M — 업계 최저가급

오픈소스

Apache 2.0, 셀프호스팅·파인튜닝 자유

다국어

201개 언어·방언 지원

장점

입력 $0.20/1M — GPT-5.4 대비 12.5배, Claude Opus 대비 25배 저렴
1M 토큰 컨텍스트 — Gated DeltaNet으로 근선형 스케일링
397B/17B MoE — 활성 메모리 95% 절감으로 효율적 추론
201개 언어 지원 — 업계 최다 다국어 커버리지
Apache 2.0 오픈소스 — 셀프호스팅·파인튜닝 자유
네이티브 멀티모달(텍스트+이미지+비디오)

단점

에이전트 도구 생태계는 Claude Code·ChatGPT 대비 부족
셀프호스팅 시 대규모 GPU 필요 (397B 파라미터)
영어·중국어 외 한국어 성능은 제한적일 수 있음
중국 기반 — 일부 기업에서 데이터 주권 우려 가능

이 모델이 포함된 비교

⚖️비교

Qwen 3 5 vs Nemotron 3 Super vs Deepseek V4

초저가·다국어는 Qwen 3.5, 에이전틱 추론·처리량은 Nemotron 3 Super, 코딩·장문 엔지니어링은 DeepSeek V4

공식 링크

공식 사이트 ↗문서 ↗GitHub ↗