LLM 모델Alibaba Cloud
Qwen 3.5
Open-source hybrid MoE model with 1M context
Qwen 3.5는 Alibaba Cloud의 Qwen 팀이 2026년 2월 출시한 오픈소스 플래그십 모델이다. 397B 총 파라미터 중 17B만 활성화하는 Gated DeltaNet+MoE 하이브리드 아키텍처로, 활성 메모리를 95% 절감하면서 1M 토큰 컨텍스트를 지원한다. 256K 컨텍스트 기준 Qwen3-Max 대비 8.6배, 256K 기준 19배 빠른 디코딩 속도를 달성했다. 201개 언어를 지원하며, 네이티브 멀티모달(텍스트+이미지+비디오)을 갖췄다. Apache 2.0 라이선스로 셀프호스팅·파인튜닝이 자유롭고, API도 입력 $0.20/1M으로 업계 최저가급이다.
컨텍스트
1M tokens
입력 가격
$0.20/1M tokens
출력 가격
$1.56/1M tokens
멀티모달
text, image, video
핵심 역량
컨텍스트 윈도우
1M 토큰 (Gated DeltaNet 근선형 스케일링)
코딩 강도
우수
추론 강도
하이브리드 추론 지원
가격 효율
입력 $0.20/1M — 업계 최저가급
오픈소스
Apache 2.0, 셀프호스팅·파인튜닝 자유
다국어
201개 언어·방언 지원
장점
- 입력 $0.20/1M — GPT-5.4 대비 12.5배, Claude Opus 대비 25배 저렴
- 1M 토큰 컨텍스트 — Gated DeltaNet으로 근선형 스케일링
- 397B/17B MoE — 활성 메모리 95% 절감으로 효율적 추론
- 201개 언어 지원 — 업계 최다 다국어 커버리지
- Apache 2.0 오픈소스 — 셀프호스팅·파인튜닝 자유
- 네이티브 멀티모달(텍스트+이미지+비디오)
단점
- 에이전트 도구 생태계는 Claude Code·ChatGPT 대비 부족
- 셀프호스팅 시 대규모 GPU 필요 (397B 파라미터)
- 영어·중국어 외 한국어 성능은 제한적일 수 있음
- 중국 기반 — 일부 기업에서 데이터 주권 우려 가능