본문으로 이동

Qwen

위키백과, 우리 모두의 백과사전.
Qwen
개발자알리바바 클라우드
발표일2023년 4월(2년 전)(2023-04)
안정화 버전
Qwen3-Max /
2025년 9월 5일(5개월 전)(2025-09-05)
Qwen3-235B-A22B /
2025년 7월 25일(6개월 전)(2025-07-25)
Qwen3-Next /
2025년 9월 11일(5개월 전)(2025-09-11)
저장소github.com/QwenLM/Qwen
프로그래밍 언어파이썬
운영 체제
종류챗봇
라이선스Apache-2.0
Qwen 연구 라이선스
Qwen 라이선스
웹사이트chat.qwen.ai

Qwen알리바바 클라우드에서 개발한 대형 언어 모델 계열이다. 많은 Qwen 변형은 Apache-2.0 라이선스에 따라 오픈 웨이트 모델로 배포되는 반면, 다른 변형은 알리바바 클라우드를 통해 서비스된다.[1]

2024년 7월, 사우스 차이나 모닝 포스트는 벤치마킹 플랫폼 SuperCLUE가 Qwen2-72B-Instruct를 오픈AI의 GPT-4o 및 앤트로픽의 클로드 3.5 소네트 다음으로 평가했으며, 다른 중국 모델들보다 앞섰다고 보도했다.[2]

모델

[편집]
위키페탄을 기반으로 Qwen3-Max(Qwen-Image 사용)가 AI 생성한 이미지. 프롬프트는 다음과 같다: 이 이미지를 피카소와 후안 그리스 스타일의 그림으로 변환하세요
언어모델
[편집]

알리바바는 2023년 4월 Qwen이라는 이름으로 Qwen 베타를 출시했고, 2023년 9월 규제 승인 후 대중에게 공개했다.[3][4]

이 모델의 아키텍처는 메타 AI가 개발한 라마 아키텍처를 기반으로 한다.[5][6] 2023년 12월에는 72B 및 1.8B 모델을 다운로드용으로 출시했으며, Qwen 7B 가중치는 8월에 출시되었다.[7][8] 이 모델들은 때때로 오픈 소스로 설명되지만, 훈련 코드가 공개되지 않았고 훈련 데이터도 문서화되지 않았으며, 오픈 소스 AI 정의리눅스 재단모델 개방 프레임워크 조건을 충족하지 않는다.

2024년 6월 알리바바는 Qwen2를 출시했으며, 9월에는 일부 모델을 오픈 웨이트로 출시했지만 가장 진보된 모델은 독점적으로 유지했다.[9][10]

2024년 11월, 오픈AI의 o1과 유사하게 추론에 중점을 둔 모델인 QwQ-32B-Preview가 아파치 2.0 라이선스에 따라 출시되었지만, 데이터 세트나 훈련 방법이 아닌 가중치만 출시되었다.[11][12] QwQ는 32K 토큰의 컨텍스트 길이를 가지며 일부 벤치마크에서 o1보다 성능이 더 좋다.[13]

Qwen-VL 시리즈는 비전 트랜스포머와 LLM을 결합한 시각 언어 모델 라인이다.[5][14] 알리바바는 20억 및 70억 매개변수 변형을 가진 Qwen2-VL을 출시했다.[15][16][17]

2025년 1월, 30억, 70억, 320억, 720억 매개변수 변형을 가진 Qwen2.5-VL이 출시되었다.[18] 72B 변형을 제외한 모든 모델은 아파치 2.0 라이선스에 따라 라이선스가 부여된다.[19] Qwen-VL-Max는 2024년 현재 알리바바의 주력 비전 모델이며 알리바바 클라우드에서 백만 입력 토큰당 0.41달러의 비용으로 판매된다.[20]

알리바바는 Qwen-Audio 및 Qwen2-Math와 같은 여러 다른 모델 유형을 출시했다.[21] 총 100개 이상의 오픈 웨이트 모델을 출시했으며, 해당 모델은 4,000만 번 이상 다운로드되었다.[10] 샌프란시스코에 본사를 둔 Abacus AI가 개발한 "Liberated Qwen"과 같이 열성적인 사람들이 미세 조정된 버전의 Qwen을 개발했는데, 이 버전은 콘텐츠 제한 없이 모든 사용자 요청에 응답한다.[22]

2025년 1월 29일, 알리바바는 Qwen2.5-Max를 출시했다. 알리바바의 블로그 게시물에 따르면 Qwen2.5-Max는 주요 벤치마크에서 GPT-4o, 딥시크, 라마-3.1-405B와 같은 다른 기반 모델보다 우수한 성능을 발휘한다.[23][24] 2025년 2월, 알리바바는 공식 X 계정을 통해 2.5-Max 모델이 공개될 것이라고 발표했지만, 아직 출시되지 않았다.[25]

2025년 3월 24일, 알리바바는 Qwen2.5-VL 모델의 후속작으로 Qwen2.5-VL-32B-Instruct를 출시했다. 이 모델은 아파치 2.0 라이선스에 따라 출시되었다.[26][27]

2025년 3월 26일, Qwen2.5-Omni-7B는 아파치 2.0 라이선스에 따라 출시되었으며, chat.qwen.ai 및 허깅 페이스, 깃허브, ModelScope와 같은 플랫폼을 통해 제공되었다.[28] Qwen2.5-Omni 모델은 텍스트, 이미지, 비디오, 오디오를 입력으로 받고 텍스트와 오디오를 출력으로 생성하여 오픈AI의 GPT-4o와 유사하게 실시간 음성 채팅에 사용할 수 있다.[28]

2025년 4월 28일, Qwen3 모델 제품군이 출시되었으며,[29] 모든 모델은 아파치 2.0 라이선스에 따라 라이선스가 부여되었다. Qwen3 모델 제품군에는 밀집 모델(0.6B, 1.7B, 4B, 8B, 14B, 32B 매개변수)과 희소 모델(3B 활성화 매개변수를 가진 30B, 22B 활성화 매개변수를 가진 235B)이 모두 포함된다. 이 모델들은 119개 언어와 방언으로 된 36조 개의 토큰으로 훈련되었다.[30] 0.6B, 1.7B, 4B 변형을 제외한 모든 모델은 128K 토큰 컨텍스트 창을 가진다. 오픈AI의 o1 및 QwQ 32B와 마찬가지로 Qwen3 모델은 토크나이저를 통해 활성화 또는 비활성화할 수 있는 추론을 지원한다. Qwen3 모델은 chat.qwen.ai를 통해 사용할 수 있으며 허깅 페이스 및 ModelScope를 통해 다운로드할 수 있다.[31]

2025년 9월 5일, 알리바바는 Qwen3-Max를 출시했다.[32] 알리바바의 공식 X 계정에 따르면, 이 모델은 Qwen3-235B-A22B-Instruct-2507, Kimi K2, 클로드 4, 딥시크 3.1와 같은 다른 기반 비추론 모델들보다 성능이 우수하다.[33] Qwen3-Max에는 아직 전용 사고 모드가 없다.[34]

2025년 9월 10일, Qwen3-Next가 아파치 2.0 라이선스에 따라 출시되었으며, chat.qwen.ai 및 허깅 페이스, Model Scope와 같은 플랫폼을 통해 제공되었다. Qwen3-Next에는 두 가지 후훈련된 Instruct 및 Thinking 모델이 포함된다. Qwen3-Next는 컨텍스트 길이 확장(Context Length Scaling)과 총 매개변수 확장(Total Parameter Scaling)이 대형 모델의 미래에 두 가지 주요 트렌드라는 믿음으로 Qwen3-Next라는 새로운 모델 아키텍처로 만들어졌다. Qwen3-Next는 Qwen3 아키텍처에 비해 여러 가지 주요 개선 사항을 도입했다: 하이브리드 어텐션 메커니즘, 고도로 희소한 전문가 혼합(MoE) 구조, 훈련 안정성에 친화적인 최적화, 더 빠른 추론을 위한 다중 토큰 예측 메커니즘. Qwen3-Next 아키텍처를 기반으로 총 80B 매개변수와 3B 활성 매개변수를 가진 모델이 생성되었다. Qwen3-Next 모델은 Qwen3-32b와 비슷하거나 일부 경우 더 나은 성능을 보이면서도 훈련 비용(GPU 시간)의 10% 미만을 사용한다. 추론에서는, 특히 32K 토큰을 초과하는 컨텍스트에서, 10배 이상 높은 처리량을 달성한다. Qwen3.5는 Qwen3-Next 아키텍처의 정교한 버전을 사용할 예정이다.[35]

2025년 9월 22일, Qwen3-Omni는 아파치 2.0 라이선스에 따라 출시되었으며, chat.qwen.ai 및 허깅 페이스와 Model Scope와 같은 플랫폼을 통해 제공되었다. Qwen3-Omni는 텍스트, 이미지, 오디오, 비디오를 처리하고 텍스트와 자연어 음성으로 실시간 스트리밍 응답을 제공할 수 있는 혼합/멀티모달 모델이다.[36]

모델 목록
버전 출시일 Ref.
Tongyi Qianwen 2023년 9월 [37]
Qwen-VL 2023년 8월 [38]
Qwen2 2024년 6월 [10]
Qwen2-Audio 2024년 8월 [39]
Qwen2-VL 2024년 12월 [15]
Qwen2.5 2024년 9월 [40]
Qwen2.5-Coder 2024년 11월 [41]
QvQ 2024년 12월 [42]
Qwen2.5-VL 2025년 1월 [43]
QwQ-32B 2025년 3월 [44]
Qwen2.5-Omni 2025년 3월 [28]
Qwen3 2025년 4월 [29]
Qwen3-Coder 2025년 7월 [45]
Qwen3-Max 2025년 9월 [32]
Qwen3-Next 2025년 9월 [46]
Qwen3-Omni 2025년 9월 [36]
이미지 모델
[편집]

모두 오픈소스 모델들로 2025년 8월 4일에 출시된 Qwen-Image, 2025년 9월 23일에 출시한 Qwen-Image-Edit가 있다. 가장 큰 특징으로는 생성되는 결과물의 일관성을 잘 유지한다는 것이다.

특히 Qwen-Image-Edit 모델의 경우, 구글의 이미지 생성 모델인 나노바나나(Gemini 2.5 flash image)라는 모델과 성능이 비슷하거나 능가함에도 불구하고 오픈소스라는 점이 큰 인기를 끌었다. 모델을 양자화를 시키면 적은 VRAM 환경에서도 원활히 돌아간다.

각주

[편집]
  1. Mo, Liam; Hall, Casey (2024년 9월 19일). Alibaba accelerates AI push by releasing new open-source models, text-to-video. Reuters.
  2. Jiang, Ben (2024년 7월 11일). Alibaba's open-source AI model tops Chinese rivals, ranks 3rd globally (영어). South China Morning Post. 2025년 3월 4일에 원본 문서에서 보존된 문서. 2024년 11월 29일에 확인함.
  3. Horwitz, Josh; Ye, Josh (2023년 4월 11일). Alibaba to roll out generative AI across apps. Reuters.
  4. Hall, Casey (2023년 9월 13일). Alibaba opens AI model Tongyi Qianwen to the public. Reuters.
  5. 1 2 Bai, Jinze 외 (2023년 9월 28일). Qwen Technical Report. arXiv:2309.16609 [cs.CL].
  6. Qwen/techmemo-draft.md (영어). GitHub. 2023년 8월 3일. 2025년 3월 7일에 원본 문서에서 보존된 문서. 2025년 3월 5일에 확인함.
  7. Fan, Feifei (2023년 12월 1일). Alibaba unveils new Tongyi Qianwen AI language model. global.chinadaily.com.cn.
  8. Ye, Josh (2023년 8월 3일). Alibaba rolls out open-sourced AI model to take on Meta's Llama 2. reuters. 2023년 10월 10일에 원본 문서에서 보존된 문서. 2024년 11월 29일에 확인함.
  9. Jiang, Ben (2024년 6월 7일). Alibaba says new AI model Qwen2 bests Meta's Llama 3 in tasks like maths and coding (영어). South China Morning Post.
  10. 1 2 3 Kharpal, Arjun (2024년 9월 19일). China's Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool (영어). CNBC.
  11. Dickson, Ben (2024년 11월 29일). Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview. VentureBeat. 2025년 1월 18일에 원본 문서에서 보존된 문서. 2024년 12월 1일에 확인함.
  12. 故渊 (2024년 11월 28일). 阿里通义千问 QwQ 登场:开源 AI 推理新王, MATH 테스트超 OpenAI o1 模型 - IT之家. ITHome (중국 웹사이트).
  13. Wiggers, Kyle (2024년 11월 27일). Alibaba releases an 'open' challenger to OpenAI's o1 reasoning model. TechCrunch.
  14. Browne, Ryan (2024년 12월 31일). Alibaba slashes prices on large language models by up to 85% as China AI rivalry heats up (영어). CNBC.
  15. 1 2 Franzen, Carl (2024년 8월 29일). Alibaba releases new AI model Qwen2-VL that can analyze videos more than 20 minutes long. VentureBeat.
  16. 沛霖 (2024년 8월 30일). 阿里通义千问推出 Qwen2-VL:开源 2B / 7B 参数 AI 대형 모델, 처리任意分辨率图像无需分割成块. ITHome (중국 웹사이트).
  17. Wang, Peng; Bai, Shuai; Tan, Sinan; Wang, Shijie; Fan, Zhihao; Bai, Jinze; Chen, Keqin; Liu, Xuejing; Wang, Jialin; Ge, Wenbin; Fan, Yang; Dang, Kai; Du, Mengfei; Ren, Xuancheng; Men, Rui; Liu, Dayiheng; Zhou, Chang; Zhou, Jingren; Lin, Junyang (2024년 9월 18일). Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution. Cs.CV. arXiv:2409.12191.
  18. Qwen2.5 VL! Qwen2.5 VL! Qwen2.5 VL! (영어). Qwen. 2025년 1월 26일. 2025년 4월 28일에 확인함.
  19. Qwen/Qwen2.5-VL-72B-Instruct · Hugging Face. huggingface.co. 2025년 4월 28일. 2025년 4월 28일에 확인함.
  20. Jiang, Ben (2024년 12월 31일). Alibaba Cloud cuts AI visual model price by 85% on last day of the year (영어). South China Morning Post.
  21. Franzen, Carl (2024년 8월 8일). Alibaba claims no. 1 spot in AI math models with Qwen2-Math. VentureBeat.
  22. Mims, Christopher (2024년 4월 19일). Here Come the Anti-Woke AIs. WSJ. 2024년 4월 23일에 원본 문서에서 보존된 문서. 2024년 11월 29일에 확인함.
  23. Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model (영어). Github. 2025년 1월 29일.
  24. Baptista, Eduardo (2025년 1월 29일). Alibaba releases AI model it says surpasses DeepSeek. Reuters.
  25. Qwen, Alibaba (2025년 2월 24일). QwQ-Max-Preview. X. 2025년 2월 24일에 원본 문서에서 보존된 문서.
  26. Qwen2.5-VL-32B: Smarter and Lighter (영어). Qwen. 2025년 3월 24일. 2025년 3월 25일에 확인함.
  27. Nikhil (2025년 3월 24일). Qwen Releases the Qwen2.5-VL-32B-Instruct: A 32B Parameter VLM that Surpasses Qwen2.5-VL-72B and Other Models like GPT-4o Mini (미국 영어). MarkTechPost. 2025년 3월 25일에 확인함.
  28. 1 2 3 Dotson, Kyt (2025년 3월 27일). Alibaba releases new open-source AI model to power intelligent voice applications. SiliconANGLE.
  29. 1 2 Ara Shaikh, Jasmeen (2025년 4월 28일). Alibaba unveils advanced Qwen 3 AI as Chinese tech rivalry intensifies. Reuters.
  30. Wiggers, Kyle (2025년 4월 28일). Alibaba unveils Qwen3, a family of 'hybrid' AI reasoning models. TechCrunch. 2025년 4월 29일에 원본 문서에서 보존된 문서. 2025년 4월 29일에 확인함.
  31. Qwen3: Think Deeper, Act Faster (영어). Qwen. 2025년 4월 29일. 2025년 4월 28일에 확인함.
  32. 1 2 Bastian, Matthias (2025년 9월 7일). Alibaba unveils Qwen3-Max-Preview, its largest language model yet (미국 영어). The Decoder. 2025년 9월 13일에 확인함.
  33. Big news: Introducing Qwen3-Max-Preview... (영어). X (formerly Twitter). 2025년 9월 5일에 원본 문서에서 보존된 문서. 2025년 9월 13일에 확인함.
  34. Qwen3 Max - API, Providers, Stats (영어). openrouter.ai. 2025년 9월 8일에 원본 문서에서 보존된 문서. 2025년 9월 13일에 확인함.
  35. Qwen3-Next: Towards Ultimate Training & Inference Efficiency. Qwen Blog. 2025년 9월 10일. 2025년 9월 11일에 원본 문서에서 보존된 문서. 2025년 9월 13일에 확인함.
  36. 1 2 Qwen/Qwen3-Omni-30B-A3B-Instruct · Hugging Face. huggingface.co. 2025년 9월 22일. 2025년 9월 23일에 확인함.
  37. Jiang, Ben (2023년 9월 13일). Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI (영어). South China Morning Post.
  38. Kharpal, Arjun (2023년 8월 25일). Alibaba launches AI model that can understand images and have more complex conversations (영어). CNBC.
  39. 沛霖 (2024년 8월 13일). 阿里通义千问开源 Qwen2-Audio 7B 语音交互 대형 모델: 자유互動, 无需输入文本. ITHome (중국 웹사이트).
  40. Alibaba accelerates AI push by releasing new open-source models, text-to-video. Reuters. 2024년 9월 19일.
  41. Nuñez, Michael (2024년 11월 12일). Qwen2.5-Coder just changed the game for AI programming—and it's free. VentureBeat.
  42. Dotson, Kyt (2024년 12월 26일). Alibaba announces advanced experimental visual reasoning QVQ-72B AI model. SiliconANGLE.
  43. Wiggers, Kyle (2025년 1월 27일). Alibaba's Qwen team releases AI models that can control PCs and phones. TechCrunch.
  44. Franzen, Carl (2025년 3월 5일). Alibaba's new open source model QwQ-32B matches DeepSeek-R1 with way smaller compute requirements. VentureBeat.
  45. Alibaba rolls out new AI coding model Qwen3-Coder, says it's their most powerful (영어). Computerworld. 2025년 7월 24일에 확인함.
  46. Qwen/Qwen3-Next-80B-A3B-Instruct · Hugging Face. huggingface.co. 2025년 9월 11일. 2025년 9월 13일에 확인함.

외부 링크

[편집]