2025-07-24 18:35 - CodeWithLLM

Qwen3-Coder
https://qwenlm.github.io/blog/qwen3-coder/
Команда китайців Qwen, яка стоїть за розробкою передових ШІ-моделей, оголосила про випуск Qwen3-Coder. Модель Qwen3-Coder-480B-A35B-Instruct використовує архітектуру Mixture-of-Experts з 480 мільярдами параметрів (з яких 35 мільярдів активні), підтримує вікно контексту до 256к токенів "з коробки" і може бути розширена до 1 мільйона токенів. Очікується випуск інших розмірів.

На етапі пост-навчання команда Qwen масштабувала навчання з підкріпленням для коду (Code RL), зосередившись на реальних завданнях, де успіх виконання легко перевірити. Крім того, запровадили довгострокове навчання з підкріпленням (Long-Horizon RL або Agent RL), щоб навчити модель вирішувати складні інженерні задачі, такі як SWE-Bench, шляхом багатоетапної взаємодії із середовищем, включаючи планування, використання інструментів та отримання зворотного зв'язку.

Модель може інтегруватися з Claude Code та Cline.

https://qwenlm.github.io/blog/qwen3-coder/
Для взаємодії з Qwen3-Coder, розробники представили інструмент командного рядка CLI – Qwen Code, це по суті китайська копія Gemini Code.

Ми отримуємо продуктивність рівня Claude 4 Sonnet, тільки значно дешевше.
https://openrouter.ai/qwen/qwen3-coder

#qwen

2026

2025

2024