2026-05-29 23:29 - CodeWithLLM

Ще нові моделі травня.

Cursor Composer 2.5
https://cursor.com/blog/composer-2-5
18 травня 2026 року команда Cursor випустила модель Composer 2.5, яка базується на тій самій відкритій моделі Kimi K2.5 від Moonshot AI, але тепер близько 85% це власне донавчання Cursor. Головна зміна порівняно з Composer 2 — зростання автономності та оптимізація вартості.

Модель пропонує два тарифи: Standard за $0.50 за млн вхідних і $2.50 за млн вихідних токенів, та Fast за $3/$15. У тестах SWE-Bench Pro досягла 49% успішності (проти 12% у Composer 2), тобто навички кодингу та розуміння контексту зросли в рази за доволі прийнятну ціну.

Qwen 3.7 Max
https://qwen.ai/blog?id=qwen3.7
20 травня 2026 року на Alibaba Cloud Summit було анонсовано Qwen3.7-Max. На відміну від попередньої лінійки Qwen 3.6, яка орієнтувалася на загальні завдання, нова версія позиціонується виключно як агентна модель для наддовгих циклів автономної роботи. Головна зміна — стійкість на довгих завданнях.

Alibaba продемонструвала кейс, де модель повністю автономно оптимізувала GPU-ядро протягом 35 годин без жодної участі людини, виконавши понад 1100 викликів інструментів. Контекстне вікно розширили до 1 млн токенів (проти 256k у попередника), а також підвищили "щільність" міркувань на токен.

Qwen3.7-Max може генерувати складні інтерактивні вебзастосунки з одного запиту — включаючи 3D-сцени на Three.js, анімації Canvas, повносторінкові макети та динамічні SVG.

https://openrouter.ai/qwen/qwen3.7-max
Зараз 50% знижка на модель у OpenRouter ($1.25/$3.75), що робить Qwen 3.7 Max поки що чи не найкращим вибором за співвідношенням ціна/можливості для довгих запусків.

Claude Opus 4.8 — менше галюцинацій та більше контролю
https://www.anthropic.com/news/claude-opus-4-8
28 травня 2026 року Anthropic представили Claude Opus 4.8 (ціна така ж як була у 4.7 $5/$25 за млн токенів) й знову очолили глобальний рейтинг Artificial Analysis з оцінкою 61.4, обійшовши GPT-5.5.

Замість фокуса на абстрактних бенчмарках Anthropic зробили ставку на "чесність" системи: модель навчилася прямо говорити "я не знаю" або просити уточнення, а також у 4 рази рідше пропускає приховані баги у власному коді порівняно з Opus 4.7.

В Claude Code з'явилися dynamic workflows. Тепер Opus 4.8 може самостійно планувати масштабне завдання, запускати паралельних субагентів і перевіряти результат перед здачею роботи.

#cursor #qwen #claude #claudecode #newllmmodel

2026

2025

2024