CodeWithLLM-Updates
-

Claude Opus 4.6 Fast Mode
https://code.claude.com/docs/en/fast-mode
Anthropic додали у Opus 4.6 новий прискорений режим генерації, швидкість виводу токенів зростає приблизно в 2,5 раза. При цьому якість відповідей не падає. Коштує значно дорожче (в 6 разів) і доступний як дослідницька функція (preview). Режим доступний й у Github Copilot.

GPT‑5.3‑Codex‑Spark
https://openai.com/index/introducing-gpt-5-3-codex-spark/
GPT-5.3-Codex-Spark — це менша версія GPT-5.3-Codex та модель, оптимізована для генерації коду у реальному часі (понад 1000 токенів на секунду) за допомогаю співпраці з компанією Cerebras. Це крок до гібридного Codex з двома режимами — довгостроковими задачами (години/дні) та реального часу. API поки що тільки для партнерів, ціну не називають.

За оновленням топ закритих моделей оновилися й топ моделі, від китайських компаній.

MiniMax M2.5
https://www.minimax.io/news/minimax-m25
Нова флагманська модель від китайської компанії MiniMax працює на швидкості 100 токенів на секунду, що майже вдвічі швидше за інші передові моделі. Виконує складні завдання на 37% швидше за M2.1 і на рівні з Claude Opus 4.6. Вартість M2.5 в середньому у 10-20 разів дешевша, ніж у Claude Opus, Gemini 3 Pro та GPT-5.

Повністю розгорнута у продукті MiniMax Agent, де користувачі можуть створювати власні "Експерти" для специфічних завдань, використовуючи "Офісні Навички" (Office Skills).

Модель буде доступна 7 днів безкоштовно у OpenCode.

GLM-5
https://z.ai/blog/glm-5
Нова флагманська відкрита (open-source) модель від китайської компанії Zhipu AI (тепер бренд Z.ai), кажуть про "Agentic engineering" (агентна інженерія) — довготривалі складні задачі, кодинг на рівні frontier-моделей. Низький рівень галюцинацій, покращений reasoning, підтримка довгого контексту. Кажуть тренування було на Huawei чипах.

https://www.youtube.com/watch?v=vtWMgVCMsx8

Лідер серед open-weights моделей за Artificial Analysis. Модель сумісна з Claude Code та OpenClaw. Зараз безкоштовно у Kilo Code. Також у OpenCode.

Ollama Cloud
https://docs.ollama.com/cloud та https://ollama.com/pricing
https://ollama.com/library/glm-5
Додали ollama launch opencode --model minimax-m2.5:cloud чи ollama launch claude --model glm-5:cloud так можна запустити основі CLI для програмування підтягнувши в них нові моделі з хмари Ollama. Почати використовувати функцію можна безкоштовно, ще є тарифи за $20 та $100 на місяць.