CodeWithLLM-Updates
-

Кілька цікавих апдейтів за травень. На фоні новин про xAI, Anthropic теж здивували, оголосивши 6 травня про партнерство зі SpaceX для розширення своїх обчислювальних потужностей.

Знижки від Anthropic та перехід на нове ціноутворення
https://www.anthropic.com/news/higher-limits-spacex
Anthropic оголосила про тимчасову "весняну знижку" на використання API своїх моделей. Також перестали блокувати використання у стилі OpenClaw. Але це радше спроба загладити кути перед великими змінами: компанія все частіше натякає на перегляд класичної моделі «фіксована підписка — безлімітний чат».

Замість оплати "за токени" впроваджується динамічний прайсинг (Compute-based pricing). Вартість запиту залежатиме від того, скільки обчислювальних ресурсів модель витратила на "міркування" (reasoning).

Оновлення Claude Code
https://code.claude.com/docs/en/whats-new#week-18
У windows нарешті Claude Code більше не вимагає встановленого Git Bash, якщо він відсутній, інструмент тепер нативно використовує PowerShell.

Робота у хмарі. Відкрили публічний доступ (research preview) до нової команди /ultrareview яка піднімає декілька автономних ШІ-агентів у хмарі, які паралельно перевіряють репозиторій на вразливості та баги. До цього ще запустили команду /ultraplan - велике завдання планування пушится на сервери Anthropic, де під нього піднімається ізольована віртуальна машина (4 ядра CPU, 16 ГБ RAM, зі встановленими Node.js, Python, Rust, Docker тощо), а після видає посилання на веб-інтерфейс з результатами.

Керування OpenAI Codex з мобільного
https://openai.com/news/codex-mobile-app/
У відповідь на схожу функцію у Cluade Code OpenAI випустила оновлення для Codex, яке дозволяє керувати AI-агентами зі смартфона. Тепер розробникам не обов'язково бути біля ноутбука: можна апрувити pull requests, запускати пайплайни тестування, вирішувати конфлікти злиття або давати промпти на фікс дрібних багів на ходу. Інтерфейс максимально оптимізовано під голос та швидкі команди — по суті, це кишеньковий пульт до агента на комп'ютері.

Gemma-моделі у Gemini CLI
https://cloud.google.com/blog/products/gcp-cli-gemma
Оновлення термінального клієнта Gemini CLI (v0.40.0) додало експериментальну інтеграцію локальних моделей Gemma. У v0.41.0 з’явилась підтримка Gemma 4 models (experimental). Поки що для інтелектуального роутингу запитів (Model Routing) й повністю offline agent execution поки немає, але команда вже готує повноцінне виконання завдань локально.

Ще покращили роботи за пам'яттю. Tiered Memory (багаторівнева пам'ять) дозволяє агенту зберігати контекст прямо в Markdown-файлах на чотирьох рівнях: від глобальних стилів розробника (у ~/.gemini/GEMINI.md) до правил конкретної директорії проекту. А нова функція Auto Memory фоново аналізує старі сесії, знаходить вдалі рішення і пропонує зберегти їх як багаторазові навички у SKILL.md. Auto Memory Inbox (з v0.42) це система, яка автоматично збирає, класифікує та пропонує важливі фрагменти інформації для довготривалої пам’яті AI-асистента.

Також покращили голосовий режим.