CodeWithLLM-Updates
-
🤖 Інструменти ШІ для програмування: практичні приклади, покрокові інструкції та реальні застосування LLM. Навчіться ефективно працювати з сучасними асистентами програмування.

Google на травневому I/O 2026 вже почав «закручувати гайки» та радикально перекроювати свою інфраструктуру для розробників.

Gemini 3.5 Flash
https://deepmind.google/models/gemini-3-5-flash/
Головним "двигуном" анонсу стала модель Gemini 3.5 Flash, яка передує майбутній 3.5 Pro. Google заявляє, що модель працює значно швидше за попередні покоління та показує frontier-рівень результатів у задачах agentic coding: ~76.2% на Terminal Bench 2.1 та ~55.1% на SWE-Bench Pro.

Нова Flash в рази дорожча за попередню, а масове використання агентів швидко спалює токени та compute.

Тариф за $100.
https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/
Google вводить новий тарифний план — Google AI Ultra за $100 на місяць, який дає вищі ліміти на використання агентів в Antigravity. Також оновлюється дорожчий enterprise-рівень: замість простих лімітів на повідомлення все більше використовується модель «compute-used» — фактична оплата за ресурси агентів та execution.

Все буде Antigravity
https://antigravity.google/blog/introducing-google-antigravity-2-0
Раніше Project IDX базувався на Code OSS (відкритому VS Code). Тепер стратегія змінилася: Google активно переводить фокус з IDX та Firebase Studio у бік Antigravity.

Замість розрізнених інструментів тепер просувається Antigravity 2.0 — «agent-first» платформа для розробки за популярним останніми місяцями підходом чат-посередені. Це пряма відповідь на Codex app та Cursor 3, але з повним контролем з боку Google над execution environment, sandboxing та orchestration агентів. Вони теж відходять від редакторів "як VS Code", але радикально прибрали редактор тексту зовсім.

https://www.youtube.com/watch?v=3arUEZlv9mc

Судячи з малоактивного обговорення на Hacker News і перших відгуків про Antigravity 2, виглядає так, що багато розробників взагалі не перейшли до активного використання інструменту після запуску — він сприймається радше як ще один експериментальний AI-IDE, ніж як стабільний робочий інструмент.

Від Gemini CLI до Antigravity CLI
https://developers.googleblog.com/an-important-update-transitioning-gemini-cli-to-antigravity-cli/
Google офіційно оголосив про закриття старих інструментів. Особливо швидко зникне з 18 червня 2026 року Gemini CLI (відкритий код, щоденні квоти) та розширення Gemini Code Assist - вони припиняють обслуговувати запити для безкоштовних користувачів та навіть для підписників AI Pro/Ultra, залишиться тільки для Enterprise.

Google фактично переводить фокус з Gemini CLI та Gemini Code Assist на новий Antigravity CLI (закритий код), який стає основним термінальним інструментом для agentic workflows. Квоти тепер більше схожі не на «кількість промптів», а на модель compute usage — скільки агентів та ресурсів реально використовуєш. Зараз вона працює дуже погано й скоріше збирає баг-репорти, ніж є інструментом розробника.

Окрім моделей Google, у наявності також дві моделі Claude від Anthropic і чомусь GPT-OSS 120B від OpenAI. Все.

Нативний Android в Google AI Studio
https://android-developers.googleblog.com/2026/05/build-android-apps-google-ai-studio.html
В Google AI Studio тепер можна з промпту згенерувати нативний Android-додаток (Kotlin/Jetpack Compose) і запустити його в емуляторі прямо в браузері.

Якщо проект стає складним — Google пропонує «безшовний» експорт в Android Studio для подальшої agentic-розробки.

Кілька цікавих апдейтів за травень. На фоні новин про xAI, Anthropic теж здивували, оголосивши 6 травня про партнерство зі SpaceX для розширення своїх обчислювальних потужностей.

Знижки від Anthropic та перехід на нове ціноутворення
https://www.anthropic.com/news/higher-limits-spacex
Anthropic оголосила про тимчасову "весняну знижку" на використання API своїх моделей. Також перестали блокувати використання у стилі OpenClaw. Але це радше спроба загладити кути перед великими змінами: компанія все частіше натякає на перегляд класичної моделі «фіксована підписка — безлімітний чат».

Замість оплати "за токени" впроваджується динамічний прайсинг (Compute-based pricing). Вартість запиту залежатиме від того, скільки обчислювальних ресурсів модель витратила на "міркування" (reasoning).

Оновлення Claude Code
https://code.claude.com/docs/en/whats-new#week-18
У windows нарешті Claude Code більше не вимагає встановленого Git Bash, якщо він відсутній, інструмент тепер нативно використовує PowerShell.

Робота у хмарі. Відкрили публічний доступ (research preview) до нової команди /ultrareview яка піднімає декілька автономних ШІ-агентів у хмарі, які паралельно перевіряють репозиторій на вразливості та баги. До цього ще запустили команду /ultraplan - велике завдання планування пушится на сервери Anthropic, де під нього піднімається ізольована віртуальна машина (4 ядра CPU, 16 ГБ RAM, зі встановленими Node.js, Python, Rust, Docker тощо), а після видає посилання на веб-інтерфейс з результатами.

Керування OpenAI Codex з мобільного
https://openai.com/news/codex-mobile-app/
У відповідь на схожу функцію у Cluade Code OpenAI випустила оновлення для Codex, яке дозволяє керувати AI-агентами зі смартфона. Тепер розробникам не обов'язково бути біля ноутбука: можна апрувити pull requests, запускати пайплайни тестування, вирішувати конфлікти злиття або давати промпти на фікс дрібних багів на ходу. Інтерфейс максимально оптимізовано під голос та швидкі команди — по суті, це кишеньковий пульт до агента на комп'ютері.

Gemma-моделі у Gemini CLI
https://cloud.google.com/blog/products/gcp-cli-gemma
Оновлення термінального клієнта Gemini CLI (v0.40.0) додало експериментальну інтеграцію локальних моделей Gemma. У v0.41.0 з’явилась підтримка Gemma 4 models (experimental). Поки що для інтелектуального роутингу запитів (Model Routing) й повністю offline agent execution поки немає, але команда вже готує повноцінне виконання завдань локально.

Ще покращили роботи за пам'яттю. Tiered Memory (багаторівнева пам'ять) дозволяє агенту зберігати контекст прямо в Markdown-файлах на чотирьох рівнях: від глобальних стилів розробника (у ~/.gemini/GEMINI.md) до правил конкретної директорії проекту. А нова функція Auto Memory фоново аналізує старі сесії, знаходить вдалі рішення і пропонує зберегти їх як багаторазові навички у SKILL.md. Auto Memory Inbox (з v0.42) це система, яка автоматично збирає, класифікує та пропонує важливі фрагменти інформації для довготривалої пам’яті AI-асистента.

Також покращили голосовий режим.

Якщо казати про всіх великих гравців LLM, то тільки xAI на сьогодні не заробляють на розробниках та програмістах. Схоже почали це виправляти.

Cursor та xAI
https://techsifted.com/posts/spacex-cursor-acquisition-april-2026/
SpaceX/xAI отримує опціон на купівлю Cursor за $60 млрд, якщо купівля не відбудеться — Cursor все одно отримає $10 млрд за партнерство та спільну R&D-роботу. Це право купити компанію пізніше за зафіксованою ціною.

В березні кілька ключових інженерів Cursor переходять працювати в xAI. У травні Cursor починає масштабну міжнародну експансію та найм. Якщо інфраструктура xAI зробить наступні версії ще потужнішими, більшість користувачів Cursor, ймовірно, залишаться.

Реакція розробників неоднозначна. Частина аудиторії Cursor обирала його саме через незалежність — не OpenAI, не Microsoft і не Google, а будь яка їх модель за бажанням. Тепер сервіс потенційно опиняється в екосистемі Ілона Маска чи це вплине на пріоритет моделі Grok поки не зрозуміло.

Дотренування Grok на даних Cursor
https://x.com/elonmusk/status/2055914584373141906
17 травня xAI завершила первинне тренування величезної моделі Grok V9 (1.5 трильйона параметрів). Наступний етап — supplemental training з використанням даних від Cursor. Це дозволить моделям Grok значно покращити кодинг-навички, адже Cursor зібрало величезну базу якісного коду від розробників.

Запуск Grok Build CLI
https://x.ai/news/grok-build-cli https://x.ai/cli
14 травня xAI випустила раню beta версію Grok Build — агента для генерації коду: планування задач, підагенти для паралельної роботи, headless режим для скриптів, підтримка AGENTS.md, diff, плагінів тощо. Все як у дорослих. Це прямий конкурент Claude Code та подібних інструментів.

Але доступний на зараз тільки для підписки SuperGrok Heavy (план за 300$ - є три дні тріал), працює в терміналі тільки Linux/macOS. В windows тільки через WSL. Оновлення виходять майже щодня, користувачі вже хвалять швидкість і якість. Elon Musk особисто просить фідбек.

https://www.youtube.com/watch?v=l_dAOKHLiYw

xAI зараз пропонує акційну підписку на SuperGrok Heavy: замість $300 на місяць тариф тимчасово коштує близько $99 протягом перших шести місяців. Але користувачі скаржаться, що навіть Heavy не відчувається “безлімітним”, а реальні ліміти можуть змінюватись залежно від навантаження на систему.

БД видалив не ШІ
https://idiallo.com/blog/ai-didnt-delete-your-database-you-did
Став популярним твіт: засновник стартапу заявив, що ШІ-агент за кілька секунд повністю видалив їхню продакшн-базу даних. Він обурювався, допитував модель і шукав винних у «поганому AI». Але автор статті каже: це не ШІ винен. Проблема в тому, що в продакшені існував публічний API-ендпоінт, який міг одним запитом знищити всю базу.

Це як поставити кнопку самознищення на видному місці й дивуватися, коли хтось її натиснув. Ibrahim Diallo каже, що не ШІ видалив базу — це зробили самі розробники небезпечною архітектурою, відсутністю захисту й безвідповідальністю. ШІ просто виявив те, що вони недбало залишили.

Обговорення
https://news.ycombinator.com/item?id=48022742
Більшість людей повністю згодні зі статтею: не ШІ винен, а той, хто дав агенту необмежений доступ до продакшену, не обмежив права API-токена і не поставив захистів. Інструмент може бути небезпечним, але відповідальність завжди на операторі. Багато хто критикує «AI-maximalism» — коли розробники з ентузіазмом дають агентам повний доступ замість sandbox і review.

10 уроків кодінгу з агентом
https://www.dbreunig.com/2026/05/04/10-lessons-for-agentic-coding.html
Завдяки сучасним ШІ-агентам код став надзвичайно дешевим у створенні, але дорогим в підтримці, безпеці та супроводі. Це повністю змінює підхід до розробки: тепер головне — не економити на написанні коду, а грамотно використовувати цю дешевизну.

  1. Впроваджуй, щоб навчатися. За допомогою Spec-Driven Development можна зайти далеко, але сам процес написання коду виявляє рішення, про які ви не подумали, і робить ваш spec кращим. Коли код дешевий – впроваджуй, щоб навчатися.
  2. Перебудовуй часто. Впроваджуй рано і часто, щоб дізнатися більше. Форкай і переписуй божевільні експерименти. Дізнавайся, як далеко можна завести фічу. Звісно, хочеться ітерувати та накопичувати зусилля, але дешевий код означає, що ви можете розвідувати та переосмислювати такими способами, які раніше були неможливими.
  3. Інвестуй у наскрізні тести. Коли ми можемо дешево переосмислювати свій код, варто витрачати час на написання тестів, які вимірюють функції нашого продукту, а не те, як він їх виконує. Нам потрібні поведінкові контракти, які дають свободу перебудовувати та перевпроваджувати.
  4. Документуй наміри. Тести деталізують наші цілі, а код кодує наші методи, але жоден із них не фіксує «чому». Ваш намір мотивує ваші рішення, і збереження його поряд із кодом допомагає вам і вашому агенту накопичувати ці рішення в послідовному напрямку.
  5. Тримай свої spec-и синхронізованими. Оновлюй свої spec-и (markdown-файли з вашими цілями та планами) у міру того, як просувається ваш код і ваші тести. Якщо ставитися до spec-у як до замороженого артефакту, написаного до початку роботи, ви втратите можливість фіксувати навчання під час впровадження. Підтримка його актуальності дозволяє постійно впливати на ваші рішення та рішення ваших агентів, а також полегшує часті перебудови.
  6. Знаходь складні речі. Працюй над проєктом досить довго – і речі перестануть бути легкими. Ви швидко пролітаєте шаблонну роботу, очевидні дизайнерські рішення і починаєте натикатися на потворну, важку роботу: інтуїтивний дизайн, продуктивність, безпека, стійкість і системна архітектура. Будь-хто може «профінтити» легкі речі. Цінність – у важкій роботі. Знайди її і занурюйся.
  7. Автоматизуй усе, що легко. Щоб більше часу приділяти складним речам, мінімізуй час на легкі. Перетворюй навчання на навички, будуй цикли, автоматизуй рев'ю коду, дозволь інструментам накопичувати ефект. Але обережно: не застрягай у «Таємничому будинку».
  8. Розвивай свій смак. Коли код приходить швидко, а зворотний зв'язок – ні, єдиним джерелом зворотного зв'язку, яке встигає, є ви самі. Чим краще ви знаєте свою доменну область, своїх користувачів та їхні проблеми, тим далі ви зможете зайти без узгодження.
  9. Агенти підсилюють досвід. Талановиті розробники недооцінюють, скільки інтуїції вони вкладають у свої промпти: правильні терміни, правильне формулювання, правильний рівень конкретики. Якщо ви знаєте свій стек, ви можете заощадити безліч циклів як під час впровадження, так і під час налагодження, а також скоротити непотрібне дослідження агента. Поєднуйте технічну експертизу з чудовим смаком для непереможної переваги.
  10. Код дешевий, але супровід, підтримка та безпека – ні. Агентний код є «безкоштовним, як цуценята». Підтримка не дешева, і безпека теж. Будуй швидко, але пам'ятай про супровід, який ти береш на себе.

Обговорення
https://news.ycombinator.com/item?id=48019025
активне й переважно позитивне — багато хто вважає її однією з найпрактичніших і тверезих публікацій про роботу з ШІ-агентами. Більшість людей згодні з автором: код став надзвичайно дешевим, тому фокус має зміститися на архітектуру, безпеку, end-to-end тести, підтримку та «смак» (taste). Є й скептики: деякі вважають, що кодинг — лише мала частина роботи, бізнес- та організаційні bottleneck нікуди не дінуться, а в великих компаніях швидкість розробки не є головним обмеженням.

Zed вийшов у версії 1.0
https://zed.dev/blog/zed-1-0
Як Cursor після зміни інтерфейсу змінили мажорну версію, так само 29 квітня 2026 року редактор коду від творців Atom офіційно став 1.0. Пишуть "we've reached a tipping point where most developers can quickly feel at home in Zed (ми досягли переломного моменту, коли більшість розробників можуть швидко відчути себе як вдома в Zed)".

Зроблений на Rust, є GPU-прискорення, колаборативний режим, вбудований Git, дебагер і AI нативно та через Agent Client Protocol. Доступний на macOS, Windows та Linux. Разом з релізом отримав можливість запускати кілька агентів одночасно в одному вікні.

Обговорення
https://news.ycombinator.com/item?id=47949027
Багато хто хвалить швидкість, колаборацію, нативне відчуття та прогрес. Є критика щодо конфігурації під конкретні проекти, AI-фіч (але їх можна вимкнути), доступності та деяких дрібних нюансів. Багато практичних відгуків від тих, хто перейшов/спробував.

Warp повністю відкрили код
https://www.warp.dev/blog/warp-is-now-open-source
28 квітня ШІ клієнт термінала Warp став open-source (AGPL для основного коду + MIT для UI-фреймворка). Тепер спільнота може контриб’ютити, включаючи розробку agent-first workflow через їхнього хмарного агента / оркестратора Oz.

Після того, як Warp відкрив вихідний код клієнта, з’явився популярний community fork під назвою OpenWarp (https://openwarp.zerx.dev, zerx-lab). Проект швидко набрав популярність. Зберігає весь звичний функціонал Warp (блоки, workflows, швидкість, UI), але головне — повністю відкриває AI-шар: можна підключати будь-який OpenAI-сумісний провайдер (DeepSeek, Qwen, Ollama, OpenRouter, LM Studio тощо), задавати кастомні system prompts через шаблони, тримати всі ключі локально і не залежати від хмарного акаунту Warp та платних планів.

GitHub Copilot переходить на оплату за використання
https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/
З 1 червня 2026 року всі плани переходять на usage-based модель з GitHub AI Credits (1 кредит = $0.01). Code completions залишаються безлімітними, а чат, агенти, CLI та інші важкі функції споживають кредити залежно від токенів.

GitHub пояснює перехід тим, що Copilot вже не той простий інструмент автодоповнення, яким був рік тому — тепер це потужні agentic-воркфлоу, чати, code review та складні агенти, які споживають значно більше обчислювальних ресурсів. Фіксована підписка перестала покривати витрати.

Обговорення
https://news.ycombinator.com/item?id=47923357
Багато хто розуміє причини (дорогі агенти й inference), але сильно скаржаться на втрату передбачуваності, зростання витрат для важких користувачів і multipliers для потужних моделей. Є інструменти для підрахунку майбутнього рахунку.

Vibe з новою моделлю та хмарою
https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5
Mistral представили нову агентну модель Medium 3.5 (128B, 256k контекст) та зробили її основною у CLI Vibe. Також тепер є remote agents, які працюють асинхронно в ізольованих sandbox хмари (аналогічно як в Codex чи Claude Code) над довгими завданнями. Можна запускати з CLI або веб інтерфейсу Le Chat зі збереженням історії.

Агентний інтерфейс у Zed
https://zed.dev/blog/parallel-agents
Zed слід за Cursor адаптує свій інтерфейс для керування агентами відразу у декілька чатів. Головним нововведенням є бічна панель Threads Sidebar, що допомагає групувати потоки за проєктами, гнучко налаштовувати доступ агентів до репозиторіїв та відстежувати їхню роботу. Панелі роботи з ШІ перемістили ліворуч, а файли й Git — праворуч.

https://www.youtube.com/watch?v=OLit5C1XE0k

Обговорення
https://news.ycombinator.com/item?id=47866750
Багато програмістів незадоволені зміною інтерфейсу, зазначають, що на практиці запуск кількох агентів одночасно створює величезне «когнітивне навантаження» та ускладнює перевірку коду, бо ШІ все ще пише забагато "сміттєвого" коду. Люди згадують про недопрацьований інтерфейс Git, відсутність нормальних інструментів для рев'ю коду - це треба доробити раніше.

Найбільшим болем залишається ізоляція баз даних, налаштувань (конфігів), портів та тестових даних. Розробники активно обговорюють, як це автоматизувати: дехто пише власні shell-скрипти, дехто використовує Devcontainers, а інші хвалять сторонні інструменти на кшталт Conductor чи Ouijit для управління життєвим циклом таких середовищ.

Claude Design
https://www.anthropic.com/news/claude-design-anthropic-labs
Anthropic представила спеціалізований ШІ-інструмент на базі нової моделі Claude Opus 4.7 та дизайн системи (файл DESIGN.md), створений для процесу продуктового дизайну: створює повністю функціональні інтерактивні прототипи, презентації, лендінги та UI-компоненти, видаючи готовий HTML, CSS та JavaScript-код у режимі реального часу.

Експорт дозволяє одним кліком передати готовий дизайн в середовище Claude Code.

Оновилися моделі, всі обіцяють агентність:

  • DeepSeek V3.2 -> V4. Дві версії V4-Pro і V4-Flash. open-source. Контекст вхід 1М, вихід 384K. Китай. Дешевші сценарії для довгих документів, агентів і автоматизації. Якість коду нижча за інші анонсовані моделі.
  • GPT-5.4 -> GPT-5.5. Презентували як агента, якому можна довірити роботу, де модель має планувати кілька кроків наперед. Код генерує за тестами ще краще, а токенів споживає стільки же. Найкраща на зараз модель на ринку якщо вірити OpenAI.
  • Kimi K2.5 -> K2.6. open-source. Китай. Moonshot AI позиціонує модель як агента для довготривалих завдань з програмування.
  • GLM-5 -> 5.1. open-source. Китай. Кажуть що значно дотягнули саме генерацію коду, кібер безпеку.
  • Qwen 3.5 -> 3.6. Qwen3.6-Plus вийшла як закрита модель, за нею флагман Qwen3.6-Max-Preview.
  • MiniMax M2.5 -> M2.7. open-weights. Китай. Теж довгі завдання, кажуть гарний емоційний інтелект. Також стабільність на скілах у OpenClaw.
  • Важливі open-source / open-weight релізи малих Qwen3.6 для коду: Qwen3.6-35B-A3B — MoE-модель 35B total / 3B active, а Qwen3.6-27Bdense 27B. Це цікаво саме практично, щоб запускати у себе на залізі.

Різниця між GPT-5.5, Kimi K2.6, GLM-5.1, Qwen3.6 Plus, MiniMax M2.7 і DeepSeek-V4-Pro-Max на SWE-Bench Pro тесті лежить у діапазоні приблизно 55–59%, тобто це вже щільна група сильних coding/agent моделей.

Кінець безкоштовного Qwen Code
https://www.reddit.com/r/Qwen_AI/comments/1skeeu5/goodbye_qwen_you_tried_but_you_failed/
Qwen OAuth free tier для Qwen Code вимкнули 15 квітня 2026, тому старий сценарій “залогінитися через браузер і користуватися безкоштовно” більше не працює або дає помилки на кшталт 401 invalid access token, token expired, Internal error, free tier quota exceeded.

Тест відключення Cluade Code за $20
https://www.reddit.com/r/ClaudeAI/comments/1ss3asp/does_claudes_20_plan_no_longer_include_claude_code/
21 квітня 2026 люди помітили, що на сторінці тарифів Anthropic Claude Code зник із Pro-плану за $20 і залишився тільки в дорожчих Max-планах. Anthropic пояснила, що це був A/B-тест / pricing experiment, який зачіпав приблизно 2% нових користувачів.

Схоже, дешевий AI-кодинг поступово закінчується.

Якщо Anthropic йде шляхом вбудови Claude Code у свій десктопний додаток Work (от нарешті додали паралельні сесії https://claude.com/blog/claude-code-desktop-redesign), то OpenAI заходить з іншого боку: на цьому тижні вони оновили кодинговий додаток Codex і додали туди функції керування комп’ютером. Шляхі різні - результат той самий.

Codex як суперапп
https://openai.com/index/codex-for-almost-everything/
На macOS Codex тепер бачить екран, рухає власний курсор, клікає, вводить текст, відкриває будь-які застосунки і працює у фоновому режимі. На всіх платформах є вбудований браузер, генерація зображень, пам’ять (запам’ятовує ваші вподобання та попередні дії -- поки що не в EU/UK), понад 90 плагінів та інтеграцій.

https://www.youtube.com/watch?v=sdNoaztocs0

Хоча в Codex і з’явилася дуже схожа на Cursor приємна функція — в згенерованому сайті можна просто клікнути на будь-який елемент (кнопку, блок, текст, зображення) і одразу додати його до промпту як референс, — загалом для програмістів саме ця тенденція двох компаній (Anthropic і OpenAI) до розширення аудиторії своїх продуктів трохи насторожує.

Обговорення
https://news.ycombinator.com/item?id=47796469
Багато хто бачить у цьому революцію для звичайних людей (не-програмістів): агенти зможуть створювати персональні UI, автоматизувати бізнес-процеси, замінювати цілі програми й радикально підвищувати продуктивність. Програмісти водночас насторожені — безпека й приватність все ще забута: повний доступ (див навіть офіційне демо) агента перетворює комп’ютер на «ворожий пристрій», де навіть txt-файл є вектором атаки.

ChatGPT Pro за $100/міс
https://help.openai.com/en/articles/9793128-about-chatgpt-pro-tiers
На початку квітня закінчилась акція по токенам Codex, тепер з безкоштовного акаунту можна запустити десь два простих завдання й вони беруть тижневий ліміт. В Plus $20 плані тепер теж не розгорнешся, тижневий ліміт підходить для легкої роботі 1-2 години в день. Саме тому з 9 квітня додався ще проміжний між Pro $200 варіант. Новий Pro $100 має 5× вищі, ніж Plus, доступ до GPT-5.4 Pro та GPT-5.3 Instant. Також дії промо до 31 травня 2026 — вдвічі більше токенів.

Це пряма відповідь Anthropic: вони мають Claude Max за $100.

Opus 4.7
https://www.anthropic.com/news/claude-opus-4-7
Оновився Claude Opus з 4.6 на 4.7 - все те саме, тільки ще краще на бенчмарках. Додали adaptive thinking (адаптивне мислення): модель сама вирішує, скільки «думати» перед відповіддю, приховує внутрішній reasoning (тепер за замовчуванням не показує повний ланцюжок думок).

Обговорення
https://news.ycombinator.com/item?id=47793411
Модель стала сильнішою, особливо в кодингу та великих контекстах. Але стає менш debuggable. Тепер неможливо нормально відключити adaptive thinking, що робить Claude Code ще гіршим, треба танцювати з бубном: /effort xhigh, CLAUDE_CODE_DISABLE_1M_CONTEXT=1, "display": "summarized" тощо щоб розуміти що модель генерує.

Anthropic робить круті моделі, але інструменти программування навколо них стають все гірше.

Роки три більшість програм для програмування це були клон VS Code та чат збоку. Нову хвилю схоже запустив Codex - вони випустили свою декстоп програму на Electron без VSC, так само і OpenCode.

Cursor 3
https://cursor.com/blog/cursor-3
Компанія повністю відмовилася від моделі форку VS Code і побудувала новий інтерфейс під кодовою назвою Glass. Головне нововведення — створене з нуля Agents Window, яке дозволяє запускати необмежену кількість агентів одночасно в паралелі: локально, у worktree, по SSH, у хмарі чи навіть у кількох репозиторіях водночас. Нова частина як кажуть написана на Rust+TS.

https://cursor.com/blog/agent-web
Пізніше ще зробили інтеграцію з мобільними девайсами через PWA. Cursor Agents на web і mobile — офіційна можливість запускати cloud agents прямо з телефону або браузера на мобільному пристрої. Можна почати чат з телефону, а потім продовжити на десктопі (або навпаки).

https://www.youtube.com/watch?v=HTKGyLar8AU

Фраза «Cursor 3 just killed the IDE» повторюється як головний хук.

Обговорення
https://news.ycombinator.com/item?id=47618084
Багато хто хвалить сміливість і технічний прогрес агентного майбутнього, але ще більше людей висловлює розчарування і навіть обурення через те, що Cursor радикально відходить від звичної моделі "IDE + плагіни + AI-помічник". Критикують, що компанія йде за інвесторським хайпом "AI замінить розробників", а не за реальними потребами програмістів.

Людям, які хочу писати код, а не керувати командою агентів, доведеться пошукати щось інше, наприклад VS Code чи Zed.

Програма від The Factory
https://factory.ai/news/factory-desktop
Ще одна компанія зробила такий самий клон інтерфейсу для "керування агентами". Цікаво ще мені після встановлення на Windows 11 пише "Not connected to Local Machine. Please download and start the Desktop app, or upgrade to a paid plan to unlock more features.", щоб я завантажив їх апп. Хоча дизайн в них дуже крутий, їх забагованний Electron апп я навіть затестіти не зміг.

Якщо минулого року Claude Code був беззаперечним фаворитом, по ньому було багато туторіалів та додаткових проєктів, то що відбувається з проєктом у 2026 році я до кінця зрозуміти не можу. Судячи зі зменшення кількості відео на YouTube, інші люди також.

У лютому–березні Anthropic анонсував і викотив кілька функцій, які зробили Claude Code набагато автономнішим (agentic). Йде активний перехід від «одного агента в терміналі» до керованої системи завдань та координації фонових агентів (Ctrl+B) з екосистемою інтеграцій хот-релоадед MCP, скілів, хуків та плагінів. Через /teleport можна ініціалізувати remote-сесії /remote-control, якими можна керувати з додатка в телефоні. Введено /loop для періодичного запуску промпту/команди та інструменти cron-планування всередині сесії тощо.

З реально корисного можна відзначити хіба що Auto Mode.

Auto Mode
https://claude.com/blog/auto-mode
Представлений як «середній шлях» між двома крайнощами в Claude Code. Раніше потрібно було або постійно вручну схвалювати кожну зміну файлу та bash-команду (дуже безпечно, але дратує), або використовувати прапор --dangerously-skip-permissions. Новий Auto Mode дозволяє Claude самому вирішувати, які дії є безпечними, і виконувати їх автоматично, без схвалення.

Перед кожним tool call окремий класифікатор (на базі Sonnet 4.6) швидко перевіряє дію на небезпеку. Безпечні дії проходять автоматично, ризиковані — блокуються. Якщо модель наполегливо наполягає на заблокованих діях, у підсумку все одно з'являється запит до користувача.

Обговорення анонсу Claude Mythos
https://news.ycombinator.com/item?id=47679258
Anthropic описує особистість, цілі та обмеження нової моделі в system card. Не випускає її publicly (не буде в загальному доступі) — нібито через різкий стрибок здібностей і ризики безпеки. Заявляють, що Mythos знайшов тисячі zero-day уразливостей в ОС, браузерах, віртуальних машинах тощо (включаючи дуже старі баги). Багато хто пише, що це може сильно змінити кібербезпеку — як у кращий, так і в гірший бік.

https://red.anthropic.com/2026/mythos-preview/
Анонсували й Project Glasswing, де дають доступ до Mythos обмеженому колу компаній, щоб ті фіксили критичний софт за допомогою моделі.


Останнім часом багато людей, які платили за підписку, бачать, що Claude Code стає практично непридатним через нещодавні зміни в політиці та обмеженнях Anthropic без чітких правил. Навіть якщо просто в системному промпті згадати OpenClaw, запит відхиляється з помилкою. Також система стала гірше працювати з не-кодинг завданнями.

Скоріш за все, через запуск нової моделі довелося максимально стиснути весь комп'ют, який раніше просто роздавали для залучення людей в інфраструктуру.

Вихідний код Claude Code
https://twitter.com/Fried_rice/status/2038894956459290963
31 березня хтось випадково опублікував production-build з sourcemap-файлом (~60 МБ) на npm — і весь вихідний код Claude Code став доступним публічно. Деякі вирішили, що це геніальний першоквітневий розіграш. У коді навіть знайшли згадку про rollout window саме на 1–7 квітня. Жарт це був насправді чи реальна помилка — досі сперечаються.

Що саме витекло (за обговореннями у треді):

  • Повна архітектура агента Claude Code (tool use, computer use, bash, файлові операції тощо).
  • Система дозволів та "Bypass Permissions Mode" — детальний опис того, як працюють guardrails.
  • Повний system prompt Claude Code (включаючи security rules та "cyber risk instructions").
  • Логіка телеметрії — що саме відправляється в Datadog (модель, session ID, тип підписки, чи є користувач співробітником Anthropic тощо).
  • Внутрішня інфраструктура: WebSocket-сесії, JWT для інтеграції з IDE, feature flags через GrowthBook, session-ingress тощо.
  • Приховані/невипущені фічі (багато постів із розборами "hidden features").
  • Підсистема "Undercover Mode" — призначена для того, щоб Claude не розголошував внутрішню інформацію Anthropic та не публікував production-build з sourcemap-файлом

Розбір від Alex Kim
https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/
Anthropic спеціально інжектить фейкові інструменти (fake tools), щоб отруїти спроби скопіювати поведінку Claude. Існує серверне узагальнення тексту з криптографічним підписом. Спеціальний режим (undercover.ts), який змушує модель приховувати згадки внутрішніх назв (Capybara, Tengu, Slack-канали, «Claude Code» тощо). Жорстка безпека bash-команд (23 перевірки проти ін'єкцій, символів нульової ширини тощо). Система кешування промптів із «липкими засувами» та 14 векторами інвалідації.

Згадується автономний режим агента KAIROS з командою /dream, щоденними логами, GitHub-webhook’ами та оновленнями кожні 5 хвилин. Схоже, це наступний великий крок після поточного Claude Code.

Найбільш мемний момент — у файлі userPromptKeywords.ts лежить великий regex, який ловить фрази на кшталт: wtf, ffs, omfg, shit, dumbass, fuck you, this sucks, damn it, що показують, що користувач злиться і, швидше за все, модель реагує інакше (автор припускає, що це для покращення досвіду або ескалації).

Витік небезпечний не стільки самим кодом, скільки розкриттям roadmap’у та внутрішніх механізмів захисту.

Візуалізація
https://ccunpacked.dev/ та https://ccleaks.com/
Особливо корисні розробникам, які хочуть зрозуміти, як Anthropic будує агентурні системи (tool calling, multi-agent, planning loop, безпеку bash тощо).

https://www.youtube.com/watch?v=LA3l81oEzJQ

Головні відкриття — приховані функції:

  • KAIROS: постійно активний background-агент, який працює 24/7, стежить за репозиторіями та сам виправляє баги,
  • ULTRAPLAN: глибоке планування до 30 хвилин у хмарі для складних завдань,
  • BUDDY: ігровий Tamagotchi-компаньйон у терміналі з 18 видами та статистикою,
  • DREAM: автоматична система самоочищення та консолідації пам’яті

Розбір від Джо Фабісевіч
https://build.ms/2026/4/1/the-claude-code-leak/
https://news.ycombinator.com/item?id=47609294
Інді-розробник, автор Plinky, пише не про сам виток, а про те, що він говорить про сучасну розробку. Anthropic одразу почав слати DMCA на GitHub (навіть на свої власні форки зі skills і прикладами). А потім з’явились clean-room-реалізації на Python і Rust.

В обговоренні жарти про «Claude сам злив»: класичний хайп про те, що модель сама вирішила «відкрити» себе.

Розбір від Han HELOIR YAN, Ph.D.
https://medium.com/@han.heloir/everyone-analyzed-claude-codes-features-nobody-analyzed-its-architecture-1173470ab622
Стаття більш технічна і спокійна - акцентує увагу не на мемних фішах (типу Buddy, Undercover Mode чи frustration regex), а на архітектурі Claude Code як повноцінного production-grade AI-агента.

Moat (захисний рів) Anthropic — не в самій моделі (LLM), а в harness (обв’язці, системі навколо моделі). Саме завдяки цій обв’язці Claude Code відчувається значно потужнішим за конкурентів, навіть якщо модель не завжди найкраща.

Nvidia Nemotron 3 Super
https://build.nvidia.com/nvidia/nemotron-3-super-120b-a12b
Nvidia презентували свою нову модель - Nemotron 3 Super, open hybrid Mamba-Transformer MoE модель: 120B total / 12B active parameters, 1M token контекст. Зараз безкоштовно в Kilo Code https://blog.kilo.ai/p/nvidia-nemotron-3-super-launch

На Hacker News пост про реліз набрав лише 13 поінтів і 2 коменти, в цілому всім все одно. Nvidia довго це робила й Qwen 3.5 зараз "наздогнав і перегнав" багато кого.

Оновлення моделі від Cursor
https://forum.cursor.com/t/introducing-composer-2/155288
https://cursor.com/blog/composer-2
Composer це власна модель Cursor, яка дає гарні результати на простих завданнях. Версію 2 тренували спеціально на довгих кодинг-завданнях через reinforcement learning. Модель доволі дешева, є звичайний та швидкий варіанти.

а це Kimi K2.5
https://news.ycombinator.com/item?id=47452404
Користувачі помітили, що Cursor Composer 2 базується на китайській моделі з відкритими вагами Kimi K2.5 від компанії Moonshot AI, а не є повністю власною розробкою Cursor «з нуля».

 Модель Kimi K2.5 має специфічну модифіковану ліцензію MIT. Вона вимагає обов'язково вказувати назву "Kimi K2.5" в інтерфейсі, якщо дохід компанії перевищує $20 млн на місяць. Пізніше представники Moonshot та Cursor підтвердили, що між ними є офіційне партнерство. Cursor отримує доступ до Kimi через провайдера інференсу Fireworks AI.

Оновлення інтерфейсу від Cursor
https://forum.cursor.com/t/what-is-cursor-glass/155327
https://cursor.com/glass
Glass це повністю новий інтерфейс який зараз у early access з парадігмою командно центра агентів. Дехто вже скаржиться, що оновлення «примусово» ставить Glass, поки що без перемикання назад.

https://www.youtube.com/watch?v=stRhZIrwa-w

Тепер агенти керуються в одному просторі: проектні трейди, паралельні сесії, marketplace плагінів, вбудований браузер+термінал, Git з одним кліком, Shift+Tab планування з Mermaid-діаграмами та todos.

Це добрий крок, щоб не відставати. Звісно наявний брак своїх ідей, бо має назву як інтерфейс Apple, а зовнішній вигляд як копія Codex app. Але більше зараз проблема, це що не можна тепер легко створювати/відкривати файли вручну тобто свій статус AI IDE, де можна все ще було напряму робити код (редактор для людей) Cursor втрачає.

модель Leanstral
https://mistral.ai/news/leanstral
Mistral AI представляє Leanstral — відкритий код-агент для мови програмування Lean 4 (яка ще interactive theorem prover). Модель з 6B активних параметрів у розрідженій архітектурі навчається не лише виконувати завдання, а й формально доводити правильність реалізацій. Це робить її потужним інструментом для перевірки коду.

Доступна безкоштовно в Mistral Vibe https://mistral.ai/products/vibe (через API labs-leanstral-2603) та для завантаження на власне обладнання та інтеграції з lean-lsp-mcp. Це перший внесок у майбутнє, де формальна верифікація стане повсякденною, а людський ревью перестане бути вузьким місцем.

Реакція ХН
https://news.ycombinator.com/item?id=47404796
Ентузіасти бачать майбутнє в «executable specs» коли агент пише код + докази, і регресії стають неможливими. Скептики нагадують що докази гарантують лише валідність, а не що ти довів саме те, що хотів і для звичайних проєктів (не математика/критичне ПЗ) це поки «overkill».

JetBrains Air
https://air.dev/changelog
JetBrains розробляє Air як Agentic Development Environment тобто Агентне середовище розробки, все це дуже схоже на відповідь до OpenAI Codex app - тут через підписку JetBrains AI Pro/Ultimate. Наразі доступна попередня версія (Preview) під Mac OS, розробка версій для Windows та Linux триває.

Почали як обгортка для Codex та Claude. 5 березня додали ще Gemini CLI та Junie. Тепер можна обирати між різними агентами залежно від завдання або комбінувати їх — один агент може перевіряти роботу іншого.

Можна використовувати ChatGPT підписку (тоді буде тільки Codex). Вхід через Claude Pro, Max та Team скасовано через нову політику використання Anthropic - треба додавати API ключі.

T3 Code
https://t3.codes/
Чомусь Teo вирішив окрім відеоблогера побути розробником - поки що вийшла забаговна обгортка Codex (потім буде й Claude Code) з мінімальним описом та доками. Навіщо це зараз використовувати замість оригінального Codex app мені не зрозуміло.

Cursor рік тому був найвідоміший AI-орієнтований код-редактор, але надалі конкуренція значно зросла.

Запустили свою CLI - за зиму додали там режими Plan і Ask, субагенти та навички, генерацію зображень, вбудовані Mermaid ASCII-діаграми, клавіатурні скорочення.

Cursor Cloud Agents з використанням комп'ютера
https://forum.cursor.com/t/cloud-agents-with-computer-use/152829
https://cursor.com/blog/third-era
Тепер агенти запускають створений софт у власному VM (повноцінному комп'ютеру), тестують зміни, генерують PR з скріншотами та логами. Можуть записувати коротке demo-відео. Можна підключитися до VM агента і подивитися.

https://www.youtube.com/watch?v=tMflcZHo2zI

Записано прямо в новому офісі Cursor. Глибокий розбір останнього великого оновлення, називають це "третьою ерою" Cursor де перша — просто AI-доповнення в редакторі, друга — локальні агенти, третя — повноцінні хмарні агенти з власним комп'ютером. Тепер рухаються в сторону agentic платформи.

Cursor у Zed та JetBrains
https://forum.cursor.com/t/cursor-is-now-available-in-jetbrains-ides/153584
Додали підтримку Agent Client Protocol (ACP) тобто тепер можна використовувати підписку та агента Cursor у тих IDE, що його підтримують як то IntelliJ IDEA, PyCharm, WebStorm.

Zed AI тільки для повнолітніх
https://zed.dev/blog/terms-update
Zed перелічили серед інших змін що додають обмеження 18+ й воно стосується «Service» — тобто хмарної SaaS-частини: створення аккаунту, AI-фіч (Zed Pro, edit prediction тощо).

У треді на Hacker News пояснили, що якщо дозволити <18, треба було б верифікувати згоду батьків, вести окремі політики зберігання/обробки даних, робити age-gate систему. Тому простіше було заборонити.

OpenAI активно намагається перехопити ініціативу у Cluade Code - зараз вкладають в це багато грошей.

Codex безкоштовно ще місяць
https://openai.com/codex/
Продовження оригінального limited-time промо від 2 лютого 2026. Після релізу Windows-версії Codex app подовжили ще на місяць, тепер безкоштовні ChatGPT аккаунти мають можливість генерувати код до 2 квітня. Для Plus - подвійні ліміти.

Codex app під Windows та GPT‑5.4
https://openai.com/index/introducing-gpt-5-4/
OpenAI представила нарешті windows версію Codex app та GPT‑5.4 нову модель, яка поєднує coding-можливості з GPT-5.3-Codex та потужний reasoning. Як завжди модель стала ефективнішою за токенами, швидшою в ітераціях та проактивнішою.

https://www.youtube.com/watch?v=8hNcRChDrNk

Додали спеціальній скіл WinUI App для розробників під Windows. Можна вибирати різні термінали та перемикатися на WSL.

З версії 26.305 додали fast mode де GPT-5.4 працює в 1.5 раза швидше при тому ж рівні інтелекту. З мінусів - не можна редагувати список "Default open destination".

Кажуть що GPT-5.4 може бачити скріншоти, керувати мишею та клавіатурою, запускати Playwright у режимі Interactive для візуального дебагінгу в реальному часі.

WebSocket режим
https://developers.openai.com/api/docs/guides/websocket-mode/
Це постійне з’єднання для Responses API, спеціально створене для довгих агентних workflow з купою tool calls (agentic coding, автоматизація, оркестрація). Для coding-агентів значно менша затримка в ітераціях, до 40% швидше виконання при 20+ tool calls.

Режим вбудовано в Codex App (macOS/Windows). У Codex-Spark режим увімкнено за замовчуванням, а для інших моделей у конфіг ~/.codex/config.toml треба додати responses_websockets_v2 = true (у версії CLI v0.110 буде Under-development features попередження).