Було відомо, що анонси оновлень моделей двох топ‑компаній заплановані на один і той самий час 5 лютого 2026, але потім Аnthropic опублікувалися на 15 хвилин раніше. А при анонсі ОpenAI їхня модель стала доступна лише в Codex, без доступу через API, що не дозволило всім стороннім проєктам (наприклад Cursor, Cline) одразу надати до неї доступ.
https://www.youtube.com/watch?v=9f2egsZZjnw
Оновлення до Claude Opus 4.6
https://www.anthropic.com/news/claude-opus-4-6
Аnthropic покращили Opus 4.5. Покращені навички планування, автономної роботи, рев'ю коду, з документами, пошуку онлайн. У бета-версії 1M токенів контекстне вікно та автоматичне підсумовування старого контексту для довших завдань (Context Compaction). Головне - здатність виконувати триваліші та складніші завдання автономно.
https://code.claude.com/docs/en/agent-teams
У Claude Code додано агентні команди (Agent Teams) для автономної координації кількох агентів. На відміну від субагентів, які працюють в рамках однієї сесії й взаємодія з ними лише через головного агента, тут можна безпосередньо взаємодіяти з окремими членами команди, не проходячи через лідера.
Обговорення HN
https://news.ycombinator.com/item?id=46902223
Скептицизм переважає над ентузіазмом. Багато користувачів не помічають суттєвої різниці між 4.5 та 4.6, деякі навіть пишуть "10x дорожче за Sonnet, але без різниці". Загальна думка: "всі моделі мають свої проблеми". Масштабна критика Claude Code за повільність, високе споживання пам'яті, використання React для терміналу.
Оновлення до GPT-5.3-Codex
https://openai.com/index/introducing-gpt-5-3-codex/
Покращили GPT-5.2-Codex. Це спеціальна модель для генерації коду складних проєктів та автоматизації. Повинна бути на 25% швидше за 5.2-Codex зберігаючи таку саму точність.
Головний фокус анонсу - Інтерактивна співпраця, можна "steer" під час роботи тобто не зупиняючи модель, допромтити й вона відразу змінить свою стратегію. Це протилежно Opus 4.6, яка намагається сама довго працювати без людини.
Codex як апп
https://openai.com/index/introducing-the-codex-app/
Окрім CLI та розширення до IDE тепер під цією назвою буде й окремий додаток. Він написаний на electron, але на анонсі була тільки mac arm версія з вейт-лістом для інших. Це ще одна спроба створити "центр керування" агентами, такій вже є й у Cursor й у Antigravity. Ця схоже вдала.
https://www.youtube.com/watch?v=ICYbOfW5RoQ
Це графічний інтерфейс (GUI) для Codex CLI, який дозволяє керувати кількома проектами, агентами та розмовами в одному вікні. Швидке перемикання між проектами та додатками. Голосове керування + відкриття у IDE + автоматичні білди + diff-перегляд.
Обговорення HN
https://news.ycombinator.com/item?id=46902638
Користувачі виділяють різні стратегії, які топ-гравці обрали. У Codex - "Steering mid-execution" - можливість керувати під час роботи. Людина залишається "в петлі" контролю. Швидше відновлення після помилок. - Краща робота з backend та "hard". У Claude збільшення автономії для рою агентів й їх довгої роботи, але люди зазначають що "Fire and forget" підхід часто приводить до хаосу й неякісного коду.
Я думаю, що компанія OpenAI прийняла ряд хороших рішень, якщо ми говоримо про генерацію коду для професійних програмістів, а не вайб-кодерів чи прототиперів. Їм більше підходить Opus 4.6 яка роєм у Claude Code скушає багато токенів, але у фіналі згенерує робочу версію.
Мені подобається, що з певного моменту моделі Codex стали писати після мого запиту як вони мене зрозуміли, і на кожному кроці повідомляють, що саме будуть робити. Генерацію можна швидко зупинити, якщо сталося непорозуміння - дописати нові інструкції та роз'яснення. Я бачу в новому Codex app, судячи з відео, за замоченням навіть буде схован показ коду, який редагується, і лише ці текстові повідомлення.
Крім того, працюючи з CLI, я сам собі створив веб‑апп, у якому керую усіма моїми чатами за всіма моїми проєктами, бо робити це зсередини CLI дуже незручно. Новий Codex app, судячи з відео, саме це й робить — буду чекати його версію під Windows.
#newllmmodel #codex #claudecode