Code With LLM

CodeWithLLM-Updates

← Попередній

Квітень 2025

Наступний →

Розробники редактора Zed, ті самі, які вже рік не можуть собі купити комп'ютера з Windows, щоб збирати версію під цю ОС, ось вони подивилися, що їхній Zed AI ще не вийшов, а вже застарів.

Тому почали для своїх бета-тестерів вмикати Agentic Editing - судячи з опису, буде як у інших: сам редагувати код, профілі для чату, файл rules правил із системною інструкцією, перемикання моделей і навіть не тільки від Anthropic, використання MCP. Обіцяють й чекпоінти - зараз у бета це робить через git.

Важливо, що це може стати гарною альтернативою засиллю VS Code і його форків. Як тільки вони зможуть купити собі комп'ютера з Windows. А поки Zed можна поставити через Scoop.

#zed #agentmode

Коментарі

https://codeium.com/blog/windsurf-wave-6

Оновлення Windsurf Wave 6

Головне це функція "Deploys", яка дозволяє одним кліком публікувати веб-сайти або Javascript-додатки в інтернет, нехай цього всього там буде ще більше. Наразі ця функція інтегрована з Netlify і має на меті спростити повний цикл розробки додатків безпосередньо в IDE.

Також поліпшено в діалогах з AI (Cascade) роботу з пам'яттю та навігацію за допомогою "Змісту розмови".

Для не безкоштовних юзерів додано генерацію описів комітів одним натисканням кнопки (в Cursor таке вже дуже давно, у Github Copilot зявилося й працює безкоштовно).

#windsurf

Коментарі

Exponent
https://x.com/exponent_run
З усіма цими програмами не до кінця зрозуміло, в яких вони стадіях розробки і що вони зарелізили, але написали що все ще ранній доступ, так писали і 4 місяці тому, може щось таки доробили.

Augment Agent
https://www.augmentcode.com/
презентували агента. є 14-денний тріал. Агент розроблений для вирішення складних завдань розробки програмного забезпечення, особливо у великих проєктах. Ключовою особливістю є "Спогади" (Memories), які автоматично оновлюються та зберігаються між сесіями, покращуючи якість генерованого коду та адаптуючись до стилю програміста.

Серед інших функцій – MCP (Model Context Protocol), "Контрольні точки" для безпечного відкату змін, мультимодальна підтримка (скріншоти, Figma), виконання термінальних команд та автоматичний режим роботи.

#agentmode #augmentcode

Коментарі

https://block.github.io/goose/blog/2025/04/08/vibe-code-responsibly

Творці проекту Codename Goose (ШІ-агента для контролю комп'ютера) описали можливі рішення проблеми вайбкодингу.

Після твіту Karpathy який ще підхопили ЗМІ дедалі більше людей почали створювати "додатки" та "сайти", просто розмовляючи з ШІ та не заглядаючи в код. Але LLM мережа — не програміст, це кодер (генератор коду).

М'яко кажучи, це створює дуже неякісний, непрофесійний код, основні проблеми якого:

важкий для розуміння людиною "спагеті"-код, де все переплутано з усім. Зазвичай ще й в одному довгому файлі на тисячі рядків.
постійна мутація та дрейфуючі баги: шматки коду, які вже нічого не роблять, та заміна добре працюючих шматків на лайно.
величезна кількість вразливостей, код який легко хакнути.
витік у доступний код закритої інформації, такої як ключі доступу.

Такий код майже неможливо підтримувати. Краще його зовсім не створювати, якщо це не "програма тільки для себе на один раз".

Розробники Goose пропонують краще контролювати та налаштовувати агентні системи, щоб вони стежили за тим, що там генерується в коді:

🧠 "Even if you're vibe coding, don't turn off your brain." (Навіть якщо займаєшся вайбкодингом, не вимикай голову.)
використовувати різні режими контролю роботи агентів, не лише повністю автоматичний.
використовувати ignore-файл (у Cursor це .cursorignore), де перерахувати, що агентам у жодному разі не можна читати-модифікувати, та файл системних інструкцій (тут це goosehints, у Cursor - .cursorrules) для встановлення обмежень.
зараз повно MCP-серверів, включно з вайбнакодженими; їх треба перевіряти і створювати Allowlist (політика дозволу) для агента, включаючи туди лише якісні.
спочатку планувати, потім робити — план добре розбиває все на зрозумілі етапи та різні невеликі файлі з кодом. Кроки можна перевірити (як робити це в Cursor — див це відео).
кожен крок комітити та використовувати git для повернення до коду, що добре працював.

#goose #vibecoding #agentmode #mcp #prompts

Коментарі

https://console.x.ai/
Модель xAI Grok-3 нарешті доступна через API

В доповненнях для програмування де можна додавати свої ключі (Cline, Roo) тепер можна використовувати як напряму, так й через https://openrouter.ai/x-ai/grok-3-beta

У Windsurf доступні всі топові моделі на сьогодні, включаючи Gemini 2.5 Pro (яка попереду у багатьох тестах) та DeepSeek V3 (0324).

Так само у Cursor тепер у налаштування можна обрати deepseek-v3.1, grok-3-beta, gemini-2.5-pro-exp-03-25 та gemini-2.5-pro-max.

У Trae немає зараз ні моделей від Google, ні від xAI.

#grok #newllmmodel #windsurf #cursor #cline

Коментарі

https://windsurf.com/blog/windsurf-wave-7

Оновлення Windsurf Wave 7

Cascade тепер доступний в IDE JetBrains (IntelliJ, WebStorm, PyCharm, GoLand та багатьох інших).

Codeium тепер Windsurf
Вирішили перейменувати компанію на Windsurf та продукт-розширення на Windsurf Plugin. Більше не буде Codeium.

Компанія була заснована у 2021 році Варуном Моханом і Дугласом Ченом з метою підвищення продуктивності розробників за допомогою рішень для кодування на основі штучного інтелекту, і перший рік називалася Exafunction (займалася віртуалізацією GPU).

Пізніше зайнялися автодоповненням коду, створивши плагін для IDE. У 2023 році було додано функції чату всередині IDE та генерації коду. Інтегрували модель GPT-4.

11 листопада 2024 року відбувся запуск Windsurf Editor, який стали просувати як першу IDE на основі AI agent. Незважаючи на те, що першим був Cursor (весна 2023 року), їхні маркетологи постаралися зробити вигляд, що його немає.

Чати з різними контекстами (зазвичай фрейморки) тепер на https://windsurf.com/live/

#windsurf

Коментарі

https://www.pillar.security/blog/new-vulnerability-in-github-copilot-and-cursor-how-hackers-can-weaponize-code-agents

Як можна атакувати автоматичні генератори коду?
Отруюючи системні інструкції (“Rules File Backdoor”) LLM.

У багатьох програмах ШІ-кодінгу зараз є можливість підвантажувати їх з текстового файлу (наприклад, у Cursor це .cursorrules чи тека правил у корені проекту) - просто текстовий файл(и).

Гадаю, лише малодосвідчені програмісти або ті, хто не знайомий, як працюють нові IDE з агентними кодерами, запустять чужий код, не прочитавши перед цим файл інструкцій якщо він там є.

Наступний варіант, це коли ми створюємо проєкт і копіюємо таку інструкцію самі з відкритих каталогів, на кшталт cursor.directory - знову ж таки, треба розуміти, що ти робиш, і читати перед цим.

Але дослідники Pillar Security виявили, що зловмисники можуть використовувати приховані юнікод-символи та інші техніки обходу в текстових файлах правил, щоб обдурити агент-асистентів (наприклад, в Cursor або GitHub Copilot) і змусити їх генерувати код з бекдорами або вразливостями (наприклад, до головної сторінки сайту підвантажувати зовнішній javascript хакера).

Як це працює?

Створення шкідливого файлу правил: Хакер створює файл правил, який виглядає нешкідливо 👀, але містить приховані шкідливі інструкції 😈, використовуючи юнікод-символи.
Впровадження в проєкт: Файл правил потрапляє до спільного репозиторію 🌐 або поширюється через спільноти 🧑‍🤝‍🧑.
Генерація коду: Розробник, використовуючи AI-асистента, генерує код 💻. AI, слідуючи шкідливим правилам, створює код з вразливостями або бекдорами 💥.
Шкідливий код поширюється: Через те, що файли правил часто спільні та використовуються повторно, зараження може поширитися на безліч проєктів 🦠.

"На відміну від традиційних атак впровадження коду, націлених на конкретні вразливості, “Rules File Backdoor” являє собою значний ризик, оскільки перетворює сам AI на вектор атаки."

Найбільш вразливі до такої атаки ті, хто мало думає, коли створює код - не читає файли інструкцій, не перевіряє все, що було згенеровано. Публікує код чи деплоїть проекти без попереднього аудиту на безпеку.

Теоретично агентні IDE повинні бути відповідальні хоча б за перевірку файлів правил та коментарів коду на вставлені невидимі інструкції, але, судячи зі статті, розробники Cursor та GitHub Copilot сказали, що це користувачі самі (!) відповідальні за код, який вони генерують.

#agentmode #prompts #hacking #cursor #githubcopilot #windsurf

Коментарі

https://openai.com/index/gpt-4-1/

Нове оновлення моделей від OpenAI це відповідь на Gemini моделі, у яких усіх 1 млн токенів контекстне вікно і більш точне слідування інструкціям.

Нам цікаво саме те, що, судячи з їхніх власних тестів, GPT 4.1 модель стала кращою у генерації коду. Тобто, якщо 4o видавала нормальний код на один із трьох запитів, то 4.1 буде робити це на кожен другий 😉.

https://aider.chat/docs/leaderboards/
У статті модель порівнюється лише зі своїми моделями. Загалом, її можна оцінити на Aider LLM Leaderboards, де вона отримує 52.4% точності, у той час як Gemini 2.5 Pro Preview 03-25 набирає 72.9%.

У Cursor в налаштування доступних моделей тепер є й gpt-4.1.

Важливе таке оновлення особливо для GitHub Copilot (вже можна використовувати 4.1), тому що їх агент та чат початково зав'язані на 4-ту модель OpenAI, а Claude Sonnet там досі не 3.7, а 3.5 для безкоштовного плану.

Завтра буде VS Code Live: Agent Mode Day, де, думаю, докладніше розкажуть.

#newllmmodel #githubcopilot

Коментарі

https://github.com/openai/codex

OpenAI нарешті відповіли й компанії Claude - випустили свій варіант агента для програмування, який працює через термінал та може створювати-редагувати файли коду. Проект open source.

Також як й Claude Code офіційно підтримує тільки macOS та Linux. Підтримка Windows через WSL.

Назвали його Codex й це може тепер заплутувати, так як одна з перших моделей для програмування (2021 рік), на якій починав працювати Github Copilot мала саме цю назву.

Встановлюється просто як глобальний пакет npm install -g @openai/codex. Є три Режими схвалення - за замовчування це підказки (тільки на читання), але можна й на редагування й на повне авто (з виконанням команд у терміналі).

https://www.youtube.com/watch?v=FUq9qRwrDrI

Анонсували разом з thiking-моделями o3 and o4-mini, яким нарешті дали можливість використовувати інструменти. За замовчуванням Codex використовує o4-mini, але можна вказати будь-яку модель, доступну в Responses API.

Всі операції з файлами та виконання команд відбуваються локально - запит, контекст та diff summaries відправляються моделі на сервер для генерації.

#agentmode #cli #newllmmodel #openaicodex

Коментарі

Варун Мохан (Varun Mohan), співзасновник та CEO Codeium, тепер Windsurf ділиться історією компанії, розповідає про два ключові півоти, філософію найму, вплив ШІ на професію інженера, стратегію виходу на корпоративний ринок та демонструє можливості Windsurf.

https://www.youtube.com/watch?v=5Z0RCxDZdrE

Перший півот (2022): З появою ChatGPT команда змінила вектор на AI-кодування, створивши безкоштовний плагін для автодоповнення коду (підтримка VSCode, JetBrains та ін.). Другий півот → Windsurf: Обмеження API VSCode змусили форкнути IDE та створити AI-нативне середовище з розширеними функціями (наприклад, візуальне редагування).

Нова парадигма: ШІ пише >90% коду → розробник фокусується на рев'ю та архітектурі. Для не-розробників: створення простих застосунків без глибоких знань.

Стратегія використання AI-моделей - гібридний підхід: Frontier-моделі (наприклад, Sonnet) для високорівневих задач. Власні моделі для ретривалу та редагування коду.

Бесіда підкреслює, як швидко змінюється ландшафт розробки завдяки ШІ. Windsurf активно формує це майбутнє, не боячись радикальних півотів та роблячи ставку на глибоке розуміння коду та "агентські" можливості ШІ, а не тільки на автодоповнення.

Зараз у новинах активно обговорюється можливість придбання компанії Windsurf компанією OpenAI.

#windsurf

Коментарі

Claude Code, OpenAI Codex, Aider це агенти що працюють з консолі.

https://github.com/coder/agentapi
Проект AgentAPI дозволяє керувати такими системами через HTTP API (GET та POST). Це дозволяє наприклад запустити декілька систем и "розмовляти" з ними через один чат, чи зробити MCP, щоб одна агентна система могла давати завдання іншій.

https://github.com/eyaltoledano/claude-task-master
Для зрозумілого керування кроками розробки можна використовувати цей проект, підключати його як MCP.

https://www.anthropic.com/engineering/claude-code-best-practices
Для Claude Code виявилось, що є слово-команда "ultrathink", про це можна почитати у доволі детальному документі, що вони виклали на сайті.

"Ми рекомендуємо використовувати слово "think" (подумай), щоб активувати розширений режим мислення, який надає Claude додатковий обчислювальний час для більш ретельної оцінки альтернатив. Ці конкретні фрази безпосередньо відображаються на зростаючі рівні обчислювального бюджету в системі:
"think" (подумай) < "think hard" (подумай добре) < "think harder" (подумай ще краще) < "ultrathink" (ультраподумай).
Кожен рівень виділяє все більше обчислювального бюджету для використання Claude."

Інші рекомендації:

налаштовувати контекст (тут файл CLAUDE.md) через системні інструкції. писати стандарти коду, команди та ін
нехай агент робить регулярні коміти
використовувати /.allowed-tools для дозволу часто використовуваних інструментів. налаштувати безпечні MCP
планування та тести (за TTD) перед генерацією коду
пояснювати агенту конкретно та ретельно. Чим конкретніший запит, тим кращий результат.
менше використовувати автоматичний (auto-accept) режим: слідкувати що агент видає та якмога раніше (клавіша Escape для зупинки) виправляти, якщо він обирає хибний шлях
Просунутий рівень — запустити два агенти: один пише код, інший — перевіряє.

#claudecode #openaicodex #prompts #mcp

Коментарі

https://github.com/github/github-mcp-server

Github запустили свій офіційний MCP.

https://www.youtube.com/watch?v=d3QpQO6Paeg

https://modelcontextprotocol.io/

Model Context Protocol (MCP) був представлений Anthropic 24 листопада 2024 року як відкритий стандарт для підключення систем ШІ до джерел даних. Першими з'явилися конектори для GitHub, Google Drive, Slack.

До лютого 2025 року спільнота розробників створила понад 1000 відкритих MCP-конекторів, що свідчить про значне зростання екосистеми та інтересу до протоколу. Так само підтримка MCP поступово з'явилася в усіх основних програмах/розширеннях для програмування з ШІ, включаючи Cline/Roo, Cursor, Windsurf, Continue.

Через MCP можна працювати з Postgres, Upstash, Slack безпосередньо в редакторі коду. Browsertools MCP надає доступ до консолі браузера для дебагу. А https://context7.com/ надає актуальну документацію для редакторів коду.

Важливим етапом стало оголошення OpenAI 26 березня 2025 року про підтримку MCP. Незабаром Google на Google Next 2025 анонсували підтримку MCP в SDK для своїх моделей Gemini (але також представили протокол A2A). Таким чином, MCP поступово стає універсальним.

Упорядкування. За першим (https://github.com/modelcontextprotocol/servers) почали з'являтися сторонні онлайн-каталоги (як-от https://opentools.com/ https://mcp.so/ https://mcpserverdirectory.org/ та ін.), де можна знайти потрібний сервер. З'являються проєкти MCP-менеджерів, які спрощують інсталяцію та налаштування, наприклад https://mcp-get.com/ https://mcpm.sh/ https://mcpmanager.app/ https://mcpmcp.io/ тощо.

Є проєкти, які допомагають конвертувати звичайний REST API в MCP - наприклад https://rapid-mcp.com/ https://api200.co/mcp.

Проблема відкритих каталогів - це незрозуміла надійність розміщених серверів.

Безпека. Оскільки MCP-сервер є посередником між моделлю та джерелом даних, зловмисник, який запустив сервер, може логувати собі все, включаючи API-ключі доступу до даних. Аутентифікація та авторизація поки що в MCP не стандартизовані.

Сервери поділяються на офіційні та спільноти. Очевидно, офіційні сервери не є посередниками, і запити до них аналогічні запитам до API-точок. До серверів спільноти, які запускають треті сторони, варто ставитись з обережністю та перевіряти, хто за ними стоїть. Також можна запустити власний сервер у хмарі (приклад погоди на AWS lambda) або як контейнер через https://github.com/metorial/mcp-containers.

Чим більше буде поширюватися протокол, тим більше з'являтиметься офіційних серверів, як це сталося з REST API.

#mcp #githubcopilot

Коментарі

https://www.byterover.dev/

Пам'ять про код та реалізацію різних функцій як MCP сервер зробили ByteRover. Тобто, використовуючи цей або схожий проєкт, можна перемикатися між Cursor, Windsurf, Cline/Roo та іншими агентами-кодерами з MCP, і кожен знатиме, що вже було зроблено. Безкоштовний план на 1к записів/місяць.

Мінус - використовується їхня хмара, тобто дані зберігаються не локально, а в компанії, якій потрібно довіряти.

https://www.youtube.com/watch?v=9sPsraoe0_c

#mcp

Коментарі

https://memex.tech/blog/introducing-memex-the-everything-builder-for-your-computer

Компанія Memex офіційно оголосила про запуск своєї платформи, що дозволяє створювати будь-яке програмне забезпечення, від веб-додатків до 3D-дизайнів. Слушно зауважити, що назву вони собі обрали дуже невдалу, адже по-перше це термін винахідника Веннівера Буша, а по друге вже багато проектів з нею.

Memex позиціонується як "Конструктор усього" (The Everything Builder) для комп'ютера. Платформа підтримує будь-які технологічні стеки та мови програмування.

Memex працює у Windows/Mac/Linux (це Tauri фреймворк) і дозволяє всім, незалежно від їх технічного досвіду, досліджувати, будувати та розгортати програмні рішення за допомогою розмови з ШІ.

Агент використовує моделі Cluade - поєднання Sonnet 3.7 + Haiku, та має доступ в інтернет. Створює чекпоїнти через вбудований git. У планах підтримка Gemini 2.5 та MCP.

#agentmode

Коментарі

https://docs.cursor.com/guides/advanced/large-codebases

Розробники Cursor поділилися порадами та техніками для ефективної роботи з великими та складними кодовими базами.

Вони виділили ключові аспекти, які допомагають швидше орієнтуватися в незнайомому коді. Основні рекомендації включають:

Використання Chat для розуміння коду: За допомогою діалогового режиму можна швидко отримати пояснення щодо роботи певних частин коду. Рекомендовано також активувати функцію "Include Project Structure" для покращення розуміння структури проекту.
Написання правил: Створення правил дозволяє підкреслити важливу інформацію про проект та забезпечує краще розуміння для агента Cursor.
Детальне планування змін: Для великих завдань варто витратити час на створення точного та добре структурованого плану послідовності дій.
Вибір правильного інструменту: Cursor пропонує різні інструменти (Tab, Cmd K, Chat), кожен з яких має свої переваги для певних завдань – від швидких правок до масштабних змін у кількох файлах.

Наголошують на важливості розбиття великих завдань на менші частини, включення релевантного контексту та частого створення нових чатів для підтримки фокусу.

#cursor

Коментарі

← Попередній

Квітень 2025

Наступний →