CodeWithLLM-Updates
-
🤖 Інструменти ШІ для програмування: практичні приклади, покрокові інструкції та реальні застосування LLM. Навчіться ефективно працювати з сучасними асистентами програмування.

Створеня гри Tower of Time
https://github.com/maciej-trebacz/tower-of-time-game/blob/main/PROMPTS.md
В тому випадку, коли код для репозиторію створює ШІ гарно було б додавати протокол всього чату чи хоча б запитів, які було використані.

Розробник (maciej-trebacz) виступає в ролі архітектора та тимліда: він ставить завдання, перевіряє результат, вказує на помилки та спрямовує процес. ШІ не вигадує гру "з нуля", а реалізує конкретні, чітко поставлені завдання.

Розробка ведеться ітеративно. Жодна складна фіча не була створена одним запитом. Коли розробник просить створити WaveSystem "за аналогією з EnergySystem.ts", ШІ справляється відмінно, тому що є готовий паттерн. Запит "Зроби рефакторінг BasicTower, щоб витягти загальну логіку для всіх веж" — ідеальне завдання для ШІ.

Висновки:

  • Писати максимально конкретно і покроково. Погано: "Зроби ворогів". Добре (як у файлі): "Реалізуй рух ворога. У нього є цільова позиція. На кожному update() він повинен рухатися до неї. Під час руху програвай анімацію, що відповідає вектору руху." Для складної механіки RewindableSprite розробник розписав цілий алгоритм з кількох пунктів.
  • Залучати ШІ до креативних завдань. Просіть не тільки писати код, а й критикувати сценарій чи пропонувати ідеї.
  • Важливо надавати контекст. Завжди вказуйте файли, з якими потрібно працювати, через синтаксис @файл.ts. Це критично важливо для точності. Вказуйте, як система НЕ повинна працювати (наприклад, "вежі не стріляють під час перемотки часу").
  • Використовувати існуючий код як приклад. Просіть робити нові фічі "за аналогією з...", щоб зберігати єдиний стиль коду. Не просто кажіть "тут помилка", а надсилайте текст помилки та логи.

Claudia
https://claudiacode.com/
Графічний інтерфейс (GUI) для керування Claude Code - замінює роботу через термінал зручним візуальним інтерфейсом. Проект безкоштовний, з відкритим кодом під Windows, macOS, Linux. https://github.com/getAsterisk/claudia

Надає зручний огляд проектів/сесій/агентів, створення власних AI-агентів, візуальний моніторинг витрат (токени/кошти), вбудований редактор промптів (Markdown), контроль версій чатів (як Git).

SuperClaude v2
https://github.com/NomenAK/SuperClaude

Оновився фреймворк конфігурації, що розширює Claude Code спеціалізованими командами (18 штук), когнітивними персонами та методологіями розробки. Модульний дизайн та 9 персон тепер можна запускати через прапорці командного рядка (--persona-architect, --persona-security, тощо)

Підтримується MCP інтеграція з Context7, Sequential, Magic, Puppeteer.


Trae Agent CLI
https://github.com/bytedance/trae-agent
Компанія Bytedance на додаток до своєї IDE Trae випустила також open-source агента, який працює в терміналі. Зараз він ще на альфа-експериментальній стадії розробки і більше для тестування та покращення.

Упор роблять на те, що їх агент має модульну архітектуру. При роботі постійно пише детальний лог і на кожному кроці наводить коротке саммарі. Підтримує OpenAI, Anthropic, Doubao, Azure та OpenRouter API. Для налаштування використовує trae_config.json.

Amazon готує щось теж у галузі CLI агента під кодовим ім'ям Kiro - почекаємо, побачимо.

Build apps with Gemini
https://aistudio.google.com/apps
Усередині aistudio від Google є розділ, де можна за допомогою промтів створювати прості додатки з ШІ. Це швидкий інструмент для прототипування та тестування ідей.

Середовище використовує Gemini SDK, запускає апку у браузері у sandboxed iframe та не підтримує Next.js, Svelte, Vue чи Astro. При цьому відкривається редактор з доступом до коду. Є приклади, включаючи генерацію музики.

Можна надалі розгорнуті й на Cloud Run.

https://www.youtube.com/watch?v=YEzjVvE44R0

Перша версія додатку генерує зображення з нечитабельним, спотвореним текстом. Автор не здається і прямо в редакторі AI Studio дає штучному інтелекту додаткові інструкції, щоб той спочатку аналізував надану інформацію, а потім створював якісніший результат. Після цього додаток починає генерувати значно кращі креативи з релевантним зображенням і правильним текстом.

MCP як універсальна екосистема
https://worksonmymachine.substack.com/p/mcp-an-accidentally-universal-plugin
Протокол не судить — він просто працює з чим завгодно. Так на USB-C можна зробити тостери з HDMI-виходом, а автомобільні прикурювачі це зараз універсальні розетки.

Завдяки ШІ хайпу MCP (Model Context Protocol) "випадково" став універсальною системою взаємодії. Кожен новий MCP-сервер розширює можливості всіх додатків. Аналогія:  LEGO з MCP кубиків.

Голова ідея - це не просто для ШІ, а використовувати MCP може будь-який додаток.

Claude Artifacts catalog
https://www.anthropic.com/news/build-artifacts
Ключова нова функція полягає в можливості вбудовувати можливості штучного інтелекту через API Claude безпосередньо в Artifacts (міні-застосунки з промту), перетворюючи їх на інтерактивні застосунки.

Також тепер користувачі мають спеціальний простір у Claude Chat для перегляду прикладів та організації своїх Artifacts. Створеними артефактами можна ділитися з іншими. Функція доступна користувачам безкоштовних планів, а також Pro та Max.

Roo Code 3.22
https://docs.roocode.com/update-notes/v3.22
Додали можливість використовувати безкоштовні запити на Pro-модель з Gemini CLI - прийшли юристи Google й все - видалили цю функцію.

Тепер можна шарити таски так https://docs.roocode.com/roo-code-cloud/task-sharing

Додали ~/.roo/rules/ де можна писати глобальні правила. Вони завантажуються першими, при цьому правила проєкту якщо вони є мають пріоритет.

Агент Gemini CLI
https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/
Google доповнює свою лінійку засобів для програмування з ШІ - є агент у хмарі Jules, є плагін Gemini Code Assist, є Stitch для дизайну UI і є IDE у хмарі Firebase studio.

Claude Code набирає все більше популярності, тому його інтерфейс та підхід починають прямо клонувати, що ось намагається зробити OpenAI, Atlassian (працює, але постійно все видаляє) і тепер Google (у мене зависає на авторизації - тобто взагалі не працює*).

Проєкт open source, працює і на Windows, код на GitHub - написаний на TS, а не упаси боже Python. І головне - є кольорові теми ;)

Може:

  • Запитувати та редагувати великі кодові бази в межах та поза межами контекстного вікна 1M.
  • Генерувати нові програми з PDF або ескізів
  • Автоматизувати завдання, як-от запити на pull-реквести або обробка складних rebase.
  • Використовувати інструменти та сервери MCP

Інтегрується з білінгом Code Assist (зараз безплатно 1000 запитів на Gemini 2.5 Pro на день) або можна використовувати свої API ключі.

У відео зазначається, що інструмент "сирий" - повторює повідомлення, погано форматує код, може нескінченно відповідати "вважаю, завдання виконано". Іноді просто зависає. Може навантажувати CPU майже на 100%. Навіть для дуже простого завдання (додати кнопку, що відкриває панель) інструмент використав більше 1M вхідних токенів!

https://www.youtube.com/watch?v=VwOfvE_3Mtk

Він дивився код і побачив, що логується довжина запиту, виклики інструментів, метадані відповідей (час, токени). Не логується сам текст запиту (якщо це не включено явно), вміст файлів, вміст відповідей API або особиста інформація.

але
https://github.com/google-gemini/gemini-cli/blob/main/docs/tos-privacy.md
Google не буде використовувати ваш код, запити або відповіді для навчання моделей тільки якщо ви використовуєте платний API-ключ Gemini API, ліцензію Code Assist або Vertex AI Gen API.

Налаштування "Usage Statistics" (Статистика використання), якщо включено, дозволяє Google збирати як анонімну телеметрію (наприклад, виконані команди), так і ваші запити та відповіді для покращення моделей. Відключення цього налаштування відключає збір запитів/відповідей для покращення моделей, але Google все одно може використовувати дані, як описано в їхніх умовах для безкоштовних сервісів.

[*] виявилось регіон "Україна" не підтримується, тому має обмеження. В усіх нормальних с точки зору Google регіонах включаючи Уганду, Сомалі, Узбекистан та Ірак працює.

Atlassian Rovo Dev CLI
https://community.atlassian.com/forums/Rovo-Dev-AI-Agents-Beta-articles/Introducing-Rovo-Dev-CLI-AI-Powered-Development-in-your-terminal/ba-p/3043623
RovoDev - новий ШІ інструменту від Atlassian (творців Jira, Bitbucket, Confluence), який є відповіддю на Claude Code від Anthropic.

https://www.youtube.com/watch?v=MjOJE7WbvfE

Завантажити CLI можна з офіційного допису в блозі Atlassian або сторінки спільноти. Потрібно створити безкоштовний обліковий запис Atlassian. Встановлення виконується за допомогою Windows PowerShell (для x86-64 версії). З windows працює нативно (на відміну від Claude Code де WSL). Аутентифікація відбувається через команду acli.exe rodev login (потрібно ввести електронну пошту та API ключ).

Демонстрація показала, як агент може аналізувати код (наприклад, симулятор "дилеми в'язня") та виконувати завдання на кшталт "оптимізувати продуктивність".

Головна перевага: під час бета-тестування Atlassian надає 20 мільйонів безкоштовних токенів щодня. Це є значною перевагою порівняно з Claude Code, який, коштує 5-10 доларів за кожне використання.

Оновлення агента від Google
https://jules.google/docs/changelog/

  • Якщо додали скрипт налаштування середовища, Jules тепер запускає його послідовно.
  • Контекст. Jules читає та використовує AGENTS.md, якщо він є у вашому репозиторії.
  • Більше тестування. Jules частіше пише та запускає тести самостійно.
  • Значно зменшено ухиляння агента. Посилили цикл, щоб Jules продовжував рухатися вперед.

Лекція від Andrej Karpathy

https://www.youtube.com/watch?v=LCEmiRjPEtQ

1. Три епохи програмного забезпечення

  • Software 1.0 👨‍💻: Традиційний код (наприклад, C++, Python), написаний людьми.
  • Software 2.0 🧠: Нейромережі (ваги моделей), які навчаються на даних.
  • Software 3.0 🤖: LLM (ChatGPT та ін.), де програми — це промпти природною мовою (англійська).

"Ми тепер програмуємо комп'ютери англійською — це божевілля!"

2. LLM — це нова ОС?

  • Аналогія з операційними системами:
    • LLM = процесор 🖥️
    • Контекстне вікно = оперативна пам'ять
    • Мультимодальність та інструменти = API
  • 1960-ті в ШІ: Зараз LLM дорогі та працюють як мейнфрейми, але скоро будуть локальними.
  • Проблеми LLM: Галюцинації, "рваний інтелект" (сверхрозумні в одному, дурні в іншому), вразливості.

3. Як працювати з LLM?

  • Часткова автономність:
    • Приклади: Cursor (автокод-помічник), Perplexity (пошук з ШІ).
    • "Повзунок автономності": Від підказок до повного агента.
    • GUI критичний: Візуалізація змін прискорює перевірку.
  • Найкращі практики:
    • Чіткі промпти → менше помилок.
    • Тримати ШІ "на повідку" (занадто великі зміни важко перевіряти).

4. Vibe Coding — програмування для всіх

  • Тепер кожен може кодити, просто описуючи завдання англійською.
  • Приклад: Карпаті за день зробив iOS-додаток, не знаючи Swift. Але розгортання та DevOps поки вимагають ручної роботи (і це біль 😅).

5. Майбутнє: інфраструктура для агентів

  • Потрібні "документи для ІІ":
    • lm.txt замість robots.txt — інструкції для LLM.
    • Markdown-документація (як у Vercel та Stripe).
    • GitHub → Ingest (конвертує репозиторій у текст для LLM). https://gitingest.com/

6. Підсумок

  • Перехід від "милиць" до агентів займе роки.
  • Аналогія з костюмом Залізної людини: Зараз це посилення людини, але рухаємося до повної автономності. Майбутнє за гібридом людей та ШІ.

Обговорення на HN
https://news.ycombinator.com/item?id=44314423

LLM як нова парадигма програмування

Аргументи "ЗА":

  • "Англійська — нова мова програмування": Це фундаментальний зсув від детермінованих, формальних мов до імовірнісних, що дозволяє створювати ПЗ не-програмістам ("vibe coding").

  • Новий інструмент: LLM — це ще один інструмент в арсеналі розробника, який доповнює, а не замінює існуючі підходи.

  • Робота з невизначеністю: Програмісти завжди мали справу з недетермінізмом (відповіді API, ввід користувача), тому робота з LLM — це лише розширення цієї практики.

Аргументи "ПРОТИ" (Скептицизм):

  • Формальні мови — це перевага, а не недолік: Вони забезпечують точність, надійність та верифікованість, які є основою інженерії. Відмова від них на користь природної мови — це крок назад до "магічного мислення".

  • Недетермінізм LLM небезпечний: На відміну від помилки API, LLM може видавати "сміття, що виглядає як золото" — правдоподібну, але абсолютно неправильну відповідь, яку важко виявити.

  • Hype vs. реальність: Багато хто вважає, що можливості LLM сильно перебільшені, порівнюючи поточний ажіотаж із "бульбашкою криптовалют".

Роль розробника трансформується:

  • Від написання коду рядок за рядком до "керування контекстом" (context wrangling) та промпт-інженерії.
  • Людина стає верифікатором та куратором — тим, хто задає швидку "петлю зворотного зв'язку" (генерація → перевірка → корекція).
  • Деякі побоюються, що це знецінить професію, перетворивши інженерів на "QA-тестувальників для ШІ". Інші ж бачать у цьому можливість для експертів з інших галузей створювати власні інструменти.

Практичні інструменти та виклики

  • Структурований вивід (Structured Outputs): Використання JSON-режиму це "суперсила", яка робить вивід LLM передбачуваним та придатним для програмної обробки. Це часто недооцінений інструмент.

  • Детермінізм vs. Хаотичність: LLM не є абсолютно випадковими. При температурі 0 вони детерміновані, але "хаотичні" (маленькі зміни у вхідних даних можуть призвести до великих змін у виводі).

Прозорість використання токенів Claude Code є проблемною.

https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor
Проєкт, який вирішує цю проблему, надаючи чітку картину використання токенів та часу. Є локальні логі Claude Code (~/.claude/projects/*/*.jsonl), які він використовує.

Дані оновлюються кожні 3 секунди, інструмент розраховує, коли можуть закінчитися токени, базуючись на поточній швидкості їх використання. Працює з планами Pro, Max5, Max20 та може автоматично розпізнавати ваш поточний план. Дозволяє встановити власний час і часовий пояс для скидання лімітів відповідно до ваших потреб.

Надалі автор планує використовувати DuckDB для більш складного аналізу логів.

Windsurf Wave 10
Презентацію цього оновлення розтягнули на кілька днів, це дозволило зробити більше блог-постів та відео на ютуб - так робили на хвилі 8 і, мабуть, з точки зору маркетингу це працює.

https://windsurf.com/blog/windsurf-wave-10-planning-mode
З'явилася кнопка "Режиму планування" - це правильний і очевидний крок (відповідь на MCP https://www.task-master.dev/). Спочатку задача розбивається на підзадачі за допомогою моделі, що "думає", а потім кодер (більш проста модель) не плутається, що зробити, а йде за пунктами (так і їм дешевше). Добре працює в поєднанні з пам'яттю.

https://www.youtube.com/watch?v=BmRJ_yH6BpU

https://windsurf.com/blog/windsurf-wave-10-browser
Знову ж таки були MCP. Тепер зробили для тих, кто не хоче налаштовувати таке одну кнопку для запуску керованого інстансу Chromium, щоб чат напряму бачив, що в ньому відбувається.

https://windsurf.com/blog/windsurf-wave-10-ux-enterprise
Один кластер запустили в Європі. Тепер метрика PCW використовується не тільки для автодоповнень в редакторі, а й для оцінки того, як агенти з чату справляються.

Percentage of Code Written (PCW)
https://windsurf.com/blog/percentage-code-written
PCW — це відсоток коду, написаного за допомогою ШІ-інструментів. Допомагає оцінити реальну користь ШІ у розробці та виключає накрутку метрик (на відміну від "відсотка прийняття" у конкурентів). - Враховується тільки код, що потрапив у комміт (невдалі правки не враховуються), при цьому метрика не враховує архітектуру, дебаг, рев'ю.

  • W — байти коду від Windsurf (Tab, Cascade).
  • D — байти коду, написані вручну.
  • PCW = (100 × W) / (W + D).

Команда Cursor продовжує маркетінгові поневірення на ютуб - пішли до Anthropic щоб на їх каналі теж засвітитися:

https://www.youtube.com/watch?v=BGgsoIgbT_Y

Cursor швидко зростає завдяки інтеграції AI, особливо моделей Claude. За рік компанія досягла $300 млн доходу, а мільйони розробників почали використовувати їхні інструменти. Спочатку AI допомагав лише з автодоповненням або редагуванням одного файлу, але завдяки Claude 3.5 Sonnet з’явилися складніші функції, як мультифайлові зміни чи фоновий агент, який паралельно виконує завдання. Команда Cursor сама використовує свій продукт для розробки, що дозволяє швидко тестувати ідеї та відкидати непрацюючі рішення.

Однак робота з великими кодовими базами залишається викликом — AI часто не розуміє внутрішніх нюансів, як DSL або неочевидних правил, які передаються усно. Тому перевірка коду залишається ключовим етапом, навіть якщо AI пише більшу його частину. У майбутньому можливі підходи, як псевдокод для стислого опису змін або інтеграція з іншими системами (наприклад, Slack), щоб AI міг враховувати контекст. Водночас Claude 3.5 Sonnet і новіші версії вже значно покращили якість сгенерованого коду.

ШІ не замінить розробників, але змінить їхню роль. Вже зараз він дозволяє навіть нефахівцям (наприклад, працівникам відділу продажів) створювати прості інструменти, а інженерам — зосередитися на архітектурі та UX. До 2027 року майже 100% коду буде створюватися за участі ШІ, але розуміння контексту залишатимуться ключовими навичками.

На конференції WWDC ще більше було про Xcode 26 та можливості програмування за допомогою ШІ.

https://developer.apple.com/documentation/xcode/writing-code-with-intelligence-in-xcode
Можна обирати ChatGPT (чомусь вони пишуть саме так, а не модель чи OpenAI) чи додати провайдера моделі як з інтернету, так й локального.

  • Вивчення коду: "Що робить цей код?" → Xcode дасть розгорнуту відповідь.
  • Генерація та виправлення коду: Можна просити додати властивості, створити список, змінити інтерфейс тощо. Приклад: "Створи таблицю з усіма властивостями об'єкта".
  • Автоматичне застосування змін: Увімкніть "Automatically Apply Changes" або перевіряйте запропоновані правки вручну.
  • Фікси помилок: Xcode пропонує виправлення для помилок компіляції.

Можна відкочувати правки через "History", але потрібен Git-репозиторій.

Виглядає так:
https://www.youtube.com/watch?v=OV38tVwySE0

Доволі схоже за функціоналом на більшість плагінів "додай чатжпт" для VSC у 2023 році, але візуально дизайн звісно в рази краще їх.

Продовження маркетингових поневірянь Cursor - переназвали версію 0.51 у 1.0.0 щоб "люди розуміли" що це справжня програма. Виклали у себе на ютуб опис.

https://www.cursor.com/changelog/1-0
Продовжують розгортати фонового агента, але треба вимкнути "режим приватності" (!) щоб почати ділитися своїм кодом з курсор. Хто цього не хоче, поки не зможи їм користуватися.

Також додали BugBot для GitHub який теж фоново працює. Знову переробили режим пам'яті між чатами (Windsurf таке давно робить), додали нарешті обробку markdown таблиць та Mermaid діаграм.

Як й більшість інших ШІ-кодінг інструментів зібрали MCP у каталог, він https://docs.cursor.com/tools - зараз 8 шт. Це перевірені.


Обговорення на HN
https://news.ycombinator.com/item?id=44185256
Значна частина обговорення зосереджена на порівнянні його з Claude Code від Anthropic. Багато користувачів, особливо ті, хто платив значні суми за Cursor Pro (наприклад, $100-$800/міс), перейшли на Claude Code (з планами $100 або $200/міс) і відзначають значно кращий досвід роботи з агентом: менше помилок у виклику інструментів, передчасного завершення, проблем із застосуванням змін. Буквально за день до обговорення Claude Code додали до Pro-плану Anthropic за $20/міс, що робить його значно доступнішим

Існує думка, що поточні ціни на AI-інструменти (включно з Cursor) субсидуються VC-грошима, і компанії поки що не є прибутковими.

Переваги Claude Code (на думку деяких користувачів):

  • Краща робота агента, менше помилок.
  • Висока продуктивність при паралельних сесіях.
  • Добре працює з командним рядком (наприклад, може підключатися по SSH та виконувати команди, запитуючи дозвіл).
  • Вважається "розумнішим" через інший системний промпт та поведінку порівняно з використанням тієї ж моделі Claude через Cursor.

Недоліки Claude Code та переваги Cursor:

  • Claude Code: Може швидко "спалювати" токени, іноді робить дивні помилки. Не вистачає деяких функцій Cursor, як-от "чекпоінти" для відкату змін (хоча є обхідні шляхи).
  • Cursor: Відзначають швидку функцію автодоповнення "Tab" для невеликих змін. Доступніший базовий Pro-план ($20/міс).

Інші інструменти та підходи:

  • Aider: Згадується як більш "точний інструмент", краще інтегрується з git (робить комміти, що Cursor/Claude Code не роблять за замовчуванням), більш контрольований.
  • Zed: Деякі користувачі переходять на Zed через кращу продуктивність порівняно з Cursor.

https://www.youtube.com/@cursor_ai
У Cursor, мабуть, закінчився приріст користувачів, оскільки вони замість того, щоб робити свій хороший продукт, створили ютуб канал і почали розповідати, який у них хороший продукт.

Зараз два відео. Анонс та розмова про їх модель.

https://www.youtube.com/watch?v=sLaxGAL_Pl0

Ключові моменти:

  • Мета Cursor — створення ШІ-асистента для розробників, який розуміє код краще за людину.
  • Підхід: Навчають моделі на величезних обсягах даних (включно з приватними репозиторіями). Застосовують "curriculum learning" — від простого до складного.
  • Результати: Моделі Cursor перевершують Copilot та ChatGPT у тестах на розуміння коду. Вміють редагувати код, а не тільки генерувати (наприклад, вносити зміни за інструкцією).
  • Особливості: "Code infilling" — передбачення пропущених частин коду. "Long-range dependencies" — розуміння зв'язків у великих файлах.

Mistral Agents API
https://mistral.ai/news/agents-api

Mistral AI представляє Agents API — інструмент для створення автономних AI-агентів, які: виконують дії (код, пошук, генерація зображень), при цьому зберігають контекст між запитами та координуються між собою.

У прикладі наведено Помічника для розробників - інтеграція з GitHub.

https://www.youtube.com/watch?v=1Tt9Fq1pUPQ