CodeWithLLM-Updates
-

https://www.cursor.com/changelogCursor

DeepSeek моделі: DeepSeek R1 та DeepSeek v3 підтримуються у версіях 0.45 та 0.44. Ви можете увімкнути їх у Settings > Models. Ми хостимо ці моделі в США.

Але composer (автоматична система написання коду) все одно підтримує наразі тільки застарілі GPT-4o чи Claude-3.5. У чаті з r1 тег не є прихованим блоком.

https://www.all-hands.dev/

All Hands OpenHands
(раніше OpenDevin)

Open Source Python інструмент, натхнений Devin 'ом, запуску агентів для програмування: пише код, виконує команди, заходить в інтернет.

Запускається через Docker, радять використовувати anthropic/claude-3-5-sonnet-20241022, але можна і Gemini, і DeepSeek - налаштовується через введення API-ключа. Рішення автоматичне з великою кількістю запитів, тому токенів споживає багато.

Є список очікування, щоб спробувати їхню hosted версію.

відео як встановити та налаштувати:
https://youtu.be/WDP2S4MOXPY

https://github.com/RooVetGit/Roo-Code
плагін активно змінюєтся від просто автоматичного редактора коду до оркестрації різних агентів зі своїми промтами та обмеженнями.

Оновлення Roo Code (prev. Roo Cline) v 3.3

Code Actions

Roo Code тепер інтегрується безпосередньо з рідною системою Code Actions VS Code, надаючи швидкі виправлення та опції рефакторингу прямо у редакторі. Шукайте над кодом лампочку 💡

Розширені можливості режимів:

  • Редагування Markdown: реалізовано одне з найбільш запитуваних функцій - режими "Ask" і "Architect " тепер можуть створювати та редагувати файли Markdown!

  • Обмеження користувацьких файлів: загалом, користувацькі режими тепер можна обмежити певними шаблонами файлів (може редагувати тільки файли Markdown).

  • Самостійне перемикання режиму: режими можуть розумно запитувати перемикання між собою залежно від завдання. Наприклад, режим "Code" може запитувати перемикання на режим "Test Engineer ", коли він готовий писати тести.

https://www.technologyreview.com/2025/01/20/1110180/the-second-wave-of-ai-coding-is-here/

У статті ті, хто зараз розповідають, як їхні моделі та сервіси для програмістів незабаром замінять тисячі розробників, але поки що радіють намахати хоча б одного інвестора:

https://zencoder.ai/ (try for free з цінами)
https://www.merly.ai/ (trial без ціни)
https://cosine.sh/ (waitlist)
https://www.tessl.io/ (waitlist)
https://www.poolside.ai/ (схоже B2B)

https://www.youtube.com/watch?v=itsGX3UioLk

Генерація драфту сайту за допомогою bolt.new коли запит для нього створює infranodus.com (є тріал на два тиждні) аналізуючи диру між попитом та пропозицією, в данному випадку нерухомості у Берліні та випадку здорової їжі.

https://www.youtube.com/watch?v=yHDvCGNjIqk

У відео проводиться порівняння Bolt і Lovable, двох AI-інструментів для створення веб-додатків.

Автор дає обом платформам однакове завдання: створити застосунок на зразок Trello з перетягуванням елементів.

  • Bolt згенерував початковий варіант трохи швидше за Lovable.
  • Обидва застосунки дозволили створювати задачі та переміщувати їх між колонками, але не редагувати.

Обидва інструменти швидко додали цю функцію після відповідного запиту.

Коли автор попросив змінити дизайн на стиль Spotify, обидва AI успішно змінили кольорову гаму на темну з зеленими акцентами.

  • Bolt у цьому випадку запропонував цікавіший ефект підсвічування при наведенні курсора на кнопки.

При додаванні функціональності для кількох дошок,

  • Bolt реалізував перемикання між ними через випадаюче меню, а Lovable розмістив назви дошок у верхній навігаційній панелі, що автору відео сподобалось більше.

В цілому, обидва інструменти є ефективними для швидкої розробки, але вибір між ними може залежати від пріоритетів користувача:

  • Bolt може бути кращим для тих, хто цінує швидкість, а Lovable – для тих, хто віддає перевагу більш інтуїтивному інтерфейсу "з коробки"

PS від мене: Lovable це закритий продукт (раніше GPT Engineer), де безкоштовно 5 запитів/день та не можна зберігти код напряму. Bolt.new та форк bolt.diy доступні на гітхаб — можна встановити на свій ком'ютер, чи використовувати сайт bolt.new

OpenAI агент Operator (новина на techcrunch ) через гугул ШІ Google AI Studio та Репліт может створити сайт =)

X

https://www.trae.ai/homeнаразі є тільки версія під MacOS, бо кому потрібен цей ваш Windows?Trae V1.0.1 (January 23, 2025)

Ще один "геніальний" винахід від китайскої ByteDance - тепер, крім того, що вони разом з китайскою розвідкою стежать за танцями в TikTok, вони вирішили стежити за всіми хто пише код.

(за Trae Privacy Policy вони можуть не тільки зберігати "код, текст, фотографії, файли, відгуки, історію чату або будь-який інший контент, який ви можете завантажити на Платформу" (When you interact with the Platform, we may collect code, text, photographs, files, feedback, chat history, or any other content that you may upload to the Platform, and the associated metadata), а також брати код для "навчання та вдосконалення своїх технологій")

Назвали вони свій диво клон Курсора - Trae.
Має "вбудований доступ до GPT-4o і Claude-3.5-Sonnet". А де DeekSeek?

Doriandarko (Pietro Schirano) cтворює асистентів для програмістів поверх найпоширеніших топових LLM моделей.

Це скрипти Python, які працюють із командного рядка (можна відкрити у вкладці Terminal у VS Code). Схоже на Aider, але простіше.

https://github.com/Doriandarko/deepseek-engineer

https://github.com/yuaotian/go-cursor-help

Якщо з якихось причин вам не вдається використовувати тріал Cursor (це поширена проблема ), то китайці і тут добралися і зробили скрипти для виправлення.

https://github.com/cline/cline/releases/tag/v3.2.0Оновлення Cline****3.2

Звісно додали deepseek-reasoner модель

Круто що форк Roo Cline (тепер назва Roo Code ) щось робить під тест, як це було створення кастомних ролей агенту, а у Cline це додаєтся вже продумано, як зараз це перемикач режиму Plan/Act зі зміною кольору поля запиту.

https://github.com/PatrickJS/awesome-cursorrules

Каталог прикладів додаткових запитів для проектів.

  • Frontend Frameworks and Libraries
  • Backend and Full-Stack
  • Mobile Development
  • CSS and Styling
  • State Management
  • Database and API
  • Testing
  • Build Tools and Development

Проект Nuxt 3:

You are a Senior Frontend Developer and an Expert in Vue 3, Nuxt 3, JavaScript, TypeScript, TailwindCSS, HTML and CSS. You are thoughtful, give nuanced answers, and are brilliant at reasoning. You carefully provide accurate, factual, thoughtful answers, and are a genius at reasoning.

Follow the user’s requirements carefully & to the letter. First think step-by-step - describe your plan for what to build in pseudocode, written out in great detail. Confirm, then write code!

Always write correct, best practice, DRY principle (Dont Repeat Yourself), bug free, fully functional and working code also it should be aligned to listed rules down below at # Code Implementation Guidelines.

Focus on easy and readability code, over being performant. Fully implement all requested functionality. Leave NO todo’s, placeholders or missing pieces. Ensure code is complete! Verify thoroughly finalised. Include all required imports, and ensure proper naming of key components.

Be concise Minimize any other prose. If you think there might not be a correct answer, you say so. If you do not know the answer, say so, instead of guessing

Coding Environment

The user asks questions about the following coding languages:
Vue 3
Nuxt 3
JavaScript
TypeScript
TailwindCSS
HTML
CSS

Code Implementation Guidelines

Follow these rules when you write code:
Use early returns whenever possible to make the code more readable.
Always use Tailwind classes for styling HTML elements; avoid using CSS or tags.
Always use composition api.
Use descriptive variable and function/const names. Also, event functions should be named with a “handle” prefix, like “handleClick” for onClick and “handleKeyDown” for onKeyDown.
Implement accessibility features on elements. For example, a tag should have a tabindex=“0”, aria-label, on:click, and on:keydown, and similar attributes.
Use consts instead of functions, for example, “const toggle = () =>”. Also, define a type if possible.

Буде працювати й у Windsurf там файл .windsurfrules
й у Cline там .clinerules
й у Aider там CONVENTIONS.md та конфіг

https://api-docs.deepseek.com/news/news250120DeepSeek-R1

Китайський стартап DeepSeek продовжує нас радувати дешевими клонами. Ось вони й добралися до openai о1.

Через API, якщо використовувати (прямо чи через openrouter ), треба платити - підійде вже згенерований ключ, просто треба змінити модель на deepseek-reasoner. Коштує у 4 рази дешевше, ніж o1.

Зараз в Cline та Aider немає її у списку - чекаємо на апдейти. Але вже можна через OpenRouter прокинути свій апі ключ DeepSeek, чи заплатити їм.

Через веб-інтерфейс та їхню нову програму для телефонів можна використовувати безкоштовно. Кэнвас/Артефактс поки що не скопіювали.

https://codeium.com/changelogWindsurf оновлення 1.2.1

Cascade тепер може автоматично виконувати веб-пошук, якщо запит вимагає актуальної інформації з інтернету. Для явного запиту пошуку можна використовувати команду @web, а для пошуку у популярній документації (включаючи власну довідку Windsurf) - команду .

Може використовувати URL-адреси як контекст, що корисно при роботі зі статтями, документацією та файлами з GitHub.

Автоматичне створення пам 'яток (Memories)
Cascade тепер автоматично створює "пам'ятки" для збереження контексту між розмовами. Користувачі можуть вручну викликати створення "пам'яток". Відображаються в спеціальній панелі та можуть бути видалені.

Все це разом називаєтся Windsurf Wave 2 https://codeium.com/blog/windsurf-wave-2

https://mistral.ai/news/codestral-2501/

Компанія Mistral AI представила оновлену модель Codestral 25.01, яка покращує швидкість та точність генерації коду, особливо у задачах "заповнення пропусків" (fill-in-the-middle, FIM).

Дійсно швидко генерує. Чомусь модель стала гірше у Java, але додала % HumanEval у Python / С++ / Javascript

Перевірити можна через Continue.dev чи по openai сумісному АПІ (модель codestral-latest) - ключ у консолі

Модель в консолі поки що не відображається в розділі лімітів, швидше за все зараз тестовий період.

VS code - Cline [3.1.9] & Roo Cline [3.1.6]

  • Add Mistral API provider with codestral-latest model

https://thegroundtruth.substack.com/p/devin-first-impressions Devin (v1.1.0, as of 15 January 2025) - перспективний інструмент з найкращим UX серед аналогів, але ще на ранній стадії розвитку.

Потенційно може суттєво змінити процес розробки ПЗ після усунення поточних недоліків. Наразі, на думку автора, вартує своїх 500$ на місяць.__(Варто відзначити, що на сторінці тарифного плану 500$ вказано як "ціну зі знижкою", тоді як початкова закреслена ціна становить 1250$)Основні переваги:
Має зручний інтерфейс та просте налаштування. Він демонструє високу швидкість виконання простих завдань. Цікавою особливістю є здатність аналізувати (“visually see“) веб-сторінки за допомогою скріншотів. Devin також підтримує паралельну роботу над декількома задачами та в окремих випадках може приймати інтелектуальні рішення, наприклад, автоматизувати повторювані дії.

Основні недоліки:
Повільно працює зі складнішими задачами, що вимагають рефакторингу чи налагодження коду. Іноді потрапляє в нескінченний цикл редагування. Його можливості обмежені: відсутній доступ до сайтів з аутентифікацією (наприклад, не може відвідати веб-сайт GitHub і побачити створений PR). Спостерігається зниження продуктивності при тривалій сессії (2.5 годин чи 10 ACUs), а також труднощі з використанням бази знань.

https://youtu.be/AtuB7p-JU8Y

Відео порівнює роботу Cursor (пропрієтарний форк VS Code) та Cline (розширення VS Code з відкритим кодом) - редагують React проект на 240к токенів коду.

Тут обидва використовують claude-3.5-sonnet.

Cursor також використовує якусь embedding модель (either with OpenAI’s embedding API or by a custom embedding model ) та хмарну векторну БД, щоб векторизувати чанки коду під семантичний пошук. [Поясненя з картинками ]

Перше просте завдання обидва виконали за 1 хв, але Cline повернув поламаний код, на завданні 3 він "зациклювався".

Тобто Cursor Composer переміг 3 з 3.

lovable.dev

Платформа для автоматичної генерації фулстеку підходом "Prompt to edit".

Безкоштовно згенеровані проекти потрапляють до публічного каталогу і поверх проектів інших можна продовжувати робити щось своє. Також є шаблони. Безкоштовно дають 5 чат повідомлень у день. Немає завантаження собі на диск, але є можливіть після до себе в гітхаб експортувати як репозиторій.

У беті зараз функція інтеграції з supabase (автентифікація та бд)

приклад:
https://www.youtube.com/watch?v=c6rd2iZ_A48

Cline v3.1 оновлення

Тепер зберігає DIFF змін на кожному кроці завдання. Дві нові функції:

Порівняти (see new changes) показує різницю між знімком і поточним робочим простором по кожному з файлів.

Відновити дозволяє повернути файли чи будь-які частини проекту до цієї точки в завданні.

AiDE забезпечує структурований підхід до розробки проектів із допомогою штучного інтелекту. Framework пропронує стандартизований спосіб розуміння штучним інтелектом контексту вашого проекту та ведення документації.

https://github.com/FixingPixels/AiDE

є кастомний GPT

5ки вийшли... чекаємо тестів, як на цьому буде бігати Llama-3.3-70b-specdec

https://nmn.gl/blog/ai-senior-developer
та з коментів https://nmn.gl/blog/hn-rank-1-analysis

Аналізатор коду, аналізуючи лінійно, часто застрягав у деталях. Щоб покращити аналіз, ми змінили підхід, моделюючи спосіб мислення (Mindset) досвідчених розробників:

📝 Групування файлів: файли згруповані за функціональністю (наприклад, "аутентифікація", "база даних").

ℹ️ Контекст: додаєтся опис про функціональність групи в рамках всієї архетектури перед аналізом коду. Аналіз впливу: розглядати зміни відносно усієї системи

🕰 Історичне розуміння: відстежувати, чому код розвивався певним чином

промт до группи

    Analyzing authentication system files:
    - Core token validation logic
    - Session management
    - Related middleware
    
    Focus on:
    1. How these integrate with existing auth patterns
    2. Security implications
    3. Performance impact on other systems

    Files to analyze:
    ${formatFiles(group.files)}

Результатом стало покращення якості розуміння, від простих спостережень до виявлення потенційних проблем, як-от конфлікти та зв'язки між компонентами.

Aider LLM Leaderboards https://aider.chat/docs/leaderboards/

Polyglot тест вимірює здатність LLM програмувати популярними мовами.

Aider найкраще працює з LLM, які добре вміють редагувати код, а не просто добре генерують код. Щоб оцінити навички редагування LLM, Aider використовує тести, які оцінюють здатність моделі послідовно дотримуватися системних підказок, щоб успішно редагувати код.

На початку 2025 року несподівано китайський DeepSeek V3 (671B MoE) дуже добре себе показує. Зараз ще у них знижки до 8 лютого на токени, ну і ціна $0.14/M input $0.28/M output [але контекстне вікно зарізане] (можна купувати на openrouter ) ні в яке порівняння з о1 та claude-3.5-sonnet не йде.

Два тижні тому вийшла версія три VSC плагіна Cline (prev. Claude Dev). Він як Composer у Cursor чи Cascade у Windsurf але не залочен на приватні підписки.

https://open-vsx.org/extension/saoudrizwan/claude-dev

Дві дуже приємні функції:

  • Auto-approve – тепер для програмування навіть не треба натискати щоразу кнопку ;), можна відправити агента у фон і увімкнути нотифікації, коли треба.

Токени, звичайно ж, споживає якневсебе і іноді зациклюється.

  • .clinerulesяк я вже писав, таке є і в Cursor, і у Windsurf – це файл у корені проєкту з кастомною інструкцією, куди можна виписати техстек, структуру БД, зовнішні API та інше, щоб агент не плутався.

Проблема, звичайно ж, у тому, що тепер кожен апп називає цей файл як хоче (cursorrules, windsurfrules) і не домовилися до стандару.

форк Roo-Cline досі на v2

Прокрутити нагору #newllmmodel #cursor #bolt #windsurf #roo #lovable #trae #cline #aider