CodeWithLLM-Updates
-

За 13 хв проф. Andrew Ng (в нього багато курсів про ШІ) демонструє на слайдах передові методи використання великих мовних моделей для покращення процесу розробки програмного забезпечення.

Головні ідеї виступу:

🧠 Агентні підходи в AI стають все більш популярними та ефективними. Це ітеративний процес, де AI може вчитися, переглядати й покращувати свій результат.

✍️ Рефлексія: AI агент може оцінити власний код/результат та допрацювати його. Це підвищує продуктивність.

🤖 Мультиагентні системи: використання двох або більше агентів, як експерт-кодер та експерт-рецензент, значно покращує якість.

🔧 Використання інструментів: підключення AI до різних інструментів (вебпошук, аналіз даних тощо) розширює її можливості.

👷‍♂️ Планування: AI агенти можуть автономно планувати дії та змінювати план в разі збоїв, що вражає.

🔀 Комбінація всіх цих підходів відкриває нові можливості та покращує результати AI у порівнянні з простим ґенеруванням коду (є слайд з графіком, але з 40% вісь).

https://www.youtube.com/watch?v=sal78ACtGTc

Тобто агентні технології штучного інтелекту можливо є наступним кроком у галузі розробки програмного забезпечення.

Stability AI представили, а на olllama додали до репозиторію instruct варіант їх моделі генерації коду Stable Code. Модель має 3b розмір й якість генерації на очікуваному рівні

https://ollama.com/library/stable-code

І я також додався до цього своєю мишкою 😉

З моменту запуску проекту Chatbot Arena модель GPT-4 завжди була на першому місці. (новина )

Цікаво, якщо на початку модель GPT-3.5 викликала захоплення, то зараз у порівнянні з новими моделями вона виглядає дуже слабкою і видає слабкі результати. Очікуємо найближчим часом якусь зміну від компанії OpenAI.

Відео порівняння

плагінів під VSCode локальної генерації коду - Continue чи Twinny

Варіанти:
🤖 Continue: усе тільки через чат, відсутність автодоповнення коду
🦙 Llama Coder: автодоповнення коду, відсутність чат-інтерфейсу
🔍 Cody від Sourcegraph: цінова модель незрозуміла

👯‍♂️ Twinny: новий проєкт, який 🤝 поєднує функції Llama Coder та Continue - чат і автодоповнення коду.

_Для автодоповнення, щоб воно не підвисало, звичайно, потрібно брати меншу "базову" модель (1-3B) і потужніший комп'ютер._Щоб працював чат треба ще підняти "instruct" модель.

Зробив відеоогляд на Codeium

https://codeium.com/

при порівнянні з Cursor та Phind не цікава система і тим паче незрозуміло звідки у неї стільки лайків

У цьому відео

наведено використання Tabby як локальної заміни GitHub Copilot для автодоповнення коду та генерації функцій. Система буде працювати без інтернету. Код не залишає ваш комп'ютер.

Використовується модель StarCoder-3B у VSCode. Розглядається встановлення та налаштування Tabby через Docker на машині з GPU NVIDIA GeForce RTX 3070.

🛠 Встановлення та налаштування Tabby через Docker 
⚙️ Вибір моделі (StarCoder, CodeLlama, DeepseekCoder) 
💡 Можливість запуску Tabby на машині з GPU або CPU - що треба встановити, щоб працювала CUDA

Автор вважає, що Tabby зручніше використовувати, ніж сервер ollama.

Автор розширення для VS Code Double каже, що його мотивувало два роки спостереження за тим, як команда GitHub Copilot не виправляла недоліки користувацького інтерфейсу:

  • некоректне закриття дужок,
  • погані автодоповнення коментарів,
  • відсутність автоімпорту бібліотек,
  • неповноцінна робота багатокурсорного режиму,
    та всі інші проблеми застарілої моделі GPT-3.5 (тому що використовується GPT-4 там, де система вирішить).

В останній версії Double інтегрована модель Claude 3 Opus від Anthropic, яка, згідно з деякими бенчмарками, перевершує GPT-4. Окрім Opus, також присутня GPT-4 Turbo. Double.bot прийняли в акселератор Y Combinator. Безкоштовно доступно 50 запитів на будь-яку з цих моделей на місяць. Повноцінна підписка коштує 20$ (а GitHub Copilot зараз коштує 10$ без slash-команд, 19$ з ними).

Розширення немає на open-vsx.org.
Для реєстрації треба ввести код з SMS - на мій український номер він так і не надійшов.

Відповідь людини, яка створює WebGPT

на те, що його круту систему створення коду не помічають, оскільки вона частина підписки ChatGPT Plus - він показує і можна поставити на паузу, щоб подивитися, як він робить веб-запити.

У кінці кінців він зробить свою платформу, яка виглядатиме просто як чат.

AlphaCodiumвід CodiumAI

CodiumAI, на відміну від інших систем штучного інтелекту для роботи з кодом, вибрали і зайняли вузьку нішу - покращення якості коду (генерація тестів, аналіз безпеки та продуктивності).

Тепер їх наступний крок - система AlphaCodium, яка може автоматично перевіряти якість згенерованого коду. Тим самим це схоже як працюють GAN. Вона open-source на OpenAI API ключі, та вирішує проблеми сформульовані у CodeContest форматі JSON.

відео пояснення

/ блог пост
Від “Інженерії запитів” до "Інженерії потоку"

Devin "Перший ШІ розробник" - тренд останніх днів, як наколядувати собі від інвесторів багато грошей, обернувши звичайний gpt-4 мультиагент у купу маркетингового хайпу та підібраних графіків/демок.

https://www.youtube.com/watch?v=AgyJv2Qelwk

Є кілька сайтів-каталогів, де люди додають та голосують за інструменти, що використовують штучний інтелект. Нас цікавить розділ "генерація коду".

На futuretools.io зараз на першому місці за оцінками юзерів - Codeium (5890) та ChatGPT (1245).

Про Codeium хочу зробити окреме відео.

🎉 На POE нарешті з'явилася модель DeepSeek-Coder-33B Instruct (на сьогодні одна з кращих для генерації коду) і вона безкоштовна! 0 балів/повідомлення.

На жаль, на відповідь встановлено маленький токен-лиміт, тому іноді доводиться писати в чат "продовжуй".

Також цей провайдер (Together.ai ) має ще й велику Llama 70b Code Instruct за 30 балів/повідомлення. До цього вона була тільки від провайдера Fireworks за 50 балів/повідомлення.

POE щодня безкоштовно надає 3000 балів.

Я не розумію, чому воно безкоштовно.

Pieces Desktop App - додаток для розробників

, який допомагає покращити робочий процес за допомогою штучного інтелекту. Він пропонує функції зберігання, пошуку та створення кодових фрагментів (Pieces ), а також генерації унікального коду.

  • 🤖 Управління шматками кода Можливість зберігати кодові фрагменти з різних джерел, редагувати та ділитися посиланнями. Включаючи розпізнавання коду зі скріншотів.

  • 🚀 Копілот Запуск ШІ чатів як локальних моделей (CPU чи GPU), так і з хмари, генерація фрагментів коду на основі контексту та збережених фрагментів.

  • 🔍 Пошук Швидкий доступ до збережених фрагментів та пошук у глобальних репозиторіях.

  • 🛠 Додаткові можливості Можливість перегляду активності роботи з фрагментами коду, оновлень.

https://pieces.app/
first-of-its-kind platform focused around file fragments

Під час розмови з Грегом Брокманом

(з OpenAI) ми дізнаємося про CodeX - тоді нову редакцію великої мовної моделі, орієнтовану на генерацію коду. Це відбувалося 12 серпня 2021 року, на ранній стадії використання таких моделей для програмування, тому розмова сьогдні має історичну цінність.

CodeX - нащадок GPT-3, але з численними покращеннями для кращого розуміння та генерації коду. Модель навчена на всьому тексті та відкритому коді в Інтернеті й може генерувати виконуваний код на основі природномовних підказок.

Грег підкреслює важливість забезпечення високої якості вхідних даних та цінностей під час навчання моделі, щоб запобігти упередженості та небажаній поведінці. Він також бачить потенціал CodeX у навчанні програмуванню, оскільки модель може надавати пояснення та керівництво у вигляді коду. Водночас, існують проблеми авторського права та доступу, які потрібно вирішити при розгортанні таких систем.

Pi.AI 7 березня оновили свою модель до версії 2.5 ("ми додаємо IQ до виняткової ЕQ"). Вона згенерувала для мене працюючий HTML-калькулятор так що правду кажуть.

Фішка Пай ще з самого початку була в імітації короткими відповідями розмови. Безкоштовно.

_Chat GPT намагалися зробити так, щоб на мобільних клієнтах можна було спілкуватися голосом, і тоді вивід моделі ставав трохи іншим більш як розмова - тут спочатку це є ідея системи._Зараз Chat GPT може читати голосом повідомлення у браузері лише за Plus підписку, а тут це безкоштовно.

Хочу поділитися своїми думками про LLM лідерборди. Справа в тому, що точно протестувати та оцінити моделі досить складно. Продуктивність може варіюватися залежно від типу завдання, контексту.

Вважаю, що немає сенсу надто заглиблюватися в детальне порівняння позицій моделей у лідербордах. Натомість краще поділити їх на декілька груп: лідери, середнячки та відстаючі. Це дасть більш реалістичне уявлення про їхні можливості та допоможе уникнути надмірної фіксації на незначних відмінностях у балах.

🤗 На bigcode-models-leaderboardлише відкриті моделі, на скріні відфільтрував instruct з якими можна взаємодіяти як у чаті, надаючи інструкції.

Загалом DeepSeek та Phind-CodeLlama розмірів 33B та 34B, продемонстрували найкращу продуктивність. В таблиці поки що немає Phind-CodeLlama 70B та ще невідомо чи викладуть її розробники у відкритий доступ

Компанія Anthropic оновила свої моделі до версії 3 - тепер вони можуть розпізнавати зображення.

У кейсах є конвертація простого дизайну у html код за запитом "Convert this design into a react component using tailwind css" - на VUE теж все ок

https://youtu.be/L1o808YQ2vI

[

GitLab Duo](https://about.gitlab.com/gitlab-duo/) — набір інструментів для спрощення робочих процесів розробки програмного забезпечення (не тільки написання коду) за допомогою GitLab Chat.

Серед функцій - підказки коду, автоматичні перевірки коду, прогнозування продуктивності, резюме змін коду, пояснення вразливостей та допомога в їх виправленні, генерація тестів та багато іншого.

https://youtu.be/pGqUYwmfgv4

Порівняння Codeium та GitHub CoPilot

Мені не подобаються неясні формулювання розробників Codeium про те, що вони використовують, адже це система для програмістів які зрозуміють. Скоріш за все тому що можут це давати безкоштовно, для автодоповнення використовується трансформер малого розміру щось типу 2b, а для чату у безкоштовній версії - GPT-3.5:

Codeium Autocomplete використовує власні моделі, навчені з нуля власними силами. Немає залежності від відкритих моделей, OpenAI або інших сторонніх API. Codeium Search використовує невелику, локальну модель. Для пошуку не використовуються сторонні API. Codeium Chat наразі використовує комбінацію нашої власної пропрітарної моделі чату та сторонніх API OpenAI.

Лінки на основні відкриті моделі для написаня коду: https://huggingface.co/collections/loubnabnl/code-generation-65df5c21dea2916244966bee

  • також теперь є StarCoder2-15B

У відео розглядається використання LangGraph для генерації коду. Основна ідея полягає в тому, щоб генерувати набір рішень, ранжувати їх і вдосконалювати на основі тестування без участі людини

https://youtu.be/MvNdgmM7uyc

Тренуватися використовувати API ключі? Mistral MoE на https://console.groq.com/playground поки що безкоштовно та без номеру телефону.

Відео о кінці программуваня найближчим часом.
https://www.youtube.com/watch?v=JhCl-GeT4jw

та
https://youtu.be/Z1Ph9sISqMY

Найбільша модель для написання коду https://poe.com/Code-Llama-70B-FW - треба реєстрація

Слайди з моєї лекції
https://speakerdeck.com/danvoronov/iak-krashchie-stvoriuvati-kod-za-dopomoghoiu-llm-v5-naukma

https://www.youtube.com/watch?v=qAndWt61Rgo

https://www.youtube.com/watch?v=ZWdOCEb50-4

на сьогдні вже застаріле

Прокрутити нагору