CodeWithLLM-Updates
-

в Cursor AI додали o1-preview та o1-mini

з 19/09 моделі OpenAI o1-preview та o1-mini тепер й у гітхаб копайлоті

https://github.blog/news-insights/product-news/try-out-openai-o1-in-github-copilot-and-models/

https://youtu.be/eHz-xLSs50o

Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.

🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.

⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модельвсе ще не досягла рівня людського розробника.
🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.

Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)

Найближчим часом очікуємо кейсів программуваня з OpenAI o1 - стежу. Багато говорять, що буде вирішувати дуже складні завдання

також цікаво скільки буде коштувати геренація проектів після тестової стадії

https://www.youtube.com/watch?v=50W4YeQdnSg

The Replit Agent is currently available through a limited early access program

https://youtu.be/IYiVPrxY8-Y

Phind-405B based on the Meta Llama 3.1 405B scores 92% on HumanEval (0-shot), matching Claude 3.5 Sonnet

  • new Phind Instant model based on Meta Llama 3.1 8B (free)

https://www.phind.com/blog/introducing-phind-405b-and-better-faster-searches

🌍 У статті Андрія Карпатія (2017 рік), популярного дослідника зі сфери штучного інтелекту та машинного навчання, аналізується фундаментальний зсув у парадигмі розробки програмного забезпечення. Він проводить чітке розмежування між "Програмним забезпеченням 1.0" (традиційне ручне кодування) та "Програмним забезпеченням 2.0" (ШІ модель-орієнтоване навчання).

🧠 Карпатій стверджує, що нейронні мережі - це не просто черговий інструмент у наборі машинного навчання, а початок нової програмної Парадигми. На відміну від явного кодування в ПЗ 1.0, ПЗ 2.0 покладається на навчання моделей через великі обсяги даних, щоб виявляти закономірності та правила.

🚘 Цей перехід уже спостерігається в галузях, таких як комп'ютерне зір, розпізнавання мови, машинний переклад та автономні транспортні засоби, де нейронні мережі перевершують традиційні алгоритми.

📚 Однак Карпатій визнає певні проблеми, пов'язані з переходом до ПЗ 2.0. Зокрема, він зазначає, що програмування через налаштування ваг і зміщень нейронних мереж є значно менш інтуїтивним і зрозумілим для людей, ніж традиційне кодування.

🔍 Таким чином, основним викликом є створення більш інтуїтивних інструментів та методів, які б дозволили розробникам та користувачам краще розуміти та взаємодіяти з нейронними мережами, - ключовим компонентом цієї нової програмної парадигми.

🔮 Висновок Карпатія полягає в тому, що, подібно до того, як "Програмне забезпечення 1.0 поглинає світ", зараз "Штучний інтелект або Програмне забезпечення 2.0 поглинає Програмне забезпечення". Це захоплююча перспектива еволюції технологій, яка змінює саму природу розробки програмного забезпечення.

https://www.youtube.com/watch?v=ozEZbqzPyFM

Прокрутити нагору