2024-09-13 17:11 - CodeWithLLM

https://youtu.be/eHz-xLSs50o

Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.

🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.

⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модельвсе ще не досягла рівня людського розробника.
🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.

Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)

2026

2025

2024