CodeWithLLM-Updates
-

Пам'ятаю, за часів GPT-4 з'являлися багато кастомних моделей, спеціально "заточених" під програмування. Були навіть окремі моделі під Python. phind.com робив круті штуки. Далі це все якось стихло, більшість універсальних моделей і так стали добре писати код.

https://windsurf.com/blog/windsurf-wave-9-swe-1
Windsurf нещодавно випустили свої моделі SWE-1, але я думаю це скоріше крок щоб скоротити витрати на зовнішні API.

Компанія Mistral досі надає API доступ до закритої моделі Codestral, останнє оновлення січень 2025.


І ось у нас новий виток, тепер моделі налаштовують на фонове самостійне вирішення низки завдань з git-репозиторію. OpenAI тільки но перевипустили Codex, тепер заснувавши модель на o3. Github оновили агента, додавши функцію фонової роботи.

https://mistral.ai/news/devstral
Відповідь від Mistral — це модель Devstral, розроблена спільно з All-hands (опен-сорс клон ШІ розробника Devin). На відміну від Codestral ліцензія тут Apache 2.0, тобто вільне використання та модефікація. Модель також доступна через API під назвою devstral-small-2505.

Що краще робить модель:

За даними All Hands AI 🙌Devstral перевершує значно більші моделі, такі як Deepseek-V3-0324 (671B) та Qwen3 232B-A22B. При цьому Devstral достатньо легка, щоб працювати на одній RTX 4090 або Mac з 32 ГБ оперативної пам'яті, що робить її ідеальним вибором для фонового локального використання.