DeepSeek оновили свою R1 модель
https://api-docs.deepseek.com/news/news250528
Окрім зменшення галюцинацій та покращення швидкості вони додали виклик функцій та вивід у JSON. Модель open-source та за їх замірами працює на рівні ТОП закритих моделей.
Крім того доробили якість генерації front-end - тепер код ще краще. Приклади у відео, особливо фізика кульок:
https://www.youtube.com/watch?v=lWd1UFtbSZ0
Поки не бачив тестування наскільки добре вона буде працювати як фоновій агент, але думаю це ж все таки модель для парного програмування.
Ціна на АПІ така сама та все ще є знижки в ночі (по Китаю). У веб-версії https://chat.deepseek.com/ використання безкоштовне, але це єдина з SOTA моделей у якої зараз немає в чаті canvas-інтерфейсу. До речі, нарешті додали можливість у налаштування ("Improve the model for everyone") відключити збір даних для тренування їх моделей.
Можна використовувати й підняту у сторонніх провайдерів:
https://openrouter.ai/deepseek/deepseek-r1-0528
https://openrouter.ai/deepseek/deepseek-r1-0528:free від https://chutes.ai/tos
#newllmmodel