2025-12-25 15:28 - CodeWithLLM

Нові моделі

Gemini 3 Flash
https://blog.google/products/gemini/gemini-3-flash/
Google потрохи розгортають свою молодшу мультимодальну агентну модель нової серії - за тестами скоріше ближче до Gemini 3 Pro ніж, до Gemini 2.5 Flash. Модель перевершує й Gemini 2.5 Pro за багатьма бенчмарками, будучи при цьому втричі швидшою та значно дешевшою. За деякими тестами модель краща за флагманські моделі інших компаній.

З моменту релізу Gemini 3 Flash стала моделлю за замовчуванням у мобільному додатку Gemini (замінюючи 2.5 Flash) та в AI Mode пошуку Google. В мене у Gemini CLI досі не з'явилися ні 3 Flash, ні 3 Pro - працювати з ними можна через Google AI Studio.

GLM-4.7
https://z.ai/blog/glm-4.7
Zhipu AI оновила свою модель GLM. 4.7 версія демонструє суттєвий прогрес порівняно з GLM-4.6 у багатомовному сценарію генерації коду. Підтримує "thinking before acting" у фреймворках на кшталт Claude Code, Kilo Code, Cline та Roo Code, забезпечуючи стабільність у складних завданнях. Також підтягнули якість генерації інтерфейсів.

Ваги моделі (MoE-архітектура, контекст до 200K токенів) публічно доступні на Hugging Face та ModelScope для локального розгортання. Доступ через API Z.ai, OpenRouter, чат на z.ai та спеціальний GLM Coding Plan ($3/місяць за перший місяць, потім по $6).

MiniMax M2.1
https://www.minimax.io/news/minimax-m21
Випуск покращеної моделі MiniMax M2 від китайської компанії MiniMax, орієнтованої на практичну розробку та агентні системи. Говорять, що модель значно посилена для роботи з не-пайтон мовами програмування (Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript, JavaScript тощо), перевершуючи Claude Sonnet 4.5 і наближаючись до Claude Opus 4.5 у багатомовних сценаріях.

Модель open-source. Вартість через API доволі низка, близько 10% від Claude Sonnet. Сумісність з популярними агентами: Claude Code, Droid (Factory AI), Cline, Kilo Code, Roo Code, BlackBox. Підтримка механізмів контексту (Skill.md, agent.md тощо).

Також мають веб платформу https://agent.minimax.io/ де можна затестувати як модель створює застосунки.

https://www.youtube.com/watch?v=kEPLuEjVr_4

Порівняння SWE-bench Verified: Gemini 3 Flash 78%, MiniMax M2.1 74%, GLM-4.7 73.8%.

#newllmmodel

2026

2025

2024