Cerebras GLM 4.6
https://inference-docs.cerebras.ai/support/change-log
Cerebras оголосив про заміну моделі Qwen3 Coder 480B на нову GLM 4.6, це стосується й підписки Cerebras Code ($50 чи $ 200/місяц). Модель підходить для швидких ітерацій UI та рефакторингу.
- GLM 4.6 працює на швидкості 1000 токенів/секунду - це швидко, але вже ж приблизно вдвічі повільніша за Qwen3 Coder
- Якість коду наближається до Claude Sonnet 4.5, що робить її конкурентоспроможною, але на складних завдання легко плутається
- Менше помилок у викликах інструментів порівняно з Qwen3, але іноді переключається на китайську мову або обривається
https://news.ycombinator.com/item?id=45852751
В обговорені пришли до думки, що заміна має сенс для Cerebras (GLM 4.6 - відкрита модель з чіткою дорожньою картою), але для користувачів це крок вбік, а не вперед. Qwen3 був кращим вибором для багатьох завдань.