Вышла обновленная модель Qwen3.
Китайцы выкатили Qwen3-235B-A22B — и это лучшая опенсорс модель, которая по бенчмаркам обходит DeepSeek V3, Claude 4 Opus и Kimi K2.
Модель хорошо справляется с пониманием инструкций, логическими выводами, задачами по математике и программированию.
Также Qwen3 работает с большим контекстом до 256 тыс. токенов, так что можно закинуть целую книгу.
Архитектура — MoE, активных параметров всего 22B.
- GPT News | ChatGPT BOT


