НОВОСТИ НЕЙРОСЕТЕЙ НОВИНКИ

ARC-AGI-2: Тест, который ставит в тупик даже ИИ от OpenAI

ARC-AGI-2: Тест, который ставит в тупик даже ИИ от OpenAI

С этим тестом не справляются даже топовые модели OpenAI. Он называется ARC-AGI-2 и проверяет способность ИИ думать как человек.

Модели o3-mini и GPT 4.5 решили этот тест на 0%. Топовая на данный момент o1-pro — 1%, а закрытая от публики o3 — 4%.

Для сравнения, люди проходят его без подготовки и получают в среднем 60%. Секрет в абстрактном мышлении, с которым у нейросетей пока проблемы.

  • GPT News | ChatGPT BOT

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *