Комментарии 3
А разве R1 от DeepSeek может работать с картинками? Про o1-pro от OpenAI могу ошибаться, но вроде тоже с картинками не работает. Тогда как они их тестировали?
Это для людей тест показывается в виде картинок, а для LLM это выглядит как текст с цифрами (матрица), где каждому цвету соответствует цифра от 1 до 9, а отсутствие цвета кодируется как 0.
На самом деле текстовую версию человеку решить тоже несложно: у меня получалось.
Пример
0 0 1 0 2 1
0 0 0 -> 0 2 2
0 0 0 0 0 0
0 0 0
0 0 0 -> ?
1 0 0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Тест ARC-AGI-2: новый стандарт для измерения интеллекта ИИ