mefdayy 25 мар в 10:34

Тест ARC-AGI-2: новый стандарт для измерения интеллекта ИИ

3 мин

1.6K

Блог компании BotHubИскусственный интеллектМашинное обучение*

Комментарии 3

А разве R1 от DeepSeek может работать с картинками? Про o1-pro от OpenAI могу ошибаться, но вроде тоже с картинками не работает. Тогда как они их тестировали?

Volozhaninov 25 мар в 12:21

Это для людей тест показывается в виде картинок, а для LLM это выглядит как текст с цифрами (матрица), где каждому цвету соответствует цифра от 1 до 9, а отсутствие цвета кодируется как 0.

На самом деле текстовую версию человеку решить тоже несложно: у меня получалось.

Пример

0 0 1    0 2 1
0 0 0 -> 0 2 2
0 0 0    0 0 0

0 0 0
0 0 0 -> ?
1 0 0

Nengchak 26 мар в 17:55

У одного у меня, картинка с примером ничего не напоминает, и ничего не могу понять?) просто как будто ребенок раскидал кубики.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Тест ARC-AGI-2: новый стандарт для измерения интеллекта ИИ

zproxy.org