Роботы - The Next Big Thing?
Инженеры Disney Research не скрывают восторга, создавая дроидов из вселенной «Звёздных войн». А теперь, благодаря Антуану Пирроне, каждый может собрать мини-дроида примерно за 400 долларов. И хотя он выглядит как забавная игрушка, подобные роботы имеют все шансы перешагнуть границы тематических парков и войти в повседневную жизнь.
Похоже, в робототехнике произошел тот самый скачок из количества в качество, о котором талдычили на философии. Машины теперь без особых усилий осваивают навыки, которые раньше приходилось жестко прописывать в коде.
Исследователи из Columbia Engineering недавно продемонстрировали это наглядно: их роботы самостоятельно изучают структуру собственного тела и принципы движения, просто наблюдая за собой через камеру. Буквально смотрят в зеркало и познают себя!
Компания Figure показала Helix — универсальную модель машинного обучения типа Vision-Language-Action (VLA) для гуманоидных роботов. Эта система одновременно обрабатывает изображения и команды на обычном человеческом языке, а затем управляет роботами в реальном времени. Благодаря Helix роботы могут узнавать и работать с тысячами обычных домашних предметов. Кроме того, Figure объявила о создании BotQ — завода по производству роботов. Для начала он будет выпускать до 12 000 гуманоидов ежегодно.
А на прошлой неделе Google DeepMind анонсировала сразу две новые модели: Gemini Robotics с технологией Vision-Language-Action (VLA) и Gemini Robotics-ER с технологией Embodied Reasoning. Обе они работают на базе Google Gemini — многомодальной базовой модели, которая понимает текст, голос и изображения, отвечает на вопросы и дает рекомендации.
Gemini Robotics, в DeepMind назвали "продвинутой системой зрения-языка-действия". Она воспринимает ту же информацию, что и базовая Gemini, но может преобразовывать ее в команды для физических действий робота. Причем она совместима с любым железом. На сайте проекта есть впечатляющие демонстрации работы системы. Интересно узнать больше? Загляните в статью "Внедрение ИИ в физический мир".
К слову, не только Google развивает робототехнику. Apple тоже проявляет интерес — компания показала милую и услужливую роботизированную лампу, и, по слухам, работает над созданием андроидов.
Теперь же, когда NVIDIA представила базовую модель для управления роботами (на примере того самого дроида от Disney) и сразу же опубликовала ее на GitHub и Hugging Face, эта технология становится гораздо доступнее, чем можно было предположить. По крайней мере частично.
Конечно, собрать в гараже человекоподобного робота пока нереально, но вот с роботизированными манипуляторами дела обстоят иначе. Открытых проектов уже хватает: PAROL6, toolboxrobotics, arctosrobotics, Thor — и это лишь верхушка айсберга. С учетом развития программного обеспечения, идея собрать такую роборуку становится все заманчивее. Лично я планирую научить свою готовить не хуже робошефа Зиппи.
Хотите знать больше? Подписывайтесь на SantryBlog