ШИ-мозг: Google и Microsoft представили реальных роботов с искусственным мозгом, который способен анализировать

Этот искусственный интеллект обладает «широким набором возможностей»…

Развитие последних достижений искусственного интеллекта ШИ, чтобы позволить работам выполнять задачи автономно в реальном мире, «значительный шаг вперед», говорят исследователи. Google и Microsoft объявили об исследованиях по применению подобных моделей искусственного интеллекта к роботам с поразительными результатами, пишет издание VICE.

«Исследователи из Google и Берлинского технологического института выпустили модель искусственного интеллекта под названием PaLM-E, которая сочетает в себе языковые и зрительные возможности для управления работами, что позволяет им автономно выполнять задачи в реальном мире – от держания пакета с чипсами, до сортировки блоков по цвету по углам прямоугольника», - говорится в статье.

Этот искусственный интеллект имеет «широкий набор возможностей», включающий в себя математические вычисления, вычисления с несколькими изображениями и мышление по цепи мыслей. Исследователи написали в статье, что искусственный интеллект использует многозадачное обучение для передачи навыков между задачами, а не тренируется на отдельных задачах. Согласно документу, модель искусственного интеллекта при управлении работами даже демонстрирует «новые способности, такие как мультимодальная цепочка мыслей и способность размышлять над несколькими изображениями, несмотря на то, что она учится только на подсказках с одного изображения».

Робот способен генерировать свой план действий в ответ на команды с помощью модели. Когда работа попросили «принести рисовую стружку из ящика», PaLM-E смог приказать ему пойти к ящикам, открыть верхнюю, достать рисовую стружку, принести ее, и положить на стол. Робот смог сделать это даже когда его побеспокоил человек: исследователь забросил рисовую стружку обратно в ящик, когда робот ее впервые взял. PaLM-E может это сделать, анализируя данные своей камеры в реальном времени.

Искусственный интеллект может отвечать на вопросы о мире, например, с каким океаном граничит Майами-Бич. PaLM-E может также давать подписи и описывать изображения.

Google – не единственная компания, которая тестирует новый мультимодальный искусственный интеллект и то, как интегрировать большие языковые модели в роботов. Корпорация Майкрософт опубликовала свое исследование о том, как она расширила возможности ChatGPT к робототехнике. Недавно они представили мультимодальную модель под названием Kosmos-1, которая может анализировать изображения на содержимое, решать визуальные головоломки, выполнять визуальное распознавание и проходить тесты на IQ.

В своей статье, описывающей результаты, исследователи Microsoft назвали конвергенцию языковых моделей с возможностями роботов шагом к созданию искусственного общего интеллекта, или AGI, обычно понимаемого как интеллект на том же уровне, что и человеческий.

PaLM-E показывает, что по мере того, как большие языковые модели становятся более масштабированными и усовершенствованными, его возможности, включая выполнение мультимодальных задач, становятся более легкими, более точными и автономными.

Читайте также:

Когда дети украинки Марины Тратнер спросили: «Мама, а что ты знаешь о своем роде?», она поняла, что у нее есть огромное белое пятно там, где должен был быть фундамент.
23022026
Анонси 2+2
В пятницу, 27 февраля, в 13:00 на стадионе им. Валерия Лобановского киевское «Динамо» своим матчем открывает 18-й тур Украинской Премьер-лиги. Соперник — «Эпицентр» из Каменца-Подольского. Прямая трансляция — на телеканале 2+2.
Сотни кораблей, десятки самолетов и тысячи людей просто испарились здесь за последнее столетие. Но есть одна деталь, которая пугает исследователей больше всего: почти никто из них не успел нажать на кнопку SOS. 
23022026
Живий
Элеонора Кравченко рассказала о работе с Андреем Исаенко, который сыграл ее мужа, о сложностях на съемочной площадке и личном пути к актерству и активной волонтерской деятельности.