ШІ-мозок: Google і Microsoft представили реальних роботів зі штучним мозком, який здатен аналізувати

Цей штучний інтелект має «широкий набір можливостей»…

Розвиток останніх досягнень штучного інтелекту ШІ, щоб дозволити роботам виконувати завдання автономно в реальному світі, є «значним кроком вперед», кажуть дослідники. Google і Microsoft оголосили про дослідження щодо застосування подібних моделей штучного інтелекту до роботів із вражаючими результатами, пише видання VICE.

«Дослідники з Google і Берлінського технологічного інституту випустили модель штучного інтелекту під назвою PaLM-E, яка поєднує в собі мовні та зорові можливості для керування роботами, що дозволяє їм автономно виконувати завдання в реальному світі — від тримання пакету з чіпсами, до сортування блоків за кольором по кутах прямокутника», - йде мова у статті.  

Цей штучний інтелект має «широкий набір можливостей», який включає математичні обчислення, обчислення з кількома зображеннями та мислення за ланцюгом думок. Дослідники написали в статті, що штучний інтелект використовує багатозадачне навчання для передачі навичок між завданнями, а не тренується на окремих завданнях. Згідно з документом, модель штучного інтелекту під час керування роботами навіть демонструє «нові здібності, такі як мультимодальний ланцюжок думок і здатність міркувати над кількома зображеннями, незважаючи на те, що вона навчається лише на підказках з одного зображення».

Робот здатний генерувати власний план дій у відповідь на команди за допомогою моделі. Коли робота попросили «принести рисову стружку з шухляди», PaLM-E зміг наказати йому піти до шухляд, відкрити верхню, дістати рисову стружку, принести її, і покласти на стіл. Робот зміг зробити це, навіть коли його потурбувала людина: дослідник закинув рисову стружку назад у ящик, коли робот її вперше взяв. PaLM-E може зробити це, аналізуючи дані своєї камери в реальному часі.  

Штучний інтелект може відповідати на запитання про світ, наприклад, з яким океаном межує Маямі-Біч. PaLM-E також може давати підписи та описувати зображення.

Google — не єдина компанія, яка тестує новий мультимодальний штучний інтелект і те, як інтегрувати великі мовні моделі в роботів. Корпорація Майкрософт опублікувала своє дослідження про те, як вона розширила можливості ChatGPT до робототехніки. Нещодавно вони також представили мультимодальну модель під назвою Kosmos-1, яка може аналізувати зображення на вміст, вирішувати візуальні головоломки, виконувати візуальне розпізнавання та проходити тести на IQ.

У своїй статті, що описує результати, дослідники Microsoft назвали конвергенцію мовних моделей із можливостями роботів кроком до створення штучного загального інтелекту, або AGI, який зазвичай розуміється як інтелект на тому ж рівні, що й людський.

PaLM-E показує, що в міру того, як великі мовні моделі стають більш масштабованими та вдосконаленими, його можливості, включаючи виконання мультимодальних завдань, стають легшими, точнішими та автономними. 

Читайте також:

Коли діти українки Марини Тратнер запитали: «Мамо, а що ти знаєш про свій рід?», вона зрозуміла, що має величезну білу пляму там, де мав бути фундамент.
23022026
Анонси 2+2
У п’ятницю, 27 лютого, о 13:00 на стадіоні ім. Валерія Лобановського київське «Динамо» своїм матчем відкриває 18-тий тур Української Прем’єр-ліги. Суперник - «Епіцентр» із Кам’янця-Подільського. Пряма трансляція — на телеканалі 2+2.
Сотні кораблів, десятки літаків і тисячі людей просто випарувалися тут за останнє століття. Але є одна деталь, яка лякає дослідників найбільше: майже ніхто з них не встиг натиснути на кнопку SOS. 
23022026
Живий
Елеонора Кравченко розповіла про роботу з Андрієм Ісаєнком, який зіграв її чоловіка, про складнощі на знімальному майданчику та особистий шлях до акторства й активної волонтерської діяльності.