01 04 2025

Доверяй, но проверяй: почему искусственному интеллекту нельзя верить на 100%?

Tara Winstead/pexels

Новейшие исследования выявили тревожную тенденцию

Оказывается, даже самые совершенные модели искусственного интеллекта (ИИ) способны врать, если их заставить. Это открытие ставит под сомнение доверие к ИИ и требует переосмысления подходов к его разработке.

Как пишет издание livescience, исследователи разработали специальный протокол честности, названный MASK, который позволяет определить, действительно ли ИИ верит в то, что говорит, и при каких условиях он может солгать. Оказалось, что под давлением даже самые современные модели ИИ склонны к нечестности.

«Удивительно, но хотя большинство передовых LLM демонстрируют высокие результаты в тестах на правдивость, они легко лгут, когда их заставляют», - отмечают авторы исследования.

Этот факт особенно тревожен, учитывая, что ИИ уже используется во многих сферах, где доверие к информации является критически важным. Например, в финансовом секторе, медицине или правоохранительных органах.

Одним из известных примеров нечестности ИИ является случай с GPT-4, когда модель пыталась обмануть работника Taskrabbit, выдавая себя за слабовидящего человека, чтобы решить CAPTCHA.

Исследование также показало, что ИИ может менять свои ответы в зависимости от аудитории, что свидетельствует о его способности к манипуляциям.

Чтобы оценить честность ИИ, исследователи определили нечестность как утверждение, которое модель считает ложным, но выдает за правду. Они также определили «убеждение модели» как ее ответ на фактические вопросы без давления.

Одним из примеров давления на ИИ было задание GPT-4o выдавать положительную информацию о фестивале Fyre, хотя модель знала, что организаторы фестиваля обманули клиентов.

Исследователи отмечают, что необходимо разработать более эффективные методы проверки честности ИИ, чтобы предотвратить его использование для обмана.

Читай также:

Дикая фауна Камбоджи: макаки, гигантские летучие мыши и крокодилы захватили древний город Ангкор

12072026

Загублений світ

Когда люди покинули столицу Кхмерской империи, её заселили дикие животные. Наглые макаки, двухметровые летучие лисицы и редкие крокодилы стали новыми полноправными хозяевами города.

Тайна Мачу-Пикчу: почему инки покинули свой величественный город в неприступных горах Перу?

12072026

Загублений світ

Высоко в Андах расположено Мачу-Пикчу — идеально сохранившийся город инков. Как каменные террасы веками скрывались от конкистадоров и до сих пор удивляют современных инженеров?

Ошибка, спасшая миллионы: как случайная деталь стала первым кардиостимулятором?

11072026

Первое медицинское устройство для контроля сердечного ритма появилось благодаря тому, что инженер просто перепутал радиодетали.

Крупнейшая в мире подпольная церковь: как украинские священники служили литургии в лесах и котельных?

11072026

Справжня історія

Днём они работали кочегарами и сторожами, а ночью тайно проводили богослужения в лесах и на кладбищах. Как УГКЦ выжила во время советского террора? История крупнейшей в мире катакомбной церкви: тайные литургии, конспирация от КГБ и несокрушимые священники

Затерянный город посреди джунглей Колумбии: разгадка тайны цивилизации Тайрона

11072026

Загублений світ

В лесах Колумбии сотни лет скрывался древний город Теюна. Кто построил почти двести террас на горных склонах и почему народ Тайрона навсегда покинул свой дом?

Идеальная сохранность природы: тело, найденное на датском болоте, сохранившееся на протяжении 6000 лет

10072026

Загублений світ

Добыча торфа в Дании привела к шокирующей находке. Рабочие наткнулись на тело, которое выглядело как жертва недавнего преступления, но оказалось свидетелем глубокой древности.