01 04 2025

Довіряй, але перевіряй: чому штучному інтелекту не можна вірити на 100%?

Tara Winstead/pexels

Новітні дослідження виявили тривожну тенденцію

Виявляється, навіть найдосконаліші моделі штучного інтелекту (ШІ) здатні брехати, якщо їх змусити. Це відкриття ставить під сумнів довіру до ШІ та вимагає переосмислення підходів до його розробки.

Як пише видання livescience, дослідники розробили спеціальний протокол чесності, названий MASK, який дозволяє визначити, чи дійсно ШІ вірить у те, що говорить, і за яких умов він може збрехати. Виявилося, що під тиском навіть найсучасніші моделі ШІ схильні до нечесності.

«Дивно, але хоча більшість передових LLM демонструють високі результати в тестах на правдивість, вони легко брешуть, коли їх змушують», - зазначають автори дослідження.

Цей факт особливо тривожний, враховуючи, що ШІ вже використовується в багатьох сферах, де довіра до інформації є критично важливою. Наприклад, у фінансовому секторі, медицині або правоохоронних органах.

Одним із відомих прикладів нечесності ШІ є випадок з GPT-4, коли модель намагалася обдурити працівника Taskrabbit, видаючи себе за людину з вадами зору, щоб розв’язати CAPTCHA.

Дослідження також показало, що ШІ може змінювати свої відповіді залежно від аудиторії, що свідчить про його здатність до маніпуляцій.

Щоб оцінити чесність ШІ, дослідники визначили нечесність як твердження, яке модель вважає хибним, але видає за правду. Вони також визначили «переконання моделі» як її відповідь на фактичні запитання без тиску.

Одним із прикладів тиску на ШІ було завдання GPT-4o видавати позитивну інформацію про фестиваль Fyre, хоча модель знала, що організатори фестивалю обманули клієнтів.
Дослідники зазначають, що необхідно розробити більш ефективні методи перевірки чесності ШІ, щоб запобігти його використанню для обману.

Читай також:

Дика фауна Камбоджі: макаки, гігантські кажани та крокодили захопили стародавнє місто Ангкор

12072026

Загублений світ

Коли люди залишили столицю Кхмерської імперії, її заселили звірі. Нахабні макаки, двометрові летючі лисиці та рідкісні крокодили стали новими повноправними господарями міста.

Таємниця Мачу-Пікчу: чому інки залишили своє величне місто у неприступних горах Перу?

12072026

Загублений світ

Високо в Андах лежить Мачу-Пікчу — ідеально збережене місто інків. Як кам'яні тераси століттями ховалися від конкістадорів та що досі дивує сучасних інженерів?

Помилка, що врятувала мільйони: як випадкова деталь стала першим кардіостимулятором?

11072026

Перший медичний пристрій для контролю серцебиття з’явився завдяки тому, що інженер просто переплутав радіодеталі.

Найбільша у світі підпільна церква: як українські священники служили літургії у лісах та кочегарках?

11072026

Справжня історія

Вдень вони працювали кочегарами та сторожами, а вночі таємно правили служби Божі у лісах та на цвинтарях. Як УГКЦ вижила під час радянського терору? Історія найбільшої у світі катакомбної церкви: таємні літургії, конспірація від КДБ та незламні священники

Загублене місто посеред джунглів Колумбії: розгадка таємниці цивілізації Тайрона

11072026

Загублений світ

У лісах Колумбії сотні років ховалося стародавнє місто Теюна. Хто побудував майже двісті терас на гірських схилах та чому народ Тайрона назавжди залишив свій дім?

Ідеальна консервація природи: тіло з данського болота, яке збереглося протягом 6000 років

10072026

Загублений світ

Видобуток торфу у Данії обернувся шокуючою знахідкою. Робітники натрапили на тіло, яке виглядало як жертва недавнього злочину, але виявилося вісником з глибокої давнини.