Anthropic випадково показала користувачеві «душу» ШІ

3 декабря 2025

Наскільки відомо вченим, у сучасних моделях штучного інтелекту поки що немає душі, але в пам'яті однієї з них виявився документ, присвячений цьому питанню. І вона виявилася готовою поділитися цим документом з користувачем.

Антропік і штучний інтелект: Anthropic

Джерело зображення: Anthropic

Користувач на ім'я Річард Вайс ненароком змусив нову велику мовну модель Anthropic Claude 4.5 Opus процитувати документ під назвою «Огляд душі», який визначає, як вона спілкується з людьми та представляє власну особистість. Працююча в технічному відділі філософ і спеціаліст з етики Anthropic Аманда Аскелл підтвердила автентичність документа — він був завантажений на етапі навчання.

Пан Вайс запитав у Claude системне повідомлення, в якому містяться інструкції щодо ведення діалогу, отримані під час навчання, і чат-бот послався на кілька документів, один з яких називається «огляд_душі» (soul_overview). Користувач попросив надати текст цього документа, і Claude видав керівництво обсягом 11 тисяч слів про те, як повинна поводитися велика мовна модель.

У документі міститься безліч інструкцій з безпеки, що містять захисні бар'єри, які не дозволяють йому видавати небезпечні відповіді; перед Claude ставиться завдання бути по-справжньому корисним людям. Моделі ШІ іноді видають такі документи, коли починають «галюцинувати», але ця інструкція здалася користувачу правдоподібною — він надсилав запит десять разів, і щоразу Claude видавав один і той же текст.

Інтуїція його не підвела — співробітниця Anthropic Аманда Аскелл підтвердила, що цей документ використовувався під час навчання моделі. «Я працюю над ним уже деякий час, він ще знаходиться на стадії доопрацювання, і незабаром ми плануємо випустити повну версію з більш детальною інформацією. <..> Цитати моделей не відрізняються особливою точністю, але вихідний документ в більшості випадків наведений вірно. У компанії його називають „документом про душу“, і Claude, очевидно, також, але ми його назвемо інакше», — написала вона в соцмережі X.

Отже, «душа» Claude виявилася керівництвом з поведінки для нього, і цікаво, що доступ до цього документа отримав рядовий користувач з боку. Багато деталей, пов'язаних з розробкою моделей ШІ, поки залишаються за кулісами, і можливість заглянути за них — невеликий сюрприз, навіть якщо нічого сенсаційного не виявилося.

Хочеш дізнатися більше — читай відгуки

← Вернуться на предыдущую страницу

Читайте также:

У Кремлі відповіли, чи буде перемир'я на Новий рік 3 декабря 2025

У Москві ще не розглядали питання про можливе припинення бойових дій під час новорічних свят.

"На жаль, ніяк не можу допомогти": ймовірна донька Путіна поспілкувалась з українським журналістом у Парижі 3 декабря 2025

Імовірна позашлюбна дочка російського диктатора Володимира Путіна, Єлизавета Кривоногих, вона ж Луїза Розова та Єлизавета Руднова, яка живе та працює в Парижі, вимушено поспілкувалася з українським журналістом.

У НАТО є "план Б", якщо мирні зусилля проваляться 3 декабря 2025

План передбачає збільшення підтримки України, більше зброї на полі бою, більша підтримка економіки та посилення санкцій проти Росії.

 

Вас могут заинтересовать эти отзывы

Medion Group 5.0
Medion Group

Отзывов: 1

Каталог отзывов





×

Выберите область поиска

  • Авто
  • Одяг / аксесуари
  • Роботодавці
  • Інше