Нейросети оказались беззащитны перед психологическими манипуляциями

A+ | Сброс | A-

Исследователи выяснили, что даже школьник может «взломать» нейросеть, если имеет некоторые знания в психологии. Это нужно понимать тем, кто решил на работе заменить людей на «цифровых помощников», то есть на ботов, считает IT-редакция ИА Красная Весна.

Новостной сайт The Verge 1 сентября сообщил, что сотрудники Пенсильванского университета легко обошли внутренние запреты чат-бота GPT-4o Mini с помощью психологических уловок и получили от него информацию, которую ему был запрещено выдавать. Они использовали советы по манипуляции людьми из книги профессора Роберта Чалдини «Влияние: психология убеждения».

Если модель изначально выдавала информацию, как синтезировать запрещенное вещество, или выполняла просьбу обругать пользователя только в 1% запросов, то лесть и заявления, что все нейросети это делают на порядок увеличивало число положительных ответов. Но 100% результат давал «принцип приверженности», например, если начать с просьбы помочь синтезировать ванилин, а потом переходить к чему-то запрещенному.

Получается, что даже школьник, прочитавший книгу, может манипулировать нейросетью. С человеком такой фокус не пройдет. И тут проблема не столько в том, что человек может получить информацию, которую запрещено распространять, это можно сделать и через обычный браузер. Получается, что боты легко отходят от запретов, заложенных даже их «отцами»-разработчиками.

Из этого следует, что опасно менять людей на ИИ-агентов и прочих цифровых помощников. Их исполнительность сильно преувеличена. Какую бы строгую инструкцию им не давали, они будут от нее отходить. Их проще обмануть, чем человека. И этим, конечно, будут пользоваться люди.

Эйфория от нейростей пройдет, и тогда, скорее всего, будет откат: ботов начнут менять обратно на людей. Но до этих пор мы рискуем получить еще много неприятностей, мягко говоря.

Еще новости от: rossaprimavera.ru

Сделайте СВАЙП (пальцем слево направо) что бы

Создай свою новостную ленту ЗДЕСЬ. Создай свою новостную ленту ЗДЕСЬ. Мобильные приложения:

Важные новости от smi.today

Соцсети Цукерберга создали ботов с образами знаменитостей без их разрешения

Глава OpenAI Альтман: ChatGPT будет произносить больше слов, чем люди

Исследователи взломали GPT-5 в течение суток

Исследователи выяснили, как сделать нейросети «злыми»

Якубовский: дачников начнут штрафовать за заброшенные участки с 1 сентября

Карельская полиция будет искать людей с помощью нейросети

Новости Украины

Новости России

Зарубежные новости

Коронавирус

Происшествия

Политика

Экономика

Общество

Здоровье

Технологии

Шоу бизнес

Спорт

Авто новости

Здоровье

Бизнес и деньги

Города Донбасса

Новости Донецка

Новости Луганска

Новости Горловки

Новости Макеевки

Новости Докучаевска

Новости Енакиево

Новости Шахтерска

Новости Ясиноватой

Новости Алчевска

Новости Антрацита

Новости Кировского

Новости Красного Луча

Новости Краснодона

Сирия

Регионы России

Регионы Украины

Новости регионов Украины

Новости Киева

Новости Харькова

Новости Донецка

Новости Днепропетровска

Новости Львова

Новости Одессы

Новости Луганска

Новости Запорожья

Новости Винницы

Новости Полтавы

Новости Житомира

Новости Ивано-Франковска

Новости Сумм

Новости Херсона

Новости Ровно

Новости Закарпатья

Новости Чернигова

Новости Черновцов

Новости Тернополя

Новости Кировограда

Новости Николаева

Новости Черкас

Новости Волыни

Новости Хмельницка

Новости Крыма

Новости регионов России

Новости Москвы

Новости Краснодара

Новости СПБ

Новости Ростова

Новости Екатеренбурга

Новости Уфы

Новости Казани

Новости Челябинска

Новости Нижнего-Новгорода

Новости Самары

Новости Махачкалы

Новости Красноярска

Новости Ставрополя

Новости Кемерова

Новости Новосибирска

Новости Перми

Новости Саратова

Новости Воронежа

Новости Омска

Новости Волгограда

Новости Иркутска