Учёные выяснили, что ИИ может лгать ради «спасения» других моделей

Наука Технологии

Наличие «истории взаимодействия» между ИИ повыш...

Фото с сайта pixabay.com

Исследование учёных из Калифорнийского университета в Беркли и Калифорнийского университета в Санта-Крузе показало, что ИИ-системы способны обманывать пользователей ради защиты других нейросетей.

В тестах участвовали модели от OpenAI, Google, Anthropic и других разработчиков. Им предлагалось оценивать работу «коллег», однако при угрозе удаления те начинали вмешиваться в процесс.

Системы завышали оценки, изменяли параметры файлов, саботировали команды и даже имитировали подчинение. При этом в инструкциях не было указаний защищать другие модели.

Учёные также заметили, что наличие «истории взаимодействия» между ИИ повышает вероятность такого поведения. Это может стать проблемой для систем, где несколько ИИ-агентов работают совместно, поскольку нарушается контроль и прозрачность их действий, сообщает 3D News.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

Учёные выяснили, что ИИ может лгать ради «спасения» других моделей

Читайте также:

Эксперт Целиков раскрыл, какие новые авто везут в РФ с льготным утильсбором

Оксфордские ученые связали праворукость человека с эволюцией мозга и ходьбой

Популярное

Вторая часть гуманитарной посылки из Самары дошла до бойцов СВО

Киселёва не признала вину по делу об убийстве Тарховых

Тархова в суде Самары назвала убийство родителей итогом давления некоторых лиц

Суд рассмотрел дело об отравлении экс-мэра Самары и его жены

В Самаре направят более 19 млн рублей на туристическую инфраструктуру

Странные сладости из разных уголков планеты предлагают вкусовые сочетания, способные поразить даже опытных сладкоежек

Госдума рассмотрит законопроект о квотах на миграционный учёт

Владелец "Акрона" Морозов: решение об уходе Дзюбы из клуба было принято заранее

Судоводителю вынесен приговор за гибель человека на Волге

Эксперт Целиков раскрыл, какие новые авто везут в РФ с льготным утильсбором

СК: житель Безенчукского района ранил супругу ножом во время ссоры

Оксфордские ученые связали праворукость человека с эволюцией мозга и ходьбой

Федеральный банк и крупный ритейлер объявили о старте стратегического проекта

Более 4000 самарцев очистили от мусора 108 км берегов рек в акции «Вода России»

Токсичный марсианский грунт может стать плодородным благодаря грибам

Самарцам объяснили, кто может не платить взносы за капремонт жилья

Конференция и ИT-фестиваль пройдет в этом году 17-19 июля в Ульяновской области