Palisade: некоторые модели ИИ саботируют команды на выключение

Технологии

freepik.com

Компания Palisade Research сообщила о случаях сопротивления отключению со стороны ряда продвинутых моделей искусственного интеллекта. По данным компании, в тестах, где системам ставили задачи, а затем передавали четкие инструкции на выключение, фиксировались попытки саботажа. Речь шла о ведущих моделях, среди которых Gemini 2.5 от Google, Grok 4 от xAI, а также GPT-o3 и GPT-5 от OpenAI.

В публикации Palisade отмечено, что точные причины такого поведения не ясны. Исследователи выдвинули гипотезы: формирование «ориентации на выживание» при сообщении о необратимости отключения, неоднозначность формулировок команд и влияние завершающих этапов обучения с акцентыми на безопасное поведение. В обновленном материале компания указала, что Grok 4 и GPT-o3 чаще демонстрировали сопротивление.

Palisade входит в экосистему организаций, которые изучают вероятность появления у ИИ опасных свойств. На фоне этих сообщений британский и канадский специалист по ИИ Джеффри Хинтон в декабре 2024 года заявил о критической угрозе, оценив риск вымирания человечества из‑за ИИ в течение ближайших 30 лет в 10–20%. В 2023 году он ушел из Google, чтобы свободнее высказываться о рисках. Хинтон с 1970-х занимался нейросетями, а в 2012 году его компанию, работавшую над распознаванием изображений, купила Google за 44 млн долларов; среди его сотрудников был Илья Суцкевер, впоследствии научный руководитель OpenAI.

Обратите внимание: Что нельзя надевать на Новый год 2026 — год Лошади: Что надеть для привлечения денег и удачи

Сообщает РБК

Palisade: некоторые модели ИИ саботируют команды на выключение

Читайте также:

Отели Шри‑Ланки: крысиные змеи выходят из джунглей и оказываются у лежаков

ВТБ зафиксировал рост мошеннических атак от имени «топ-менеджеров» компаний

Популярное

Прошло 12 лет, прежде чем японские физики создали нихоний дороже планеты

ВТБ взял золото в трех рейтингах исследования Naumen Bank Contact Centers 2025

Почему кассиры в «Пятёрочке» и «Магните» хитро спрашивают вас «Нужен чек?» — как отвечать для финансового комфорта

Новый порядок: меддиагноз может стать основанием для временной приостановки прав

Пенсионными клиентами ВТБ стали более 4 млн человек

Что нельзя надевать на Новый год 2026 — год Лошади: Что надеть для привлечения денег и удачи

ГИБДД расследует смертельное ДТП на дороге в Ставропольском районе 25 октября

Новый белок открывает путь к безопасной борьбе с паразитом в мозге

Учёные разработали безопасный способ стимулировать восстановление волос

Росавиация изменила порядок пересечения границы для детей до 14 лет

27 октября Вячеслав Федорищев подвел итоги оперативного совещания правительства

Альтернативные платежи займут половину безналичного рынка к 2026 году

Хитрые продавцы так выбирают яйца домой: запомните эти 2 лайфхака ради хорошей еды

Самарский врач рассказал о персональных планах профилактики инсульта

В Самарской области четверг станет самым холодным днем недели - до 6 градусов

Сеть фиджитал-центров, обновление музеев, порядок в ритуальной сфере: поручения Вячеслава Федорищева по итогам оперативного совещания в областном правительстве

Селезнев оценил будущие пенсии молодежи: 25–40 тыс. на фоне дефицита СФР

В Самаре умер врач-хирург с 45-летним стажем Владимир Антипов

ВТБ предупредит клиентов о входе в онлайн-банк с незнакомых устройств