Доверие к ИИ падает, роботы придумывают правдоподобные оправдания ошибок

freepik.com
Команда ученых решила проверить, насколько честен современный искусственный интеллект, когда его просят «объяснить», как он пришёл к тому или иному выводу. Для этого большим языковым моделям давали логические задачи, где легко проверить не только правильность ответа, но и корректность рассуждений. Оказалось, что ИИ нередко демонстрирует поразительную точность в финальном результате — но сопровождает его объяснением, которое звучит убедительно, хотя не имеет отношения к реальному процессу решения.
Такая рассинхронизация между ответом и аргументацией и получила название «галлюцинации рассуждений». Модель использует свои статистические «чутьё» и скрытые паттерны, чтобы быстро сойтись к правильному варианту, но при этом не хранит прозрачный, человекочитаемый путь. Когда её просят обосновать выбор, она не поднимает внутренний «протокол вычислений», а генерирует наиболее ожидаемый текст, который, по её статистике, должен понравиться пользователю. Это не анализ, а имитация анализа.
В результате люди сталкиваются с парадоксом: ИИ может быть полезен как мощный инструмент поиска решений, но крайне ненадёжен как источник объяснений. В повседневной переписке это не так страшно, но в ситуациях, где от обоснований зависят деньги, свобода или здоровье, подобное поведение превращается в серьёзный риск. Юрист, врач или аналитик, полагающийся на «логичные» рассуждения модели, может строить решения на иллюзии.
Авторы работы подчеркивают, что проблема заложена в самой архитектуре обучения. Модели учат не думать, а предсказывать текст, который будет максимально правдоподобен. Пока разработчики не внедрят механизмы реальной проверяемой трассировки рассуждений, любые убедительные объяснения от ИИ стоит рассматривать как риторику, а не как доказательства. Именно это несоответствие между внешней убедительностью и внутренней непрозрачностью и подтачивает доверие к новым технологиям, сообщает innovanews.ru.
Читайте также:
- С 2025 года в РФ появятся новые штрафы в сфере ЖКХ
- Для автомобилистов могут вернуть скидку 50% на добровольную оплату штрафов
- Штраф за отсутствие прописки в 2026 году: в каких случаях надо будет платить
- В Госдуме раскрыли средний размер пенсии в России в 2026 году
- В России могут узаконить выплаты алиментов продуктами и одеждой


