Дзен

16.06.2026, 15:19

· 16+ · Анастасия Максименко

PNAS Nexus: ученые обнаружили ключевую слабость современных ИИ

Наука Технологии

Исследование показало, что языковые модели врод...

magnific.com

PNAS Nexus: ученые обнаружили ключевую слабость современных ИИ

Международный исследовательский коллектив протестировал крупные языковые модели с помощью теста Струпа. Результаты опубликованы в журнале PNAS Nexus.

В исследовании участвовали GPT-4o, GPT-5, Claude 3.5 Sonnet, Claude Opus 4.1 и Gemini 2.5, которые выполняли задания различной длины.

Как работает тест Струпа

Суть методики заключается в том, что человеку показывают слова, обозначающие цвета, написанные другим цветом. Требуется назвать цвет чернил, игнорируя значение слова. Этот тест используется для оценки концентрации и устойчивости внимания у людей.

Как ИИ справился с задачами

При коротких списках (до 5 слов) модели демонстрировали высокую точность. Однако с увеличением количества заданий качество ответов заметно снижалось.

Например, у GPT-4o точность падала с 91% до 57% при 10 заданиях и до 15% при 40. Claude 3.5 Sonnet удерживал стабильные результаты только до примерно 20 слов, после чего также фиксировалось резкое падение качества.

Что показали выводы исследования

Ученые пришли к выводу, что модели начинают терять фокус на исходной инструкции при увеличении объема текста и переходят к более простому способу обработки — чтению слов буквально.

Это отличает их от человека, который способен сохранять устойчивое внимание и выполнять инструкцию даже при высокой когнитивной нагрузке.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

PNAS Nexus: ученые обнаружили ключевую слабость современных ИИ

PNAS Nexus: ученые обнаружили ключевую слабость современных ИИ

Как работает тест Струпа

Как ИИ справился с задачами

Что показали выводы исследования

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

Читайте также:

Ученые первые подробно изучили микропластик в тканях живых организмов

Обнаружена древнейшая ветвь сумчатых в эволюции Австралии

Популярное

В Самарской области 16 июня назначат выборы в губдуму

В Самаре на АЗС «Татнефти» ввели лимит на бензин

В Самаре проведут дополнительную проверку в отношении Александра Милеева

Пляжи пустеют: почему туристы стали массово отказываться от жаркого моря

В Сергиевском районе на трассе М-5 произошло ДТП с выездом на встречную полосу

На трассе в Самарской области шестерых госпитализировали после ДТП

В Самарской области 14 июня зафиксировали массовое ДТП на трассе М-5 «Урал»

Волга у берегов Тольятти и Сызрани прогрелась до +21 градуса

В Самаре приостановил прием заявлений визовый центр Кипра

Самарские вузы исследуют влияние космического полета на бактерии и растения

Врач Бородин: чрезмерная работа на огороде повышает риск инсульта

Суд рассмотрит спор из-за срыва ремонта моста в Самарской области

Пьянов предупредил о рисках «черного лебедя»: почему новая пандемия опаснее экономических шоков

В Тольятти дело о мошенничестве на 78 млн рублей в автосалоне дошло до суда

Эксперт Рыбальченко: молния не следует за сигналом мобильного смартфона

Суд по иску прокуратуры обязал вернуть пенсионерке 900 000 руб после обмана

«Новые люди» провели в Самаре концерт молодых исполнителей в рамках проекта «Голос города»