Обнаружена слабость ИИ: ChatGPT не справился с содержанием научных заметок

Эксперимент AAAS с ChatGPT: анализ ограничений ИИ в научной журналистике
Ученые провели эксперимент с написанием научных...

Фото с сайта pixabay.com

Годовое исследование Американской ассоциации содействия развитию науки (AAAS) представляет собой одну из наиболее масштабных и методологически строгих попыток оценить применимость современных языковых моделей в профессиональной научной журналистике. Результаты эксперимента с ChatGPT выявили фундаментальные ограничения искусственного интеллекта в области создания качественного научного контента, что имеет серьезные последствия для понимания перспектив автоматизации в медиаиндустрии.

Эксперимент проводился с декабря 2023 по декабрь 2024 года по строго контролируемой методике. Журналисты AAAS еженедельно предоставляли ChatGPT одно-два сложных научных исследования с задачей создания кратких научных заметок в формате SciPak - специализированных брифов для журналистов, которые обычно готовит команда журнала Science и сервиса EurekAlert.

Ключевые требования к создаваемому контенту включали минимизацию специализированной терминологии, четкую структуру изложения и понятный контекст для журналистов, не являющихся экспертами в конкретной научной области. За год было обработано 64 научных работы, что обеспечило статистически значимую выборку для анализа.

Численные показатели эксперимента демонстрируют системные проблемы ChatGPT в создании качественного научного контента.Оценка "неотличимости" от профессиональных текстов: 2,26 балла из 5 возможных. Это означает, что опытные редакторы легко идентифицировали автоматически сгенерированный контент, что свидетельствует о существенных различиях в качестве и стиле.

Оценка "увлекательности": 2,14 балла из 5. Этот показатель критически важен для научной журналистики, поскольку способность заинтересовать читателя сложными научными темами является основным профессиональным навыком.

Процент успешных работ: только одна работа из 64 получила высший балл, что составляет менее 1,6% от общего объема. Этот показатель демонстрирует, что успешные результаты носили случайный, а не системный характер.

Анализ работы ChatGPT выявил четыре основные категории систематических ошибок. Концептуальные ошибки в интерпретации данных: модель регулярно путала корреляцию и причинно-следственные связи - фундаментальную ошибку в научном мышлении. Это особенно опасно в научной журналистике, поскольку может привести к распространению неверных представлений о научных открытиях среди широкой публики.

Игнорирование методологических ограничений: ChatGPT систематически опускал критически важные ограничения исследований. Например, при описании мягких актуаторов модель не упоминала их крайне низкую скорость работы - характеристику, кардинально влияющую на практическую применимость технологии.

Неконтролируемый оптимизм: модель склонна к чрезмерному использованию слов "прорыв", "революция" и "новизна" без достаточного обоснования, что противоречит принципам сбалансированной научной журналистики.

Потеря научной точности при упрощении: стремление к доступности изложения приводило к чрезмерному упрощению, лишающему текст необходимой научной глубины и нюансов.

Ключевой вывод исследования заключается в отсутствии экономии времени при использовании ChatGPT. По словам Абигейл Айзенштадт, необходимость проверки каждого факта в автоматически сгенерированном тексте требует столько же времени, сколько написание заметки с нуля. Более того, процесс верификации может оказаться даже более трудозатратным, поскольку требует выявления тонких неточностей в уже сформулированном тексте.

Ключевой урок исследования заключается в том, что эффективное использование ИИ в журналистике требует не замены человеческой экспертизы, а её усиления через продуманную интеграцию технологических инструментов и профессиональных навыков. Качественная научная журналистика по-прежнему требует уникального сочетания научного понимания, критического мышления и коммуникативных навыков, которыми обладают профессиональные журналисты, сообщает anti-malware.

Обратите внимание: Офтальмолог рассказал, как защитить глаза в осенний период