Система НГУ отличит авторский текст от нейросети и перевода

Новосибирский государственный университет предс...

freepik.com

Новосибирский государственный университет представил математическую систему, которая по статистическим признакам стиля способна определять автора текста и выявлять несоответствия в его структуре. Как сообщили в вузе со ссылкой на результаты исследования, алгоритм уже адаптирован для работы с четырьмя языками — русским, английским, китайским и амхарским.

В основе разработки лежит анализ устойчивых элементов письменной речи. Система оценивает частоты слов и выражений, типичные синтаксические модели, особенности расстановки знаков препинания и другие параметры, формирующие индивидуальный стиль. На базе этих данных строится математическая модель, которая позволяет сравнивать разные фрагменты и определять, принадлежат ли они одному автору.

Одно из ключевых приложений — контроль академической добросовестности. По информации НГУ, система может использоваться для проверки студенческих работ в школах и университетах. Алгоритм выявляет участки, резко отличающиеся по стилю, что помогает заподозрить плагиат или использование готовых материалов.

Ещё одно направление — обнаружение текстов, созданных нейросетями. Машинные модели генерируют фразы с иным распределением лексики и конструкций, чем человек. Это отражается в статистике, и система НГУ способна фиксировать такие расхождения, предлагая дополнительный инструмент для редакторов, преподавателей и экзаменационных комиссий.

Разработка также применяется для оценки качества перевода. Сравнивая стилевые характеристики оригинала и перевода, алгоритм показывает, насколько близко переводчик сохранил авторскую манеру. Такой подход особенно важен для художественной литературы и сложных публицистических материалов.

Исследователи рассчитали минимальный объём текста, необходимый для надёжного анализа. Порог задан в килобайтах, а не в количестве символов или слов, что позволяет корректно учитывать языки с высокой плотностью информации, такие как китайский. В университете отмечают, что в дальнейшем систему планируют доработать для расширения языковой линейки и интеграции в образовательные и издательские сервисы, сообщает sib.fm.

Обратите внимание: Дороги назад уже не будет: Тамара Глоба назвала один знак, который с 1 декабря заживет по-новому