Учёные создали инструмент для оценки сложности текстов на языках народов

freepik.com
Учёные Центра языка и мозга НИУ ВШЭ создали онлайн‑инструмент, который позволяет быстро оценивать сложность текстов на ряде малоресурсных языков России. В пилотную версию вошли адыгейский, башкирский, бурятский, татарский, осетинский и удмуртский языки. Как отмечают разработчики, система учитывает их специфическую морфологию, типичную длину и частотность слов и не ограничивается прямым переносом русскоязычных моделей.
Ключевая особенность подхода — адаптация формулы удобочитаемости Флеша под каждый язык отдельно. Параметры перерасчитаны с учётом структуры слогов, слов и предложений, что позволяет точнее оценивать, насколько текст будет трудным для носителя. Дополнительно алгоритм анализирует лексическую плотность и разнообразие, а также показатели «динамичности» и описательности, опираясь на частотный словник из 5 тысяч наиболее употребляемых единиц.
По данным пресс-службы ВШЭ, созданный калькулятор сложности текста может стать практическим инструментом для педагогов, подбирающих учебные материалы по уровню, а также для лингвистов и нейропсихологов, которым важно использовать сопоставимые тексты в научных экспериментах. Разработка вписывается в реализацию Основ государственной языковой политики РФ, направленных на поддержку и развитие языков народов России. В дальнейшем команда планирует подключать к системе другие мало описанные языки, распространённые как в регионах страны, так и за её пределами, сообщает ТАСС.
Обратите внимание: Аномальная зима 2025–2026: Синоптики предупреждают о непредсказуемых сценариях по всей стране

