Учёные выяснили, как нейросети справляются с каламбурами в заголовках

Технологии

Исследователи из нескольких стран при участии специалистов ФКН НИУ ВШЭ представили корпус KoWit‑24, который содержит 2700 российских новостных заголовков с языковой игрой. Цель проекта — проверить, насколько современные языковые модели способны распознавать каламбуры и корректно их интерпретировать. Об этом сообщили «Жуковский.Life» в пресс‑службе университета.

Созданный корпус сопровождается разметкой, включающей тип приёма, ключевые слова и указание контекстных отсылок. Каждый заголовок снабжён описанием ситуации, что позволяет моделям опираться не только на формальную игру со словами, но и на новостной фон.

При тестировании пяти крупных языковых моделей, включая GPT‑4o и GigaChat, выяснилось, что задача интерпретации каламбуров остаётся для ИИ сложной. Модели чаще успешно отмечали наличие игры слов, чем правильно объясняли её механизм и скрытый смысл.

Доцент факультета компьютерных наук НИУ ВШЭ Павел Браславский подчеркнул, что KoWit‑24 закрывает два основных недостатка прежних корпусов: отсутствие контекста и недостаточно детальную разметку. Благодаря этому подборка превращается в удобный «испытательный полигон» для оценки работы нейросетей на сложных примерах естественного языка.

Авторы напоминают, что каламбуры — распространённый инструмент российских медиа. Например, заголовок «Особо бумажные персоны» обыгрывает устойчивое выражение «особо важные персоны». Результаты работы представлены на конференции RANLP, а данные корпуса доступны в открытом формате для дальнейших исследований и улучшения языковых моделей.

Учёные выяснили, как нейросети справляются с каламбурами в заголовках

Читайте также:

Минздрав РФ планирует обновить стандарт лечения шизофрении

«Ген смерти» помогает клеткам мозга выживать при хроническом стрессе

Популярное

Губернатор Самарской области аннулировал удостоверение участника СВО вице-спикера

Жара вскрыла дефициты: почему силы закончились раньше отпуска

Купание ограничено на трёх пляжах Самарской области

Родной отец забрал сына Екатерины Тарховой в Израиль

В Самаре проведут дополнительную проверку в отношении Александра Милеева

Три воспитанника подписали контракты с «Крыльями Советов»

Людмила Тархова назвала новых подозреваемых в убийстве родителей

Волга у берегов Тольятти и Сызрани прогрелась до +21 градуса

Число автобусов на маршруте №396 в Самаре выросло до 30

В Самарской области к зиме обновят 80 километров тепловых сетей

Школа «Сота» и лицей «Спутник» — в топ-30 частных школ России

Девять ветеранов СВО получили глазные протезы в Самарской области

ВТБ узнал, что мотивирует россиян пользоваться кобрендинговыми картами

В Самаре 422 донора сдали 190 литров крови

Магнитная буря накроет Самарскую область с 20 по 28 июня

Павел Сещенко назначен директором по коммуникациям «Крыльев Советов»

Стратег ВТБ: мир в Персидском заливе обвалит нефть и ослабит рубль, но поднимет палладий