Российский датасет Yambda позволил европейским ученым ускорить обучение ИИ

freepik.com
Yambda от Яндекса ускорила обучение ИИ-рекомендаций у европейских исследователей
Пресс-служба Яндекса сообщила ТАСС, что крупнейший российский набор данных Yambda помог исследователям из Европы разработать метод, который в десятки раз ускоряет обучение ИИ-рекомендаций без снижения качества. Это подтверждает ценность открытых данных для глобальной науки.
Масштаб и структура датасета
Опубликованный летом 2025 года Yambda включает пять миллиардов элементов и основан на обезличенных данных Яндекс.Музыки. Он содержит агрегированные прослушивания, лайки, дизлайки и характеристики музыкальных треков, что делает его одним из крупнейших наборов данных для рекомендательных систем.
Использование SEATER и европейскими учеными
Исследователи из Амстердамского университета применили Yambda для обучения рекомендательных систем на базе алгоритма SEATER. Новый подход организует элементы в иерархический каталог, ускоряющий обработку и повышающий точность рекомендаций.
Эффективность ускоренного метода
Проверка альтернативных методов подготовки каталога показала, что один алгоритм сократил время с 82 минут до 83 секунд — почти в 60 раз. Качество рекомендаций при этом оставалось на высоком уровне. Весь код улучшенной модели SEATER открыт для исследовательского сообщества, что демонстрирует пользу масштабных открытых данных.
Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.
Читайте также:
- Очереди у полок гарантированы: 16 новинок из «Чижика», которые выгоднее маркетплейсов
- Большинство водителей теряются: что сказать инспектору ГИБДД, чтобы не нарваться на штраф
- Нет домового чата — минус 300 тысяч? Управляющие компании поставили перед фактом
- С 1 марта деньги придут не всем: кто из россиян получит повышенную пенсию
- Вы всё ещё тратите деньги зря! Роскачество назвала порошок, который выводит любые пятна


