Российский датасет Yambda позволил европейским ученым ускорить обучение ИИ

Данные "Яндекса" помогли ученым из Европы сокра...

freepik.com

Yambda от Яндекса ускорила обучение ИИ-рекомендаций у европейских исследователей

Пресс-служба Яндекса сообщила ТАСС, что крупнейший российский набор данных Yambda помог исследователям из Европы разработать метод, который в десятки раз ускоряет обучение ИИ-рекомендаций без снижения качества. Это подтверждает ценность открытых данных для глобальной науки.

Масштаб и структура датасета

Опубликованный летом 2025 года Yambda включает пять миллиардов элементов и основан на обезличенных данных Яндекс.Музыки. Он содержит агрегированные прослушивания, лайки, дизлайки и характеристики музыкальных треков, что делает его одним из крупнейших наборов данных для рекомендательных систем.

Использование SEATER и европейскими учеными

Исследователи из Амстердамского университета применили Yambda для обучения рекомендательных систем на базе алгоритма SEATER. Новый подход организует элементы в иерархический каталог, ускоряющий обработку и повышающий точность рекомендаций.

Эффективность ускоренного метода

Проверка альтернативных методов подготовки каталога показала, что один алгоритм сократил время с 82 минут до 83 секунд — почти в 60 раз. Качество рекомендаций при этом оставалось на высоком уровне. Весь код улучшенной модели SEATER открыт для исследовательского сообщества, что демонстрирует пользу масштабных открытых данных.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

Читайте также: