ИИ DeepMind сам разработал DiscoRL и превзошёл человеческие алгоритмы

freepik.com
В публикации в журнале Nature сообщается, что ИИ из Google DeepMind самостоятельно сформировал правила обучения DiscoRL и достиг показателей выше, чем у алгоритмов, спроектированных человеком.
В проекте использовали подход с мета‑оптимизацией: большая группа ИИ‑агентов решала разные задачи, а над ними работала «мета‑нейросеть» — родительская система. Она наблюдала за стратегиями, меняла параметры и правила так, чтобы следующее поколение обучалось быстрее и работало точнее. В результате возник набор правил DiscoRL.
Чтобы оценить эффективность, исследователи обучили нового агента на основе DiscoRL и сравнили результаты с ведущими человеческими решениями в обучении с подкреплением. По данным Nature, агент на DiscoRL показал лучшие результаты на сравнимых задачах.
Обратите внимание: Соседка скупает бахилы пачками: когда узнала зачем она это делает, стала закупать больше — 5 необычных применений
Сообщает info.sibnet.ru
