Ученые РФ повысили эффективность обучения генеративных потоковых ИИ

freepik
Российские исследователи представили инновационный подход, который существенно повышает продуктивность обучения генеративных нейронных сетей потокового типа, предназначенных для решения задач, не имеющих четкой структуры. Эта разработка способна ускорить прогресс в создании искусственного интеллекта, способного находить принципиально новые лекарственные средства.
Предложенный метод позволяет значительно оперативнее изучать пространство возможных решений и выявлять больше многообещающих вариантов, чем традиционные и широко применяемые методики. В общем и целом, этот способ приближает генеративные модели к методам обучения с подкреплением.
Согласно заявлениям исследователей, генеративные потоковые сети представляют собой специфический вид алгоритмов машинного обучения, которые формируют сложные объекты поэтапно, шаг за шагом. Ученые применяют их для открытия новых белков и лекарственных препаратов, а также для оптимизации транспортных систем. Для решения подобных задач ИИ должен приобрести способность понимать характеристики объектов и управлять ими с целью достижения желаемого результата.
Зачастую, такие сети состоят из двух основных компонентов: прямой и обратной модели. Первая последовательно генерирует сложные объекты из заданного набора элементарных составляющих, а вторая анализирует их, определяя последовательность действий, которая привела к формированию этой структуры. Для корректной и стабильной работы такой формы ИИ критически важно поддерживать баланс между этими двумя компонентами, что особенно сложно реализовать для обратной модели.
Специалисты внесли изменения в стратегию поиска оптимального решения, придав ей сходство с переговорным процессом, где каждая сторона готова идти на уступки. В задачах, где присутствует высокий уровень неопределенности, обратная модель выступает лишь как дополнительный инструмент для увеличения производительности прямой модели.
По мнению ученых, данная методика позволит улучшить эффективность обучения генеративных потоковых сетей в различных сферах науки и экономики, включая фармацевтику, материаловедение и настройку больших языковых моделей. Использование этого подхода позволит быстро находить оптимальные решения и значительно уменьшит потребность в вычислительных ресурсах, подытожили авторы исследования.
Обратите внимание: К 6 сентября лето уже закончится: Тольяттинцам рассказали про прогноз погоды на начало осени
Пишет ТАСС