Ученые: Алгоритм ИИ раскрывает мотивацию нашего мозга через VTA

freepik
Теперь известно, что вентральная тегментальная область (VTA) играет центральную роль в нашей системе обработки вознаграждений. Она генерирует дофамин, нейротрансмиттер, который способствует прогнозированию будущих вознаграждений на основе контекстных признаков.
Новое исследование выявило, что VTA выполняет более многогранную функцию: она кодирует не просто ожидаемый приз, а и точный момент его наступления. Данное открытие, сделанное с помощью алгоритма машинного обучения, подчеркивает значимость интеграции областей искусственного интеллекта и нейробиологии.
Эксперименты на животных показали, что когда вознаграждение последовательно следует за световым сигналом, VTA в конечном итоге начинает выделять дофамин при появлении сигнала, а не в момент получения вознаграждения. Таким образом, эта реакция отражает предсказание вознаграждения, ассоциированное с сигналом, а не само вознаграждение.
Этот тип "обучения с подкреплением", требующий минимального вмешательства, имеет основополагающее значение для обучения человека. Он также лежит в основе многих алгоритмов искусственного интеллекта, которые повышают эффективность за счет самообучения.
В недавнем исследовании ученые обнаружили, что кодирование VTA еще более детализировано, чем предполагалось ранее. Выяснилось, что каждое вознаграждение представлено индивидуально, с указанием точного времени его ожидания. Нейроны VTA отдают предпочтение вознаграждениям, которые наступают в ближайшем будущем, следуя принципу немедленного удовлетворения.
Установлено, что различные нейроны выполняют эту функцию в разных временных диапазонах: некоторые сосредотачиваются на вознаграждениях, ожидаемых через несколько секунд, другие – на тех, что ожидаются через минуту, а третьи – на более отдаленных перспективах.
Эти результаты являются плодом успешного взаимодействия между нейронаукой и искусственным интеллектом.
Пишет PlanetToday