Больше не нужно переучивать: учёные научились переписывать мысли ИИ в реальном времени

freepik.com
Исследователи из T-Bank AI Research в России создали способ понимания и контроля за внутренними механизмами крупных языковых моделей, не требующий их перенастройки. Этот новый метод опирается на разреженные автоэнкодеры и идею графа потока признаков – своеобразной схемы, отражающей формирование смысловых элементов в недрах модели.
Данное изобретение позволяет включать или отключать определённые признаки на различных этапах создания текста, тем самым регулируя его стиль, тематику или эмоциональную окраску. Это предоставляет возможность точечного и быстрого вмешательства в работу модели, даже если заранее неясно, где может возникнуть проблема.
Эксперименты показали, что одновременное воздействие на несколько уровней и модулей обеспечивает более высокую точность при минимальном снижении качества. Этот подход может найти применение как в научных исследованиях, так и в практических задачах, к примеру, для отсеивания нежелательного контента в чат-ботах без внесения изменений в структуру модели.
Сообщает ТАСС