ИИ научился геопривязке гербариев с точностью до 10 километров

freepik.com
Биологи Университета Северной Каролины в Чапел‑Хилл показали, что большие языковые модели способны почти с человеческой точностью «читать» этикетки гербарных образцов и определять по ним место сбора растений. Исследование, опубликованное в Nature Plants, демонстрирует, что ИИ может взять на себя один из самых ресурсоёмких этапов оцифровки коллекций естественной истории — геопривязку.
Традиционно географическая информация восстанавливается вручную: специалист интерпретирует исторические описания маршрутов и локальных ориентиров, сверяется с архивными картами, а затем указывает примерные координаты. Существующие автоматизированные решения требуют настройки и часто уступают по точности экспертной оценке.
В новом проекте исследователи задействовали большие языковые модели, обученные работать с неструктурированными текстами. Алгоритм получал текст этикетки и возвращал координаты точки сбора. Сопоставление с эталонными данными показало, что средняя погрешность LLM остаётся в пределах 10 километров — уровня, приемлемого для большинства экологических и биогеографических задач, и нередко превосходит классические методы.
Ключевым преимуществом стала масштабируемость. По словам ведущего автора Юйяна Се, система обрабатывает тысячи записей «за малую долю времени и стоимости» по сравнению с ручной работой. Автор‑корреспондент исследования, доцент Сяо Фэн, отмечает, что это создаёт «беспрецедентные возможности» для изучения глобального распределения биоразнообразия, поскольку геопривязка перестаёт быть главным ограничивающим фактором.
Во всём мире в гербариях накоплены миллиарды засушенных растений — своеобразные «капсулы времени», фиксирующие состояние флоры десятилетия и столетия назад. Но пока большая часть этих фондов остаётся недоступной для анализа из‑за отсутствия цифровых описаний и координат.
Авторы подчёркивают, что их работа — одно из первых систематических применений LLM к геопривязке природоведческих коллекций. По их мнению, интеграция таких моделей в рабочие процессы музеев и гербариев позволит в ближайшие годы резко ускорить оцифровку и включить в глобальные базы данных миллионы записей, которые сейчас «лежат в шкафах» и почти не используются в исследованиях изменения климата и утраты биоразнообразия, сообщает rutab.net.
Обратите внимание: Тельцам этот день уготовил сюрпризы, а Скорпионов интуиция спасет из любой ситуации

