Команда учёных и разработчиков запустила нейросеть для экомониторинга Байкала на облачной платформе Yandex Cloud (6+). Проект необходим для прогнозирования состояния озера, влияния климатических изменений на его экосистему, а также оценки рыбозапаса, пишет ИА IrkutskMedia со ссылкой на сайт компании.
Алгоритм машинного обучения (ML) анализирует пробы воды из озера, определяет и классифицирует содержащиеся в ней микроорганизмы. Уже сейчас нейросеть умеет работать с 70 формами планктона, которые чаще всего встречаются в пробах. Внедрение искусственного интеллекта упростит работу биологов, которые много лет подсчитывали и определяли микроорганизмы вручную.
Нейросеть в проекте помогает биологам автоматизировать весь цикл мониторинга и, впоследствии, быстрее получать данные для новых исследований. Вместе с учёными НИИ нейросеть разрабатывали компания MaritimeAI, команда платформы Yandex Cloud и Фонд поддержки прикладных экологических разработок и исследований "Озеро Байкал".
Биологи предоставили почти 50 тысяч изображений проб, из которых 20 тысяч было использовано для обучения алгоритмов. Теперь изображения проб с микроскопов автоматически передаются в облачную платформу Yandex Cloud. Алгоритм определяет мельчайших рачков, их видовую принадлежность и формирует отчётные карточки. Нейросеть продолжает обучаться в сервисе для разработки и эксплуатации ML-алгоритмов Yandex DataSphere. Разметка данных происходила с помощью краудсорсингового сервиса "Толока" (18+).
"Научное сообщество и образовательные организации делают всё больше открытий в облаке. Одна из приоритетных задач нашей платформы — создать надёжный трамплин для лёгкого использования облачных сервисов в исследовательских проектах. В Yandex Cloud запускали систему мониторинга урожая, создавали алгоритм для беспилотного гоночного болида, исследовали тёмную материю. Нейросеть для экологического мониторинга Байкала — особый проект и для нас, и для всего сообщества, невероятный по своему масштабу и значимости", — сказал генеральный директор компании Алексей Башкеев.
В будущем участники проекта планируют масштабировать мониторинг и отслеживать состояние воды в других точках Байкала. Также разработчики последовательно будут выкладывать в opensource технологии, которые используются в проекте. Так, в свободном доступе уже есть датасет изображений проб с разметкой. Его можно использовать для тестирования гипотез по детекции, сегментации и классификации планктонных организмов. Позже будут выложены более полный набор данных и исходный код. Это поможет разрабатывать собственные системы мониторинга водоёмов другим научным группам и институтам по всему миру.