UlanMedia, 29 декабря 2025. Центр "Бэлиг" начал собирать аудиозаписи на бурятском языке для создания дата-сета, необходимого для обучения модели распознавания речи. Это часть усилий по цифровизации бурятского языка и его интеграции в современные технологии, сообщает пресс-служба министерства образования и науки Республики Бурятия.
Проект стартовал после соглашений, заключенных центром в Москве с Домом народов России и компанией "Яндекс". Согласно договору, "Бэлиг" передаст "Яндексу" голосовые данные для разработки систем синтеза и распознавания бурятской речи.
Первое совещание участников прошло в онлайн-формате. Директор центра Баир Балданов подчеркнул важность инициативы:
— Мы начинаем работу над еще одним из важных проектов по сохранению и развитию бурятского языка в цифровом пространстве. Благодарю вас, уважаемые коллеги за то, что вы согласились участвовать в нем на безвозмездной основе.
Распознавание речи — технология искусственного интеллекта, которая преобразует устную речь в машиночитаемый текст. Она включает анализ звука, выделение фонем, слов и фраз с помощью нейросетей. В будущем такие системы позволят создавать голосовых помощников, ботов-консультантов, функции голосового поиска и управления устройствами на бурятском языке.