Из-за куртки на экзамене по ПДД мужчину ждет суд
15:50
Полицейские в Бурятии помогли восстановить документы семье, где погибли родители
15:14
Жительница потеряла 9 тысяч рублей на фальшивом туре на Байкал
14:47
В России увеличатся штрафы за перевозку детей без автокресел - названа дата
14:25
За вынос живой елки к обычному мусорному контейнеру грозит штраф до 3000 рублей
13:30
Как длинные выходные в январе повлияют на зарплату
12:45
Как вернуть деньги за подарочный сертификат - совет юриста
11:45
Присяга при получении гражданства РФ теперь обязательна с 14 лет
10:45
В Бурятии ожидается снег и усиление ветра
08:00
Улан-Удэ — самый загрязненный город России
8 января, 21:04
Мужчина с бутылкой в руках напал на трамвай в Улан-Удэ
8 января, 20:34
Два одиночных ДТП подряд произошли на новом мосту в Улан-Удэ
8 января, 15:47
Трижды доктор наук из Бурятии: Зачем нам нужна азиатская оптика понимания истории
8 января, 13:50
Из-за нападения на девушку прикормленных собак в Бурятии завели дело
8 января, 13:49
Ограничили движение на подтопленной трассе на севере Бурятии
8 января, 13:03

В Бурятии запустили проект с "Яндексом" по распознаванию бурятской речи

Создание аудио дата-сета позволит обучить ИИ понимать бурятский язык
Тематическая иллюстрация Кирилл Роткин, ИА Irkutskmedia
Тематическая иллюстрация
Фото: Кирилл Роткин, ИА Irkutskmedia

UlanMedia, 29 декабря 2025. Центр "Бэлиг" начал собирать аудиозаписи на бурятском языке для создания дата-сета, необходимого для обучения модели распознавания речи. Это часть усилий по цифровизации бурятского языка и его интеграции в современные технологии, сообщает пресс-служба министерства образования и науки Республики Бурятия. 

Проект стартовал после соглашений, заключенных центром в Москве с Домом народов России и компанией "Яндекс". Согласно договору, "Бэлиг" передаст "Яндексу" голосовые данные для разработки систем синтеза и распознавания бурятской речи.

Первое совещание участников прошло в онлайн-формате. Директор центра Баир Балданов подчеркнул важность инициативы:

— Мы начинаем работу над еще одним из важных проектов по сохранению и развитию бурятского языка в цифровом пространстве. Благодарю вас, уважаемые коллеги за то, что вы согласились участвовать в нем на безвозмездной основе.

Распознавание речи — технология искусственного интеллекта, которая преобразует устную речь в машиночитаемый текст. Она включает анализ звука, выделение фонем, слов и фраз с помощью нейросетей. В будущем такие системы позволят создавать голосовых помощников, ботов-консультантов, функции голосового поиска и управления устройствами на бурятском языке.

233828
48
5