Дорогу до Байкала в Бурятии хотят расширить: ее длина более 400 км
13:38
Страховку по долгосрочным вкладам повысят до 2 миллионов рублей
12:20
Министр транспорта России оценил состояние Третьего моста в Улан-Удэ
11:38
Длинные выходные и сокращенный рабочий день ждут россиян
10:20
В Бурятии ловят рыжую плутовку: детей просят не выпускать на улицу
09:39
С оплатой ЖКХ за май россияне могут не торопиться
08:20
В Улан-Удэ заложили первый камень нового путепровода
13 июня, 21:40
Забывчивого арендатора леса оштрафовали в Улан-Удэ
13 июня, 17:37
Депутат выиграл весенний чемпионат Улан-Удэ по футболу 
13 июня, 16:43
Суд в Улан-Удэ отказал в выплате премии бывшему директору подразделения
13 июня, 15:27
Boдитeль квaдpoциклa пoгиб на трассе в Бypятии
13 июня, 14:30
В Улан-Удэ новый подрядчик достроит Третий мост под надзором прокуратуры
13 июня, 13:36
Память героев Победы почтили в Улан-Удэ в День города
13 июня, 12:21
День города в Улан-Удэ: куда пойти 13 июня кроме концерта Валерии
13 июня, 11:02
Пасмурная погода обещала не испортить день города в Улан-Удэ
13 июня, 10:18

Ученые проверили ГигаЧат на знания в области математики и компьютерных наук

18 марта, 17:50
Общество
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук pxhere.com
Ученые проверили ГигаЧат на знания в области математики и компьютерных наук
Фото: pxhere.com
Нашли опечатку?
Ctrl+Enter

Нейросеть Сбера ГигаЧат (12+) сдала экзамен по направлению "Математика и компьютерные науки". В ходе аттестационного испытания, проведенного на базе Сколтеха, работа модели была оценена аттестационной комиссией на оценку "4" ("хорошо").

Аттестация проходила в два этапа. Сначала модель прошла тестирование на 500 вопросах закрытого типа в формате MMLU, которые были разработаны преподавателями Сколтеха. Они охватывали девять тем в области компьютерных наук: алгоритмы и структуры данных, базы данных, кибербезопасность, программное обеспечение, программирование, сети и оборудование, специализированное ПО, управление и искусственный интеллект. Средний показатель правильных ответов модели на вопросы составил 76,9%.

Второй этап — очный экзамен с участием аттестационной комиссии, состоящей из восьми докторов технических и физико-математических наук. Эксперты комиссии выбрали три билета из 45, по которым проводили оценку знаний нейросети. Каждый билет содержал два задания — теоретическое и практическое. Все задачи были разработаны специально для этого испытания и отсутствовали в открытых базах, что исключало возможность поиска готовых ответов и требовало от нейросети применения реальных знаний. Для объективной оценки глубины компетенций эксперты не только проверяли ответы, но и задавали уточняющие вопросы, просили объяснить ход рассуждений и анализировали работу модели с нестандартными формулировками. 

Оценка проводилась по профильному принципу: например, при оценке ответов модели на задания по программированию решающий голос принадлежал соответствующему эксперту. Применение весовых коэффициентов позволило обеспечить максимальную объективность аттестации. По итогам очного экзамена модель набрала 7 из 10 баллов по шкале Сколтеха.

233940
48
5