Большинство россиян не знают о правилах подарков для учителей
1 октября, 21:35
Как увеличить пенсию с помощью переезда, рассказали в Соцфонде
1 октября, 20:20
В приложениях крупных банков РФ с 1 октября появится тревожная кнопка
1 октября, 19:20
Юрист раскрыл правду о штрафах за чихание в общественных местах
1 октября, 18:50
Что почти всем россиянам нужно обязательно сделать до 1 декабря
1 октября, 18:40
В новой сельской школе в Бурятии будет 7 блоков
1 октября, 18:28
Жители Бурятии обратились к Бастрыкину из-за плохих дорог в сельском районе
1 октября, 17:56
Сбер выложил две собственные ИИ-модели в открытый доступ
1 октября, 17:35
В Бурятии строят новый корпус центра соцобслуживания за 700 миллионов рублей
1 октября, 17:29
В Улан-Удэ книголюбы погрузились в мир банковских продуктов и финансовой грамотности
1 октября, 17:26
Каждый второй российский технопредприниматель вдохновляется успехами внутри страны
1 октября, 17:25
Первый урок в 9 утра: начало школьных занятий хотят перенести на час позже
1 октября, 17:20
В октябре россиянам придется отработать шесть дней в неделю
1 октября, 17:00
Чиновник в Бурятии ушёл на СВО после срыва строительства школы
1 октября, 16:41
Нестандартная стройка: как Т2 за три года покрыла сетью 139 небольших сел Дальнего Востока
1 октября, 16:30

Сбер выложил две собственные ИИ-модели в открытый доступ

Это весомый вклад в развитие российского и международного open-source сообщества
1 октября, 17:35 Общество
Сбер выложил две собственные ИИ-модели в открытый доступ Илья Аверьянов, ИА PrimaMedia.ru
Сбер выложил две собственные ИИ-модели в открытый доступ
Фото: Илья Аверьянов, ИА PrimaMedia.ru
Нашли опечатку?
Ctrl+Enter

Бизнес и разработчики получили открытый доступ к обновлённой модели для создания векторных представлений текста — Giga-Embeddings (18+), а также модели для генерации видео Kandinsky Video Lite (18+). Обе модели распространяются по открытой лицензии, допускающей свободное использование в коммерческих проектах любого масштаба. Об этом рассказал старший вице-президент, руководитель блока "Технологическое развитие" в рамках мероприятия "День ИИ" в Сколково, пишет ИА IrkutskMedia со ссылкой на пресс-службу банка.

"Научная команда Сбера активно публикует различные модели генеративного искусственного интеллекта. Так, в открытый доступ выложены все модели линейки Kandinsky, семейство акустических моделей для русского языка GigaAM, которые находятся "под капотом" нашего сервиса GigaChat (18+). 

Предоставление бизнесу и разработчикам новых мощных инструментов, как Kandinsky Video Lite и Giga-Embeddings, способствует ускорению темпов исследований, развитию инновационных продуктов и сервисов мирового уровня. Это демонстрирует наше стремление внести ощутимый вклад в развитие международного open-source сообщества. Кроме того, это важный этап становления стандартов в сфере обработки естественного языка (NLP), а также укрепление позиций России как технологического лидера на мировой арене", — отметил старший вице-президент, руководитель блока "Технологическое развитие" Сбербанка Андрей Белевцев.

Kandinsky Video Lite позволяет создавать короткие видео длительностью до 10 секунд на основе текстового запроса (промпта). Это компактная модель, содержащая всего два миллиарда параметров. При этом по внутренним тестам Kandinsky Video Lite превосходит по общему качеству (которое включает в себя оценки качества следования промпту, визуала и динамики) гораздо более громоздкие модели, такие как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз. Особое внимание при обучении Kandinsky Video Lite было уделено пониманию отечественного культурного кода: для этого был сформирован специальный датасет из более, чем миллиона изображений и видео — при этом существенная его часть отбиралась в несколько этапов большой командой профессиональных художников и дизайнеров. За счёт этого наша модель хорошо понимает характерные для нашей страны и её истории объекты. Мы также выкладываем ускоренную версию Kandinsky Video Lite Flash, которая работает примерно в 6 раз быстрее базовой модели.

Модели найдут широкое применение среди исследователей, разработчиков и представителей творческих профессий. Теперь создание качественных видеороликов станет доступным каждому, вне зависимости от уровня технических ресурсов или бюджета проекта.

Разработчикам и бизнесу также стала доступна в open-source обновлённая модель, преобразующая текстовую информацию в эффективные векторные представления — Giga-Embeddings. Эта модель абсолютный лидер на русском языке, она уверенно занимает первое место в общем зачёте авторитетного бенчмарка ruMTEB с результатом 74.1, значительно опережая другие открытые модели, а также показывает высочайшее качество работы и на английском языке, сохраняя конкурентоспособность на мировом уровне.

Giga-Embeddings обеспечивает построение высокоэффективных RAG-систем (Retrieval-Augmented Generation), гарантирующих надёжность и точность ответов искусственного интеллекта. Таким образом, корпоративный сектор получает мощный инструмент для повышения качества поиска по документам, аналитики данных и автоматизированной поддержки пользователей на основе актуальной информации. Разработчики с помощью модели смогут быстро создать умных помощников и чат-ботов, способствующих эффективной обработке корпоративных данных без риска появления недостоверных ответов.

Модели уже доступны для свободного использования на Hugging Face (18+), GitVerse (18+). Kandinsky Video Lite можно также найти на GitHub (18+).

Реклама. Рекламодатель — ПАО "Сбербанк". (ОГРН 1027700132195. Юридический адрес: Москва, ул. Вавилова, 19).

234715
48
5