Как легко очистить чайник от накипи: 3 простых и дешевых способа
2 апреля, 23:40
Неделя в Бурятии местами начнется с +16
5 апреля, 22:00
Дикие друзья Пумбы попали на камеру в Бурятии
5 апреля, 18:06
Суд дал отсрочку жителю Улан-Удэ, чтобы убраться с участка
5 апреля, 17:48
Жителям Бурятии за 15 дней выплатят премию за водителей "под мухой"
5 апреля, 16:05
Женщину в Улан-Удэ признали членом семьи благодаря вкладу в ремонт квартиры
5 апреля, 15:01
Известный драматург дал мастер-класс ветеранам СВО в Улан-Удэ
5 апреля, 14:32
Дырой в работе операторов связи в Бурятии воспользовались IT-аферисты
5 апреля, 14:25
Бурятия определила приоритеты внедрения ИИ в экономике и государственном управлении
5 апреля, 13:55
Электрички в Бурятии ускорили на час
5 апреля, 12:11
Коммунальщики взяли с россиян по ЖКХ лишние 50 млрд рублей
5 апреля, 12:00
Ветераны СВО на колясках сыграли в баскетбол 3х3 в Улан-Удэ
5 апреля, 11:45
В Бурятии утилизировали шесть трупов скота из леса
5 апреля, 11:12
Врач предупредила об опасности красителей для пасхальных яиц
5 апреля, 11:00
Водитель в Улан-Удэ дошёл до суда из-за опасного люка
5 апреля, 10:17
Лучшего учителя-аниматора назвали в Бурятии
5 апреля, 09:03

Сбер представил новую версию нейросети Kandinsky 3.0

Модель теперь лучше понимает текстовые запросы и за несколько секунд создаёт реалистичные изображения
Сбер. Офис Сбера в Иркутске Наталия Раткевич, ИА IrkutskMedia
Сбер. Офис Сбера в Иркутске
Фото: Наталия Раткевич, ИА IrkutskMedia

создал новую версию генеративной модели для творчества — Kandinsky 3.0 (12+). Усовершенствованная нейросеть представлена на конференции Сбера по искусственному интеллекту и машинному обучению AI Journey, которая проходит с 22 по 24 ноября. Об этом пишет ИА IrkutskMedia со ссылкой на пресс-службу банка. 

Новая версия в сравнении с предыдущими лучше понимает текстовый запрос пользователя. Нейросеть теперь умеет создавать ещё более фотореалистичные изображения, генерировать полноценные художественные картины и арты со скетчами. Модель работает с запросами из широкого списка тем и способна реализовать любой полёт фантазии. 

Kandinsky 3.0 лучше предыдущих версий знает элементы отечественного культурного кода. Так, значительно улучшилось качество генерации российских и советских известных личностей и персонажей, архитектурных достопримечательностей, объектов культуры и элементов народного искусства России, например гжельской росписи. Кроме того, у новой модели усовершенствована функция редактирования изображений и возможность их дорисовки в режиме бесконечного полотна (inpainting и outpainting).

Kandinsky 3.0 создаёт изображения с высоким разрешением — 1024 х 1024 пикселей, — при этом может синтезировать картинки с выбранным соотношением сторон. Для обучения нейросети разработчики использовали обновлённый датасет в размере 1,5 млрд пар "текст — изображение", содержащий данные, которые прошли многоэтапные процедуры фильтрации, что в итоге привело к заметному повышению качества генераций. 

"Технологии искусственного интеллекта могут наделить человека супервозможностями. Kandinsky — один из инструментов, предоставляющих такие возможности. Это удобная, функциональная и бесплатная нейросеть Сбера для творчества. Мы постоянно работаем над её усовершенствованием. Новая версия модели ещё лучше понимает запросы от пользователей, научилась разбираться в тонкостях русской культуры и народного творчества. Пробуйте, творите, создавайте уникальные художественные произведения, которые могут стать подарком или украсят вашу коллекцию", — сказал первый заместитель председателя правления Сбербанка Александр Ведяхин. 

Пользователи нейросети Kandinsky 3.0 также могут создавать видеоролики по текстовому описанию в режиме анимации. По одному запросу генерируется видео длиной в четыре секунды c выбранным эффектом анимации, с частотой 24 кадра в секунду и разрешением 640 x 640 пикселей. Синтез одной секунды видео в среднем занимает около 20 секунд. Для расширения возможностей базовой модели были реализованы разные виды анимации изображений, что позволило перемещать объекты, приближать и отдалять их, оживлять статику всеми возможными способами. В основе режимов анимации лежит функция перерисовки изображения по текстовому описанию (image2image).

Kandinsky 3.0 понимает запросы более чем на 100 языках, а пользователи могут создавать изображения в неограниченном количестве стилей. Модель разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Оценить возможности нейросети можно на платформе fusionbrain.ai (18+), в Telegram— (18+) и в VK-ботах (12+), на сайте rudalle.ru (12+). Модель работает в сервисе GigaChat (12+), доступна в мобильных приложениях СберБанк Онлайн (6+) и Салют (12+), а также на умных устройствах Sber по голосовой команде "Запусти художника". Сгенерировать анимационные видеоролики можно в Telegram-боте (18+) — для этого нужно оставить заявку на доступ.

Услуги предоставляются ПАО "Сбербанк" (ОГРН 1027700132195. Юридический адрес: Москва, ул. Вавилова, 19).

190699
48
57
Игра "Вордли" — угадай слово!