С новой версией генеративной модели Сбера — Kandinsky 2.2 (12+) — теперь можно создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации. Значительного прироста качества удалось достигнуть при создании портретов. Для дообучения нейросети использовался датасет в размере 1,5 млрд пар "текст — изображение". Это на 300 млн больше, чем в предыдущей версии — Kandinsky 2.1. Об этом сообщает ИА IrkutskMedia со ссылкой на пресс-службу Байкальского банка Сбербанка.
Новая версия модели научилась генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации. Это стало возможным благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet (12+).
Kandinsky 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).
"Мы продолжаем совершенствовать нашу нейросеть для создания уникального контента. Новая версия даёт пользователям еще больше возможностей, при этом она генерирует изображения в ещё лучшем качестве. Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации. Как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, так что протестировать её можно совершенно бесплатно", — уточнил первый заместитель председателя правления Сбербанка Александр Ведяхин.
Оценить возможности нейросети можно на промостранице модели, на платформе FusionBrain.AI (12+), в Telegram-боте (18+) и боте "ВКонтакте" (12+), а также при помощи команды "Запусти художника" на умных устройствах Sber, в мобильном приложении "Салют" (0+). Модель доступна на платформе ML Space (12+) в хабе предобученных моделей и датасетов DataHub (12+).
Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из института искусственного интеллекта AIRI на объединенном датасете Sber AI (6+) и компании SberDevices. Напомним, что предыдущая модель — Kandinsky 2.1 — стала самой быстрорастущей нейросетью в мире, набрав 1 млн пользователей всего за четыре дня после выхода.