Отмечается, что новая модель Kandinsky 2.1 была дополнительно обучена на 170 млн пар «текст – изображение» высокого разрешения к уже имеющемуся набору в 1 млрд пар «текст – изображение». Нейросеть способна за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
Нейросеть разработали и обучили исследователи Sber AI при поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices.
В новой версии Kandinsky кардинально улучшена генерация изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.
В июне 2022 года Сбер выпустил первую версию своей нейросети Kandinsky. Тогда особенностью сервиса была работа на русском языке. Вторая версия появилась в ноябре того же года.
Источник:
https://tass.ru/ekonomika/17443047
|