Команда Сбербанка анонсировала обновление для модели генерации изображений по тексту под названием Kandinsky Image.
Как сообщили в пресс-службе, теперь модель способна создавать надписи на кириллице.
В Сбере отметили, что текст не просто накладывается на изображение, а органично интегрируется: он может быть изображён на стене, вырезан из дерева, отлит из металла, вышит, связан или выложен лепестками роз.
Для этого разработчики обучили нейросеть на специальной базе данных, включающей более 10 миллионов изображений с русским текстом, написанным в различных стилях, чтобы модель могла различать печатные, рукописные и другие шрифты.
В будущем разработчики планируют улучшить стабильность при создании длинных надписей и надписей, содержащих смесь кириллицы и латиницы, а также на основе детализированных описаний.
Опробовать возможности Kandinsky Image можно в Telegram-боте Kandinsky и во всех ботах GigaChat (в Telegram, «ВКонтакте», «Одноклассниках», Max), а также в веб-версии.