Selon la déclaration de l'entreprise, YandexART 1.3 est équipé d'une technologie améliorée pour produire des images par diffusion latente. De plus, l’ensemble de données d’images utilisé pour entraîner le modèle a également été agrandi de 2,5 fois. Ces améliorations permettent à YandexART de mieux comprendre les commandes de texte et de créer des images plus réalistes dans différents formats.
La nouvelle version de YandexART peut être utilisée dans l'application «Shedevrum» partout dans le monde, y compris en Turquie.
La technique de diffusion latente nécessite moins de ressources informatiques et facilite la création de graphiques de meilleure qualité. Le processus commence par le développement d’une représentation d’image intermédiaire connue sous le nom de code secret. Il contient une description compacte avec des informations de base sur l'image sous forme compressée.
Le réseau neuronal convertit ensuite ce code en une image haute résolution en une seule étape. Cette technique s'est avérée plus efficace que le raffinement en plusieurs étapes de la diffusion progressive.
DESCRIPTIONS D'IMAGES DÉTAILLÉES AJOUTÉES
La société a également ajouté des descriptions d'images détaillées générées par le réseau neuronal, appelées textes synthétiques, à l'ensemble de données de formation pour aider le modèle à mieux comprendre les invites des utilisateurs. L'ensemble de données en question a été étendu pour inclure plus de 850 millions de paires image-texte.
De plus, deux encodeurs de texte ont été inclus dans le modèle pour permettre à YandexART de prendre en compte plus de détails dans les invites des utilisateurs. Ces encodeurs permettent à YandexART d'interpréter correctement les commandes de texte et de les convertir en données lisibles par machine.
YandexART mis à jour permet aux utilisateurs de créer des images dans une variété de formats, notamment 16:9, 4:3 ou 3:4, rendant ces images utilisables sur les couvertures de magazines, à la télévision et bien plus encore.
Les benchmarks internes révèlent que YandexART 1.3 surpasse Midjourney V5.2 dans 57 % des essais et YandexART 1.2 dans 63 % des essais.