Amazon a publié une version mise à niveau de son modèle interne de génération d’images, Titan Image Generator, pour les clients AWS utilisant sa plateforme d’IA générative Bedrock.
Simplement appelé Titan Image Generator v2, le nouveau modèle apporte plusieurs nouvelles fonctionnalités, explique Channy Yun, défenseur principal des développeurs AWS dans un billet de blog. Les utilisateurs peuvent « guider » les images qu’ils génèrent à l’aide d’images de référence, modifier des visuels existants, supprimer des arrière-plans et générer des variations d’images, explique Yun.
« Titan Image Generator v2 peut détecter et segmenter intelligemment plusieurs objets de premier plan », écrit Yun. « Avec le Titan Image Generator v2, vous pouvez générer des images conditionnées aux couleurs basées sur une palette de couleurs. [And] Vous pouvez utiliser la fonction de conditionnement d’image pour façonner vos créations.
Titan Image Generator v2 prend en charge le conditionnement d’image, en prenant éventuellement une image de référence et en se concentrant sur des caractéristiques visuelles spécifiques de cette image, comme les bords, les contours des objets et les éléments structurels. Le modèle peut également être affiné à l’aide d’images de référence telles qu’un produit ou le logo d’une entreprise, afin que les images générées conservent une esthétique cohérente.
AWS reste vague sur les données qu’il utilise exactement pour entraîner ses modèles Titan Image Generator. La société avait précédemment déclaré à fr.techtribune.netqu’il s’agissait d’une combinaison de données propriétaires et sous licence.
Peu de fournisseurs révèlent facilement de telles informations ; Ils considèrent les données d’entraînement comme un avantage concurrentiel et les gardent donc secrètes, ainsi que les informations qui s’y rapportent. Les détails des données de formation sont également une source potentielle de poursuites liées à la propriété intellectuelle, ce qui dissuade de révéler grand-chose.
Au lieu de transparence, AWS propose une politique d’indemnisation qui couvre les clients dans le cas où un modèle Titan comme Titan Image Generator v2 régurgite (c’est-à-dire crache une copie miroir de) un exemple de formation potentiellement protégé par des droits d’auteur.
Lors de la récente conférence téléphonique sur les résultats du deuxième trimestre de la société, le PDG d’Amazon, Andy Jassy, a déclaré qu’il était toujours « très optimiste » sur la technologie d’IA générative comme les modèles Titan d’AWS, malgré les signes de remise en question de l’entreprise et les coûts croissants liés à la formation, à la mise au point et à la diffusion des modèles.
« Dans le domaine de l’IA générative, cela va devenir grand rapidement », a-t-il déclaré, « et tout sera en grande partie construit dès le départ dans le cloud. »