Hier soir, un utilisateur de Reddit nommé frigis9 publié six images qui comportait des mises à niveau graphiques détaillées vers des jeux informatiques MS-DOS classiques tels que Commandant Keen 6 et Le secret de Monkey Island. La partie la plus intéressante est la façon dont ils l’ont fait: en utilisant une technique de synthèse d’image appelée « img2img » (image à image), qui prend une image d’entrée, applique une invite de texte écrit et génère une image de sortie similaire en conséquence. C’est une caractéristique de l’ Stable Diffusion modèle de synthèse d’images publié la semaine dernière.
En réponse à une question d’un autre utilisateur de Reddit, frigis9 a fourni plus de détails sur la façon dont il a créé l’image à l’aide d’un programme frontal appelé Visions du Chaos—une application polyvalente qui donne accès à de nombreux styles différents d’art informatique génératif : « Pour de beaux portraits simples comme ceux-ci, j’ai réglé la force de l’image init sur 0,25. Pour les images plus sombres et moins détaillées, il faudra peut-être le faire monter jusqu’à 0,35 ou 0,4. Vous n’aurez qu’à manipuler la valeur de force de l’image, et une fois que vous l’avez (c’est-à-dire en vérifiant si votre image de sortie ressemble plus ou moins à votre image d’initialisation), travaillez sur l’invite pour ajouter ou supprimer des détails. Ajustez, rincez et répétez une centaine de fois jusqu’à ce que vous obteniez l’image parfaite (ou meh, assez bonne).
Au cours de la semaine dernière, les utilisateurs de la fonction img2img de Stable Diffusion ont dessins d’enfants améliorés, transformé les gribouillis en chevaliers étincelants dans le désert, Amélioré leurs photos de profil, et plus encore. Pour le moment, l’exécution d’img2img sur votre propre machine est encore un processus quelque peu technique, mais en utilisant des frontaux graphiques comme Visions du Chaos et modèles sur Hugging Face, vous pouvez l’expérimenter vous-même. Le développement progresse rapidement, de sorte que de meilleures façons de les utiliser sont probablement juste au coin de la rue.
La qualité de l’art dans la synthèse d’images nécessite actuellement beaucoup d’essais et d’erreurs avec des invites et une sélection sélective pour obtenir le type de résultats que frigis9 a affichés, probablement des heures de travail. Mais avec quelques progrès progressifs dans les techniques de synthèse d’images et la puissance gpu, nous pourrions imaginer un émulateur mettant à niveau les graphismes de jeux vintage en temps réel d’ici quelques années.