Représentant une autre étape importante dans la recherche sur l’échange de visages de Kakao Brain, l’article de la société « Smooth-Swap : A Simple Enhancement for Face-Swapping with Smoothness » sera présenté lors de la prochaine conférence mondiale sur la vision par ordinateur, CVPR 2022[2], pour la deuxième année consécutive. Cela comprendra une session de présentation orale exclusive réservée aux articles les plus remarquables parmi les articles acceptés (25,33% des 8 161 soumissions ont été acceptées cette année). Lors de l’événement de l’année dernière, seuls 4 % des articles acceptés ont eu le temps de faire une présentation orale dans laquelle Kakao Brain a été nominé pour son article de recherche exceptionnel, « HOTR : End-to-End Human-Object Interaction Detection with Transformers ». Cette année, non seulement ‘Smooth-Swap’ a réussi à réduire considérablement la complexité de son architecture, mais il possède également un grand potentiel de commercialisation, tous deux reconnus et récompensés par la première conférence sur la vision par ordinateur.

Un gradient d’identité précis et cohérent[3] est essentiel pour changer l’identité d’une personne sans sacrifier la haute qualité de l’image. Entraîné via une perte contrastive supervisée, ‘Smooth-Swap’ acquiert son gradient d’identité stable en apprenant l’incorporation avec une plus grande douceur. Ces améliorations corrigent la faiblesse du modèle précédent consistant à ajouter des composants fabriqués à la main et à modéliser le visage en 3D, ce qui a finalement compliqué sa conception et entraîné un réglage sophistiqué des hyperparamètres. Au lieu de cela, « Smooth-Swap » s’appuie sur une architecture simple basée sur U-Net avec un intégrateur d’identité intégré pour offrir des performances de pointe.

L’architecture simple et les performances améliorées de « Smooth-Swap » ont non seulement rendu la technologie compétitive en termes de potentiel de commercialisation et d’application plus large, mais elles lui permettent également de faire face à des scénarios d’échange de visage plus difficiles, tels que l’échange de visage pendant la lecture vidéo. « Smooth-Swap » suggère une approche d’intégration d’identité différenciée et permet au générateur de créer des images de meilleure qualité, en particulier lors de la modification de la forme du visage d’un sujet. Grâce au « Smooth-Swap » de Kakao Brain, qui permet un échange de visage rapide et stable, il est prévu de développer différents types d’humains numériques tels que des influenceurs virtuels, des animateurs d’émissions et des annonceurs.

« Nous sommes fiers et ravis de dévoiler au monde la technologie révolutionnaire d’échange de visages, ‘Smooth-Swap' », a déclaré Kim Il-doo, PDG de Kakao Brain. « Je crois fermement que cette technologie accélérera l’innovation dans le domaine de l’échange de visages, nous rapprochant encore davantage du métaverse incroyablement immersif dont nous avons toujours rêvé, ainsi que des services humains numériques du futur. »

À propos de Kakao Brain

Publicité

Kakao Brain est une société d’IA de premier plan au monde, dotée de technologies d’IA et de réseaux de recherche et développement inégalés. La société a été créée par Kakao en 2017 pour résoudre certaines des plus grandes « questions impensables » du monde avec des solutions rendues possibles par ses technologies d’intelligence artificielle transformant le mode de vie. Toujours à la pointe de l’innovation dans le monde de la technologie, Kakao Brain a développé de nombreux services et modèles d’IA révolutionnaires conçus pour améliorer la qualité de vie de milliers de personnes, notamment minDALL-E, KoGPT, CLIP/ALIGN et RQ-Transformer. En tant que pionnier mondial de l’IA, Kakao Brain a la responsabilité de favoriser une communauté technologique dynamique et un écosystème R&D robuste dans le cadre de sa mission de création de nouveaux marchés technologiques au potentiel infini. Pour plus d’informations, visitez https://KakaoBrain.com/.

[1] L’intégration d’identité est une représentation vectorielle d’une image de visage utilisée pour comparer les identités. Si les vecteurs de représentation (ou vecteurs d’intégration) de deux faces sont suffisamment proches, leurs identités sont considérées comme identiques.

[2] CVPR (Conférence sur la vision par ordinateur et la reconnaissance de formes)coparrainé par l’Institute of Electrical and Electronics Engineers (IEEE) et la Computer Vision Foundation (CVF) depuis 1983, est considéré comme l’une des conférences annuelles les plus reconnues dans le secteur de la vision par ordinateur, avec la Conférence européenne sur la vision par ordinateur (ECCV ) et Conférence internationale sur la vision par ordinateur (ICCV).

[3] Le gradient d’identité est un signal d’apprentissage indiquant au modèle d’échange de visage quelle partie doit être réglée pour changer l’identité de la personne avec précision.

SOURCE Cerveau Kakao

Rt

Rate this post
Publicité
Article précédentLa capacité de production de smartphones Huawei a été restaurée
Article suivantComment désactiver l’écran d’un ordinateur portable Windows en un clic à l’aide de ScreenOff

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici