Le suivi de l’iris a été largement adopté dans les applications du monde réel telles que la photographie informatique et la réalité augmentée. Cependant, en raison du calcul limité, des conditions de lumière changeantes et des occlusions telles que le plissement des yeux ou les mèches de cheveux, l’obtention d’un suivi précis de l’iris sur les appareils mobiles reste un défi.
Une équipe de chercheurs de Google AI a proposé une solution à ce problème avec MediaPipe Iris, un nouveau modèle d’apprentissage automatique conçu pour fournir une estimation précise de l’iris sans utiliser de capteurs de profondeur. Les expériences montrent que l’approche peut mesurer la distance entre l’objectif de la caméra et l’utilisateur avec un taux d’erreur relatif comparable aux méthodes qui utilisent des capteurs de profondeur.
S’appuyant sur le travail précédent de Google AI avec Maillage facial MediaPipe, le modèle proposé peut suivre en temps réel des points de repère impliquant l’iris, la pupille et les contours des yeux à l’aide d’une seule caméra RVB sans matériel spécialisé requis. L’approche est basée sur la taille de l’iris, car le diamètre horizontal de l’iris des yeux humains est généralement constant à 11,7 ± 0,5 mm sur une large population.
MedaiPipe Iris a été formé sur les régions oculaires coupées. Les chercheurs ont annoté manuellement environ 50 000 images comprenant diverses conditions d’éclairage et des poses de tête et des sujets ethniquement divers. Le modèle résultant peut fonctionner sur la plupart des téléphones mobiles, ordinateurs de bureau, ordinateurs portables et même sur le Web.
Pour tester la précision du modèle, les chercheurs l’ont comparé au capteur de profondeur d’un iPhone 11, collectant des images vidéo et de profondeur synchronisées orientées vers l’avant de plus de 200 participants. À l’aide d’un appareil de télémétrie laser, l’équipe a calculé que le taux d’erreur du capteur de profondeur de l’iPhone 11 était inférieur à 2,0% pour des distances allant jusqu’à deux mètres. L’approche proposée pour l’estimation de la profondeur avait une erreur relative moyenne respectable de 4,3% et un écart-type de 2,4%.
Les chercheurs soulignent que «toute forme de surveillance ou d’identification est explicitement hors de portée et non permise par cette technologie» et que le modèle s’aligne sur Principes d’IA de Google.
Ils prévoient d’étendre le modèle MediaPipe Iris en améliorant les performances de suivi stables pour réduire les taux d’erreur, et espèrent que la communauté ML dans son ensemble pourra appliquer ses fonctionnalités dans des cas d’utilisation créatifs, de nouvelles applications responsables et de nouvelles voies de recherche.
La page du projet MediaPipe Iris est sur GitHub.
Analyste: Yuqing Li | Éditeur: Michael Sarazen; Yuan Yuan
Rapport synchronisé | Une enquête sur les solutions d’intelligence artificielle en Chine en réponse à la pandémie COVID-19 – 87 études de cas de plus de 700 fournisseurs d’IA
Ce rapport offre un aperçu de la manière dont la Chine a exploité les technologies d’intelligence artificielle dans la bataille contre le COVID-19. Il est également disponible sur Kindle d’Amazon. Parallèlement à ce rapport, nous avons également introduit un base de données couvrant 1428 solutions d’intelligence artificielle supplémentaires à partir de 12 scénarios de pandémie.
Cliquez sur ici pour trouver plus de rapports de notre part.
Nous savons que vous ne voulez manquer aucune histoire. Abonnez-vous à notre populaire IA mondiale synchronisée chaque semaine pour obtenir des mises à jour hebdomadaires de l’IA.