Chercheurs Klaus Greff, IA Google chercheur François BellettiGoogle Scholar Lucas Beyer et plusieurs autres ont publié un article sur un générateur d’ensemble de données évolutif, Kubric. Il s’agit d’un framework Python open source qui utilise à la fois PyBullet et Blender pour créer des images de haute qualité. PyBullet est utilisé pour entraîner le modèle à simuler physiquement l’interaction avec d’autres objets, tandis que Blender est utilisé pour le rendu des images. L’outil a été conçu pour réduire les coûts et les ressources associés à la génération de données réelles.
La recherche papier a démontré l’efficacité de Kubric en utilisant une série de 13 ensembles de données distincts qui ont été générés pour les tâches impliquées dans vidéo multi-objets non supervisée détection. Les ensembles de données concernaient plusieurs tâches allant des modèles NeRF 3D à l’estimation du flux optique. Kubric a publié des scènes photoréalistes qui sont fortement annotées et peuvent être facilement escaladé pour des tâches plus importantes exécutées par des milliers de machines. L’outil est capable de générer d’énormes volumes de ces données synthétiques.
Même avec le besoin urgent de données moins chères, bien annotées et impartiales, il y a un manque d’outils logiciels qui génèrent des données efficaces et utilisables. Données synthétiques est devenu plus préférable dans un passé récent en raison de ses nombreux avantages – des coûts moins élevés, des annotations riches, donnant aux chercheurs un contrôle total sur leurs données et évitant les risques associés aux licences et à la confidentialité.