Google a annoncé la prise en charge de TensorFlow 2 (TF2) dans le Détection d’objets TensorFlow (OD) API. La version comprend des binaires compatibles en mode hâtif, deux nouvelles architectures réseau et des pondérations pré-entraînées pour tous les modèles pris en charge.
Écrivant sur le blog TensorFlow, l’ingénieur logiciel Vivek Rathod et le chercheur Jonathan Huang ont donné un aperçu de haut niveau des nouvelles fonctionnalités dans la version. Une grande partie du travail s’est concentrée sur la migration des modèles pré-entraînés existants pour être compatibles TF2 en portant le code du modèle à utiliser Keras couches et fournir les poids comme points de contrôle de type TF2. Le cadre OD inclut également la prise en charge de la formation distribuée synchrone ainsi que de nouveaux binaires en mode impatient pour la formation, l’évaluation et l’exportation. Alors que tous les nouveaux modèles et tout nouveau développement seront uniquement disponibles sur TF2, TF1 est toujours pris en charge. La plupart des modules de code sont compatibles avec les deux versions de TensorFlow, et ceux qui n’en ont pas deux. Selon Rathod et Huang,
Notre philosophie pour cette migration était d’exposer tous les avantages de TF2 et Keras, tout en continuant à prendre en charge notre large base d’utilisateurs toujours en utilisant TF1.
L’API de détection d’objets TensorFlow est «un framework open source construit sur TensorFlow qui facilite la construction, la formation et le déploiement de modèles de détection d’objets». Ce cadre comprend un ensemble d’utilitaires pour gérer l’entrée de données d’image et des interfaces pour les modèles de détection d’objets. En général, les modèles de détection d’objets attendent une image d’entrée et produisent un ensemble de cadres de délimitation qui représentent l’emplacement des objets détectés dans l’image. L’API OD fournit également un « zoo modèle« de modèles pré-formés, qui sont utiles comme point de départ pour développer des applications de détection d’objets personnalisées. Il s’agit notamment de plusieurs architectures populaires de vision par ordinateur d’apprentissage en profondeur, telles que MobileNet et ResNet, qui ont été formés sur le Objets communs en contexte (COCO) Ensemble de données 2017.
TensorFlow version 2 est sorti en Septembre 2019. Parmi les nombreux changements apportés au cadre populaire d’apprentissage en profondeur, citons l’adoption de Keras en tant qu’API officielle de haut niveau pour la définition de modèles; Keras a été conçu à l’origine comme une interface conviviale permettant de définir des réseaux de neurones, prenant en charge les backends, notamment TensorFlow et Theano, qui étaient plus orientés vers les graphiques de calcul. TF2 a également fait exécution avide le mode par défaut, qui facilite le développement et le débogage. La nouvelle version de l’API OD tire parti de ces fonctionnalités. Les modèles pré-entraînés ont été réimplémentés en utilisant des couches Keras et les poids ont été enregistrés au format de point de contrôle TF2. Le code de l’utilitaire dans le cadre OD a été compilé pour une exécution rapide, ce qui permet aux développeurs de déboguer de manière interactive leurs scripts pour affiner les modèles. La nouvelle API OD prend également en charge la formation distribuée synchrone, qui peut accélérer la formation de grands modèles, sans perte de précision que cela peut se produire dans un entraînement distribué asynchrone.
Outre le portage des modèles existants dans le zoo, la nouvelle version comprend deux nouvelles architectures de modèles: CenterNet et EfficientDet. CenterNet représente l’emplacement de l’objet comme un point unique au lieu d’une zone de délimitation, et a «le meilleur compromis vitesse-précision» sur le jeu de données COCO. EfficientDet est un nouveau modèle de détection d’objets à la pointe de la technologie qui est 4x à 9x plus petit et utilise 13x – 42x moins de FLOP que les modèles SOTA précédents.
Réagir à l’actualité de la version, un utilisateur de Reddit a commenté:
EfficientDet semble vraiment prometteur et semble vraiment dédié à rendre les modèles OD d’entraînement plus accessibles via TF2. Cependant, je pense que l’équipe TF pourrait certainement investir des ressources dans la création d’une API de détection d’obj plus simple. [with inspiration from] Torch Hub, Huggingface et même Tensorflow Hub.
le API de détection d’objets le code source et les modèles pré-entraînés sont disponibles sur GitHub.
.