Google a annoncé la disponibilité générale d’une nouvelle interface visuelle pour Google Cloud API de synthèse vocale dans la console Google Cloud. La nouvelle interface visuelle vise à réduire les complexités auxquelles les développeurs sont confrontés lorsqu’ils utilisent l’API Speech-to-Text.
L’API STT permet aux développeurs de convertir la parole en texte en tirant parti des années de recherche de Google dans le domaine de la reconnaissance automatique de la parole et de la technologie de transcription. le API aide les utilisateurs à ajouter des fonctionnalités vocales à leurs applications pour mieux répondre aux besoins des consommateurs.
L’API STT peut être utilisée de la dictée et des commandes courtes au sous-titrage et aux sous-titres. Cependant, pour obtenir la plus grande précision sur n’importe quel cas d’utilisation de l’IA, STT nécessite des tests et des ajustements minutieux. Auparavant, les développeurs s’appuyant sur l’API STT devaient effectuer ce travail manuellement, avaient besoin de se familiariser avec GCP concepts d’intégration et devaient soit créer leurs propres outils, soit gérer divers scripts et appels d’API pour bien comprendre la documentation de l’API. Ces actions ont rendu la mesure, la personnalisation et l’amélioration des modèles encore plus difficiles
La disponibilité de l’API STT dans le Google Cloud Console simplifie le processus, facilitant l’itération et l’intégration des modèles dans les applications des développeurs en permettant aux développeurs d’exécuter chaque fonction de l’API depuis la console. Avec ce nouvel ajout, les développeurs ont la possibilité de gérer et d’itérer rapidement les personnalisations du modèle STT avec Model Adaption.
L’API STT est disponible dans toutes les régions Google Cloud et est accessible à tous les utilisateurs GCP sans frais supplémentaires. le API STT prend en charge plus de 70 langues dans 120 variantes locales différentes.