Bien que le métaverse soit virtuel, les principes de base de la communication et du langage seront les mêmes que dans le monde physique. Si le métaverse est censé se comporter comme le cyberespace mondial, les barrières linguistiques doivent être supprimées. Meta de Zuckerberg a clairement relevé ce problème et a annoncé un traducteur de parole universel alimenté par l’IA. Meta a affirmé que le traducteur de parole en parole n’aura aucun retard en raison du temps de transcription. Les conversations seront plus naturelles puisque le processus de traduction devient transparent et ne sera pas perceptible par l’autre personne.

Fondation du métaverse

Le traducteur vocal universel sera construit sur la base d’un concept « Aucune langue laissée de côté », qui est un système de traduction qui aura la capacité d’apprendre chaque langue. Cela inclura également les langues qui sont largement parlées et pour lesquelles les textes ne sont pas disponibles. En 2019, Facebook prenait déjà en charge 41 langues.

Regardez la vidéo ici

Il n’y a pas que Meta qui croit en l’amélioration des fonctions de l’IA conversationnelle. L’année dernière, à Conférence Interspeech de NVIDIA en septembre, PDG Jensen Huang ont démontré les capacités de leur IA conversationnelle. Au milieu du discours d’ouverture de Huang, un Huang virtuel s’est glissé dans le discours sans que personne ne puisse faire la différence entre les deux, même si l’un avait une voix et une image générées par ordinateur.

La société a également publié une autre série appelée « Je suis IA », où la voix du locuteur est générée par ordinateur. NVIDIA a également proposé Camée Vid2Vid, qui combine l’IA conversationnelle et le traitement graphique avancé en temps réel. Dans les cas où l’on n’est pas à son meilleur et doit se présenter de toute urgence lors d’un appel vidéo, Cameo a la capacité de mapper une image téléchargée de l’utilisateur avec ses expressions faciales en temps réel.

Publicité

Nouvelles applications vocales

Lors de la conférence NVIDIA GTC de cette année, le PDG Huang a présenté le Kit de développement Riva 2.0, et l’offre gérée Riva Enterprise de la société. Ces deux éléments peuvent être utilisés sur le marché pour créer des applications d’IA liées à la voix, signalant l’intérêt de NVIDIA pour la reconnaissance vocale. La société a déclaré que Riva 2.0 a été intégré dans TAO, un produit low code pour le déploiement et la personnalisation d’applications vocales. NVIDIA a révélé que Snap, la société mère de Snapchat, utilise la technologie de reconnaissance vocale automatique et de synthèse vocale de Riva dans sa plate-forme pour les développeurs. Une autre entreprise de solutions de communication AnneauCentral utilise également les services de Riva pour les sous-titres en direct lors de vidéoconférences.

YouTube video

Selon la société de recherche Markets and Markets, la reconnaissance vocale et vocale marché devrait passer de 8,3 milliards USD en 2021 à 22 milliards USD en 2026, grâce aux applications d’entreprise. Une enquête menée par Pingoutte en 2018 a constaté que 28 % des 500 décideurs informatiques et commerciaux utilisaient la technologie vocale pour aider les clients.

La technologie vocale comprend désormais également des outils de clonage de la voix qui utilisent l’IA pour copier la hauteur et l’intonation du discours d’une personne. Voix personnalisée Riva de NVIDIA, un outil de clonage de la parole, a déclaré qu’il pouvait étudier 30 minutes de discours préenregistrés pour créer des voix personnalisées de type humain. Le marché mondial du clonage de voix a le potentiel de passer de 456 millions USD à 1,73 milliard USD en 2023, selon Markets and Markets.

YouTube video

« La santé, l’automobile, la vente au détail, le commerce électronique, la banque et les ressources humaines visant à améliorer le service client grâce à des interactions plus personnalisées sont quelques-uns des cas d’utilisation où nous avons connu des taux de croissance explosifs. Les algorithmes avancés qui prennent en charge le traitement de conversations complexes en couches via le traitement du langage naturel et la génération de langage naturel qui permettent des interactions quasi humaines ont été les technologies motrices du succès de l’IA conversationnelle. De plus, la reconnaissance automatique de la parole et la gestion avancée des dialogues, avec l’apprentissage automatique comme colonne vertébrale, ont fait des progrès révolutionnaires dans la fourniture d’un résultat optimisé », Amitt SharmaPDG et fondateur de VDO.AI déclaré.

La semaine dernière, plateforme basée sur l’IA conversationnelle Kore.ai’PDG Raj Koneru a expliqué qu’il pensait que la plupart des applications à l’avenir deviendraient conversationnelles. Koneru a également réitéré que l’IA conversationnelle deviendrait le fondement du métaverse et de l’omnivers.

Et avec des géants de la technologie comme Microsoft, Meta, Amazon, TikTok et Apple investissant dans la création de leurs propres métaverses et des hommes d’affaires comme Bill Gates prédisant que les réunions virtuelles passeront aux métaverses dans les deux à trois prochaines années, les opportunités commerciales pour l’IA conversationnelle augmentent de façon exponentielle. .

Rate this post
Publicité
Article précédentComment créer une page d’erreur 404 personnalisée dans NGINX
Article suivantSony PlayStation Plus et PlayStation Now fusionnés en un seul service

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici