Deepbrain

Note de l’éditeur Ceci est un article invité de Joe Murphy du virtuel étant développeur IA DeepBrain

Text-To-Speech (TTS) est la technologie du jour pour la plupart des assistants vocaux. Cela ne fait aucune différence si quelqu’un interagit avec Alexa, Siri, Google ou d’autres ; les réponses sont généralement un son TTS diffusé sur un haut-parleur intelligent, un téléphone portable ou un haut-parleur de voiture. Le paradigme actuel de l’assistant vocal consistant à parler à une boîte noire et à recevoir une réponse vocale désincarnée fonctionne avec les modèles d’interaction d’aujourd’hui, mais cela ne se traduit pas bien dans le métaverse que nous voyons à l’horizon.

Publicité

Entrez dans une foule de nouvelles entreprises en démarrage toutes dans une course pour développer des « humains virtuels » ou des « jumeaux numériques ». Ils créent ce qui sera très probablement la prochaine génération d’interfaces conversationnelles basées sur des interactions numériques plus naturelles, authentiques et humanistes. Alors pourquoi Virtual Humans, et pourquoi maintenant ? Quelques moteurs technologiques et facteurs socio-économiques ont créé la tempête parfaite pour la synthèse vidéo en temps réel et les humains virtuels.

Pilotes technologiques

Par rapport aux réponses TTS conversationnelles, il ne fait aucun doute que les solutions de synthèse vidéo nécessitent des charges de travail plus élevées (CPU + GPU) pour générer de la vidéo et des charges utiles plus élevées (taille de fichier) pour diffuser de la vidéo. Cependant, les performances CPU et GPU toujours croissantes et la disponibilité accrue accélèrent le processus de synthèse vidéo dans le cloud et en périphérie. De plus, les progrès du traitement par lots et de la mise en cache intelligente ont permis une synthèse vidéo en temps réel qui rivalise avec les solutions TTS pour la vitesse de conversation. Ainsi, le goulot d’étranglement de la génération de vidéos ultra-réalistes à la volée a été principalement résolu. Cela conduit à diffuser la vidéo en temps réel, qui, grâce aux vitesses à large bande sur le Wi-Fi et la 5G, est désormais facilement accessible à la plupart des foyers, des entreprises et des écoles. Vous pouvez voir la comparaison dans la vidéo ci-dessous.
https://www.youtube.com/watch?v=ftOqULabRQM

Aide (et contenu) recherché

Les entreprises qui ont besoin d’employés pour interagir avec les clients, comme les hôtels, les banques ou les restaurants à service rapide, ont du mal à embaucher et à retenir de nouveaux employés. Un manque d’employés disponibles et qualifiés peut nuire à la perception de la marque par le client et créer une véritable ponction sur les revenus. Entrez les humains virtuels qui peuvent traiter les demandes de base rapidement et de manière cohérente. En Corée, 7-11 et KB Bank ont ​​installé des kiosques IA qui s’appuient sur un humain virtuel pour interagir avec les clients. La mise en œuvre 7-11 prend en charge une opération sans homme (ou sans femme).

Une autre verticale prometteuse pour les humains virtuels est celle des médias, à la fois les médias de diffusion et les médias sociaux (influenceurs). Qu’il s’agisse de diffuser des actualités 24h/24 ou de rester pertinent sur TikTok, le besoin est le même : générer plus de contenu vidéo et le rendre plus rapide. Une fois de plus, l’Asie a pris les devants avec Virtual Humans. Des stations de télévision telles que MBN et LG HelloVision complètent toutes deux leurs émissions en direct avec des versions Virtual Human de leurs ancres principales qui fournissent des mises à jour régulières de l’actualité tout au long de la journée. À l’aide d’appels API ou d’une interface Web intuitive « ce que vous tapez est ce que vous obtenez », les vidéos avec des humains virtuels peuvent être réalisées en quelques minutes sans avoir besoin d’une caméra, d’une équipe, de lumières, de maquillage, etc. outil d’enregistrement qui peut être mélangé tout au long de la journée pour garder le contenu frais.

« Quelle est notre stratégie pour le métaverse ? » Cette question est posée dans les salles de conférence de tous les secteurs. Il est facile d’imaginer comment les marques tirant parti des humains virtuels 2D d’aujourd’hui pour prendre des commandes, aider, partager des nouvelles évolueront rapidement pour devenir les premiers pionniers du monde 3D et du métaverse. Surveillez tout au long de l’année les grandes annonces dans cet espace.

La startup humaine virtuelle Deepbrain AI lève 44 millions de dollars




Rate this post
Publicité
Article précédentLa chanson « Shinigami Eyes » de Grimes a été inspirée par la série télévisée animée « Death Note »
Article suivantLa poussée cryptographique des EAU voit Bybit, Crypto.com annonce des bureaux à Dubaï

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici