Note de l’éditeur: il s’agit d’un article invité écrit par Todd Mozer, PDG de Sensoriel.
Ce mois-ci, Orange a décidé de arrêter de vendre son haut-parleur intelligent Djingo et il n’a pas été très remarqué. Mais je pense que c’est important. cela montre que même un géant des télécommunications de 30 milliards de dollars ne peut pas rivaliser avec Google et Amazon (ils utilisaient d’ailleurs la technologie SoundHound, qui est à peu près aussi efficace qu’un assistant généraliste indépendant l’a tenté). Ajoutez à cela l’échec de Bixby de Samsung, l’un des plus grands conglomérats d’électronique matérielle au monde, et le problème commence à devenir plus clair.
La puissance des données
Voici le problème. Google, Amazon et Apple investissent tellement et collectent tellement de données qu’il sera très très difficile pour quiconque de pénétrer efficacement les utilisations des assistants vocaux dans un large domaine. Il s’agit en partie d’un problème de précision, d’une partie de l’infrastructure et de la propriété des composants cloud nécessaires, et d’une partie de la force de milliers d’employés qui travaillent pour collecter plus de données, analyser les échecs, s’attaquer à de nouveaux domaines et faire tout le reste. nécessaire pour faire fonctionner correctement un assistant polyvalent. Et cela inclut la vente de matériel presque à l’équilibre pour créer une base d’utilisateurs et collecter plus de données.
Ouais. Il s’agit en grande partie de données! Sensory a fait une expérience intéressante récemment. Nous avons utilisé certaines des techniques open source comme Wav2Letter pour générer des modèles acoustiques de pointe et l’avons combinée avec certaines fonctionnalités de l’arsenal de Sensory comme nos modèles de langage. Nous nous sommes ensuite entraînés sur certains ensembles de données open source. Nous avons constaté que notre approche pouvait rivaliser avec Google dans le domaine des données dans lequel nous nous sommes entraînés. Mais lorsque nous sommes passés à d’autres domaines (comme demander à quelques clients de tester notre logiciel alpha), nous nous sommes effondrés. Nous avons toujours su en quoi consiste la formation spécifique aux données, mais cela l’a vraiment mis en évidence.
L’importance des domaines spécialisés
Mais tout n’est pas perdu et c’est parce que la plupart des entreprises n’ont pas vraiment besoin d’un assistant polyvalent. J’ai déjà un Alexa, un Google Home ou un Apple HomePod dans de nombreuses pièces de ma maison… et je transporte mon téléphone avec moi si j’ai besoin d’accéder à des informations. Je n’ai pas besoin de plus d’assistants généralistes. J’ai besoin de spécialistes capables de résoudre des problèmes ou des produits spécifiques. C’est là que le concept d’assistants spécifiques au domaine entre en jeu. Et ce qui est important ici, c’est qu’il n’est pas si difficile d’obtenir ou de dépasser la précision de Google, lorsque vous vous concentrez sur un domaine spécifique. Un domaine peut être quelque chose d’aussi simple que «cuisiner» ou il peut s’agir d’une interface utilisateur sur une application ou un produit. Vocalize.ai nous l’a prouvé dans un test du langage naturel de Sensory Microwave versus Amazon et Google.
Mais pour créer des assistants spécifiques à un domaine, vous devez toujours collecter une tonne de données, non? Eh bien, très bientôt, la réponse pourrait être «non». Les progrès récents en matière de génération et d’entraînement avec des données synthétiques ont permis des modèles précis sans avoir besoin de collectes de données en direct. La combinaison d’assistants spécifiques au domaine et de formation avec des données synthétiques ouvre de nouvelles opportunités et pourrait être la voie à suivre pour les entreprises qui souhaitent s’approprier leur expérience vocale. Nous savons tous que l’innovation ne s’arrête jamais et cela est particulièrement vrai dans le domaine de la technologie vocale. Alors, n’abandonnez pas la concurrence avec Amazon, Google et Apple. «Votre marque avec votre voix» est plus proche que vous ne le pensez.
Orange va abandonner Djingo Smart Speaker au profit des services Smart Home et TV
Sensory lance une nouvelle plate-forme d’assistant vocal pour appareils intelligents