Nous avons abordé plusieurs façons dont les grands modèles de langage, et plus généralement, une nouvelle vague de logiciels et de matériels d'intelligence artificielle, pourraient changer. la façon dont nous jouons à des jeux, travailler avec nos propres donnéeset trouver des informations en ligne. Personne n'est vraiment sûr à quoi sert l'IA générative – et accepter des performances assez médiocres pendant que les développeurs tentent de les comprendre – mais il est au moins clair que s'appuyer sur des interactions naturelles avec les assistants numériques pourrait changer de nombreuses façons dont nous utilisons nos ordinateurs au quotidien. Principalement en supprimant le besoin d’interfaces compliquées.

Jusqu'à présent, gadgets d'IA actuels sont utilisés pour imaginez un avenir sans applicationsou du moins un où ils sont beaucoup moins importants. Ai de Humane Badge les rejette entièrement, préférant travailler directement avec les services pour créer des « expériences » diffusées à la demande. Pendant ce temps, le Le R1 du lapin utilise ce qu'il appelle un « grand modèle d'action » pour naviguer dans les interfaces Web et d'applications à votre place, vous donnant même la possibilité de former le R1 à de nouvelles compétences que Rabbit n'aurait jamais imaginées.

La Lumière 01, un nouveau périphérique open source d'Open Interpreter pourrait aller encore plus loin. Avec un peu de configuration, le 01 Light en forme de galet peut exécuter et contrôler votre ordinateur existant entièrement localement. Si parler à quelque chose en langage naturel était ce qui rendait les gens accros au potentiel de l'IA générative, la capacité de former un modèle d'IA pour gérer tous les clics, tapotements et glissements répétitifs des appareils que vous possédez déjà pourrait réaliser la véritable science-fiction. vision d’un assistant IA, non pas dans des décennies, mais cette année.

La Lumière 01

Une femme tenant un disque blanc compatible IA devant la caméra.

Oui, le 01 Light est un autre gadget IA, mais il pourrait aussi être le plus puissant à ce jour.

Interprète ouvert

Publicité

Basé sur une courte vidéo de démonstration Open Interpreter partagée sur Xle 01 Light n’est en réalité qu’un composant d’un projet plus vaste visant à devenir le « Linux » du matériel artificiellement intelligent.

« En combinant des modèles linguistiques d'interprétation de code (« interprètes ») avec la reconnaissance vocale et la synthèse vocale, le système d'exploitation phare du 01 (« 01OS ») peut alimenter des dispositifs d'IA conversationnels fonctionnant sur ordinateur similaires au Rabbit R1 ou au Humane Pin », Open Interpreter revendique dans ses documents open source. L'objectif est d'obtenir les fonctionnalités de ces appareils, mais avec un système d'exploitation open source et une plate-forme matérielle « modulaire et gratuite pour un usage personnel ou commercial ».

Le 01 Light, qu'Open Interpreter vend actuellement au prix de 99 $, fonctionne localement sur votre ordinateur portable ou de bureau, mais pourrait éventuellement être entièrement hébergé sur les serveurs d'Open Interpreter. Appuyez sur un bouton et demandez la météo. Le modèle local ouvre Chrome, se dirige vers le site Web de Weather Channel et lit les prévisions. Demandez-lui de vérifier votre calendrier et d'ajouter un événement, puis il ouvrira l'application Calendrier d'Apple et la créera. L'effet est qu'il y a un utilisateur fantomatique à votre écoute, un utilisateur qui comprend déjà les interfaces des applications de votre ordinateur et qui peut apprendre à acquérir de nouvelles compétences simplement avec des instructions vocales.

… il y a un utilisateur fantomatique à votre écoute et à votre appel…

La capacité « d’apprendre » de nouvelles informations est un élément clé des produits d’IA actuels que vous pouvez utiliser aujourd’hui. Fonctionnalité « GPT » d'OpenAI est un moyen convivial de créer des chatbots personnalisés basés sur les compétences existantes de GPT-4 et quels que soient les paramètres et les nouvelles informations que vous introduisez. Vidéo de présentation du lapin a démontré la capacité du R1 à apprendre à utiliser Discord comme argument de vente. Le modèle donne l'essentiel de la façon dont le logiciel est présenté ; vous lui apprenez simplement les détails afin qu'il puisse effectuer la tâche à plusieurs reprises. C'est moins glamour que nos systèmes d'exploitation pour smartphones et ordinateurs de bureau existants qui soient réinventés d'une manière ou d'une autre pour anticiper nos besoins et travailler pour nous, mais l'essentiel est que ce que font Rabbit et Open Interpreter est possible maintenant, sans qu'un géant comme Google, Apple ou Microsoft n'ait faire n'importe quoi.

Ordinateur, Améliorer

YouTube video

La science-fiction, qu’elle soit littéraire, cinématographique ou télévisée, regorge d’exemples de personnes parlant à des ordinateurs. Le capitaine Kirk parle au Entreprise'l'ordinateur, David Bowman s'occupant de Hal 9000 dans les deux 2001 : Une odyssée de l'espace film et roman, Theodore Twombly tombant amoureux de Samantha en Son. Il existe d'innombrables exemples, souvent avec la complexité supplémentaire d'une relation émotionnelle superposée à celle, plus utilitaire, d'un ordinateur qui fait des choses lorsque vous lui parlez. Certaines personnes, pour être dangereusement générales, sont très attachées à l'idée d'un serviteur informatique qui fait des choses à votre place… jusqu'à ce que ce ne soit plus le cas. Et si vous ressentez la même chose, il est facile de voir en quoi cela pourrait être intéressant et même utile.

Nous avons vécu pendant des années sous l’influence de cet intérêt pour les assistants IA, comme en témoigne le enceinte intelligente que vous avez peut-être déjà dans votre salon, ou le smartphone que vous avez dans votre poche. Mais l’idée de ces assistants utilisant vos appareils à votre place n’a pas encore été explorée de manière aussi approfondie. Bixby de Samsung était censé naviguer sur votre téléphone Galaxy pour vous, en activant et en désactivant les paramètres que vous pourriez avoir du mal à trouver par vous-même. Bixby n'a pas mis le feu au monde, mais c'était une idée assez bonne pour que Siri et Google Assistant l'adoptent peu de temps après. Cortana était censé faire la même chose pour Windows et la suite Office, et Microsoft commence tout juste à explorer à nouveau sérieusement l'idée avec le Expérience Copilot sur Windows 11.

La promesse du Rabbit R1 et surtout du 01 Light, compte tenu de sa bonne foi open source (vous pouvez télécharger les fichiers CAO et les schémas pour en créer un dès maintenant), est que tout ce qui se passe sur le Web est un jeu équitable pour un assistant IA. . Vous n'avez pas besoin d'attendre le soutien officiel ; le modèle peut déjà « voir » et « comprendre » ce qui est là.

Ne cliquez, n'appuyez ou ne glissez plus jamais

Il existe de nombreuses choses pour lesquelles un bouton physique ou une simple interface logicielle restera plus pratique que de parler dans ce qui équivaut à un talkie-walkie avec un modèle d'IA. En acceptant cela, cependant, si le concept et la mise en œuvre d'Open Interpreter sont adoptés, il y a une réelle chance que nos relations avec nos ordinateurs existants puissent vraiment changer ou, à tout le moins, que la façon dont les applications et les interfaces sont conçues soit radicalement déformée.

Existe-t-il un moyen pour qu'une interface soit plus conviviale pour ces modèles ? Avons-nous même besoin d'apprendre à utiliser un logiciel professionnel comme Adobe Photoshop pour ajouter une ombre portée si nous pouvons avoir un assistant IA dans un appareil comme le 01 Light pour naviguer dans les menus déroulants et les calques pour vous ? (Ou Adobe peut vendre un assistant d'IA qui le fait ? Cela semble être un moyen simple d'augmenter les frais d'abonnement !) C'est le genre d'effets d'entraînement qu'un modèle d'IA qui comprend et peut exécuter des logiciels pourrait avoir.

Les applications ont été le principal moyen par lequel nous avons compris comment faire avancer les choses sur nos smartphones, tablettes et ordinateurs portables. À mesure que les besoins ont évolué, les applications sont devenues plus complexes et plus fonctionnelles, mais pas nécessairement plus faciles à utiliser. Les applications resteront et les développeurs et les concepteurs continueront d'essayer de les rendre accessibles, mais en attendant, si l'IA peut rendre l'utilisation d'une application plus simple et moins longue, c'est une option que je souhaite avoir.

->Google Actualités

4.4/5 - (13 votes)
Publicité
Article précédentElden Ring : Guide de précommande de l'Ombre d'Erdtree
Article suivantDragon's Dogma 2 – Guide des vocations et des quêtes Magick-Archer

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici