Accueil Google Les vidéos d’IA de Google pointent vers un avenir généré par la...

Les vidéos d’IA de Google pointent vers un avenir généré par la machine

Les capacités créatives de l’IA dépassent ses compétences de conduite. Alors que la technologie des voitures autonomes ne va nulle part, il y a eu une explosion remarquable de la recherche autour des modèles génératifs, ou des systèmes d’intelligence artificielle qui peuvent créer des images à partir de texte simple. Au cours de la dernière semaine, les chercheurs en IA de Meta Platforms Inc. et de Google d’Alphabet Inc. ont fait un bond en avant extraordinaire, en développant des systèmes capables de générer des vidéos avec à peu près n’importe quelle invite de texte que l’on peut imaginer.

Les vidéos de Meta, parent de Facebook, ressemblent à des séquences de rêve trippantes, montrant un ours en peluche peignant des fleurs ou un cheval aux jambes distendues galopant au-dessus d’un champ. Ils durent environ une ou deux secondes et ont une qualité glitchy qui trahit leur source, mais ils sont toujours remarquables. Les vidéos générées par Google, de café versé dans une tasse ou d’un vol au-dessus d’une montagne enneigée, semblent particulièrement réalistes.

Google a également construit un deuxième système encore plus impressionnant appelé Phenaki qui peut créer des vidéos plus longues, d’une durée de deux minutes ou plus. Voici un exemple de l’invite utilisée par Google pour l’un d’entre eux :

« Beaucoup de trafic dans une ville futuriste. Un vaisseau spatial extraterrestre arrive dans la ville futuriste. La caméra pénètre à l’intérieur du vaisseau spatial extraterrestre. La caméra avance jusqu’à ce qu’elle montre un astronaute dans la pièce bleue. L’astronaute tape dans le clavier. La caméra s’éloigne de l’astronaute. L’astronaute quitte le clavier et marche vers la gauche… »

C’est moins d’un tiers de l’ensemble de l’invite, qui se lit presque comme un script de film avec des commandes telles que « la caméra zoome ». Et voici le clip qui en résulte, posté sur Twitter par Dumitru Erhan, l’un des créateurs de Phenaki chez Google Brain:

Publicité

Vous pensez peut-être que c’est la fin d’Hollywood tel que nous le connaissons ou que n’importe qui avec quelques cellules cérébrales et un ordinateur sera bientôt en mesure de produire des longs métrages. C’est en fait dans le sens de ce que les chercheurs espèrent. Erhan a tweeté que lui et son équipe voulaient donner aux gens les moyens de « créer leurs propres histoires visuelles … [to] faciliter la créativité des gens.

Il est difficile de voir des vidéos générées par l’IA arriver dans votre cinéma local de sitôt. Mais nous les verrons presque certainement être publiés dans nos flux de médias sociaux, en particulier sur des plateformes comme TikTok de ByteDance Ltd., Reels d’Instagram ou YouTube.

TikTok n’a pas répondu à une question sur la construction de son propre outil de génération de vidéos IA, mais il serait logique que la plate-forme le fasse. Les utilisateurs de TikTok adorent ajouter des autocollants, du texte et des écrans verts à leurs messages, et la plate-forme répond à la demande avec de nouvelles technologies. En août, il a ajouté un générateur d’images IA à son application pour créer des écrans verts stylisés. Tapez une invite comme « Boris Johnson » et TikTok fera apparaître une image abstraite rappelant vaguement l’ancien Premier ministre britannique.

Que se passe-t-il lorsque les machines non seulement recommandent les vidéos qui nous permettent de faire défiler, mais ont également une plus grande main dans leur création? Beaucoup d’entre nous aiment regarder des images de chats mignons et de gens qui trébuchent sur eux-mêmes, donc un algorithme qui pourrait produire de faux montages de trébuchements gênants ou de chatons fringants attirerait des succès viraux avec peu de travail, tant qu’ils semblent réels.

Les créateurs de contenu sur TikTok, et les plateformes elles-mêmes, ont tout intérêt à exploiter un outil capable de générer des vidéos à grande échelle, surtout lorsqu’il est bon marché et facile.  Pour le reste d’entre nous, le résultat serait des flux de médias sociaux plus axés sur la machine que jamais. Déjà alimentées par l’IA et les algorithmes de recommandation, les vidéos d’IA ajouteraient aux boucles de rétroaction auto-renforcées qui grattent nos démangeaisons cognitives.

L’autre conséquence imminente est un flot de désinformation, mais il y aura peut-être moins besoin de s’alarmer à ce sujet à court terme. Les plateformes de médias sociaux ont intensifié leurs efforts pour éliminer le faux contenu, et Google et Facebook refusent de divulguer leurs outils de création vidéo au public en raison du potentiel d’utilisation abusive (et probablement de mauvaises relations publiques). Google a déclaré que son propre système générait des vidéos biaisées contre les femmes, même lorsqu’elles essayaient de filtrer les résultats stéréotypés. Le modèle ou son code source ne sera pas publié tant que le problème n’aura pas été résolu, ont déclaré les chercheurs de Google.

Bien sûr, vous pourrez bientôt utiliser ces outils avec peu de restrictions de toute façon, grâce à des organisations comme Stability AI. La start-up britannique a publié un outil de génération d’images en août dernier qui permettait à quiconque de générer de l’art cool, ainsi que de fausses photos de célébrités, de politiciens et de zones de guerre, ce que les grandes entreprises d’IA ont interdit. J’ai essayé l’outil et, en quelques secondes, j’ai pu préparer des photos de l’ancien président Donald Trump jouant au golf avec North K.le dirigeant oréen Kim Jong Un. Stability travaille sur un outil de génération vidéo qu’elle prévoit de publier publiquement lorsqu’il sera prêt.

Mais si un meilleur accès à ces outils conduira à plus de faux contenus, cela signifiera également que plus de gens sont conscients que les outils existent. Ils sont plus susceptibles de soupçonner que la « photo » du président Joe Biden frappant une vieille dame est générée par l’IA. C’est l’espoir, en tout cas.

Tout aussi inquiétant est ce que ces outils feront à l’alimentation quotidienne des gens de contenu. Les chercheurs de Google affirment que leurs outils augmenteront la créativité humaine. Mais quand il devient si facile de faire de la vidéo que vous avez à peine à y penser, est-ce vraiment exploiter notre imagination? Peut-être pas dans tous les cas.

Couplé aux moteurs de recommandation qui dirigent une grande partie de ce que nous avons vu en ligne, orientés vers la génération de clics, cela rend notre avenir beaucoup plus orienté vers la machine – et, sans doute, pas très créatif.

Cette chronique ne reflète pas nécessairement l’opinion du comité de rédaction ou de Bloomberg LP et de ses propriétaires.

Parmy Olson est un chroniqueur de Bloomberg Opinion couvrant la technologie. Ancienne journaliste pour le Wall Street Journal et Forbes, elle est l’auteure de « We Are Anonymous ».

D’autres histoires comme celle-ci sont disponibles sur bloomberg.com/opinion

Rate this post
Publicité
Article précédentSamsung Galaxy Buds2 Pro vérifie toutes les cases de la liste de contrôle de Harrdy Sandhu
Article suivantHeure de sortie, date et streaming confirmés pour le nouvel anime
Avatar
Violette Laurent est une blogueuse tech nantaise diplômée en communication de masse et douée pour l'écriture. Elle est la rédactrice en chef de fr.techtribune.net. Les sujets de prédilection de Violette sont la technologie et la cryptographie. Elle est également une grande fan d'Anime et de Manga.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici