Même si nous sommes en 2023, la course à l’IA entre les entreprises continue d’avancer à un rythme effréné. Et même si ChatGPT a le dessus depuis longtemps, il semble que ce ne soit plus le cas. Google a lancé Gemini, son modèle d'IA le plus grand, le plus puissant et le plus performant à ce jour.
Comme détaillé dans un article de blog publié récemment, Google a détaillé que son IA Gemini a été conçue dès le départ pour être complètement multimodal. Le modèle a été pré-entraîné dès le départ pour différentes modalités.
Il a ensuite été optimisé et entraîné pour accepter toutes sortes de sorties afin de fournir toutes sortes de sorties. Cela se traduit effectivement par le modèle d'IA comprendre parfaitement le texte, les images, les vidéos, l'audio, le code et répondre.
Google a présenté la même chose en fournissant au modèle une simple vidéo de deux fils et en montrant des suggestions sur ce qu'il fallait faire. Le même cas est apparu lorsque Gemini a construit un code pour un motif matriciel qui lui a été montré. Le fait que le modèle puisse lire et traduire des vidéos en sorties est fou.
Gemini bat le GPT-4 d'OpenAI
En plus de présenter sa multimodalité, Google a également publié quelques chiffres de référence comparant Gemini au modèle GPT-4 d'OpenAI. Il s’agit notamment du test Massive Multitask Language Understanding (MMLU), l’un des tests de référence les plus populaires. Étonnamment, L'IA Gemini a battu GPT-4 dans divers domaines, notamment le raisonnement, les mathématiques et même le code.
Considérant que ChatGPT est présenté comme le principal modèle GPT en matière d'IA, le fait que Bard le batte est une affaire assez énorme qui provoquera sûrement des vagues de hausse.
Gemini AI : trois variantes différentes
Google va lancer Gemini AI dans trois modèles différents intitulé « Ultra », « Pro » et « Nano ». Le modèle Ultra le plus performant est le plus performant et conçu pour des tâches très complexes. Le Pro est le meilleur modèle pour la mise à l’échelle, tandis que le Nano est compact.
Google a déjà prévu une version Ultra l'année prochaine tandis que le Le modèle Gemini Pro alimentera Bard parmi d'autres services. Gemini Nano sera à l'intérieur du téléphone Pixel 8, aidant avec des suggestions de réponses et résumant les enregistrements audio.
L'IA Gemini de Google a été formée et sera disponible en anglais et sera disponible dans plus de 170 pays. La possibilité d'analyser les images et les sons sera déployée ultérieurement pour Google Bard.
Alors, que pensez-vous du Gemini de Google ? Pensez-vous qu'il peut battre GPT-4 ? Laissez vos réflexions dans les commentaires ci-dessous.