Google IA développé un modèle de langage d’apprentissage profond appelé Minerve ce qui pourrait résoudre problèmes quantitatifs mathématiques en utilisant un raisonnement étape par étape.

Dans l’ article récemment publié Lié à Minerva, les chercheurs ont expliqué le développement de ce modèle d’apprentissage profond. Ils ont obtenu une solution de pointe en formant un modèle d’apprentissage profond sur un grand ensemble de données de formation qui contient un raisonnement quantitatif avec des expressions symboliques. Le modèle final, Minerva, pourrait résoudre des problèmes mathématiques quantitatifs sur des tâches de raisonnement STEM.

Minerva analyse la question à l’aide de traitement du langage naturel et les techniques de traitement de la notation mathématique. Il rappelle les formules pertinentes, les constantes et les solutions étape par étape impliquant le calcul numérique. Il génère des solutions qui incluent la manipulation symbolique et le calcul numérique sans s’appuyer sur une calculatrice pour obtenir les réponses finales. En générant différentes réponses au problème avec différentes probabilités attribuées, Minerva a utilisé le vote majoritaire pour sélectionner la réponse finale. L’image suivante montre un échantillon de la sortie de Minerva pour un problème mathématique quantitatif.

1Image5 1657746774620

Exemple de réponse de Minerva à un problème mathématique

Publicité

Minerva a été construit sur le Modèle de langage Pathways (PaLM, paramètre de 540 milliards, densément activé, modèle de langage de transformateur) avec plus d’ensembles de données mathématiques comme arXiv, texte contenant Latex et MathJax, ou d’autres formats mathématiques. Pour entraîner le modèle sur des données symboliques, les notations mathématiques symboliques sont conservées dans le jeu de données d’entraînement. Ce processus est illustré dans le diagramme suivant.

2Image1 1657746774620

Les expressions mathématiques symboliques sont préservées pour la formation minerva

Pour comparer les performances de Minerva, des repères STEM allant du niveau de l’école primaire au niveau des études supérieures ont été utilisés. Les chercheurs ont utilisé des ensembles de données comme MATHÉMATIQUES (Problèmes de niveau de compétition de mathématiques au secondaire), MMLU-STEM (indice de référence massif de compréhension du langage multitâche axé sur les STEM, couvrant des sujets tels que l’ingénierie, la chimie, les mathématiques et la physique au niveau secondaire et collégial), et GSM8k (problèmes de mathématiques à l’école primaire impliquant des opérations arithmétiques de base résolvables par un élève talentueux du collège). Il montre des performances significatives sur MATH et MMLU-STEM comme il est montré dans les graphiques suivants:

1Graphs 1657746774620

La performance de Minerva

L’une des limites importantes de Minerva est que les réponses du modèle ne pouvaient pas être évaluées automatiquement. Comme il est dit dans l’article de blog :

Notre approche du raisonnement quantitatif n’est pas fondée sur les mathématiques formelles. Minerva analyse les questions et génère des réponses en utilisant un mélange de langage naturel et Latex expressions mathématiques, sans structure mathématique sous-jacente explicite. Cette approche présente une limite importante, en ce sens que les réponses du modèle ne peuvent pas être vérifiées automatiquement. Même lorsque la réponse finale est connue et peut être vérifiée, le modèle peut arriver à une réponse finale correcte en utilisant des étapes de raisonnement incorrectes, qui ne peuvent pas être détectées automatiquement. Cette limitation n’est pas présente dans les méthodes formelles de démonstration des théorèmes (p. ex., voir Coq, Isabelle, HOL, Maigre, Metamathet Mizar).

Pour évangéliser NLP modèles de raisonnement quantitatif, Google AI a partagé un explorateur d’exemples interactif pour que le public puisse explorer les capacités de Minerva.

L’utilisation du traitement du langage naturel et de l’apprentissage profond dans le raisonnement mathématique est un domaine de recherche difficile. Il existe d’autres articles avec les codes sources dans ce domaine comme l’apprentissage du graphique à l’arborescence, Modèle neuronal structuré en arborescence axé sur les objectifs pour les problèmes de mots mathématiques. Papier avec code a également d’autres articles avec le code source dans ce domaine pour une lecture plus approfondie.

Rate this post
Publicité
Article précédentLe film complet The Warriorr en HD a fui sur les sites de torrent et les chaînes de télégrammes pour téléchargement gratuit et visionnage en ligne; Le film de Ram Pothineni est-il la dernière victime du piratage ?
Article suivantLes réalisateurs de Stranger Things, Duffer Brothers, Netflix adaptant Death Note rend les fans d’anime largement inquiets, légèrement pleins d’espoir
Avatar
Violette Laurent est une blogueuse tech nantaise diplômée en communication de masse et douée pour l'écriture. Elle est la rédactrice en chef de fr.techtribune.net. Les sujets de prédilection de Violette sont la technologie et la cryptographie. Elle est également une grande fan d'Anime et de Manga.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici