L’ingénierie rapide est devenue un travail brûlant l’année dernière dans l’industrie de l’IA, mais il semble qu’Anthropic développe maintenant des outils pour l’automatiser au moins partiellement.
Anthropic a publié mardi plusieurs nouvelles fonctionnalités pour aider les développeurs à créer des applications plus utiles avec le modèle de langage de la startup, Claude, selon un Article de blog de l’entreprise. Les développeurs peuvent désormais utiliser Claude 3.5 Sonnet pour générer, tester et évaluer des invites, en utilisant des techniques d’ingénierie d’invites pour créer de meilleures entrées et améliorer les réponses de Claude pour des tâches spécialisées.
Les modèles de langage sont assez indulgents lorsque vous leur demandez d’effectuer certaines tâches, mais parfois, de petites modifications de la formulation d’une invite peuvent conduire à de grandes améliorations dans les résultats. Normalement, vous devriez trouver cette formulation vous-même, ou embaucher un ingénieur rapide pour le faire, mais cette nouvelle fonctionnalité offre un retour rapide qui pourrait faciliter la recherche d’améliorations.
Les fonctionnalités sont hébergées dans la console Anthropic sous un nouvel onglet Évaluer. Console est la cuisine d’essai de la startup pour les développeurs, créée pour attirer les entreprises qui cherchent à créer des produits avec Claude. L’une des fonctionnalités, dévoilée en mai, est le générateur d’invites intégré d’Anthropic ; il s’agit d’une brève description d’une tâche et d’une construction d’une invite beaucoup plus longue et étoffée, en utilisant les techniques d’ingénierie d’invite d’Anthropic. Bien que les outils d’Anthropic ne remplacent peut-être pas complètement les ingénieurs prompts, la société a déclaré qu’ils aideraient les nouveaux utilisateurs et feraient gagner du temps aux ingénieurs rapides expérimentés.
Dans Évaluer, les développeurs peuvent tester l’efficacité des invites de leur application d’IA dans divers scénarios. Les développeurs peuvent Télécharger des exemples du monde réel dans une suite de tests ou demander à Claude de générer un ensemble de cas de test générés par l’IA. Les développeurs peuvent ensuite comparer l’efficacité de différentes invites côte à côte et évaluer des exemples de réponses sur une échelle de cinq points.
Dans un exemple tiré de l’article de blog d’Anthropic, un développeur a identifié que son application donnait des réponses trop courtes sur plusieurs cas de test. Le développeur a pu modifier une ligne dans son invite pour allonger les réponses et l’appliquer simultanément à tous ses cas de test. Cela pourrait faire économiser beaucoup de temps et d’efforts aux développeurs, en particulier ceux qui ont peu ou pas d’expérience en ingénierie.
Dario Amodei, PDG et cofondateur d’Anthropic, a déclaré que l’ingénierie rapide était l’un des éléments les plus importants pour l’adoption généralisée de l’IA générative par les entreprises. interview de google Cloud Next plus tôt cette année. « Cela semble simple, mais 30 minutes avec un ingénieur rapide permettent souvent de faire fonctionner une application alors qu’elle ne l’était pas auparavant », a déclaré Amodei.