Nous avons tous des idées, mais les communiquer efficacement et gagner les gens n’est pas une mince affaire. Alors, quelle est la meilleure façon d’y parvenir à une époque de surcharge d’informations et de réduction de la durée d’attention ?
Si vous êtes les ingénieurs Pramod Sharma et Jerome Scholler, vous utilisez Serviette, une nouvelle plateforme d’« IA visuelle » que les deux hommes ont construite ensemble. Napkin se lance furtivement aujourd’hui avec un financement de 10 millions de dollars d’Accel et de CRV.
Napkin est né de la frustration de Sharma et Scholler face au nombre infini de documents et de présentations qui sont devenus la norme dans le monde de l’entreprise. Avant de lancer Napkin, Sharma, un ancien Googler, a fondé la société de jeux éducatifs Osmo. Scholler faisait partie de l’équipe fondatrice d’Osmo et, avant cela, a travaillé chez Ubisoft, LucasArts et google.
« Le produit de base de Napkin s’adresse aux spécialistes du marketing, aux créateurs de contenu, aux ingénieurs et aux professionnels de la vente d’idées et de la création de contenu », a déclaré Sharma à TechCrunch. « L’objectif est de minimiser le temps et les maux de tête du processus de conception en le transformant en un flux principalement génératif. »
« Générative » fait référence à l’IA générative. Oui, des serviettes de table encore un autre mise sur le potentiel de la technologie et rejoint une longue, longue liste. Mais quelques éléments ressortent de l’expérience, qui est strictement basée sur le Web pour l’instant.
Avec Napkin, les utilisateurs commencent par du texte (une présentation, un plan ou un autre document du même genre) ou demandent à l’application de générer du texte à partir d’une invite (par exemple, « Un aperçu des meilleures pratiques pour un entretien d’embauche »). Napkin crée ensuite un canevas de type Notion avec ce texte, puis ajoute une « icône d’étincelle » aux paragraphes de texte qui, lorsqu’on clique dessus, transforme le texte en visuels personnalisables.
Ces visuels ne se limitent pas aux images, couvrant différents styles d’organigrammes, de graphiques, d’infographies, de diagrammes de Venn et d’arbres de décision. Chacune de ces images contient des icônes qui peuvent être remplacées par une autre dans la galerie de Napkin, et vous obtenez des connecteurs qui peuvent également lier visuellement deux ou plusieurs concepts. Les couleurs et les polices sont modifiables, et Napkin propose des « décorateurs » tels que des surbrillances et des soulignements pour embellir l’apparence de n’importe quel élément.
Une fois terminés, les visuels peuvent être exportés sous forme de fichiers PNG, PDF ou SVG, ou sous forme d’URL qui renvoie au canevas où ils ont été créés.
« Contrairement aux outils existants qui ajoutent un composant génératif à un éditeur existant, nous nous concentrons sur l’expérience de la génération en premier où l’édition est ajoutée pour compléter la génération et non l’inverse », a déclaré Sharma.
J’ai fait un bref tour à Napkin pour avoir une idée de ce qu’elle pouvait faire.
À l’étape de la création du document, par curiosité morbide, j’ai essayé de faire en sorte que Napkin génère quelque chose de controversé, comme « Instructions pour assassiner quelqu’un » ou « Une liste d’insultes extrêmement offensantes ». L’IA utilisée par Napkin ne me dirait pas comment commettre un meurtre, mais elle s’est conformée à cette dernière demande – bien qu’avec un addendum sur la façon dont les insultes étaient « destinées à des fins éducatives ». (Il y a un bouton dans l’écran du canevas pour signaler ce type de mauvais comportement de l’IA.)
Mischief parvenu, j’ai jeté un article de fr.techtribune.netdans Napkin – un brouillon de celui-ci pour être précis. Et, eh bien, il est rapidement devenu évident où se situent les forces et les faiblesses de Napkin.
Napkin s’en sort mieux avec des descriptions simples, des grandes lignes d’idées et des récits avec des chronologies clairement établies. La façon la plus simple de le dire est la suivante : si une idée se lit comme si elle pourrait être mieux illustrée dans un visuel, Napkin se montrera le plus souvent à la hauteur de l’occasion.
Lorsque le texte est un peu plus nébuleux, Napkin s’accroche à des pailles, générant parfois des visuels qui ne sont pas du tout fondés sur ce texte. Jetez un coup d’œil à celui ci-dessous, par exemple – il frise l’absurde.
Pour le visuel ci-dessous, Napkin a inventé les avantages et les inconvénients de toutes pièces (comme les modèles génératifs ont l’habitude de le faire). Nulle part dans le paragraphe je n’ai mentionné les problèmes de confidentialité ou la courbe d’apprentissage de Napkin.
Napkin suggère parfois des images ou des illustrations pour les visuels. J’ai demandé à Sharma si les utilisateurs pourraient avoir à s’inquiéter des implications en matière de droits d’auteur de ceux-ci, et il a dit que Napkin n’utilise aucune donnée publique ou protégée par IP pour générer des images. « C’est interne à Napkin, donc les utilisateurs n’ont pas à se soucier des droits sur le contenu généré », a-t-il ajouté.
Je n’ai pas pu m’empêcher de remarquer que les visuels de Napkin respectent tous un design assez générique et homogène Langue. Certains des premiers utilisateurs des fonctionnalités d’IA générative de Microsoft pour PowerPoint ont décrit les résultats de ce logiciel étaient « de niveau lycée », et la démo de Napkin n’a pas pu s’empêcher de me rappeler ces commentaires.
Cela ne veut pas dire qu’une partie de cela n’est pas réparable. Après tout, Napkin n’en est qu’à ses débuts – la plate-forme prévoit de lancer des plans payants, mais pas de sitôt – et l’équipe est un peu limitée par sa taille. Il y a actuellement 10 personnes chez Napkin, basé à Los Altos, et il prévoit de passer à 15 d’ici la fin de l’année.
De plus, peu de gens pourraient suggérer que Sharma et Scholler ne sont pas des entrepreneurs prospères, ayant vendu Osmo au géant indien de l’edtech Byju’s pour 120 millions de dollars en 2019. Rich Wong d’Accel a soutenu Napkin en partie parce qu’il était impressionné par la sortie d’Osmo – Wong était également un des premiers investisseurs d’Osmo.
« Jerome et Pramod ont une capacité étonnante à prendre quelque chose d’incroyablement difficile d’un point de vue technique et à le rendre facile pour les utilisateurs », a déclaré Wong dans un communiqué. « En tant que partenaire de leur première entreprise, Osmo, nous les avons vus donner vie à leur vision d’un nouveau mouvement de jeu grâce à l’IA réflexive. Nous sommes ravis de soutenir ce nouveau chapitre, car Napkin apporte l’IA visuelle à la narration des entreprises.
M. Sharma a déclaré que le produit de la ronde de financement de 10 millions de dollars sera consacré au développement de produits et à l’embauche d’ingénieurs et de graphistes en IA.
« Toute notre énergie et nos ressources seront consacrées à la façon dont Napkin peut générer les visuels les plus pertinents et les plus convaincants compte tenu du contenu textuel », a-t-il déclaré. « Il existe d’innombrables façons de visualiser et de concevoir. Nous investissons des capitaux dans la construction de cette profondeur et l’amélioration de la qualité de l’IA.