Même à 13 ans, Eric Tassone n’était pas un fan de baseball moyen. Chaque semaine, il récupérait un courrier contenant les données de la saison en cours dans sa boîte aux lettres, puis insérait les chiffres dans une série de formules, cherchant à déterminer par lui-même quelles équipes étaient les plus susceptibles de gagner.
« C’était comme Internet avant Internet », a déclaré Tassone.
Il utilisait ce qui se rapprochait le plus des données en temps réel – et de la science des données – dont il disposait à l’époque.
Tassone a rejoint la faculté de la School of Data Science de l’Université de Virginie l’été dernier après un mandat de 12 ans en tant que data scientist chez Google. Au cours de son mandat au sein de l’entreprise, il a dirigé des projets et des équipes travaillant sur l’infrastructure de recherche de Google, a contribué à des logiciels statistiques utilisés pour les prévisions et s’est associé à certaines des équipes de politique publique et juridiques de l’entreprise.
Il a fallu un certain temps à Tassone pour commencer officiellement sa carrière de scientifique des données – il a obtenu une maîtrise en mathématiques, un doctorat. en biostatistique et même un diplôme en droit de l’Université de Virginie en cours de route – mais son intérêt pour le concept a commencé avec ces formules de baseball, a-t-il déclaré.
Les équations qu’il a utilisées ont été développées par Bill James, un analyste renommé du baseball et la figure la plus visible du mouvement « sabermetrics » du jeu. Par exemple, James a aidé à établir que la moyenne au bâton, longtemps un bâton de mesure dominant pour les performances de baseball, n’était pas réellement associée à des matchs gagnants comme d’autres mesures que James aiderait à populariser.
« Il a pris la sagesse conventionnelle et il l’a recadrée », a expliqué Tassone. En utilisant de nouvelles formules, « il a pu mieux adapter les données existantes pour répondre à la bonne question ».
Tassone appelle cette approche « faire passer la question avant les méthodes », et cela a été un thème tout au long de sa carrière.
Chez Google, il a collaboré avec toutes sortes d’experts, des ingénieurs en logiciel aux chefs de produit. « Lorsque j’essaie d’expliquer aux gens ce que c’est que de pratiquer la science des données, je dis souvent qu’il s’agit de s’attaquer à une question quantitative intégrée à une question d’ingénierie intégrée à une question commerciale », a-t-il déclaré.
Le fait que leur domaine recoupe tant d’autres signifie que les scientifiques des données doivent rester concentrés sur le monde réel, a-t-il ajouté. Il est facile de tomber amoureux de la perspective de concevoir l’algorithme ou la métrique parfaite. Mais si, comme les moyennes au bâton, ce que vous concevez ne tient pas compte du contexte ou ne répond pas avec précision à la question posée, cela ne sera pas utile.
« Il ne s’agit pas nécessairement d’avoir l’algorithme le plus efficace », a déclaré Tassone. « Il s’agit de la créativité et de l’esprit d’entreprise que les gens apportent pour résoudre les problèmes. »
Dans son nouveau rôle, Tassone aidera à développer et à diriger le Collaboratory for Applied Data Science in Business, un partenariat entre la School of Data Science et la Darden School qui a débuté en octobre.