Vie étudiante
L'international
Ancien de l’ESME Sudria, Raphael Presberg (promo 2018) est à le cofondateur de la start-up Eiffo, incubée au sein de IONIS 361. Avec son associé Alexis Tuil, il a participé au lancement de Data Against Covid-19, une initiative open source qui vise à mieux informer l’évolution de l’épidémie par région en France et qui, désormais, compte plusieurs centaines de volontaires.
Raphael Presberg
Avec Eiffo, Raphael Presberg et Alexis Tuil ont développé un score de « santé clients » prédictif, pour des entreprises SaaS B2B qui vendent des produits avec abonnements annuels ou mensuels. « Ce score permet aux équipes customer success de ces entreprises d’obtenir une visibilité objective de leur portefeuille client grâce à la donnée et d’identifier en amont les clients à risque afin d’adapter leur stratégie », explique l’ingénieur spécialiste de la data et de l’intelligence artificielle qui s’est lancé dans l’aventure entrepreneuriale en janvier 2019. Pour autant, c’est aujourd’hui pour une autre aventure, citoyenne cette fois, que l’ESME Sudria a tenu à s’entretenir avec cet Ancien : il s’agit de Data Against Covid-19.
Raphael Presberg : Tout est parti d’une publication postée sur LinkedIn par Lior Perez, le responsable Software Development & AI Lab de Meteo-France : nous étions alors au début du mois de mars et il lançait un appel aux Data Scientists afin de collecter de la donnée. Avec Alexis, nous avons décidé de le rejoindre et, au départ, nous étions seulement quatre. Notre but était alors d’essayer de commencer à récolter de la donnée sur la propagation du Covid-19 en France par région, ce qui n’existait pas. Pour cela, nous épluchions chaque jour les journaux régionaux, provinciaux… Bref, toutes les dépêches locales sur le sujet, pour avoir des informations sur les personnes atteintes. L’objectif était de construire une source de données assez granulaire, c’est-à-dire contenant beaucoup d’informations sur les patients touchés, afin de pouvoir ensuite pratiquer de l’analyse dessus.
Il y a environ deux semaines. Quand nous avons commencé, j’ai pris en main la région Grand Est où il y avait entre 100 et 120 cas recensés et Alexis se chargeait de l’Île de France qui était peu touchée. Aujourd’hui, ces chiffres ont explosé. Mais compter le nombre de cas, cela ne veut plus rien dire désormais car, en France, les personnes ne sont pas testées dans leur majorité. Sans test, on peut toujours noter le nombre de cas confirmés, mais l’on ne peut pas dénombrer l’ensemble des cas réels.
Oui, en même temps que le nombre de personnes impliquées. Très vite après le lancement, d’autres volontaires nous ont rejoints. De quatre, nous sommes passés à huit. Nous avons alors créé un petit groupe de discussion via l’application Slack. En parallèle, le nombre de malades a augmenté à très grande vitesse et il n’était donc plus possible d’aller chercher des informations de façon granulaire sur ces cas. Nous avons alors plutôt préféré récolter des données pour non pas décrire en détail les profils des personnes touchées, mais suivre le nombre de personnes atteintes par région et par jour. Nous nous sommes entraînés ensemble et avons mis en commun notre travail afin d’obtenir quelque chose de solide. Dès le 8 mars, nous étions douze sur le Slack pour consolider ces données. Et puis, sans savoir comment, deux ou trois jours plus tard, nous sommes retrouvés à près de 450 « data guys » sur le Slack, tous prêts à aider ! Cela a aussitôt permis la création de deux dashboards de datavisualisation permettant de suivre l’évolution du Covid-19. Aujourd’hui, le groupe continue d’augmenter et nous devons être plus de 900 volontaires. Cela donne lieu au développement de très nombreux projets.
Nous sommes très vite entrés en contact avec des institutions étatiques, à travers par exemple des personnes d’Etalab, l’organisme qui a pour mission première la digitalisation des institutions publiques. Nous nous sommes également rapprochés de la Direction générale de la santé (DGS) pour comprendre quelles données elle récoltait et envoyait à Santé publique France. S’en est suivie une partie de lobbying pour rendre ces données publiques afin que l’on puisse travailler dessus et les comparer avec la data que nous avions constituée. Alexis a ensuite parlé avec des épidémiologues et des médecins pour comprendre les besoins. Tout cela a permis de lancer de nouveaux projets, principalement de prédiction. Cela concerne la prédiction du nombre de lits en réanimation en régions, la prédiction du pic épidémiologique par département, la prédiction du nombre de masques, de gels et de personnes nécessaires, la prédiction du nombre de cas réels et de cas testés, etc.
Oui. D’ailleurs, l’un de nos dashboards est présent aujourd’hui sur le site du gouvernement. Cela a été évidemment facilité par la présence de personnes d’Etalab à nos côtés, qui ont justifié notre crédibilité.
C’est avant tout un moyen d’informer de façon purement quantitative. La création de ces dashboards est aussi pensée pour le grand public, ou plutôt le grand public déjà familier avec l’analyse de courbes, pour lui permettre de comprendre l’évolution de l’épidémie.
Initialement, cela faisait partie des projets que nous avions, en particulier avec les chiffres relatifs à la propagation du virus Ebola sur lesquels Alexis avait travaillé. Mais nous n’avons finalement pas pu le mettre en place car nous ne disposons pas aujourd’hui de toutes les informations et du recul nécessaires. Pour analyser une épidémie, il faut suffisamment de recul et de données.
C’est difficile à dire car, en France, peu de prédictions avaient été faites en amont. Il ne faut pas oublier une notion importante : il y a deux-trois semaines, nous ne savions encore rien ! Et l’on ne sait pas non plus où l’on en sera dans deux semaines.
Nous travaillons dessus actuellement. Avec la forte progression qu’a connue notre groupe de travail sur Slack, il nous a semblé normal de créer une équipe de communication interne et externe. Nous allons prochainement pouvoir être présents pour communiquer nos travaux sur les réseaux sociaux. En attendant, nous disposons toujours d’un site comprenant l’adresse de notre Slack et nos contacts (https://bzg.fr/covid19-developpeurs-datascientistes-comment-aider/).
Bien sûr ! Ces profils sont les bienvenus. Nous avons aussi besoin de Project Managers, de juristes, de spécialistes en protection de données… C’est une initiative vraiment open source et tout le monde peut venir aider, avec ses compétences, ses idées et ses envies.
Pas encore. Pour autant, l’AP-HP et Santé publique France ont demandé si, dans notre groupe de travail, des personnes en CDD ou freelance pouvaient être disponibles pour des missions à réaliser. Par contre, nous transmettons nos résultats à la DGS pour challenger leurs modèles et ses évolutions.
Fondée en 1905, l’école d’ingénieurs ESME forme en 5 ans des ingénieurs pluridisciplinaires, prêts à relever les défis technologiques du XXIe siècle : la transition énergétique, les véhicules autonomes, la robotique, les réseaux intelligents, les villes connectées, la cyber sécurité, et les biotechnologies.
Trois composantes font la modernité de sa pédagogie : l’importance de l’esprit d’innovation ; l’omniprésence du projet et de l’initiative ; une très large ouverture internationale, humaine et culturelle. Depuis sa création, près de 15 000 ingénieurs ont été diplômés. L’école délivre un diplôme reconnu par l’Etat et accrédité par la CTI.
Etablissement d’enseignement supérieur privé – Inscription au Rectorat de Créteil – Cette école est membre de IONIS Education Group comme :