Va-t-on bientôt se noyer dans une vague virtuelle? Comment gérer, classer, utiliser le tsunami de données que nous générons chaque jour? Un défi qui ne fait pas peur à Philippe Cudré-Mauroux, professeur en informatique spécialisé dans ces questions. Il nous aide à remonter le courant en vue du Café scientifique consacré à ce sujet.
Le big data est présenté comme une sorte de révolution démesurée dans le traitement des données. C’est extrêmement difficile de se le représenter. A quoi peut-on le comparer pour se faire une idée?
On dit souvent que le big data est le pétrole de demain. Je trouve l’analogie intéressante. Comme le pétrole, le big data peut être utilisé pour alimenter toutes sortes d’applications (aide à la décision, optimisation, personnalisation, etc.). Mais, tout comme pour le pétrole également, il faut passer par des étapes complexes d’extraction et de raffinage avant de pouvoir utiliser les données de manière optimale.
Comment cela fonctionne-t-il?
La science des données est autant un art qu’une science à l’heure actuelle. On procède de manière itérative: on commence par extraire des données, les formater et les intégrer. On essaie ensuite d’en extraire la substantifique moelle (ce qu’on appelle des features) pour l’application visée. On utilise les données extraites pour générer un modèle de classification ou de prédiction. Finalement, on évalue la performance du modèle, ses points forts et ses faiblesses, et on recommence le cycle sur la base de l’expérience acquise jusqu’à présent.
Que vont devenir toutes ces données?
L’idée est de sauvegarder un maximum des données sur le long terme. Même si on ne sait pas toujours à quoi ces données pourraient servir à l’heure actuelle, on espère toujours leur trouver de nouvelles applications dans le futur.
En tant que spécialiste de la question, comprenez-vous que cela puisse effrayer certaines personnes? Quels en sont les dangers et les avantages?
Oui bien sûr, il y a énormément d’opportunités, mais aussi de risques liés au big data. Les avancées potentielles dans les domaines de la science, de la santé, de l’industrie ou des services sont gigantesques. Mais elles s’accompagneront de changements profonds de notre société et rendront un nombre croissant de professions obsolètes. Il faudra donc accompagner ce changement et éviter une mainmise totale des sociétés étrangères dans ce domaine.
Le défi pour la recherche, en tous cas, est immense, qu’est-ce qui vous attiré dans ce domaine spécifique?
Deux points principalement: le fait qu’il n’y avait pratiquement aucune solution aux problèmes de big data il y a 10 ans, quand j’ai commencé à travailler sur ce sujet (les choses ont bien évolué depuis) et… les applications potentielles, quasi infinies.
- Site de Philippe Cudré-Mauroux
- Le Café scientifique «Big data – alerte noyade?» aura lieu le mercredi 29 novembre 2017, au Nouveau Monde à 18h00
- Ecouter l’émission Les Experts de Radio Fribourg consacrée à la question