Assemblée plénière Région Normandie – 24 juin 2019
Délibération 9 : Datalab Normandie pour un écoystème régional de la donnée
Intervention de Laëtitia Sanchez, présidente du groupe Normandie Ecologie EELV
Vous souhaitez développer un écosystème régional du bigdata, du deep learning et de l’IA. Une Silicon Valley normande en somme ! Sauf, qu’au contraire de la Silicon Valley, où la concurrence acharnée a permis de construire des empires, vous proposez de construire un data lake des données collectées – dont les données privées de nos concitoyens – mises en commun entre la recherche et l’innovation : autrement dit des startups et entreprises privées.
Qui elles-mêmes ont pour partenaires ou clients des entreprises comme EDF, Bouygues, Vinci, Vallourec, Matmut, BNP Paribas, Caisse d’Épargne, pour ne citer qu’eux.
Un data lake, c’est un référentiel de données, qui stocke pour une durée indéterminée des quantités massives de données, où les données brutes côtoient les données transformées.
Celui-ci sera hébergé par le CRIANN, et accessible à la fois à aux centres de recherche et aux entreprises. Et ces données seront commercialisées, au travers d’un site internet.
Ce mélange public/privé, dont je sais qu’il ne vous effraie pas, et le mélange des données publiques et privées, pose tout de même des questions :
Sur l’adossement des entreprises privées sur la recherche publique, on a en mémoire l’article du Canard Enchaîné du 5 juin, quand un brevet développé par le Généthon, financé par les dons du public, a été vendu 13,3 M€ à une startup dont ce fut le seul produit. Un mois plus tard, cette startup a été rachetée par Novartis 7,7 milliards d’euros. Pour une thérapie qui serait vendue aux parents français 800 000 € pour sauver leur bébé. Alors que ce sont les dons des français qui auront permis son développement.
Il faut donc veiller à ce que la recherche publique puisse profiter à la société tout entière, et ne soit pas accaparée par des entreprises, qu’elles soient startups ou multinationales.
Mais il faut veiller aussi à ce que les données, publiques ou privées, collectées auprès de chaque citoyen, avec ou sans accord, ne soit pas utilisées à son insu. Vous invoquerez l’anonymisation. Mais nous savons qu’avec le big data et le deep learning , il n’y a plus d’anonymat ! Les données sont analysées, recoupées, et les développements des algorithmes de l’IA permettent une connaissance de plus en plus fine des modes de vie, de consommation, habitudes, relations, niveaux de vie, investissements personnels, syndicaux ou politiques, ainsi que des besoins, envies ou désirs de chacun et chacune d’entre nous.
Vous direz que cela peut nous aider à mieux comprendre les déplacements, ou l’adéquation formation/emploi. Et donc permettre d’apporter des solutions. Je vous répondrai que les entreprises participantes ainsi que leurs partenaires ou clients feront de même pour des raisons commerciales ou stratégiques. De toutes façons, ces données ont vocation à être commercialisées.
Rappelons aussi que les big data, conjointement avec l’utilisation des outils informatiques et des réseaux sociaux ont permis d’influencer nombre d’élections majeures, manipulant ainsi nos démocraties.
Vous parlez d’éthique et de gouvernance : comment comptez-vous protéger les données de nos concitoyens, et leur garantir le droit de consultation et de suppression des informations qui les concernent ou qu’ils auront transmises, notamment quand elles auront été transformées ?
Et en matière de transparence : puisque les entreprises pourront acheter ces informations pour utilisation commerciale, ou stratégique, quel en sera l’accès pour le public ? Avec quels accès pour les données, droits de réutilisation, ou de diffusion ?
Ce sera réalisé avec l’argent public. Ce sont les citoyens qui financent un outil qui stocke, analyse et revend leurs propres données.
Nous savons que malgré le RGDP, avec des procédures compliquées pour un citoyen normal, leurs données sont captées en permanence avec un accord plus ou moins tacite et consensuel, simplement en cliquant sur un gros bouton OK, ou en validant un texte en petites lignes.
Quelles sont les garanties que les données ne seront pas captées ou revendues à leur insu ?
Et en cas de revente de leurs données, nos concitoyens seront-ils informés de l’utilisation qui est faite de leurs données, et seront-ils rémunérés ? Pourront-ils s’opposer à la vente de leurs données ?
Et enfin, combien de temps leurs données seront-elles conservées ?