Dans un monde de données, les algorithmes jouent un rôle fondamental. Il nous incombe de les comprendre pour les utiliser au mieux.

Nous sommes entrés dans une nouvelle ère, où la collecte de l’information s’est démultipliée et son traitement par des algorithmes généralisé. Il s’agit là du point de départ de deux ouvrages co-écrit par Serge Abiteboul, chercheur en informatique à Inria   et ancien membre du Conseil National du Numérique. Le premier de ces livres, Terra Data, sous-titré Qu’allons nous faire des données numériques ?, a été écrit avec Valérie Peugeot, chercheuse en digital studies à Orange Labs, membre de la CNIL   et présidente de Vecam, association de réflexion et d’action pour vivre la citoyenneté dans la société numérique. Ce livre est le pendant d’une exposition du même nom à la Cité des Sciences qui permet d’appréhender les différentes implications qu’ont sur nos vies cette collecte de données ainsi que leur traitement. Le second livre, Le Temps des algorithmes, a lui été écrit avec Gilles Dowek, informaticien, également chercheur à Inria, et par ailleurs auteur d’un ouvrage sur l’histoire des mathématiques   .

Ces deux livres se veulent généralistes, à portée de tous, notamment le premier d’entre eux, adossé à une exposition de médiation scientifique. Ils portent aussi le point de vue des acteurs de ces évolutions, qui possèdent les compétences techniques pour en comprendre les fondements, et qui sont aussi impliqués dans les instances et les débats autour de ces changements. En toute logique, ces ouvrages restent très proches l’un de l’autre, malgré des différences dans les thématiques analysées. Le ton est toutefois plus pédagogique dans Terra Data que dans Le Temps des algorithmes, somme de réflexions sur différents aspects de notre vie bouleversés par l’arrivée en masse des algorithmes.

 

Que sont les algorithmes ?

Les données sont collectées depuis l’invention de l’écriture, sous forme de tablettes d’argile, de livres de comptes, de photographies, de journaux. Ce qui a toutefois changé durant les dernières décennies, c’est le passage au numérique qui permet et stocker et de traiter plus facilement les données, mais aussi le volume et la vitesse à laquelle arrivent les données. Avec Internet et les objets connectés, plus de données sont produites chaque jour, sur un vaste ensemble de sujets, allant de la santé à nos contacts sociaux, en passant par des données sur nos préférences d’achat, ou sur notre situation sociale et économique. Dans ce contexte, il faut de nouveaux outils pour traiter les données : les algorithmes.

« Un algorithme est un procédé qui permet de résoudre un problème, sans avoir besoin d’inventer une solution à chaque fois »   . Ces algorithmes, de différents types, manipulent des informations symboliques pour fonctionner : les données. Ils permettent de faire des calculs, de gérer de l’information, de communiquer, d’analyser des données, de traiter des signaux et bien plus encore. Ces algorithmes restent toutefois limités par leur programmation initiale : ils ont été construits en vue d’une tâche, mais aussi par des données techniques comme la puissance de calcul. Ces outils peuvent être très complexes et incorporent de nombreuses opérations différentes qu’il est difficile d’analyser. Cette complexité créé une certaine opacité sur les résultats des algorithmes, souvent renforcée par le fait que nous ne savons pas quelles sont les données, les informations, en entrée de l’algorithme qui vont lui servir de base pour construire ces mêmes résultats.

 

Des promesses à double tranchant

Loin d’être mystiques, les algorithmes ne sont que des outils, certes très puissants et complexes, dont il nous revient de choisir le mode d’utilisation. Dans le domaine de la santé par exemple, les algorithmes permettent ou permettront bientôt d’améliorer la détection des tumeurs ou d’adapter au mieux les traitements pour chaque patient en construisant une médecine personnalisée à partir des données de chacun et notamment de celles du génome. A l’inverse ces promesses peuvent aussi constituer de graves dangers si les données ne sont pas suffisamment protégées ou si des usages non directement liés à la santé du patient sont autorisées. Ainsi des assurances pourraient se servir de ces données pour moduler les primes en fonction du génome, rompant par là le principe de mutualisation des risques qui prévalait jusqu’alors.

Dans le domaine de l’économie les algorithmes ont déjà un impact fort avec la construction de services qui révolutionnent notre rapport aux relations sociales comme Twitter ou Facebook, mais dont le pendant est un profilage actif de chacun d’entre nous à des fins publicitaires. Si ces services qui nous permettent de communiquer entre nous, ou de nous orienter sur Internet pour Google, sont gratuits c’est aussi parce qu'ils vendent nos données afin de mieux nous cibler et donc de nous pousser à l’achat. Dans ces deux exemples de la santé et de l’économie numérique, les algorithmes et les données qui les nourrissent ont des impacts qui ne sont pas que positifs pour les individus.

 

La société bouleversée par les données

Cela est potentiellement le cas pour chaque aspect de notre vie, y compris en ce qui concerne des décisions individuelles importantes et pour la société dans son ensemble. Ainsi, un algorithme-juge permettrait d’appliquer à tous les mêmes critères de décision. Il enverrait alors des humains en prison, sur la base de données qui sont celles des jugements antérieurs. Toutefois un tel algorithme aurait un immense impact pour les mis en examen, sans possibilité de défendre au mieux leur cas devant un juge capable d’en comprendre les détails et sans possibilité de se retourner contre une décision prise par une machine et dont personne n’est au fond responsable tandis que le juge engage lui la responsabilité du corps social et la sienne en tant qu’acteur du système judiciaire. D’une façon similaire, la collecte massive d’informations sur les individus, qu’il s’agisse de la surveillance de masse des gouvernements, ou de celle des entreprises, restreint considérablement les libertés de chacun en imposant une surveillance de chaque instant. Il s’agit là de deux dérives dont les algorithmes et la collecte des données sont les outils.

A l’inverse, la diffusion des données des entreprises et des entités publiques, en open data, peut être elle, un des aspects bénéfiques de ceux-ci. Cette diffusion contribue à la transparence des institutions sur ses choix et permet aux citoyens de s’impliquer davantage dans la vie démocratique. De même, de nouveaux services peuvent naître de la mise à disposition de données. De fait, les données peuvent être sources de bénéfices pour tous, qu’il s’agisse par exemple d’un service de vélo rendu possible grâce à la production d’un fichier listant les bornes de recharge ou de l’amélioration des récoltes grâce à des capteurs connectés.

 

Les algorithmes sont ce que nous en feront

Ces deux livres avancent la même thèse : les algorithmes ne sont ni bons, ni mauvais. Ils sont ce que nous en faisons et surtout ce que nous en feront. Les auteurs appellent à une analyse responsable des algorithmes, qui doivent être transparents sur leurs contenus et sur les données qu’ils utilisent. Bien qu’ils soient complexes, cela permet d’en corriger les erreurs et les failles, mais aussi d’en comprendre les résultats. En parallèle de cette transparence, le public non spécialisé doit être à même de vivre dans une société où les algorithmes sont présents et où le numérique joue un rôle fondamental. Pour cela il convient d’apprendre à tous les fondements de l’informatique, notamment par un enseignement général de cette culture à l’école. Il faut par ailleurs protéger les individus et leurs données en réglementant l’accès à ces données personnelles. C’est déjà le cas en France avec la CNIL ou la mise en place d’un système national des données de santé. Mais les efforts restent à poursuivre pour que le droit soit toujours en phase avec la technologie. L’usage des algorithmes et des données dans nos sociétés reste ainsi à écrire, par chacun d’entre nous, qui sommes de fait tous impliqués par la société des données au temps des algorithmes