Entretien avec Baptiste Kotras : la mesure de l'opinion en ligne
[vendredi 05 octobre 2018 - 08:00]

Baptiste Kotras étudie les différentes manières de mesurer l'opinion apparues avec le web. Il renouvelle se faisant, d'une manière originale et convaincante, la façon d'appréhender les enjeux de sa représentativité. Il a accepté de répondre à quelques questions à l'occasion de la sortie de son livre La Voix du Web. Nouveaux régimes de l'opinion sur Internet1.

 

Nonfiction : Le web est à l’origine d’une révolution dans la façon de mesurer les opinions, montrez-vous, qui s’est déroulée en deux étapes. Une première étape dans laquelle les outils et les méthodes utilisés se sont intéressés aux publics qui exprimaient ces opinions en ligne. Et une seconde étape où ces outils et ces méthodes se sont détournés de la caractérisation des publics pour se concentrer sur les seules opinions et leurs évolutions. Pourriez-vous expliciter ces étapes pour nos lecteurs ? Comment ce passage s’est-il opéré ?

Baptiste Kotras : En réalité, les deux approches apparaissent à peu près simultanément, au milieu des années 2000. Un premier groupe d’agences et de start-ups, dont les fondateurs viennent plutôt du marketing et des études traditionnelles, choisit de se concentrer sur les opinions produites au sein de communautés de blogueurs à la fois spécialisés et reconnus sur un sujet, dont les publications sont largement citées. Le slogan de l’une de ces entreprises à l’époque est : si vous écoutez tout, vous n’entendrez rien. Autrement dit, sur le web, toutes les opinions ne se valent pas : certaines sont très influentes, de par l’autorité et la mobilisation de leurs auteurs. Il faut donc selon ces acteurs développer des techniques de mesure de l’influence et de l’appartenance communautaire, pour échantillonner uniquement les publics qui façonnent l’opinion du plus grand nombre.

L’autre approche naît plutôt dans les sciences informatiques et affirme au contraire qu’il faut développer des logiciels puissants, capables d’indexer le plus possible de publications, issues des blogs, des forums puis bientôt des réseaux sociaux, Twitter surtout. De cette façon, on peut détecter rapidement ce que ces acteurs appellent des « signaux faibles », c’est-à-dire essentiellement des mouvements critiques qui menaceraient l’image du client (souvent des grandes entreprises), et auxquels on veut pouvoir répondre le plus vite possible avant que la critique ne se propage. Pour ce faire, ces acteurs indexent donc en effet le web social de la manière la plus extensive possible, et proposent des tableaux de bord de veille dotés de nombreux indicateurs, courbes, graphiques, qui permettent à leur utilisateur de filtrer des milliers de données pour détecter celles qui l’intéressent particulièrement. En refusant d’échantillonner, cette approche économise donc toute description d’un public de référence : elle se centre sur les mots-clés, sur la sémantique de l’opinion, plus que sur les publics opinants. 

Cette approche l’emporte au final dans les années 2010 sur le marché de l’opinion en ligne, pour plusieurs raisons : d’une part, les modèles échantillonnés nés autour de 2005, 2006, fonctionnent très bien pour étudier la blogosphère, faite d’auteurs reliés entre eux et spécialisés sur un thème, mais assez mal sur les réseaux sociaux, où l’expression se rapproche beaucoup plus de la parole orale, se « dés-éditorialise », indépendamment d’un thème de prédilection. D’autre part, ces approches échantillonnées reposent beaucoup sur l’analyse « manuelle » des opinions par des chargés d’études, soit un modèle économique beaucoup plus difficile à reproduire à l’international que la commercialisation d’un logiciel générique. L’internationalisation de la concurrence entre ces entreprises a donc tendanciellement éliminé des approches plus artisanales.

 

Les logiciels de social media analysis permettent aujourd’hui une veille en continu de l’opinion basée sur ses traces, sans s’embarrasser de sélectionner préalablement les publics ou les opinions à analyser. Pourriez-vous expliquer comment cela fonctionne ?

La promesse de ces logiciels est, comme je le disais, de détecter en temps réel n’importe quel mouvement dans la conversation en ligne. Ils s’inscrivent donc dans une logique de la veille. Au départ, l’utilisateur est invité à définir des requêtes sémantiques, c’est-à-dire à lister et combiner les mots-clés qui comptent pour lui : le nom d’une marque, de ses dirigeants, de ses produits, les termes afférents à tel ou tel autre sujet d’étude. Sur la base de ces requêtes, le logiciel interroge en temps réel les immenses bases de données constituées par ces acteurs, voulues les plus complètes possibles, et met à disposition de l’usager tous les tweets, billets de blog, messages de forum, qui contiennent ces agencements de mots-clés. On accède donc à l’opinion directement par ses traces et non par les publics qui la produisent ; c’est la même différence, dans le monde hors ligne, entre aller interroger des personnes avec une série de questions, et écouter directement ce qui se dit dans les cafés, dans la queue de la boulangerie, à la poste – mais à très grande échelle. On ne sait plus très bien qui parle, en revanche on apprend des choses très précises sur ce que les gens ont en tête, en tout cas ceux qui choisissent de parler publiquement. Evidemment, étant donnée la masse de données en jeu ici, l’utilisateur du logiciel ne lit que rarement toutes les traces qu’il collecte : il dispose d’algorithmes, de filtres, d’indicateurs qui lui permettent de se concentrer sur tel ou tel sous-ensemble d’opinions, liées à un mot-clé particulier, ou émises durant une période de temps déterminée. Ces outils sont donc moins panoptiques dans leurs usages que ce qu’en disent les commerciaux chargés de les vendre.

 

Vous ne vous contentez pas de décrire ces formes de mesure de l’opinion en ligne, vous les reliez à des dispositifs historiques de mesure des opinions, que l’enquête par sondages et la valeur démocratique qu’on lui reconnaissait souvent avaient parfois éclipsés, pour en dégager des points communs. Quels sont-ils ?

La mesure des opinions des gens, au sens large, ne naît pas avec les enquêtes par sondage, loin s’en faut. Mon enquête m’a conduit à montrer que les entreprises qui mesurent l’opinion sur le web contribuent à rouvrir plusieurs questions anciennes qui ont déjà préoccupé des acteurs très variés par le passé. Au XVIIIe siècle, par exemple, la monarchie française dispersait des agents – surnommés « mouches » par la population – pour écouter les conversations des Parisiens dans les lieux publics, les tavernes, dans la rue, etc., et ainsi pouvoir anticiper sur les mouvements de contestation et d’agitation sociale. Malgré la distance considérable entre les époques, les enjeux et les technologies mises en œuvre, on trouve des points communs entre ce projet et celui du social media analysis actuel, ou social listening : notamment, le fait d’écouter en continu et de façon extensive des foules peu identifiées, pour y détecter des motifs de mécontentement et agir en conséquence. De même, un peu plus proche de nous, les régimes successifs du XIXe siècle en France se sont inquiétés de l’opinion véhiculée par une presse de plus en plus démocratisée. Des employés du ministère de l’Intérieur, aidés par la toute jeune agence Havas, se chargeaient donc de dépouiller quotidiennement tous les journaux, afin de faire des rapports sur les tendances du moment, de développer leur connaissance des lignes éditoriales de chaque titre. Le pouvoir nouait aussi des relations suivies avec certains patrons de presse afin de s’attirer leurs bonnes grâces, ou créaient de toutes pièces des journaux nouveaux favorables au gouvernement. Là encore, ce système est en partie analogue à la pratique des relations publiques digitales, qui voit les entreprises veiller attentivement sur les blogueurs les plus influents, les rencontrent et les sollicitent afin d’agir par ricochet sur leurs publics. Ces dispositifs ne sont bien sûr pas identiques d’une époque à l’autre, mais il est intéressant de discerner ces continuités pour voir comment le web pluralise la mesure des opinions, en renouant avec des projets épistémiques et politiques bien antérieurs. 

 

Vous concluez en présentant quatre régimes de l’opinion : le régime des majorités, le régime de la mobilisation, un régime hiérarchisé et un enfin un régime public-discursif, qui est celui des social media analysis. Vous notez qu’ils sont en tension, comme autant de conceptions différentes de ce qu’est dire l’opinion. Pourriez encore expliciter ce point ?

Ce qui est important de noter, c’est que le fait de dire l’opinion, de la mesurer ou de s’en faire le porte-parole, est un acte nécessairement politique, qui a des conséquences sur la façon dont on conçoit la société et notamment le public, ce que l’on peut en dire, ou pas. Les acteurs qui disent l’opinion sont amenés à se positionner sur plusieurs questions, assez constantes dans le temps : De qui, de quelles populations collecte-t-on les opinions ? De quelle manière ? Comment sont produits des résultats ? S’agit-il par exemple de compter des opinions individuelles ou de décrire qualitativement des tendances collectives ? On voit bien que ces questions sont à la fois techniques et politiques : ce n’est – par exemple – pas la même chose d’affirmer, comme le fait le sondage, que toutes les opinions se valent, quelle que soit la personne interrogée, et que l’on peut les additionner entre elles, que de considérer, comme dans le modèle de la presse au XIXe ou celui de beaucoup d’entreprises que j’ai étudiées, que seules les opinions les plus visibles et les plus influentes doivent être prises en compte, étant donné leur impact bien supérieur sur la société. On peut donc dire que l’opinion constitue un objet en tension, en ce qu’aucun dispositif particulier de sa mesure ou de sa mise en forme ne peut prétendre emporter définitivement la partie : même si le sondage détient une place prépondérante depuis des dizaines d’années, les façons de mesurer et dire l’opinion demeurent nombreuses et antagonistes.

 

Finalement, vous semblez appeler à résister au régime public-discursif, qui constitue ce que vous appelez une « opinion sans public », pour rouvrir le débat sur les critères permettant de décrire les populations qui s’expriment sur le web. Pourriez-vous encore expliquer ce que vous entendez par là ?

Non, je ne dis pas qu’il faille « résister » aux dispositifs de social media analysis. Mon travail en tant que sociologue a été d’enquêter sur ces outils, ceux qui les conçoivent, leurs projets et les partis-pris qui sont les leurs, afin d’éclairer le contenu politique de ces instruments d’un genre nouveau. C’est ensuite aux lectrices et lecteurs de se faire leur avis sur la question, sur ce qu’ils estiment collectivement souhaitable ou non. Qui plus est, si sur le marché des outils de mesure des opinions en ligne des consommateurs, ces logiciels l’ont clairement emporté, ils coexistent toujours avec d’autres façons de mettre en forme les opinions du web : les trending topics de Twitter, par exemple, qui fonctionnent sur une logique analogue à celle de la manifestation ou de la pétition, constituent un enjeu de lutte pour différentes tendances d’opinion, et attirent l’attention des journalistes qui à leur tour les relaient. Au final, si mon livre peut servir à quelque chose, c’est à discerner les enjeux collectifs et politiques des différentes manières de mettre en forme l’opinion qui émergent avec le web.

 

Pour aller plus loin :

"Le tout plutôt que la partie. Big data et pluralité des mesures de l'opinion sur le web" de Baptiste Kotras, Revue française de sociologie, numéro 59-3, juillet/septembre 2018, un numéro intitulé Big data, sociétés et sciences sociales



rédacteur : Jean BASTIEN, Critique à nonfiction.fr
Illustration : Bizztor

Notes :
1 - Seuil/La République des Idées, septembre 2018