Google en sait-il plus que l’Insee sur les Français ?
Sur son blog, l’Insee s’interroge s’il ne va pas se faire supplanter par les géants du numérique.
En effet, à chaque fois que nous utilisons un moteur de recherche comme Google, une application comme Facebook, ou un smartphone comme Apple, nous laissons un nombre considérable de « traces numériques » sans commune mesure avec ce que l’Insee collecte traditionnellement par le biais d’enquête ou de données administratives.
Toutefois, la donnée ne fait pas l’information statistique, et encore moins la compréhension de phénomènes économiques ou sociaux complexes pour éclairer les débats publics.
C’est autant grâce aux données qu’elle traite qu’au cadre institutionnel qui entoure ces traitements que la statistique publique remplit cette mission, fondamentale pour la vie démocratique.
Il y a une différence fondamentale entre Google et l’Insee dans le traitement de l’information. L’objet de l’Insee est de diffuser des chiffres et des analyses sur des données agrégées qui ne peuvent être reliées à un individu en particulier.
Le modèle économique de Google est d’exploiter de l’information au niveau individuel à des fins commerciales, de savoir ce que vous recherchez sur Internet, de quel produit vous avez envie, quels sont vos centres d’intérêt, avec qui vous êtes en relation... L’Insee reconnaît la rapidité de réaction de Google en matière de mobilité lors la crise sanitaire.
Les indicateurs de Google ont montré rapidement la chute des déplacements à la mi-mars, la reprise plus graduelle au mois de mai, autour du déconfinement, et le nouveau choc consécutif au couvre-feu puis au deuxième confinement. « Il se passe quelque chose... mais quoi exactement ? Et de quelle ampleur ? », ironise l’Insee.
La documentation de Google à l’usage des clients de ces données y répond en creux : « Ces données représentent un échantillon de nos utilisateurs. Elles ne reflètent donc pas nécessairement le comportement exact d’une population plus importante. » Google conseille d’éviter de comparer des lieux entre plusieurs pays, « ce qui peut induire en erreur ».
De son côté, Apple avertit que son application Apple Plans « ne recueillant pas de données démographiques sur ses utilisateurs, il est impossible de dire si les chiffres issus de l’application sont représentatifs de l’ensemble de la population ».
En conclusion, l’Insee rappelle que la statistique publique se distingue avant tout par les conditions de son exercice : tout ce que l’Insee sait des Français est public, de même que la façon dont ces savoirs sont construits.
Son programme de travail est orienté par les demandes sociales, exprimées à travers le Conseil national de l’information statistique (Cnis), dans lequel siègent les représentants notamment des organisations syndicales de salariés dont la CFDT. Son indépendance vis-à-vis de toute influence extérieure est contrôlée par l’Autorité de la statistique publique (ASP).
Nul ne sait aujourd’hui tout ce que Google et les autres entreprises du numérique savent des Français, encore moins pour quelles finalités ils produisent ces savoirs et avec qui ils les partagent.
Source : Blog de l’Insee
Jean-Pierre Druelle et François Jabœuf