Google en sait-il plus que l’Insee sur les Français ?

Les grandes entreprises numériques, dont Google, recueillent des volumes considérables de données sur leurs clients. Ces nouvelles sources de données présentent des attraits indéniables, et viennent défier la statistique publique. L’Insee peut et doit naturellement tirer avantage des possibilités qu’elles ouvrent, comme il a déjà commencé à le faire depuis plusieurs années. Néanmoins, l’apport de ces nouvelles sources de données ne peut être jugé en bloc, toutes ayant leurs spécificités : la donnée ne fait pas l’information statistique, et encore moins la compréhension de phénomènes économiques ou sociaux complexes pour éclairer les débats publics. C’est autant grâce aux données qu’elle traite qu’au cadre institutionnel qui entoure ces traitements que la statistique publique remplit cette mission, fondamentale pour la vie démocratique.

©Bruno / Stock.Adobe.com

Les évolutions technologiques entraînent une inflation des « traces numériques » des activités humaines, dans des champs de plus en plus étendus. Les volumes de données enregistrées par les entreprises, au premier rang desquelles Google, sont considérables, et sans commune mesure avec ce que l’Insee collecte traditionnellement par le biais d’enquête ou de données administratives.

Il y a toutefois une différence fondamentale entre Google et l’Insee dans le traitement de l’information. L’objet social de l’Insee est de diffuser des chiffres et des analyses sur des données agrégées, qui ne peuvent être reliées à un individu particulier au-delà des caractéristiques qu’il partage avec un groupe plus large (âge, niveau de vie, catégorie sociale, lieu de résidence, etc.). L’Insee ne sait pas ce que vous recherchez sur internet, de quel produit vous avez envie, quels sont vos centres d’intérêts ou avec qui vous êtes en relation… Le modèle économique de Google est à l’inverse d’exploiter de l’information au niveau individuel. Mais l’exploitation agrégée de ces données individuelles peut être un produit peu coûteux et porteur d’information statistique : il est donc légitime de se demander si toutes ces « traces numériques » peuvent se substituer aux collectes classiques de la statistique publique, voire si Google peut remplacer l’Insee dans ses missions.

Lire la suite (INSEE)