Google est omniprésent dans vos vies. Que ce soit par ses services ou ses produits, l’entreprise californienne collecte un nombre de données, parfois des données personnelles, ahurissant. Paranoïa ? Non : pour objectiver les choses, l’Université de Vanderbilt (États-Unis) a réalisé une grande étude en analysant tout ce que collecte Google sur nos vies quotidiennes. Voici les principaux éléments à retenir.
Une donnée = une information
Pour que ce qui suit soit bien clair, il faut clarifier la différence entre une donnée et une donnée personnelle.
Sur Internet, une donnée est tout simplement une information. Cela ne signifie pas que cette information est publique, cela veut simplement dire qu’une de vos actions a généré un archivage et que certains acteurs peuvent accéder à cette information.
Par exemple, votre géolocalisation. Si vous utilisez Google maps, l’application GPS de Google, vos allées et venues sont autant de données disponibles pour Google. Autre exemple : votre historique de navigation sur le web. Les sites web que vous avez visités constituent des données.
Précision importante : ces données ne permettent pas, en tout cas pas à elles seules, de vous identifier. C’est en revanche le cas des données personnelles.
Une donnée personnelle = une information qui permet de vous identifier
Une donnée personnelle, elle, permet de vous identifier.
Par exemple, si vous commandez quelque chose sur un site de e-commerce, votre numéro de carte bancaire est une donnée personnelle. Avec cette seule donnée, un service peut en effet vous identifier personnellement.
De même, si vous indiquez votre numéro de téléphone lorsque vous réservez un billet de train, cette donnée permet de vous identifier personnellement.
Pourquoi Google est omniprésent dans nos vies
En guise de contexte, les auteurs de l’étude livrent quelques données intéressantes à propos de la présence de Google dans nos vies :
- Google est leader des navigateurs web. En France, son navigateur Chrome accapare 63 % des parts de marchés (février 2019), avec une forte croissance.
- Google est leader des systèmes d’exploitation mobile. En France, Android, l’OS mobile de Google, équipe 77 % des smartphones (juin 2018).
- Google est leader des moteurs de recherche. En France, Google concentrait 94 % des requêtes en mars 2019.
- Les services Maps, YouTube et Gmail sont utilisés chaque mois par 1 milliard d’utilisateurs… chacun.
Comment Google collecte nos données
Nous ne sommes pas toujours, loin de là, bien informé·es de ce que nous transmettons à Google. Car le géant californien, comme beaucoup d’entreprises qui aquièrent des données, procède de deux manières :
- « l’internaute donne directement et consciemment des informations à Google » par exemple en s’inscrivant sur YouTube ou Gmail. Dans ces cas-là, ne serait-ce que pour l’inscription, vous transmettez en effet vos noms, prénoms et d’autres informations personnelles ;
- « une application devient pendant son utilisation l’instrument de la collecte des données, sans que l’utilisateur en soit conscient. » D’après l’étude, 2/3 des informations collectées par Google le sont de cette manière. Les auteurs citent les exemples des « plateformes (Android, Chrome), les applications (le moteur de recherche, YouTube, Maps), des outils de publication (Google Analytics, AdSense) et de publicité (AdMob, AdWords). » Tous collectent des données, personnelles ou pas, sans que nous le sachions ou que nous comprenions l’utilisation qui en est faite. Google a d’ailleurs été condamné en janvier 2019 à ce sujet par la CNIL.
Ce que Google apprend de nous en 24 heures
Pour objectiver ce que Google apprend sur nous, les auteurs de l’étude ont testé la « journée type » d’une personne lambda. Comme beaucoup, cette personne se connecte à de multiples reprises à Internet durant la journée, que ce soit via son ordinateur ou son téléphone. Cette personne dispose d’un compte Google et son mobile fonctionne avec l’OS Android. Pour éviter les biais liés à l’historique de cette personne, une nouvelle carte SIM a été intégrée dans son téléphone.
À l’issue de l’expérimentation, plusieurs constats ont été réalisés, les voici.
Android joue un rôle majeur dans la collecte des données pour Google
En effet, cet OS est « étroitement connecté à l’écosystème Google via le service Google Play [le magasin d’applications qui permet de télécharger des apps sur les téléphones fonctionnant avec Android]. Android aide Google à récolter des informations personnelles sur les utilisateurs (nom, numéro de téléphone, date de naissance, code postal et dans beaucoup de cas le numéro de carte bancaire), les activités réalisées sur le téléphone (applications utilisées, sites web consultés) et les coordonnées de géolocalisation. »
Chrome participe massivement à la collecte et transmission de données à Google
Dans le détail, le navigateur maison de Google, « collecte des informations personnelles (comme lorsqu’un utilisateur remplit un formulaire en ligne) et les envoie à Google via le processus de synchronisation. Il liste aussi les pages visitées et envoie les données de géolocalisation à Google. »
Même lorsqu’un internaute est inactif, Google reçoit des données sur lui
Les auteurs notent en effet que « Android comme Chrome envoient des données à Google même en l’absence de toute interaction de l’utilisateur. Nos expériences montrent qu’un téléphone Android dormant et stationnaire (avec Chrome actif en arrière-plan) a communiqué des informations de localisation à Google 340 fois pendant une période de 24 heures, soit en moyenne 14 communications de données par heure. »
Même sans utiliser d’applications Google, le géant californien collecte des informations
Les auteurs observent que « une fois qu’un utilisateur ou une utilisatrice commence à interagir avec un téléphone Android (par exemple, se déplace, visite des pages web, utilise des applications), les communications passives vers les domaines de serveurs Google augmentent considérablement, même dans les cas où l’on n’a pas utilisé d’applications Google majeures (ni recherche Google, ni YouTube, pas de Gmail ni Google Maps). »
Ils concluent que « même si un utilisateur n’interagit avec aucune application phare de Google, Google est toujours en mesure de recueillir beaucoup d’informations par l’entremise de ses produits d’annonce et d’éditeur. » Ces produits sont, entre autres, Google analytics et Google ads. Présents sur de très nombreux sites web (Google analytics est par exemple présent sur 50 % des sites dans le monde qui utilisent un analytics !), ils permettent à Google d’acquérir des données y compris issus d’espaces numériques qui ne leur appartiennent pas.
Pourquoi Google collecte toute ces données
Si le géant californien déploie tant d’effort pour acquérir ce tombereau de données, c’est pour nourrir son modèle économique. Les auteurs expliquent ainsi que « Google analyse les données collectées pour déterminer les centres d’intérêt des utilisateurs et utilisatrices, qu’il utilise ensuite pour les cibler avec des publicités adaptées.«
En 24 heures, Google a pu « attribuer 18 centres d’intérêts à Jane [la personne qui a utilisé le smartphone de l’expérimentation], dont 8 qui correspondent précisément aux utilisations et activités de Jane. » Une finesse d’analyse permise par l’énorme collecte opérée par Google.
- Consulter cette étude scientifique dans son intégralité, en version française.
- Pour comprendre comment les auteurs de l’étude ont procédé pour consulter précisément les données acquises par Google, la méthodologie est détaillée en bas de la page 4.
Vous avez des questions ? Des remarques ? N’hésitez pas à nous en faire part sur notre page LinkedIn ou en nous envoyant un message, ici. Vous pouvez aussi recevoir tous nos conseils pratiques et notre article premium dans votre boîte mail une fois par mois.