google analytics 4

#110 > Analytics >Tout ce que vous devez savoir sur Google Analytics 4 avec Anne Devillers

Épisode diffusé le 29 janvier 2025 par Bannouze : Le podcast du marketing digital !

Écouter l'épisode :

0:00 --:--
Vitesse

Il y a un an, google analytics 4 a imposé à toute la profession une migration forcée. Pas de retour en arrière, pas d’historique de données récupérable, et un produit qui – soyons honnêtes – n’était clairement pas prêt. Anne Devillers, consultante indépendante spécialisée sur GA4 depuis plusieurs années (elle a commencé chez Google sur les comptes B2B avant de passer par l’agence Keyade, puis des postes acquisition chez des e-commerçants opérant jusqu’au Nigeria), a accepté de faire le bilan avec le podcast Bannouze. Ce qu’elle dit est plus nuancé que ce qu’on lit d’habitude sur le sujet.

Les hurlements étaient justifiés. Mais la situation a évolué. Et certains problèmes restent entiers.

Ce que tout le monde a oublié de dire sur google analytics 4

Commençons par le commencement. Google analytics 4 – ou GA4 – c’est un outil de web analytics. Un bout de code sur toutes les pages d’un site qui collecte ce que font les utilisateurs : d’où ils viennent, sur quoi ils cliquent, ce qu’ils regardent, s’ils convertissent. Rien de révolutionnaire dans le concept.

Ce qui a changé, c’est tout le reste. Le modèle de données est radicalement différent de celui d’Universal Analytics – l’ancienne version, désormais rebaptisée GA3. Et cette différence de fond a rendu impossible le transfert de l’historique.

La nouvelle version est complètement différente de la version d’avant, il y a une histoire de nouveau modèle de données. Et donc malheureusement on pouvait pas importer son historique… Universal, ça faisait 10 ans quand même que c’était sur le marché.

Dix ans de données, effacées d’un coup. Pour un annonceur qui avait construit ses benchmarks sur une décennie, c’est pas anodin.

Mais le vrai problème au moment du switch – l’été 2023 – c’est que le produit avait des bugs concrets. Des rapports de base manquants. Des métriques mal nommées (la métrique ‘utilisateurs’ qui en réalité comptait les utilisateurs actifs, pas le total). Et le taux de rebond qui avait purement disparu. (Ce dernier point a été beaucoup moqué, à juste titre – tout le monde regardait ce chiffre même sans savoir exactement ce qu’il mesurait, et d’un coup, plus rien.)

La communauté a hurlé. Et cette communauté est massive – des consultants, des agences, des équipes analytics dans toutes les boîtes. Le problème, c’est que Google n’écoutait pas. Ou en tout cas, ne répondait pas.

Il y avait pas de communication. On avait aucune idée de leur roadmap. On savait pas quels étaient les grosses étapes de développement prévu pour le produit. Il y avait pas de compte Twitter par exemple… Il y avait pas non plus de porte-parole identifié à GA4.

Ce silence a amplifié la rage. Un nouveau produit imparfait, sur lequel tout le monde est obligé de basculer, sans roadmap publique et sans interlocuteur identifié – c’est la recette parfaite pour une crise de confiance. Ce qui m’a frappé dans ce que dit Anne, c’est que le problème n’était pas seulement technique.

Un an après : google analytics 4 a rattrapé une partie de son retard

Depuis le switch obligatoire, Google a documenté chaque mise à jour dans une sorte de journal de release accessible via le moteur de recherche. Pas très sexy comme interface, mais au moins c’est là. Et selon Anne Devillers, les grosses problématiques du lancement ont été en grande partie comblées.

Il reste des bugs. En août dernier, un problème de remontée des campagnes Google Ads a semé la pagaille dans les rapports de plusieurs clients. Et certains rapports de base manquent encore. Mais le produit s’est stabilisé.

Ce qui reste vrai, c’est que google analytics 4 n’est pas pré-mâché. Loin de là. Des informations qui existaient en un clic dans Universal demandent maintenant de construire des rapports personnalisés. L’exemple des termes de recherche interne est parlant : l’événement est collecté automatiquement, mais le rapport correspondant n’existe pas par défaut dans la navigation.

Et cette partie – la construction de rapports – c’est souvent là que ça coince pour les équipes qui ne sont pas spécialisées analytics.

Anne distingue deux types de rapports dans GA4 :

  • Les rapports standards, accessibles à tous, avec une navigation prédéfinie
  • Explorer, la section avancée – disponible gratuitement pour tous (alors qu’elle était réservée à la version payante dans Universal)

Et c’est là que se cache un piège concret. Par défaut, Explorer ne conserve que 2 mois d’historique. Pas rétroactif – donc si vous ne changez pas l’option maintenant, vous ne récupérerez jamais ces données.

Ça par défaut, c’est sur 2 mois. Ce qui est un petit peu embêtant parce que dès qu’on devient un petit peu plus à l’aise sur GA4, souvent on va dans Explorer. Et donc on se retrouve avec 2 mois d’historique de données.

Et même en modifiant l’option, le plafond est à 14 mois. Au-delà, il faut exporter vers BigQuery – un entrepôt de données sur lequel on fait des requêtes SQL pour construire des visualisations. BigQuery appartient à Google, évidemment. (La boucle est bouclée.)

La mécanique cachée : quand l’algorithme reconstitue vos données

Voilà ce qui m’a le plus intéressé dans cet épisode. Et c’est aussi là que ça devient inconfortable.

On perd de la donnée sur le web pour deux raisons principales. D’abord le consentement : en Europe, on ne peut pas collecter de données sans accord explicite de l’utilisateur. Ensuite, les navigateurs eux-mêmes bloquent ou limitent les cookies – Apple avec ITP supprime les cookies au bout de 7 jours environ. Si on additionne les deux, on peut tomber à 40-60% de son trafic réellement mesuré. Le reste, c’est du néant.

La réponse de google analytics 4 à ce problème, c’est la modélisation. Du machine learning qui reconstitue ce qu’il ne peut pas mesurer directement.

D’un seul coup, on voit tous à partir du moment où la modélisation s’active, on voit d’un seul coup dans les rapports tout son trafic… C’est assez impressionnant à voir. Et chez les clients chez qui la modélisation s’active, il y a toujours un ‘waouh mais comment ça fonctionne ?’

Impressionnant, oui. Et aussi un peu flippant. Parce que les conditions pour activer cette modélisation sont strictes – il faut suffisamment de trafic quotidien et avoir configuré le Consent Mode en mode avancé – et surtout, on ne sait pas exactement comment l’algorithme reconstitue les données manquantes.

Pour Anne Devillers, c’est ici que se situe la vraie black box de GA4. Pas dans les rapports manquants (ça, ça se règle en construisant les rapports). Dans cette modélisation opaque qui gonfle d’un coup tous vos KPI et sur laquelle vous n’avez aucune prise. C’est exactement le problème.

Et cette question de la donnée perdue est directement liée au sujet des cookies – si vous voulez aller plus loin sur ce terrain, la fin des cookies tiers a fait l’objet d’un épisode entier sur Bannouze, avec des éclairages complémentaires sur les alternatives qui émergent.

Le cas RGPD : google analytics 4 était-il vraiment illégal ?

Techniquement, oui. Pendant un moment.

La CNIL avait déclaré GA illégal – pas à cause du consentement, mais parce que les données étaient hébergées aux États-Unis, où les agences de renseignement américaines pouvaient théoriquement y accéder. Le Privacy Shield, l’accord censé encadrer ces transferts de données entre l’Europe et les États-Unis, avait été retoqué par la Cour de justice européenne – en 2020, si je me souviens bien.

La CNIL avait bien tenté un compromis : utilisez GA via un proxy qui anonymise l’IP et modifie les identifiants cookies. Mais comme le note Anne, si vous alliez jusqu’au bout des recommandations, ça servait plus à grand chose d’utiliser GA.

Depuis l’été 2023, un nouveau texte encadre ces transferts de données. L’illégalité est donc – pour l’instant – levée. Mais Anne est prudente :

Ça veut pas dire que ça va pas de nouveau se retrouver devant la Cour européenne de justice et que le texte ne pourra pas se faire retoquer une nouvelle fois.

Dit autrement : on est sur du sable. Ce sujet du tracking et du consentement s’articule aussi avec des questions plus larges sur la mesure et l’attribution marketing dans un monde cookieless – un épisode avec Margarita Zlatkova de Weborama avait creusé ce terrain avec un angle programmatique intéressant.

Et il y a aussi la question des alternatives. Piano (qui a racheté AT Internet), Matomo, Adobe Analytics… Google analytics 4 reste ultra-dominant, mais la communauté analytics européenne commence à regarder ailleurs – surtout depuis l’épisode CNIL. Ce mouvement vers des outils de mesure sans dépendance aux cookies est lent, mais il existe.

Ce qu’un annonceur doit vérifier aujourd’hui dans google analytics 4

Deux points concrets, tirés directement de l’expérience d’Anne sur le terrain.

Premier point : la durée de conservation dans Explorer. Aller dans l’administration, trouver l’option de conservation des données, passer de 2 mois à 14 mois. Maintenant. Pas la semaine prochaine.

Deuxième point : les événements collectés automatiquement. C’est un vrai avantage de google analytics 4 sur Universal – les clics sortants, les téléchargements, les interactions vidéo YouTube, les recherches internes sont capturés sans configuration supplémentaire. Dans l’ancienne version, il fallait des tags dédiés pour chaque interaction. Mais ces données sont là sans être facilement accessibles – il faut savoir construire les rapports pour les lire.

C’est un paradoxe un peu agaçant : l’outil collecte plus que jamais, mais l’interface présente moins qu’avant. Et ce travail de configuration – construire ses rapports personnalisés, comprendre Explorer, éventuellement connecter BigQuery – demande une montée en compétence réelle. Ce n’est pas insurmontable, mais ce n’est pas non plus ce qu’on vous vendait avec le discours ‘GA4, c’est plus simple et plus puissant’.

Pour ceux qui veulent progresser : Google Skills Shop propose une formation gratuite. Analytics Mania (Julius Fedorovicus, chaîne YouTube et blog très fournis) est la référence anglophone. En français, les agences Unnest et Bseven publient régulièrement. Et pour le tracking web au sens large, un épisode complet sur Tag Manager et les plans de tracking est disponible sur Bannouze – c’est le socle technique sans lequel GA4 ne sert pas à grand chose.

Reste une question sur laquelle Anne n’a pas de réponse tranchée – et honnêtement, personne n’en a : est-ce que google analytics 4 est vraiment au niveau de ce qu’on est en droit d’attendre d’un outil qui agrège tout l’écosystème d’acquisition d’une boîte ? Quand on pense que même un bug de remontée des campagnes Google Ads dans Google Analytics – deux produits du même groupe – a duré des semaines l’été dernier, la question mérite d’être posée.

Mais bon. C’est gratuit. Et comme dit Anne en citant la formule connue : quand le produit est gratuit, c’est vous le produit. Ce qui ne veut pas dire qu’on doit tout accepter – ça veut dire qu’on sait exactement ce qu’on vaut dans l’équation. Et ça, ça change la façon dont on lit ses propres données. La question de la dépendance à l’écosystème Google – GA4, BigQuery, Google Ads, tout interconnecté – est aussi au coeur des enjeux SEA que un épisode sur les enjeux SEA 2024-2025 avait commencé à décortiquer.

Questions fréquentes

Pourquoi google analytics 4 a-t-il été si mal reçu à son lancement ? +
Plusieurs raisons se sont superposées. D'abord, le passage à GA4 était obligatoire à l'été 2023, sans possibilité de récupérer l'historique de données d'Universal Analytics - certaines équipes perdaient 10 ans de données d'un coup. Ensuite, le produit avait des bugs réels : des rapports de base manquants, des métriques mal nommées, le taux de rebond qui avait disparu. Et par-dessus tout, Google n'a communiqué ni roadmap ni porte-parole identifié, laissant une communauté massive de consultants et d'agences sans interlocuteur.
Qu'est-ce que la modélisation dans GA4 et comment ça fonctionne ? +
Quand un utilisateur refuse les cookies ou que son navigateur bloque le tracking, google analytics 4 peut utiliser du machine learning pour reconstituer les données manquantes. On peut tomber à 40-60% de trafic réellement mesuré sans cette fonctionnalité. La modélisation s'active sous conditions : trafic quotidien suffisant et configuration du Consent Mode en mode avancé. Concrètement, tous les KPI augmentent d'un coup dans les rapports dès que la modélisation est active. La limite : on ne sait pas exactement comment l'algorithme fonctionne.
Comment augmenter la durée de conservation des données dans GA4 ? +
Par défaut, la section Explorer de google analytics 4 ne conserve que 2 mois de données. Dans l'administration du compte, une option 'durée de conservation de la donnée' permet de passer à 14 mois. Attention : ce n'est pas rétroactif, donc plus vous attendez, plus vous perdez d'historique. Au-delà de 14 mois, il faut exporter vers BigQuery.
Google Analytics 4 est-il légal en France après les décisions de la CNIL ? +
La CNIL avait déclaré GA illégal parce que les données transitaient aux États-Unis, où les agences de renseignement pouvaient y accéder. Depuis l'été 2023, un nouveau cadre juridique - successeur du Privacy Shield - encadre ces transferts de données entre l'Europe et les États-Unis. google analytics 4 est donc à nouveau légal. Mais rien ne garantit que ce texte ne sera pas à son tour contesté devant la Cour de justice européenne.
Quelles ressources pour apprendre google analytics 4 gratuitement ? +
Google Skills Shop propose une formation gratuite en ligne, bonne première étape. En anglais, Analytics Mania (Julius Fedorovicus) est la référence avec une chaîne YouTube et un blog très complets. En français, les agences Unnest et Bseven publient régulièrement du contenu de qualité. Sur LinkedIn, des profils comme Juliana Jackson, Dana DiTomasso ou Charles Farina partagent des actualités souvent avant les annonces officielles de Google.
Quelles sont les alternatives à GA4 pour les entreprises européennes ? +
Les principales alternatives citées sont Piano (qui a racheté l'ancien AT Internet), Matomo, Adobe Analytics et Piwik. Pour les entreprises sensibles à la question de la souveraineté des données, Matomo présente l'avantage de pouvoir être hébergé en Europe. Aucune de ces alternatives n'a la part de marché de google analytics 4, mais l'épisode CNIL a clairement accéléré les questionnements dans certaines DSI.

Épisodes similaires

  • Social Ads & Acquisition