Vous avez probablement entendu parler, reçu un email ou aperçu un pop-up dans Google Analytics concernant ce changement : les propriétés Universal Analytics standards ont cessé de traiter les nouvelles données depuis le 1er juillet 2023. La date limite pour les propriétés 360 Universal Analytics a été repoussée au 1er juillet 2024.
Si vous êtes récemment passé de Universal Analytics (UA) à Google Analytics 4 (GA4), vous vous êtes peut-être posé la question suivante : "Pourquoi mes données diffèrent-elles entre UA et GA4 ?". Si cette situation vous semble familière, nous aimerions vous guider à travers six raisons potentielles qui pourraient éclairer les divergences de données que vous observez.
1. Indicateurs clés
Les indicateurs clés tels que les utilisateurs, les sessions, les conversions, les événements, etc. ont des définitions et des méthodologies de comptage différentes dans UA et GA4. Prenons l'exemple du comptage des utilisateurs. Les propriétés UA utilisent l'ID du client, tandis que les propriétés GA4 utilisent l'ID de l'utilisateur. En outre, les propriétés UA affichent le nombre total d'utilisateurs, tandis que les propriétés GA4 affichent le nombre d’utilisateurs actifs.
Les sessions sont un autre indicateur clé qui diffère. Dans UA, les sessions s'interrompent à minuit, ce qui signifie que si vous commencez à naviguer sur un site web à 23h59 et que vous continuez jusqu'au lendemain, UA enregistrera deux sessions. En revanche, GA4 ne redémarre pas les sessions à minuit, et n'enregistrera donc qu'une seule session pour la même activité de navigation.
Pour mieux comprendre les différences des indicateurs clés entre UA et GA4, je vous recommande de consulter cet article qui fournit une comparaison détaillée.
2. Reporting Identity
Il y a trois façons d'identifier les utilisateurs dans GA4 :
- Blended : cette méthode d'identification prend en compte l’ID de l'utilisateur, les Google Signals, l’ID de l'appareil et les données modélisées.
- L’ID de l'utilisateur est un identifiant unique généralement généré lors de la connexion, basé sur l'adresse e-mail par exemple.
- Si aucun identifiant n'est collecté, les informations provenant des Google Signals seront utilisées. Google Signals est une fonctionnalité qui fournit des données inter-appareils provenant d'utilisateurs de sites web qui se sont connectés à leur compte Google (par exemple Gmail) et qui ont activé la personnalisation des annonces.
- Si l’ID utilisateur ou les Google Signals ne sont pas disponibles, l'ID de l'appareil sera utilisé. L’ID de l'appareil, également appelé ID du client, est un identifiant aléatoire généré automatiquement pour un appareil. Il ne doit pas être confondu avec l’ID de l'utilisateur.
- Si aucun identifiant n'est disponible, la modélisation sera utilisée.
- Observed : cette méthode prend en compte l’ID de l'utilisateur, les Google Signals et l’ID de l'appareil. Elle est similaire à l'approche “blended”, mais n'implique pas de modélisation.
- Device-based : cette méthode repose uniquement sur l’ID de l'appareil.
3. Comptage des conversions
Dans UA, une conversion n'était comptée qu'une seule fois par session. Lorsque GA4 a introduit les conversions, une conversion était comptabilisée à chaque fois que l'événement était déclenché. Depuis, cela a été modifié dans GA4 et il est désormais possible de sélectionner la méthode de comptage au niveau de chaque conversion. Cela signifie que vous avez la possibilité de choisir si une conversion doit être comptabilisée une fois par session (comme pour UA) ou à chaque fois que l'événement se déclenche.
Il est important de noter que ce changement de méthode de comptage n'est pas appliqué rétroactivement. Si vous modifiez la méthode de comptage, les données seront comptabilisées différemment pour les conversions qui ont eu lieu avant et après la modification.
4. Modélisation
La modélisation fait référence à l'utilisation de techniques d'apprentissage automatique pour combler les lacunes des données et estimer les conversions qui ne peuvent pas être observées directement. La modélisation est une fonctionnalité exclusive de GA4. Il existe plusieurs exemples de modélisation des conversions dans GA4, dont certains sont présentés dans cet article.
- L'une des techniques de modélisation utilisées par GA4 est la modélisation comportementale pour le “consent mode”. Le “consent mode” est utilisé pour modéliser les conversions manquantes pour les utilisateurs qui ont refusé les cookies analytiques. Il s'appuie sur le comportement des utilisateurs qui ont accepté les cookies analytiques pour estimer les conversions de ceux qui les ont refusés.
- En outre, Google a annoncé l'utilisation des “enhanced conversions” pour modéliser les conversions en ligne à partir de Q2 2023. Les “enhanced conversions” sont une fonctionnalité qui améliore la précision de la mesure des conversions lorsque les cookies ne sont pas disponibles, en s'appuyant sur des “first-party data”.
5. Filtres
Dans UA, les filtres sont un outil puissant utilisé pour modifier les données dans une vue. Ils permettent également d'inclure ou d'exclure des données spécifiques. Dans les propriétés GA4, les filtres ne sont actuellement pas pris en charge de la même manière. Le seul type de filtre disponible dans GA4 est l'exclusion du trafic interne et des développeurs et il n'est d’application que lorsque vous appliquez un filtre.
6. Attribution
UA utilise un modèle d'attribution dernier clic cross-canal, tandis que GA4 utilise différents modèles d'attribution en fonction des rapports que vous consultez. Cependant, UA et GA4 ont en commun d'exclure les visites directes du crédit d'attribution, à moins que le chemin de conversion ne soit constitué uniquement de visites directes.
Si vous avez récemment mis en place GA4, il est possible d'observer une part plus importante de trafic attribuée à Direct par rapport à vos données UA. Cela s'explique par le fait que GA4 dispose de moins de données historiques pour catégoriser et attribuer avec précision le trafic sur votre site web.
En conclusion, il est important de noter que la liste fournie n'est pas exhaustive et qu'il peut y avoir d'autres facteurs contribuant aux divergences de données entre les propriétés UA et GA4. Il est peu probable que l'on obtienne des données parfaites, et il est normal qu'il y ait un certain niveau de divergence. Toutefois, si vous constatez une disparité importante entre les deux plateformes, il convient d’investiguer pour s'assurer qu'il n'y a pas de problème de tracking sous-jacent. Si vous souhaitez obtenir de l'aide pour analyser vos données, n'hésitez pas à nous contacter.