En 2019, Google a annoncé qu'une nouvelle version de Google Analytics était sur leur roadmap : GA4 (précédemment appelé App + Web). Fin 2020, ce nouveau produit a été officiellement lancé après une période bêta réussie.
La principale différence entre GA3 (universal analytics) et GA4 est le changement du schéma de données qui est maintenant basé sur les événements au lieu des sessions. Chez Semetis, depuis le début de l'année 2021, nous poussons nos clients à adopter ce nouveau produit puisqu’ il est devenu évident qu'il s'agit de l'avenir étant donné que plus aucune amélioration ne sera apportée à GA3 (la maintenance se poursuivra pendant un certain temps). Si vous souhaitez plus d'informations, consultez nos autres articles dans lesquels nous avons abordé les sujets suivants : introduction à GA4, comment configurer votre compte GA4, comment utiliser votre couche de données de commerce électronique améliorée existante pour GA4, et bien d'autres encore.
Une amélioration majeure de GA4 par rapport à GA3 est la possibilité d'exporter vos données vers Google BigQuery (Google Cloud Platform) pour tous les comptes et gratuitement alors que GA3 ne le permettait que pour les comptes premium (GA360). C’est cette fonctionnalité que nous allons introduire dans cet article.
Qu'est-ce que BigQuery ?
BigQuery est un entrepôt de données d'entreprise entièrement géré qui vous permet de stocker et d'analyser vos données. L'architecture sans serveur de BigQuery vous permet d'utiliser des requêtes SQL pour répondre aux plus grandes questions de votre entreprise, sans qu’aucune gestion de l'infrastructure soit nécessaire. BigQuery fonctionne parfaitement avec des données de toutes tailles, d'une feuille de calcul Excel de 100 lignes à plusieurs pétaoctets de données. Plus important encore, il est possible d’exécuter une requête complexe sur ces données en quelques secondes (téraoctets) ou minutes (pétaoctets).
Vous pouvez ensuite stocker vos données brutes dans BigQuery, transformer ces données à l'aide de SQL et stocker ce résultat dans une autre table BigQuery.
- Ingestion de données - vous pouvez importer des données (1) manuellement, (2) en utilisant l'API disponible dans la plupart des langages de programmation ou (3) en utilisant une solution d'intégration de données telle que Fivetran, Stitch, Supermetrics, etc.
- Transformation des données - vous pouvez manipuler les données à l'aide de la syntaxe SQL spécifique de BigQuery, qui est accompagnée d'une documentation très claire. En outre, des fonctionnalités intégrées telles que l'apprentissage automatique, l'analyse géospatiale et la veille stratégique sont également disponibles.
- Activation des données - les informations générées par la transformation de vos données peuvent ensuite être exploitées de différentes manières : exportation vers des fichiers csv/excel, connexion à des outils de BI pour des visualisations, exportation vers différentes plateformes telles que les audiences dans Google Analytics.
Enfin, il est important de noter que BigQuery n'est pas gratuit et que son coût dépend de la quantité de données stockées et traitées. De nombreux produits GCP (dont BigQuery) possèdent un "Free Tier", c'est-à-dire des limites mensuelles en dessous desquelles vous n'avez aucun coût. Le "Free Tier" de BigQuery offre 10 GB de stockage et 1 TB de traitement par mois. D'après notre expérience, ces coûts restent extrêmement bas, voir plus d'informations sur les prix ici.
Comment établir la connexion ?
Parce que ces deux produits font partie de l'écosystème Google, la mise en place d'une connexion pour envoyer vos données brutes GA4 vers BigQuery est extrêmement simple et ne nécessite que quelques clics, aucun code n'est nécessaire. Tout ce dont vous avez besoin est un compte GA4 et un compte Google Cloud Platform (GCP). Si vous n'avez pas encore de compte GCP, il est possible de commencer gratuitement soit :
- Utilisant le "BigQuery Sandbox" (disponible pour toute personne disposant d'un compte Google) permet d'utiliser BigQuery gratuitement (vous n'avez pas besoin de saisir les détails de votre carte de crédit) afin de vous assurer qu'il s'agit de la bonne solution pour votre entreprise. De nombreuses limitations s'appliquent, comme l'utilisation du "Free Tier" uniquement, voir la liste complète ici ;
- Lors de la création d'un compte (directement ou à partir de la sandbox), GCP offre un essai de 90 jours avec un crédit de 300$, permettant d'essayer tous leurs services. Notez que vous devrez enreistrer une carte de crédit, qui sera facturée dès que la période d'essai ou votre crédit sera terminé.
Google propose un tutoriel clair, étape par étape, pour configurer la connexion : [GA4] Set up BigQuery Export. Vous pouvez également consulter ce tutoriel.
Comment exploiter les données de GA4 dans BigQuery ?
Une fois la connexion établie, une base de données dans BigQuery avec la nomenclature "analytics_<property_id>" sera créée sous le projet GCP que vous avez sélectionné lors de l'établissement de la connexion. Chaque matin, une nouvelle table (ou table partitionnée) contenant toutes les données brutes de la journée précédente sera créée (si la fréquence "quotidienne" est choisie dans le paramétrage de la connexion).
Les données GA4 peuvent être utilisées pour une grande variété de projets :
- Répondre à toute question commerciale liée aux données. L'un de nos clients souhaitait comprendre comment ses utilisateurs interagissent avec les filtres produits de son site web dans le cadre d'une mission CRO/UX. Avec le bon tracking plan en place, nous avons pu créer un tableau de bord très détaillé pour visualiser l'utilisation des filtres entre les pays, le groupe de filtres les plus utilisés, le filtre menant à plus de conversions, etc. De plus, toute l'architecture a été déployée sur GCP, permettant une mise à jour entièrement automatisée des données sur une base quotidienne ;
- Création d'audience
- Prédiction de la LTV ;
- Prédiction du taux de désabonnement ;
- Et bien d’autres.
Ces projets peuvent très facilement utiliser les capacités intégrées de machine learning par le biais de BigQuery ML et les informations peuvent ensuite être poussées vers différentes plateformes pour être activées (par exemple, pousser les audiences dans GA).
Enfin, il est important de noter que les données que vous obtenez dans BigQuery diffèrent légèrement de celles que vous avez dans GA4 :
- Les dimensions PII (informations personnelles identifiables) telles que les adresses IP ne sont pas disponibles dans BigQuery ;
- Les variables basées sur les données internes de Google et les extrapolations telles que l'âge et le sexe ne sont pas disponibles dans BigQuery ;
- Les données créées dans Google Analytics, telles que les segments ou les coûts publicitaires (si elles sont liées à une plateforme) ne sont pas disponibles dans BigQuery.
Comment démarrer ?
Grâce à l'adoption massive de cette technologie, de nombreuses ressources et de use cases sont disponibles en ligne. Un bon point de départ est le cookbook BigQuery avec des exemples de requêtes ou le cours "Insights from Data with BigQuery", tous deux fournis par Google (uniquement pour GA3 pour le moment). Afin de générer des insights appropriés, vous devrez également vous assurer que votre tracking plan capture les bonnes données dans le format approprié. N'hésitez pas à nous contacter si vous souhaitez discuter du projet par lequel commencer, de la manière de configurer correctement votre plan de suivi et de créer des pipelines de transformation de données entièrement automatisés sur GCP.