Fonctionnement d’un outil de mesure d’audience
Notre outil de mesure d’audience est structuré autour de 3 grands processus :
- La collecte de données : elle doit être la plus rapide possible, scalable afin de permettre d’amortir une hausse de trafic et le tag doit bien sûr être le plus petit possible.
- L’analyse de ces données : le traitement de Bigdata (plusieurs Go par jour) doit impérativement être fait dans un langage le moins gourmand possible.
- L’affichage des données : il doit être rapide et optimisé quel que soit le type de client.
Pour chaque processus, nous avons étudié le meilleur choix technologique afin d’optimiser chaque étape.

Avec plusieurs milliers de clients, l’interface doit être compréhensible aisément et en même temps personnalisable et complète.
Plusieurs Go de données sont générés par jour. Notre infrastructure doit donc pouvoir les compresser pour les rendre affichage par une interface web rapidement.
Chaque page vue d’un site client fait un hit sur nos serveurs. Notre infrastructure doit donc être capable de tenir une charge de plusieurs milliards de hits par mois avec des pics à plusieurs millions par heure.
Pour chaque processus, nous avons étudié le meilleur choix technologique afin d’optimiser chaque étape.
Résumé des choix opérés
- Une optimisation du marqueur pour limiter le trafic web
- Choix du langage Rust pour l’analyse et le traitement de données
- Pas ou peu de base de données (la plupart des données sont stockées en fichier plat
- Multi cloud souverain notamment pour la collecte pour garantir la cette fonctionnalité stratégique
- Modification de l’architecture logicielle afin de réutiliser les serveurs de mesure la nuit (sous-utilisation technique)