Bannouze : Le podcast du marketing digital !

#86 Tout savoir sur les data clean rooms

Épisode diffusé le 1 juin 2023 par Bannouze : Le podcast du marketing digital !

Écouter l'épisode :

0:00 --:--

Vitesse

La data clean room, c’est le mot qu’on entend partout depuis 2022 sans que personne ne prenne vraiment le temps d’expliquer ce que ça change concrètement pour un annonceur ou un éditeur. Paul Ripart, directeur commercial programmatique et data chez Prisma Media – une trentaine de marques médias au compteur, dont Télé Loisirs – a accepté d’en parler sans langue de bois dans le podcast Banooz. Et ce qu’il dit mérite qu’on s’y attarde.

Pas pour la définition. La définition, tu la trouves partout. Mais pour comprendre pourquoi ce concept arrive maintenant, dans ce contexte précis, et ce qu’il révèle des tensions qui traversent le marché de la data depuis la mort annoncée du cookie tiers. Et aussi – soyons honnêtes – pourquoi il y a un risque réel de se retrouver avec autant de data clean rooms qu’il existe de walled gardens.

Ce que « sécurisé » veut vraiment dire ici

Définir la data clean room comme « un environnement sécurisé de partage de données » – c’est la version Wikipedia. Pas fausse, mais elle occulte l’essentiel. Le vrai problème qu’elle résout, c’est le suivant : comment je mets ma donnée à disposition d’un partenaire commercial sans qu’elle parte se balader ailleurs ?

Paul Ripart pose ça très clairement :

« Je veux pas que ma donnée puisse se balader n’importe où, qu’elle soit utilisée n’importe comment parce que premièrement c’est illégal et deuxièmement, je n’ai pas envie de ça. »

Dit comme ça, ça a l’air simple. Mais derrière cette phrase, il y a dix ans de frustration accumulée des éditeurs face aux annonceurs qui demandaient de la donnée sans vraiment s’embarrasser du cadre légal. Le RGPD a changé la donne. Le DPO est entré dans la conversation. Et du coup, la question n’est plus « est-ce que je partage ma data » mais « dans quel cadre je la partage ».

La data clean room répond précisément à ça. Deux entités mettent leurs données en commun dans une plateforme tierce – ou propriétaire – elles font des croisements, des analyses, des insights. Mais personne n’exporte la donnée individuelle. Tu peux savoir que les acheteurs de Tena regardent plutôt TF1 que France 2. Tu ne peux pas récupérer la liste des emails des acheteurs de Tena. Nuance fondamentale.

Ce qui m’intéresse là-dedans, c’est que cette contrainte – qu’on pourrait voir comme une limitation – est en fait ce qui rend le truc commercialement viable. Sans cette garantie, aucun éditeur sérieux ne jouerait le jeu. Et faire de la publicité sans accès à la donnée, on sait ce que ça donne.

Le cas Essity chez Prisma : quand la data clean room devient outil d’insight

Bon. La théorie, c’est bien. Mais Paul Ripart donne un exemple concret qui vaut mieux que toute définition.

Essity – le groupe derrière Lotus, Nana, Tena – est un grand industriel. Et les grands industriels ont un problème structurel que les gens de l’adtech oublient parfois : ils vendent via des intermédiaires. Carrefour, Amazon, les grandes surfaces. Résultat ?

« L’industriel n’a pas accès à la donnée, il a pas de données. Et donc pour avoir accès à de la donnée bah il va devoir la demander ailleurs. »

Voilà le point de départ. Essity veut savoir quels programmes TV regardent les gens qui achètent du Tena. Prisma Media a la base Télé Loisirs. Le croisement se fait dans la data clean room : les personnes présentes dans le programme de fidélité d’Essity qui consultent aussi Télé Loisirs, qu’est-ce qu’elles regardent comme chaînes ? TF1 ? M6 ? Arte (spoiler : probablement pas) ?

L’objectif final, c’est du reciblage sur l’open web avec une monnaie qui n’est plus le cookie. Mais la première étape – l’insight – c’est déjà une valeur en soi. Tu sais où tes clients passent leur temps. Tu sais ce qu’ils consomment comme contenu. Et tu peux construire une stratégie media autour de ça.

Ce que ce cas illustre aussi, c’est la transformation du rôle de l’éditeur. Prisma ne vend plus seulement de l’inventaire publicitaire. Il devient partenaire data. Paul Ripart le dit explicitement : l’idée est de se demander si, en plus d’être un simple partenaire média, il peut devenir un partenaire data. Et franchement, pour un éditeur qui a une trentaine de marques et des millions d’utilisateurs enregistrés, ce pivot a du sens.

La data clean room en pratique : pas si compliqué, sauf sur un point

Techniquement, la mise en place est décrite comme « assez simple » par Paul Ripart. Clic bouton, interface classique, pas de compétences d’ingénieur data requises pour les cas d’usage courants. C’est volontairement fait pour que « le commun des mortels » puisse l’utiliser.

Le vrai point de friction ? Le juridique.

« Les principales difficultés vont être souvent d’ordre juridique. Il faut avoir du coup bah de la part de son entreprise, la possibilité de pouvoir travailler avec un fournisseur de Data Clean room et de mettre ses données à disposition là-dedans. »

Et c’est souvent là que ça coince. Pas parce que le droit est incompréhensible, mais parce que faire valider un nouveau cas d’usage data par son DPO, son service juridique, et parfois sa direction générale – ça prend du temps. Beaucoup de temps. (Ce qui explique pourquoi certains projets data clean room traînent depuis deux ans dans les tuyaux de grandes entreprises sans jamais voir le jour.)

Une fois le cadre juridique posé, l’opérationnel suit. Et là, les plateformes comme LiveRamp – avec qui Paul Ripart travaille – ont fait un effort réel sur l’accessibilité. On est loin des DMP des années 2015-2018 qui nécessitaient une équipe data dédiée pour chaque manipulation.

Pour ceux qui veulent comprendre comment le tracking et la collecte de données fonctionnent en amont de tout ça, l’épisode sur le plan de tracking et Tag Manager pose de bonnes bases.

Le problème des walled gardens : trop de data clean rooms tuent la data clean room

C’est le moment où la conversation devient vraiment intéressante. Et un peu inquiétante.

Chaque walled garden a développé sa propre data clean room. Amazon a la sienne. Google a la sienne. Et les acteurs indépendants – LiveRamp en tête – ont les leurs. Résultat : si tu veux activer ta donnée sur l’ensemble de l’écosystème digital, tu dois potentiellement jongler avec trois, quatre, cinq environnements différents.

Paul Ripart le formule avec une lucidité désarmante :

« On se retrouve face à cette espèce de multitude et c’est là-dessus un peu dommage de Data Clean room à savoir j’ai une Data Clean room un peu d’Open Web que je vais utiliser qui est celle de Liveramp… Par contre, quand je vais vouloir travailler sur une Data Clean room dans l’environnement Amazon, je vais utiliser la Data Clean room d’Amazon. »

C’est exactement le problème. On a passé des années à essayer de réduire la fragmentation de l’adtech – méta-DSP, méta-SSP – et voilà qu’on recrée la même fragmentation sur la couche data. Le marché finira probablement par s’y adapter. Mais entre-temps, les équipes marketing qui voulaient simplifier leur stack se retrouvent avec une nouvelle complexité à gérer.

L’idée d’un « méta-data clean room » – évoquée en boutade dans le podcast – n’est pas si absurde. Quelqu’un finira par le faire. La question c’est qui, et à quel prix. Et quelle dépendance ça crée.

Cette tension entre open web et walled gardens, on l’a déjà explorée sous l’angle budgétaire dans l’épisode sur la répartition des budgets pub entre l’open web et les GAFAM. Le schéma se répète, couche après couche.

Identifiants et fin des cookies : la data clean room comme infrastructure post-cookie

Difficile de parler de data clean room en 2023 sans parler de la fin des cookies tiers. Les deux sujets sont intrinsèquement liés – même si la data clean room existait avant et existera après.

Le point central, c’est l’identifiant. Un cookie, en gros, c’est un identifiant temporaire et facilement effaçable. Les data clean rooms se sont construites – ou reconstruites – autour d’identifiants plus stables : l’adresse email en particulier.

Paul Ripart donne l’exemple de [email protected]. Cette adresse, je l’utilise pour me connecter à Télé Loisirs. Je l’utilise aussi pour ma carte de fidélité Carrefour. Elle devient une variable de réconciliation entre deux bases de données sans qu’on ait besoin d’un cookie tiers pour faire le lien. Et contrairement au cookie, elle ne disparaît pas quand l’utilisateur vide son cache.

LiveRamp a d’ailleurs construit son identifiant – le RampID – précisément sur cette logique d’email haché. D’autres acteurs ont fait des choix différents. Mais le principe converge : trouver un identifiant persistant, consenti, qui fonctionne cross-device et cross-domaine.

Le sujet des identifiants alternatifs au cookie a été traité en détail dans l’épisode sur la fin des cookies tiers et les ID persistants – si tu veux aller plus loin là-dessus. Et pour la mesure et l’attribution dans ce contexte post-cookie, cet épisode avec Weborama est solide.

Ce que j’aurais voulu qu’on me dise – enfin, ce que j’aurais voulu qu’on dise plus clairement – c’est que la data clean room n’est pas une solution à la fin des cookies. C’est une infrastructure qui peut fonctionner sans cookies. La nuance est importante. Un annonceur qui n’a pas de first party data solide, pas de programme de fidélité, pas d’emails collectés avec consentement – il arrivera dans une data clean room avec les mains vides. Et une data clean room vide d’un côté, ça ne croise rien.

Qui propose des data clean rooms aujourd’hui – et pourquoi tout le monde se lance

Le marché explose. Paul Ripart le note avec un mélange d’enthousiasme et de prudence : le nombre d’acteurs qui se lancent sur ce segment est un signal fort de demande. Mais ça ne dit rien sur la consolidation à venir.

Les grandes catégories d’acteurs :

Les walled gardens avec leurs environnements propriétaires : Amazon Marketing Cloud, Google Ads Data Hub
Les acteurs spécialisés indépendants : LiveRamp, InfoSum, Habu
Les plateformes data généralistes qui pivotent : Snowflake, qui a lancé sa couche clean room en s’appuyant sur son infrastructure cloud

Les anciens DMP reconvertis tentent aussi leur chance. Et des acteurs BI pure players regardent le marché. Bref, tout le monde veut sa part. Ce qui est logique quand la demande est là – mais qui va mécaniquement créer un marché sur-encombré avant consolidation.

La vraie question pour un annonceur ou un éditeur qui doit choisir : est-ce que je prends un acteur indépendant qui fonctionne sur l’open web, avec le risque de ne pas couvrir les inventaires walled garden ? Ou est-ce que j’accepte de me fragmenter entre plusieurs environnements ?

Pour l’instant, la réponse pragmatique de la plupart des acteurs semble être : on commence par l’open web avec un acteur comme LiveRamp, et on gère les walled gardens au cas par cas. Pas très élégant. Mais réaliste. La vidéo en programmatique pose d’ailleurs des questions similaires sur la fragmentation des inventaires – les mêmes arbitrages reviennent systématiquement.

Ce qui est certain : la data clean room n’est plus un sujet de niche réservé aux équipes data des grandes régies. En 2023, c’est entré dans les conversations des CMO et des directeurs médias. Et quand Paul Ripart dit qu’il espère devenir un partenaire data autant qu’un partenaire media pour ses annonceurs – c’est exactement ce mouvement-là qu’il décrit. L’éditeur qui ne joue pas cette carte dans les deux ou trois ans qui viennent va laisser de la valeur sur la table.

Reste à voir si le cadre juridique suivra à la même vitesse que la technologie. Ce n’est pas gagné.

Questions fréquentes

C'est quoi une data clean room exactement ? +

Une data clean room est une plateforme sécurisée dans laquelle deux entités - par exemple un éditeur et un annonceur - mettent en commun leurs données pour les croiser et en tirer des insights. La particularité fondamentale : personne n'exporte les données individuelles. On voit les résultats des croisements, pas les lignes de données brutes. C'est ce qui la distingue d'un simple partage de fichiers CSV et ce qui la rend compatible avec le RGPD.

Quelle est la différence entre une data clean room et du second party data classique ? +

L'objectif final est similaire - croiser deux bases de données entre partenaires. Mais la data clean room ajoute une couche de sécurité et de conformité juridique. Avec du second party data classique, la donnée peut techniquement sortir de l'environnement et être réutilisée. Dans une data clean room, l'accès est contrôlé et l'extraction de données individuelles est bloquée. C'est la garantie que l'éditeur ne perd pas le contrôle de son actif le plus précieux.

La data clean room fonctionne-t-elle sans cookies tiers ? +

Oui, et c'est l'un de ses atouts majeurs dans le contexte actuel. La plupart des data clean rooms s'appuient sur des identifiants basés sur l'email haché - comme le RampID de LiveRamp - plutôt que sur des cookies. Ces identifiants sont plus stables, consentis, et fonctionnent cross-device. La data clean room n'est pas une réponse directe à la fin des cookies, mais elle fonctionne parfaitement dans un écosystème sans eux.

Quelles entreprises proposent des data clean rooms en France ? +

Le marché est fragmenté entre plusieurs catégories. Du côté des acteurs indépendants : LiveRamp, InfoSum, Zeotap, Snowflake. Du côté des walled gardens : Amazon Marketing Cloud, Google Ads Data Hub. Des acteurs comme The Trade Desk ou AppNexus proposent aussi des environnements similaires. Le problème, c'est que ces environnements ne communiquent pas entre eux - ce qui oblige les annonceurs à jongler entre plusieurs plateformes selon leurs inventaires cibles.

Est-ce compliqué à mettre en place une data clean room pour un éditeur ? +

Techniquement, non. Les interfaces sont conçues pour être accessibles sans compétences data avancées. Le vrai frein est juridique : il faut valider le cadre légal avec son DPO, obtenir les autorisations internes, et signer les accords commerciaux avec le fournisseur de la plateforme. Ce processus peut prendre plusieurs mois dans les grandes structures.

Un annonceur sans first party data peut-il utiliser une data clean room ? +

Difficilement. Une data clean room croise deux bases de données - si l'une d'elles est vide ou très pauvre, les insights produits seront limités. C'est la limite réelle du concept : il suppose que l'annonceur a déjà investi dans la collecte de données consenties - programme de fidélité, base email, compte client. Sans ça, la data clean room n'a rien à croiser de son côté.

Podcast précédent

Podcast suivant

Épisodes similaires

Social Ads & Acquisition