« Quel(s) marché(s) de la donnée à l’heure de l’IA générative ? »

Le 21 janvier, s’est tenu le 5e Data & Business Day® dans les locaux de Cap Digital. Cette édition, labellisée « Sommet de l’action pour l’IA », organisé par le gf2i, Cap Digital et la FNPS, réunissait des experts autour de la question « Quel(s) marché(s) de la donnée à l’heure de l’IA générative ? ».

En ouverture, Denis Berthault, fondateur des Data & Business Day®, en a rappelé que le Data & Business Day® est né du constat que dans le monde numérique les données constituent la matière première et qu’il faut rapprocher producteurs et réutilisateurs potentiels de ces données. « Le Data & Business Day® est donc la réunion de ces producteurs et réutilisateurs potentiels pour parvenir à la création d’un marché BtoB des données ».

Après des premières éditions consacrées aux données de la ville intelligente, de la RSE, de l’information juridique et légale et des données agricoles, l’édition 2025 était dédiée aux enjeux, opportunités et défis que pose l’essor de l’IA générative pour le marché de la donnée. Deux tables rondes, animées par le journaliste spécialiste des questions numériques Emmanuel Parody, séquençaient la soirée.

De laa première table ronde proposait un état des lieux à partir d’exemples de plateformes thématiques, on retiendra les points clés :

  • La diversité des situations : que l’on parle de plateformes (Carole Guirado, journaliste et cheffe de projets Médias européen à l’AFP pour le projet TEMS, Rudy Cambier, Chef du Département Innovation et Partenariats industriels de l’IGN et Maxime Siret, Chef du produit numérique transport.data.gouv.fr) ou d’infrastructures de mise de mise en relation (Sébastien Picardat, ancien DG de agdatahub), certains marchés thématiques semblent constitués ou en voie de structuration (ex. données médias et données géographiques) tandis que d’autres apparaissent sous forme de perspectives voire de chimères (ex. données agricoles).
  • L’hétérogénéité des niveaux d’avancement des modèles économiques explique cette diversité de maturité : « la difficulté, c’est d’intéresser d’autres secteurs que les médias à nos données » (Carole Guirado) ; « l’enjeu pour l’IGN est d’être en capacité de mutualiser une infrastructure sur la géo-donnée » (Rudy Cambier) ; « est-ce que la logique d’intermédiation prévue par le législateur européen est possible ? » (Sébastien Picardat) ; « la vocation de la plateforme étatique [transport.data.gouv.fr] est de garantir la qualité et la mise à jour des données » (Maxime Siret).
  • La variabilité de l’impact de l’IA : « l’IA a très peu d’impact aujourd’hui en termes d’usages externes pour transport.data.gouv.fr » (Maxime Siret) ; « l’IA est une réalité avec des dégâts déjà constatés (deepfakes) et des opportunités (outils de vérification) » (Carole Guirado).
  • Des freins identifiés : « l’accessibilité aux données … » (Sébastien Picardat), « … de qualité » (Maxime Siret), « la difficulté à identifier des utilisateurs finaux payeurs » (Carole Guirado) et « la qualité de leur engagement » (Rudy Cambier).

De la seconde table ronde, qui abordait de manière transversale les questions de régulation et d’organisation du marché BtoB de la donnée, on retiendra comme axes forts :

  • L’adoption de règles de gouvernance des données constitue un levier essentiel pour le développement de données de qualité. « L’appréciation de cette qualité est subjective » (Jean-Marc Lazard, Président et co-fondateur d’Opendatasoft) et peut varier selon le moment et l’usage des données. S’« il y a plusieurs niveaux de gouvernance » (Fabrice Tocco, fondateur et co-CEO de Dawex), pour traiter les questions relatives à la circulation la traçabilité, l’identification des sources, la modification et la maintenance des données, ces règles sont indispensables à la structuration d’un marché de la donnée. Cette thématique de la gouvernance n’est pas sans soulever des difficultés, notamment au sein des services d’État, mais « l’IA pousse [à traiter ces questions] parce que la donnée fait partie du patrimoine de l’État » (Raphaël Bevenot, Chef adjoint du Datalab de la DINUM).
  • La fixation du prix de la donnée relève d’une pure logique de marché, la donnée n’ayant pas de prix en soi. « On se trouve donc face à une recherche classique d’équilibre entre vendeur et utilisateur » (Jean-Marc Lazard et Fabrice Tocco), l’accès à la donnée constituant souvent le critère de détermination du prix. « Cette question tend toutefois à se sophistiquer en raison de la multiplication des acteurs et des usages » (Jean-Marc Lazard), alors même que tous ne sont pas identifiés.
  • L’« IA apparaît comme un catalyseur de la connaissance des données » (Raphaël Bevenot). En facilitant le travail, elle permet de répondre plus rapidement aux demandes et engendre une multiplication des cas d’usage. Ainsi, « le marché, en son état actuel, est dans une situation d’effet de balancier prononcé » (Fabrice Tocco), dépendant du « niveau de rencontre de l’IA dans les métiers » (Thomas Saint-Aubin, associé et directeur de l’innovation et des affaires publiques de MyLegitech). Dans le monde du droit, « l’IA fait exploser la dichotomie information/conseil » (Thomas Saint-Aubin).
  • Les attentes à l’égard du régulateur sont simples : qu’il joue pleinement son rôle en devenant vraiment partie prenante dans la structuration du marché tout en continuant à favoriser l’ouverture des données. Associée à une régulation claire et effective, la collaboration entre acteurs publics et privés apparaît comme un levier essentiel à la structuration souhaitée du marché des données, afin de surmonter les défis identifiés au cours de la soirée.

Retrouvez le replay de ces échanges ici

 


 

Document à télécharger :
Pour visionner le replay

Groupement Français
de l’Industrie de l’Information

17, rue Castagnary 75015 Paris
Tél. +33 1 44 90 43 69