Menu

Lexique · IA technique en contexte juridique

Données synthétiques

IA technique en contexte juridique

Données générées artificiellement (souvent par un modèle) pour reproduire les propriétés statistiques d'un jeu de données réel, sans contenir les enregistrements individuels d'origine.

Définition

Les données synthétiques sont mobilisées pour entraîner ou tester un modèle quand les données réelles sont sensibles, rares, ou indisponibles. Elles sont aussi utilisées pour équilibrer un jeu d'entraînement (générer des cas sous-représentés) et atténuer certains biais.

Sur le plan RGPD, les données synthétiques bien conçues peuvent ne pas être des données personnelles. Mais la qualification est délicate : si les données synthétiques permettent, par recoupement, de réidentifier des personnes du jeu d'origine, le RGPD s'applique.

Pour les usages réglementés (santé, finance), les données synthétiques sont un outil prometteur mais pas une solution magique : leur représentativité doit être validée et documentée.

Ce que ça change concrètement

Pour un juriste ou un DRH belge.

  • 01

    Pour un projet IA santé en Belgique, recourir à des données synthétiques peut débloquer un cas d'usage que la voie « données réelles + DPIA » rendait difficile.

  • 02

    L'usage de données synthétiques doit être documenté dans la DPIA et dans la model card du modèle entraîné.

Un cas concret derrière le terme ?

Si ce terme correspond à une question opérationnelle dans votre organisation, on peut en discuter directement.

Me contacter