IA Générative, voix et image : les aspects juridiques à ne pas négliger
TOC Example

La contrathèque
Accédez gratuitement à nos modèles de contrats et templates
Découvrez un décryptage clair d'un enjeu concret, avec un regard juridique et des solutions pratiques.
IA Générative, voix et image : les aspects juridiques à ne pas négliger
On parle beaucoup du droit d’auteur dans le cadre de l’IA générative. Mais les enjeux juridiques ne s’arrêtent pas là. Voix et image, lorsqu’elles sont utilisées pour entraîner ou exploiter un modèle d’intelligence artificielle, soulèvent des questions tout aussi sensibles — et parfois moins balisées.
Entraîner une IA : attention aux droits de la personnalité
Quand une IA est nourrie avec des voix ou des images de personnes réelles, on touche à des attributs de la personnalité, protégés par le droit français (article 9 du Code civil). En pratique, cela signifie que :
- Si l’image ou la voix est captée directement, il faut l’autorisation explicite de la personne concernée pour utiliser son image / sa voix aux fins d’entraîner un modèle d’IA.
- Si l’utilisateur fournit ces éléments en input dans un outil d’IA, la même autorisation doit être prévue dans les conditions d’utilisation du service.
Autrement dit : le scraping sauvage est juridiquement risqué (et soit-dit en passant : pas seulement au regard des droits de la personnalité).
Générer des voix ou des images pour entraîner une IA : une solution ?
Créer artificiellement un corpus de voix ou d’images, sans rattachement possible à une personne réelle, permet en principe d’éviter les contraintes liées aux droits de la personnalité. Mais attention :
- Il faut vérifier que les conditions d’utilisation du modèle génératif autorisent un tel usage des outputs.
- Et s’assurer que le fournisseur de ce modèle, lui-même, a respecté les règles en matière de données lors de l’entraînement de son propre système.
Et le RGPD dans tout ça ?
La voix et l’image permettent d’identifier une personne : ce sont donc des données personnelles. Leur collecte à des fins d’entraînement suppose dès lors, entre autres :
- Une information claire des personnes concernées ;
- Le respect de l’une des bases légales prévues par le RGPD (par exemple le consentement, qui pourra être recueilli via l’autorisation évoquée plus haut).
Mais sont-elles aussi des données biométriques ?
Le RGPD définit les données biométriques comme des données personnelles résultant d’un traitement technique spécifique appliqué à des caractéristiques physiques ou comportementales (ex. : reconnaissance faciale ou vocale), en vue d’identifier de manière unique une personne.

Ce point est déterminant : si la voix et/ou l’image étaient qualifiées de données biométriques, leur traitement serait en principe interdit, sauf exceptions très encadrées. Cela rendrait leur utilisation dans des systèmes d’entraînement d’IA particulièrement complexe sur le plan juridique.
Pour l’instant, la CNIL et le Comité européen de la protection des données (CEPD) estiment qu’une image ou une voix brute, sans traitement technique d’identification associé, ne constitue pas une donnée biométrique.
Mais cette position pourrait évoluer. Une interprétation plus large par la Cour de justice de l’Union européenne n’est pas exclue, notamment si le traitement porte une atteinte jugée significative aux droits fondamentaux de la personne.
En l’état, il semble en tout cas raisonnable de considérer que l’image et la voix sont des données personnelles "classiques", à traiter dans le respect du RGPD. Ce qui, déjà, suppose rigueur et transparence.
Et côté exploitation des contenus générés ?
- Si la voix ou l’image générée évoque une personne existante, on retombe dans le champ des droits de la personnalité : l’autorisation de la personne est requise pour l’usage projeté de son image et/ou de sa voix, même générées par IA.

Exemple : en 2023, un morceau intitulé Heart On My Sleeve, généré par IA, imitant les voix de Drake et The Weeknd, a atteint plusieurs millions de vues sur TikTok avant d’être retiré. Les artistes n’avaient pas donné leur accord pour l’utilisation de leur voix, même synthétisée.
- Si le contenu est totalement fictif (sans lien identifiable avec une personne réelle), il faudra vérifier les droits d’usage accordés par le modèle génératif pour déterminer si l’usage projeté est possible ou non.
L'abonnement juridique illimité pour les entrepreneurs
Fonds publics, conflit d'associés, mise en conformité RGPD, M&A, contentieux : découvrez toutes nos offres conçues pour les startups.