Extraction et indexation du contenu d’une base de données forment ensemble – juridiquement – le « carburant » d’un logiciel d’Intelligence Artificielle.
Sans « data », une IA n’est qu’un logiciel classique, un « programme d’ordinateur » (terme officielle utilisé par la Directive UE logiciel de 2009).
Ce qui permet à un logiciel de devenir une IA ? Ce sont les données qu’il traite et qui lui permettent de modifier ses « patterns », ses « modèles de classification » (en Molière dans le texte). Cliquez sur le lien pour accéder à notre présentation spéciale « intelligence artificielle » du 26 mai 2021.
L’exploitant d’un logiciel d’IA dispose-t-il du droit de « piocher » sans limite dans la base de données d’un tiers, un concurrent par exemple ?
Evidemment non, ce n’est pas juridiquement vrai !
Le caractère évident de ce « non » n’est pourtant valable juridiquement qu’en Europe, seule partie du monde qui a choisi dès 1996 de donner une valeur économique au contenu des bases de données.
Le droit d’utiliser une base de données est dénommé « droit sui generis » et encadre le droit à extraction et indexation qui est reconnu sur le contenu d’une base de données.
Ce droit de contrôler toute extraction et indexation du contenu d’une base de données (quelle que soit la nature des données) est accordé au « producteur » de ce contenu.
Les professionnels utilisent plutôt le terme de « scrapping » de base de données et se comprend selon l’idée suivante : « si des contenus sont techniquement disponibles sur le web, j’ai (donc) le droit de les utiliser« .
Rien n’est moins vrai, surtout pour les professionnels.
Voila qui mérite quelques explications juridiques, non ?
Bienvenue dans cette analyse tout en BD de la Directive 96/9 du 11 mars 1996.
information ? message ? données ? donnée INPUT ? donnée OUTPUT ?
Pour saisir la portée du droit de l’UE sur l’extraction et l’indexation du contenu d’une base de données, il faut maitriser le vocabulaire technique.
Petit rappel rapide.
Celles et ceux qui voudraient approfondir les notions de message / information / données pourront cliquer sur ce lien et visionner la vidéo+BD spéciale sur ce thème.
Et pour aller au fond des choses, voyons les notions de « données INPUT » (celles qui sont traitées) et les « données OUTPUT » (le résultat du traitement). C’est la propriété des données OUTPUT qui pose problème en cas de traitement par un logiciel d’IA, nous y reviendrons dans la partie finale de cette présentation.
contenant et contenu d'une base de données ?
La base de données envisagée comme un « contenant« , c’est une protection de type droit d’auteur qu’il faudra gérer. Rien qui nous intéresse ici. Pour creuser cet aspect des choses, cliquez sur ce lien.
Ce qui est juridiquement interessant, voire essentiel dans le régime de la Directive 96/9, c’est la protection conférée au contenu de la base de données, la protection spécifique des « data ».
Au profit de qui d’abord ? Du « producteur » du contenu.
les investissements du producteur sur le contenu de sa base de données
La protection sur le contenu d’une base de données est conférée légalement au « producteur« , à la personne qui prouve un investissement pour (i) constituer, (ii) vérifier et/ou (iii) présenter le contenu de sa base de données.
Vous allez le voir dans le slider ci-dessous, la jurisprudence est déjà abondante sur ces trois points.
le droit d'extraction et d'indexation sur le contenu d'une base de données (accrochez-vous...)
Le droit d’interdire toute extraction et indexation (ajout par une jurisprudence particulièrement intéressante de la Cour d’appel de Paris de février 2021) est le coeur du dispositif légal.
NON, il n’est pas autorisé de « piocher » sans autorisation dans le contenu d’une base de données, même techniquement accessible sur le web.
droit de réutilisation du contenu d'une base de données
Si vous faites une extraction du contenu d’une base de données, c’est pour vous en resservir, non ?
Aperçu du régime légal autour du droit de réutilisation (de ce contenu).
les droits de l'utilisateur légitime du contenu d'une base de données (c'est rapide)
Si vous utilisez de manière légitime une base de données, vous disposez de droits, assez similaires à ceux conférés au titre de l’exception de copie privée d’une oeuvre en droit d’auteur.
Si vous êtes un professionnel, vous ne disposerez pas du droit à extraction et indexation du contenu de la base que vous consultez ! La pratique est pourtant généralisée depuis des années…
quelle durée de protection et quel droit de licence / cession sur le contenu d'une base de données ?
Si le contenu d’une base de données est protégé au titre d’un investissement, son titulaire (le producteur, donc) doit disposer du droit d’en assurer la commercialisation.
Comme en matière de licence / cession de logiciel, le producteur peut conférer des licences, gratuites ou payantes, sur le droit à extraction et à indexation du contenu de sa base de données.
Mais pour combien de temps ?
Le régime des droits « sui generis » de la Directive 96/9 est prévue pour une durée de 15 ans.
15 ans à partir du dernier investissement « substantiel » sur le contenu de sa base.
Si le producteur assure la mise à jour du contenu de sa base, il est protégé contre toute extraction et indexation illicite pour 15 ans à compter de la dernière mise à jour « substantielle ».
La durée de protection est donc potentiellement illimitée, ce qui est assez rare en droit français.
Une sanction pénale du non-respect du droit d'extraction et d'indexation sur le contenu d'une base de données ?
Que serait un texte de loi en France sans sa batterie de sanctions pénales ?
Le droit d’interdire toute extraction et indexation des data d’une base de données est donc assorti d’un délit pénal spécifique.
Voyons l’infraction et sa circonstance aggravante (en cas de délit en bande organisée).