Trois organisations représentant les éditeurs et les auteurs français ont saisi la justice contre Meta, accusant le géant américain d’avoir utilisé des œuvres protégées sans autorisation pour entraîner ses modèles d’intelligence artificielle générative. Le Syndicat national de l’édition (SNE), le Syndicat national des auteurs et compositeurs (SNAC) et la Société des Gens de Lettres (SGDL) réclament le retrait des données utilisées illégalement et pointent une violation massive du droit d’auteur. Selon Vincent Montagne, président du SNE, Meta a incorporé “de nombreuses œuvres éditées par ses membres” dans ses bases de données, utilisées notamment pour améliorer son modèle de langage Llama. Ces corpus incluraient des livres en français issus de la base Books3, une collection illégalement constituée de près de 200 000 ouvrages, déjà au centre de litiges judiciaires aux États-Unis.
Les plaignants dénoncent une absence totale de transparence de la part de Meta et une menace directe pour le monde de l’édition. François Peyrony, président du SNAC, s’inquiète notamment de l’émergence de textes générés par IA, qui pourraient “concurrencer les vrais livres des auteurs”. Christophe Hardy, président de la SGDL, estime quant à lui que “la création d’un marché de l’IA ne peut pas se faire au détriment du secteur culturel” et appelle les entreprises technologiques à proposer des contreparties aux créateurs dont elles exploitent les œuvres. Pour l’heure, aucune estimation du préjudice financier causé par ces pratiques n’a été communiquée, mais les éditeurs et auteurs espèrent que cette action en justice incitera les grandes plateformes à respecter le cadre juridique en vigueur.
Ce procès s’inscrit dans une tendance plus large d’opposition entre le secteur culturel et les entreprises du numérique, notamment sur la question des droits d’auteur et de l’usage des données. En janvier dernier, Meta avait admis avoir utilisé des œuvres protégées sans autorisation dans le cadre d’une procédure judiciaire aux États-Unis, tout en défendant son approche comme relevant du “fair use”. Ce litige en France intervient alors que l’Union européenne impose désormais aux entreprises de l’IA plus de transparence sur les sources utilisées pour l’entraînement de leurs modèles. L’issue de cette affaire pourrait donc avoir des répercussions importantes sur l’encadrement de l’intelligence artificielle et la protection du patrimoine culturel.