Meta annonce qu’il va utiliser les données publiques de ses utilisateurs en Europe afin d’entraîner ses intelligences artificielles. Dans l’Union européenne, Meta va former ses modèles d’IA sur le contenu public partagé par les adultes sur les produits Meta et sur les interactions que les gens ont avec l’IA chez Meta. Les personnes basées dans l’UE qui utilisent les plateformes de Meta peuvent choisir de s’opposer à ce que leurs données publiques soient utilisées à des fins de formation des IA.
Usage des publications et des commentaires des adultes
L’annonce a été faite le 14 avril. L’intention est de former l’IA chez Meta à partir de contenus publics, c’est-à-dire les publications et les commentaires qui sont partagés par des adultes dans l’UE. Les interactions des utilisateurs avec l’IA de Meta, les questions et les requêtes serviront également à former et améliorer les modèles d’IA. Cette approche fait suite au lancement de Meta AI en Europe en mars dernier.
À partir de la semaine du 14 avril, les utilisateurs des plateformes Meta basés dans l’ UE recevront des notifications, intégrées à l’application et par e-mail, expliquant le type de données qui seront utilisées, les améliorations que cela apportera à l’IA chez Meta et l’expérience utilisateur globale. Ces notifications comprennent également un lien vers un formulaire qui sert à s’opposer à tout moment à l’utilisation des données.
Les messages privés ne sont pas utilisés
Meta précise qu’il n’utilise par les messages privés échangés pour entraîner ses modèles d’IA générative. De plus, les données publiques des comptes de personnes de moins de 18 ans résidant dans l’UE ne sont pas utilisées à des fins d’entraînement.
Meta explique que son but est de développer une IA qui soit adaptée aux Européens. Dès lors, la firme estime qu’il est essentiel que ses modèles d’IA générative soient entraînés sur une variété de données afin de comprendre les nuances et les complexités diverses qui composent les communautés européennes. Cela englobe les dialectes et les expressions familières jusqu’aux connaissances locales et les différentes manières dont chaque pays utilise l’humour et le sarcasme.
Transparence de Meta
Au passage Meta lance une pique à ses concurrents dont il estime qu’ils sont moins transparents que lui sur l’usage des données. « Nous suivons l’exemple d’autres acteurs, comme Google et OpenAI, qui ont déjà utilisé les données d’ utilisateurs européens pour former leurs modèles d’IA. Nous sommes fiers de la transparence accrue de notre approche par rapport à nombre de nos homologues du secteur » déclare Meta.
Meta ajoute que son approche est conforme aux lois et aux réglementations européennes. La firme précise qu’elle a retardé la formation de ses grands modèles linguistiques (LLM Large Language Model) utilisant du contenu public, le temps que les régulateurs clarifient les exigences légales. « Nous saluons l’avis rendu par le CEPD [Comité européen de la protection des données] en décembre 2024, qui a confirmé que notre approche initiale respectait nos obligations légales. Depuis lors, nous avons collaboré de manière constructive avec l’IDPC [Irish Data Protection Commission] » conclut Meta.