← Blog 03/06/2026 Droits et données Initié 5 min

Comment utiliser une IA générative sans lui livrer vos données : la check-list CNIL

Quand on ouvre ChatGPT, Gemini, Mistral ou Claude pour la première fois, l'écran ne pose pas la question des données. Il propose un cadre de saisie et une promesse d'utilité. Les paramètres de confidentialité existent mais ils sont à plusieurs clics, par défaut réglés au plus permissif et formulés dans un langage qui suppose qu'on sait ce qu'on cherche. Le 27 mai 2026, la CNIL et son homologue sud-coréen (la PIPC) ont publié une affiche pédagogique en 6 questions pour aider les utilisateurs à se poser les bonnes questions avant, pendant et après usage (CNIL, 27 mai 2026).

Le document est court, gratuit, distribué dans les collèges et lycées. Il vaut la peine d'être lu, même si ce qu'il ne dit pas est aussi instructif que ce qu'il dit.

(Ajouter l’affiche en question en image)

Avant d'utiliser : choisir son IA, choisir s'il faut un compte

La première question de l'affiche est celle qu'on saute presque toujours : quelle IA choisir ?

La CNIL recommande de comparer les services et de consulter la politique de confidentialité pour comprendre quelles données sont collectées, comment elles sont utilisées et comment on peut limiter cet usage.

En pratique, ces politiques font 15 à 30 pages et personne ne les lit. Le réflexe minimal, c'est de chercher dans la politique deux mots : « entraînement » et « training data ». Le passage qui suit décrit ce que le fournisseur fait de vos prompts. Si on n'y trouve pas la mention d'un paramètre d'opt-out, c'est que vos prompts servent par défaut à entraîner le modèle.

La deuxième question est encore plus simple : faut-il vraiment créer un compte ?

Pour un usage ponctuel, plusieurs services se laissent interroger sans inscription, ce qui empêche le rattachement durable de vos requêtes à votre identité. Quand le compte est inévitable, la CNIL recommande un mot de passe robuste et une authentification à deux facteurs. Ces réflexes valent pour toute la galaxie compte en ligne, pas seulement pour l'IA.

Pendant l'usage : couper le robinet d'entraînement et trier ce qu'on tape

La troisième question porte sur les paramètres.

Au moment de la rédaction de cet article, chez OpenAI, l'option « Améliorer le modèle pour tout le monde » est généralement présentée comme activée par défaut à l'inscription. Chez Google avec Gemini, l'historique d'activité est lui aussi enclenché et il alimente l'entraînement des futurs modèles. Chez Anthropic, depuis un changement annoncé fin août 2025, les utilisateurs des offres grand public Claude doivent désormais choisir explicitement s'ils acceptent ou non que leurs conversations servent à l'entraînement, avec un bouton présenté à la connexion dont les modalités d'affichage ont été critiquées. Le mode temporaire (ChatGPT) ou la désactivation de l'historique (Gemini) sont des bascules à faire une fois, à la création du compte, pas à chaque conversation. Comme ces paramètres évoluent fréquemment, le réflexe est d'aller relire la page de configuration au moins une fois par trimestre…

Le mode temporaire ne signifie pas qu'aucune donnée n'est conservée. Il signifie que la conversation est exclue de l'entraînement et n'apparaît pas dans votre historique visible. Les fournisseurs conservent généralement les échanges quelques jours pour des raisons de sécurité (modération, signalement d'abus), comme l'indique la politique d'OpenAI sur les conversations temporaires (OpenAI Trust Center).

La quatrième question est celle du contenu : que faut-il éviter de partager ?

La liste de la CNIL est claire : nom, adresse, établissement scolaire, mots de passe, informations bancaires, problèmes personnels. C'est ce qu'on devrait éviter de coller dans une IA générative quand on ne sait pas où va ce qu'on tape. Ce conseil est de bon sens mais il se heurte au cas d'usage réel : on consulte une IA précisément parce qu'on a un problème personnel à creuser, un mail délicat à reformuler ou un document professionnel à résumer. Le réflexe à acquérir, c'est de relire son prompt avant d'envoyer et de remplacer les données identifiantes par des marqueurs : « ma collègue Z », « l'adresse à laquelle j'habite », « la somme en question ». La perte de précision est minime, la perte de risque est réelle.

Après usage : croiser, nettoyer, fermer

La cinquième question concerne la fiabilité des réponses.

La CNIL rappelle que l'IA peut se tromper et qu'il faut recouper avec des sources fiables. C'est une question de protection moins évidente mais elle compte : croire un diagnostic médical, un conseil juridique ou un calcul fiscal sorti d'un modèle de langage sans recoupement : c'est un risque pour soi-même. Le fait que l'IA s'exprime avec aplomb n'est pas un indice de qualité de l'information.

La dernière question est celle qu'on oublie systématiquement : que faire quand on a terminé ?

L'affiche recommande de relire et supprimer les anciennes conversations, de supprimer le compte si le service n'est plus utilisé et de se déconnecter, surtout sur un appareil partagé. La suppression d'une conversation chez OpenAI ou Google ne supprime pas immédiatement les données côté fournisseur : il existe un délai légal de conservation et des sauvegardes. Le ménage côté utilisateur réduit malgré tout l'exposition en cas de compromission de votre compte ou d'accès non autorisé.

Pour aller plus loin

L'affiche est utile parce qu'elle pose les bons réflexes. Elle est insuffisante parce qu'elle traite les fournisseurs comme un environnement neutre dont on peut maîtriser l'usage en cochant les bonnes cases. Ce que vous ne pouvez pas configurer reste plus important que ce que vous pouvez configurer. Vous ne pouvez pas choisir où vos données seront stockées ni à qui elles seront transmises en cas de réquisition étrangère. Vous ne pouvez pas vérifier que l'opt-out d'entraînement est respecté en pratique, seulement déclaré dans une politique. Vous ne pouvez pas effacer ce qui a déjà été appris par un modèle entraîné avant que vous activiez le mode temporaire.

Ce que l'affiche pourrait dire et ne dit pas, c'est que le RGPD vous donne deux outils plus contraignants que les paramètres : le droit d'accès (article 15 du RGPD) qui vous permet de demander au fournisseur quelles données il détient sur vous et le droit à l'effacement (article 17) qui vous permet d'exiger leur suppression. Les fournisseurs majeurs proposent des formulaires dédiés mais ces droits restent largement sous-utilisés sur les services d'IA générative parce que personne ne pense à les exercer à ce moment-là.

L'autre angle mort, c'est que la CNIL conseille des bonnes pratiques utilisateur sans interroger les choix par défaut des fournisseurs. Pourquoi le mode temporaire n'est-il pas le mode par défaut ? Pourquoi l'entraînement à partir des prompts n'est-il pas en opt-in ? Ces questions de défaut relèvent moins de l'AI Act (qui impose surtout de la transparence sur les données d'entraînement et une classification par risque des systèmes) que du RGPD lui-même. L'article 25 prévoit le principe de protection des données dès la conception et par défaut. C'est sur ce terrain et via les lignes directrices de la CNIL ou de l'EDPB que les choix par défaut des fournisseurs d'IA pourraient être encadrés. En attendant, chaque utilisateur compense individuellement un déséquilibre qui pourrait être réglé en amont.

Comment utiliser une IA générative sans lui livrer vos données : la check-list CNIL

Avant d'utiliser : choisir son IA, choisir s'il faut un compte

Pendant l'usage : couper le robinet d'entraînement et trier ce qu'on tape

Après usage : croiser, nettoyer, fermer

Pour aller plus loin

Dans la même série

Comment savoir si une entreprise sécurise vraiment vos données

Apps de rencontre : ce que les chercheurs ont trouvé dans vos données

Bitwarden change ses règles : que faire si vous y stockez vos mots de passe

Email