Techno: Proposé le 28/11/2024 par Max Bertin actualisé le 30/11/2024
La fantastique généralisation de l'usage de l'intelligence artificielle par le grand public relance le défi de la confidentialité des données, qu'elles soient à caractère personnel ou non.
Comme souvent avec les outils numériques, l'engouement suscité par la nouveauté tend à permettre des usages contraires à la conservation du caractère confidentiel de certaines de nos données, que ce soit par méconnaissance ou absence de maîtrise de ces nouveaux outils, comme les chatbots boostés à l'IA.
L'apparente conversation naissant au cours des échanges, notamment par la pertinence des réponses faites par le Chatbot, le tutoiement peut faire croire à l'existence d'une certaine familiarité vous amenant à donner des informations d'ordre personnel comme, d'une façon générale, la santé.
Il ne faut pas oublier que votre "interlocuteur" est avant tout basé sur un grand modèle de langage, les fameux LLM, qui furent entraînés sur des masses gigantesques données, habituellement ne leur appartenant pas et sans autorisation de leurs détenteurs légitimes.
Aujourd'hui, rien de nouveau avec votre Chatbot IA qui envoie votre question, donc vos données vers un serveur en ligne, pour traitement et en retour fournir une réponse.
Les données parfois anodines mais pas toujours, restent sur le serveur, peuvent vous être associées, réutilisées pour de futurs échanges. L'accumulation de données permettra d'établir votre profil et d'en faire un usage que vous ignorez
Le postulat selon lequel plus notre demande est précise ou complète, meilleure sera la réponse est en réalité une incitation à livrer des informations à caractère personnel, sans aucune garantie de meilleur résultat et relèverait, pour les informations d'ordre général, cuisine, consommation, culture etc., plutôt du mythe et n'est due qu'à la pseudo-intimité créée par la fiction d'un "face-à-face" avec le bot.
En reformulant votre demande excluant des infos personnelles, vous obtiendrez, très probablement, le même résultat car votre "interlocuteur" est un algorithme qui pour une même demande caractérisée fournira toujours la même réponse.
Cette digression faite à propos de l'IA ne doit pas nous éloigner des risques en matière de confidentialité et de sécurité comme pour tous services en ligne.
La collecte de données est l'un des risques admis, par exemple, par OpenAI qui permet aux utilisateurs de refuser la collecte de données. Si l'intention est là, qu'en est-il réellement?
En plus de la collecte, vous êtes exposé aux risques de partages de données avec des tiers, volontairement à des fins mercantiles, involontaires par des tiers non autorisés.
La sécurité des serveurs n'est pas différentes de celles des autres services en ligne que vous utilisez déjà. Elle n'est ni meilleure ni pire mais soumise à des vulnérabilités, à des tentatives de piratage par des cyber-criminels toujours avides de données fraîches.
La CNIL a réalisé une intéressante vidéo d'une simulation de conversation avec Germain, son assistant vocal.
Commentaire : La première personne garante de la confidentialité de vos données, c'est vous, leur détenteur, leur créateur et responsable de leur conservation ou de leur diffusion avant leur dispersion dans l'éther du web.
-