3 avril 2023

Intelligence artificielle et déni de confidentialité

Written by Arnaud Le Men

Sommaire

Avec la disponibilité, la traçabilité et l’intégrité, la confidentialité est l’un des quatre piliers de la sécurité informatique. Cependant, avec l’accélération de l’ouverture de services d’intelligence artificielle au grand public, la confidentialité est l’un des piliers les plus mis à mal.

Comment l’émergence de l’Intelligence Artificielle impacte-t-elle la confidentialité ?

Un principe essentiel des technologies d’Intelligence Artificielle est l’apprentissage de l’algorithme. Pour qu’un algorithme d’intelligence artificielle puisse remplir sa fonction, il a d’abord besoin d’apprendre ce qu’il doit faire.

Suivant un principe de courbe d’apprentissage, l’algorithme démultiplie et optimise les chemins qui lui permettent d’exécuter ses fonctions.

Cette phase d’apprentissage nécessite des volumes d’informations colossaux qui lui servent de terrain d’apprentissage. Les sources d’informations sont multiples, et reposent sur l’usage quotidien de ses services qui favorise une amélioration permanente des mécanismes de calcul. En injectant des données dans le système, les utilisateurs alimentent les bases d’apprentissage des algorithmes.

D’un point de vue cyber, c’est là que réside le risque. Les services offerts sont extrêmement simples d’usage, n’importe qui peut les utiliser et y injecter n’importe quoi.

Début 2023, Cyberhaven a réalisé une étude sur l’usage de ChatGPT par les employés d’entreprises. Bien qu’effarant, le résultat n’est pas surprenant : 2.3% des salariés ont déjà copié des informations confidentielles dans le logiciel d’IA développé par OpenAI.

Cette réalité interroge les règles d’utilisation des services proposés, notamment dans leur version gratuite.

Rétrospective sur 4 solutions très populaires :

Chat GPT – IA générateur de texte développé par OpenAI (Etats-Unis)

Vous pouvez a priori tout lui demander : de la rédaction d’un document à la traduction d’un texte dans n’importe quelle langue. Pour utiliser le service, il suffit de se connecter et d’écrire la question et l’algorithme vous répond dans la foulée.

Le service utilise t’il vos informations ?

D’après les mentions indiquées dans les « terms of use » il y a deux cas de figures. Si les données proviennent de l’API fournie par OpenAI, non. Si les données ne proviennent pas de l’API, oui.

La question est donc la suivante : quels sont les services qui sont non API et ceux qui utilisent l’API ? La réponse se trouve sur le blog d’Open AI.

Pour conclure, si vous utilisez le service ChatGPT, celui que tout le monde connait, l’éditeur se réserve le droit par défaut d’utiliser les données que vous y injectez.

Il existe cependant un formulaire mis à disposition par OpenAI pour demander que vos données injectées dans le service ChatGPT ne soient pas exploitées.

MidJourney – IA générateur d’image sur Discord (Etats-Unis)

MidJourney est un algorithme incroyable. Vous lui donnez des instructions textuelles qu’il traduit en image d’une impressionnante finesse et créativité. Le principe de fonctionnement est relativement simple, après la création d’un compte, vous vous connectez sur Discord pour donner les ordres de création artistique (nommée /imagine prompt) sous forme de mots clés. Vous pouvez également donner en entrée une photo vous appartenant. De nombreux utilisateurs injectent d’ailleurs des photos d’identité, de famille, de soirées, etc. pour les modifier avec l’algorithme.

Le service utilise t’il vos informations ?

Oui, sans aucune limite et c’est explicitement mentionné dans l’article « Rights you give to MidJourney » dans les conditions d’utilisation du service.

Donc, il n’y a pas d’ambiguïté, si vous déposez des informations dans MidJourney, les données deviennent la propriété de MidJourney.

DeepL – IA de traduction « language to language » (Allemagne)

Service très populaire, avec son interface ultra simple, DeepL est utilisé par des milliers de personnes tous les jours pour traduire des textes dans différentes langues.

L’utilisation est simple, il suffit d’injecter un texte et sélectionner la langue de sortie.

Le service utilise t’il vos informations ?

Non et oui ! Le service ne garde pas la mémoire des textes injectés, uniquement si on l’utilise dans une version Pro payante. Le service gratuit, lui conserve et se réserve le droit d’exploiter les données injectées.

ElevenLabs – IA générateur de voix (Etats-Unis)

ElevenLabs propose un service de génération de voix. Fin mars 2023, le service est ouvert au public en version Beta, avec une interface très simple.

Le service utilise t’il vos informations ?

Dans sa version gratuite, oui les données injectées sont conservées et exploitées par le service.

Conclusion

L’IA est-elle une révolution et va-t-elle s’inscrire dans le paysage numérique durablement ? Évidemment oui, c’est déjà le cas, et cela continuera à s’accélérer en proposant de plus en plus de services d’IA pour faciliter l’usage du numérique pour le grand public comme pour les organisations. Microsoft a, par exemple, annoncé en mars 2023 l’intégration des algorithmes d’OpenAI dans son environnement Azure, et l’intégration de Copilot (autre solution d’OpenAI) dans la suite Microsoft Office 365. C’est une tendance de fond.

Cela étant, l’émergence de ces nouveaux usages sont aussi sources de risques, et notamment pour la confidentialité des données. Il faut dès maintenant rappeler les bonnes pratiques et sensibiliser les utilisateurs à l’usage de ces outils :

On ne dépose pas un document confidentiel pour le faire traduire par un algorithme sans savoir ce que devient la source ensuite
On ne télécharge pas dans un outil des photos de tiers sans leur consentement
On ne demande pas à un algorithme de traiter des données personnelles sans valider leur compatibilité au RGPD et politique de sécurité

Au-delà de son apport incontestable pour le traitement de données, l’intelligence artificielle est aussi l’opportunité pour les internautes de faire preuve de bon sens et de discernement.

Ressources similaires