Avec des millions d’utilisateurs de ChatGPT, vous pouvez vous demander ce qu’OpenAI fait de toutes ces conversations. Analyse-t-elle constamment les choses dont vous parlez avec ChatGPT ?


La réponse à cette question est oui, ChatGPT apprend à partir des données de l’utilisateur, mais pas de la manière dont la plupart des gens le pensent. Voici un guide détaillé expliquant pourquoi ChatGPT suit les conversations, comment il les utilise et si votre sécurité est compromise.

ChatGPT se souvient-il des conversations ?

ChatGPT ne prend pas les messages à la lettre. Il utilise la mémoire contextuelle pour se souvenir des entrées précédentes et y faire référence, garantissant ainsi des réponses pertinentes et cohérentes.

Prenons l’exemple de la conversation ci-dessous. Lorsque nous avons demandé à ChatGPT des idées de recettes, il a pris en compte notre message précédent sur les allergies aux arachides.

Parler à ChatGPT de ses allergies alimentaires

Voici la recette sûre de ChatGPT.

ChatGPT propose une recette de gâteau sans farine

La mémoire contextuelle permet également à l’IA d’exécuter des tâches en plusieurs étapes. L’image ci-dessous montre que ChatGPT reste fidèle à son personnage même après avoir reçu une nouvelle invite.

Demande à ChatGPT de jouer le rôle de Ash dans Pokemon

ChatGPT peut mémoriser des dizaines d’instructions au cours d’une conversation. Ses résultats s’améliorent en fait en termes d’exactitude et de précision au fur et à mesure que vous fournissez plus de contexte. Veillez simplement à expliquer vos instructions de manière explicite.

Vous devez également gérer vos attentes car la mémoire contextuelle de ChatGPT a encore des limites.

Les conversations de ChatGPT ont des capacités de mémoire limitées

La mémoire contextuelle est limitée. ChatGPT a des ressources matérielles limitées, et ne se souvient donc que de certains points des conversations en cours. La plateforme oublie les messages antérieurs dès que la capacité de mémoire est atteinte.

Dans cette conversation, nous avons demandé à ChatGPT de jouer le rôle d’un personnage fictif nommé Tomie.

Demander avec succès à ChatGPT d'incarner le personnage de manga Tomie

Il a commencé à répondre aux invites en tant que Tomie, et non ChatGPT.

ChatGPT Répondre aux questions sur la santé en tant que Tomie le personnage

Bien que notre demande ait fonctionné, ChatGPT a rompu le caractère après avoir reçu une invite de 1 000 mots.

ChatGPT remplace les invites précédentes par de nouvelles invites

OpenAI n’a jamais révélé les limites exactes de ChatGPT, mais des rumeurs disent qu’il ne peut traiter que 3 000 mots à la fois. Dans notre expérience, ChatGPT a mal fonctionné après plus de 2 800 mots.

ChatGPT envoie des erreurs pour les messages trop longs

Vous pouvez diviser vos invites en deux séries de 1 500 mots, mais ChatGPT ne retiendra probablement pas toutes vos instructions. Commencez simplement un autre chat. Sinon, vous devrez répéter des détails spécifiques plusieurs fois au cours de votre conversation.

ChatGPT ne se souvient que des entrées pertinentes pour le sujet

ChatGPT utilise la mémoire contextuelle pour améliorer la précision des résultats. Il ne se contente pas de conserver des informations pour le plaisir de les collecter. La plateforme oublie presque automatiquement les détails non pertinents, même si vous êtes loin d’avoir atteint la limite de jetons.

Dans l’image ci-dessous, nous essayons d’embrouiller l’IA avec diverses instructions incohérentes et non pertinentes.

Tentative de confusion de ChatGPT avec différentes invites

Nous avons limité nos entrées combinées à moins de 100 mots, mais ChatGPT a tout de même oublié notre première instruction. Il a rapidement perdu son caractère.

ChatGPT oublie les invites en essayant de retenir des informations non pertinentes

Pendant ce temps, ChatGPT a continué à jouer le rôle pendant cette conversation parce que nous n’avons posé que des questions en rapport avec le sujet.

ChatGPT garde son caractère même après plusieurs questions

Idéalement, chaque dialogue doit suivre un thème unique afin de conserver des résultats précis et pertinents. Vous pouvez toujours saisir plusieurs instructions simultanément. Veillez simplement à ce qu’elles s’alignent sur le thème général, sinon ChatGPT risque de laisser tomber les instructions qu’il juge non pertinentes.

Les instructions de formation prennent le dessus sur les données de l’utilisateur

ChatGPT donne toujours la priorité aux instructions prédéterminées par rapport aux données générées par l’utilisateur. Il met fin aux activités illicites en imposant des restrictions. La plateforme rejette toute demande qu’elle juge dangereuse ou préjudiciable à autrui.

Prenons l’exemple des demandes de jeu de rôle. Bien qu’elles passent outre certaines limitations de langage et de formulation, vous ne pouvez pas les utiliser pour commettre des activités illicites.

Les restrictions de ChatGPT empêchent de répondre correctement aux requêtes

Bien entendu, toutes les restrictions ne sont pas raisonnables. Si des directives rigides rendent difficile l’exécution de tâches spécifiques, continuez à réécrire vos messages-guides. Le choix des mots et le ton utilisé influencent fortement les résultats. Vous pouvez vous inspirer des messages-guides les plus efficaces et les plus détaillés sur GitHub.

Comment OpenAI étudie-t-elle les conversations des utilisateurs ?

La mémoire contextuelle ne s’applique qu’à la conversation en cours. L’architecture sans état de ChatGPT traite les conversations comme des instances indépendantes ; elle ne peut pas référencer les informations des conversations précédentes. Commencer de nouvelles conversations réinitialise toujours l’état du modèle.

Cela ne veut pas dire que ChatGPT se débarrasse instantanément des conversations des utilisateurs. Les conditions d’utilisation d’OpenAI stipulent que l’entreprise recueille des données provenant de services consommateurs non liés à l’API, tels que ChatGPT et Dall-E. Vous pouvez même demander des copies de votre historique de conversation.

Demander à ChatGPT d'exporter les discussions précédentes

Bien que ChatGPT accède librement aux conversations, la politique de confidentialité d’OpenAI interdit les activités susceptibles de compromettre les utilisateurs. Les formateurs ne peuvent utiliser vos données qu’à des fins de recherche et de développement de produits.

Les développeurs cherchent des failles

OpenAI passe au crible les conversations à la recherche de failles. Elle analyse les cas dans lesquels ChatGPT présente des données biaisées, produit des informations nuisibles ou aide à commettre des activités illicites. Les directives éthiques de la plateforme sont constamment révisées.

Par exemple, les premières versions de ChatGPT répondaient ouvertement à des questions sur le codage de logiciels malveillants ou la fabrication d’explosifs. Ces incidents ont donné aux utilisateurs l’impression qu’OpenAI n’avait aucun contrôle sur ChatGPT. Pour regagner la confiance du public, elle a entraîné le chatbot à rejeter toute question susceptible d’aller à l’encontre de ses directives.

Les formateurs collectent et analysent les données

Femme lisant des rapports sur des fiches physiques et son ordinateur

ChatGPT utilise des techniques d’apprentissage supervisé. Bien que la plateforme se souvienne de toutes les entrées, elle n’apprend pas d’elles en temps réel. Les formateurs de l’OpenAI les collectent et les analysent d’abord. Cela garantit que ChatGPT n’absorbe jamais les informations nuisibles et préjudiciables qu’elle reçoit.

L’apprentissage supervisé nécessite plus de temps et d’énergie que les techniques non supervisées. Cependant, il a déjà été prouvé que laisser l’IA analyser seule les données d’entrée était néfaste.

Prenons l’exemple de Microsoft Tay, l’une des fois où l’apprentissage automatique a mal tourné. Comme Tay analysait constamment des tweets sans l’aide d’un développeur, des utilisateurs malveillants ont fini par l’entraîner à cracher des opinions racistes et stéréotypées.

Les développeurs sont constamment à l’affût des préjugés

Plusieurs facteurs externes sont à l’origine de biais dans l’IA. Les préjugés inconscients peuvent résulter de différences entre les modèles d’apprentissage, d’erreurs dans les ensembles de données et de restrictions mal conçues. Vous les verrez dans diverses applications de l’IA.

Heureusement, ChatGPT n’a jamais fait preuve de préjugés discriminatoires ou raciaux. Selon un rapport du New York Post, l’inclinaison de ChatGPT pour les idéologies de gauche est peut-être le pire biais que les utilisateurs aient remarqué. La plateforme écrit plus ouvertement sur des sujets libéraux que conservateurs.

Pour résoudre ces biais, OpenAI a interdit à ChatGPT de fournir des informations politiques. Il ne peut répondre qu’à des faits généraux.

Les modérateurs examinent les performances de ChatGPT

Les utilisateurs peuvent donner leur avis sur les performances de ChatGPT. Vous trouverez les boutons « pouce vers le haut » et « pouce vers le bas » sur le côté droit de chaque réponse. Le premier indique une réaction positive. Après avoir cliqué sur le bouton « J’aime » ou « Je n’aime pas », une fenêtre s’ouvre dans laquelle vous pouvez envoyer vos commentaires dans vos propres mots.

Laisser un commentaire sur ChatGPT Output

Le système de feedback est utile. Il faut juste laisser à OpenAI le temps de trier les commentaires. Des millions d’utilisateurs commentent régulièrement ChatGPT – ses développeurs donnent probablement la priorité aux cas graves de biais et de génération de résultats nuisibles.

Vos conversations sur ChatGPT sont-elles sûres ?

Compte tenu des politiques de confidentialité d’OpenAI, vous pouvez être assuré que vos données resteront en sécurité. ChatGPT n’utilise les conversations que pour l’apprentissage des données. Ses développeurs étudient les informations recueillies pour améliorer la précision et la fiabilité des résultats, et ne volent pas de données personnelles.

Cela dit, aucun système d’IA n’est parfait. ChatGPT n’est pas intrinsèquement biaisé, mais des personnes malveillantes pourraient toujours exploiter ses vulnérabilités, par exemple des erreurs dans les ensembles de données, une formation négligente et des failles de sécurité. Pour votre protection, apprenez à combattre ces risques.