Après toutes les spéculations et affirmations concernant les capacités du GPT-4, la quatrième itération très attendue de la famille des modèles de langage GPT a été lancée le 14 mars 2023.


Le GPT-4 n’a pas été doté de certaines des fonctionnalités tant annoncées par les rumeurs. Cependant, le dernier modèle améliore considérablement le GPT-3.5 et ses prédécesseurs. En quoi le GPT-4 diffère-t-il du GPT-3.5 ? Nous allons vous présenter les principales différences entre le GPT-4 et le GPT-3.5.

1. GPT-4 vs. GPT-3.5 : Créativité

Modèle de langage GPT-4 avec le logo de l'OpenAI

L’un des avantages les plus marqués du modèle GPT-4 par rapport au modèle GPT-3.5 est sa capacité à fournir des réponses plus créatives aux questions. Ne vous méprenez pas, le modèle GPT-3.5 est très créatif. Il y a une longue liste de choses créatives que vous pouvez faire avec ChatGPT qui utilise le modèle. Cependant, il surpasse déjà de nombreux grands modèles de langage en termes de créativité.

Cependant, GPT-4 place la barre encore plus haut. Bien que l’avantage créatif de GPT-4 puisse ne pas être apparent lorsqu’il s’agit de résoudre des problèmes de base, la différence de créativité entre les deux modèles devient évidente lorsque la tâche devient plus difficile et exige un niveau de créativité plus élevé.

Par exemple, si vous demandez aux deux modèles d’effectuer une tâche créative comme écrire un poème en utilisant l’anglais et le français sur chaque ligne du poème, ChatGPT alimenté par le dernier modèle GPT-4 fournira de meilleurs résultats. Alors que la réponse de GPT-4 utiliserait les deux langues à chaque ligne, GPT-3.5 alternerait entre les deux langues, chaque ligne utilisant une langue et la suivante l’autre.

2. GPT-4 vs. GPT-3.5 : images ou données visuelles

Image d'un circuit et d'une tête humaine

Alors que le GPT-3.5 ne peut accepter que des invites textuelles, le GPT-4 est multimodal et peut accepter des entrées textuelles et visuelles. Pour être clair, lorsque nous parlons d’entrées visuelles, l’image n’a pas besoin d’être une image d’une invite dactylographiée – elle peut être une image de n’importe quoi. Ainsi, de l’image d’un problème de mathématiques écrit à la main aux mèmes Reddit, le GPT-4 peut comprendre et décrire presque n’importe quelle image.

Contrairement à GPT-3, GPT-4 est à la fois un langage et un modèle visuel.

Lors de la diffusion en direct de l’annonce de GPT-4, un ingénieur d’OpenAI a fourni au modèle une capture d’écran d’un serveur Discord. GPT-4 a pu en décrire chaque détail, y compris les noms des utilisateurs en ligne à ce moment-là. Le modèle a également reçu une image d’une maquette dessinée à la main d’un site web de plaisanterie, avec des instructions pour la transformer en site web, et étonnamment, GPT-4 a fourni un code fonctionnel pour un site web correspondant à l’image.

3. GPT-4 vs. GPT-3.5 : des réponses plus sûres

Image du bouclier représentant la cybersécurité

Bien que le GPT-4 ne soit pas parfait, les mesures qu’il adopte pour garantir des réponses plus sûres constituent une amélioration bienvenue par rapport au modèle GPT-3.5. Avec GPT-3.5, OpenAI a adopté une approche plus modérée de la sécurité. En d’autres termes, certaines des mesures de sécurité ont été prises après coup. OpenAI a surveillé ce que les utilisateurs faisaient et les questions qu’ils posaient, a identifié les failles et a essayé de les corriger en cours de route.

Avec GPT-4, la plupart des mesures de sécurité sont déjà intégrées au système au niveau du modèle. Pour comprendre la différence, c’est comme construire une maison avec des matériaux robustes dès le départ plutôt que d’utiliser n’importe quoi et d’essayer de corriger les choses au fur et à mesure de l’apparition des défauts. Selon le rapport technique GPT-4 de l’OpenAI [PDF]GPT-4 ne produit des réponses toxiques que dans 0,73 % des cas, contre 6,48 % pour GPT-3.5.

4. GPT-4 vs. GPT-3.5 : Factualité de la réponse

Une inscription du mot

L’un des défauts de GPT-3.5 est sa tendance à produire des informations absurdes et fausses en toute confiance. Dans le jargon de l’IA, ce phénomène est appelé « hallucination de l’IA » et peut susciter la méfiance à l’égard des informations générées par l’IA.

Dans le GPT-4, l’hallucination reste un problème. Cependant, selon le rapport technique du GPT-4, le nouveau modèle est 19% à 29% moins susceptible de provoquer des hallucinations que le modèle GPT-3.5. Mais il ne s’agit pas seulement du rapport technique. Les réponses du modèle GPT-4 sur ChatGPT sont nettement plus factuelles.

5. GPT-4 vs. GPT-3.5 : Fenêtre contextuelle

Deux programmeurs assis dans un bureau en train de réviser du code.

Une différence moins connue entre GPT-4 et GPT-3.5 est la fenêtre de contexte et la taille du contexte. La fenêtre de contexte est la quantité de données qu’un modèle peut conserver dans sa « mémoire » pendant une session de chat et pendant combien de temps. Le modèle GPT-4 a une taille et une fenêtre de contexte nettement meilleures que celles de son prédécesseur.

Concrètement, cela signifie que GPT-4 peut mieux se souvenir du contexte d’une conversation pendant plus longtemps, ainsi que des instructions données au cours de la conversation.

Un problème avec GPT-3.5 est la propension du modèle à s’éloigner du sujet ou à ne pas suivre les instructions au fur et à mesure que vous progressez au cours d’une conversation. Vous pouvez, par exemple, demander au modèle de s’adresser à vous par votre nom, ce qu’il fera pendant un certain temps, mais il ne suivra pas les instructions en cours de route. Bien que ce problème subsiste avec le modèle GPT-4, il est moins important grâce à une meilleure fenêtre contextuelle.

Un autre problème est la limitation du volume de texte que vous pouvez utiliser simultanément dans une invite. Pour résumer un texte long à l’aide du modèle GPT-3, il faut généralement diviser le texte en plusieurs morceaux et les résumer petit à petit. L’amélioration de la longueur du contexte dans le modèle GPT-4 signifie que vous pouvez coller des PDF entiers en une seule fois et faire en sorte que le modèle les résume sans les diviser en morceaux.

GPT-4 : un pas en avant par rapport à GPT-3.5

Il ne fait aucun doute que le GPT-4 représente une avancée significative par rapport aux modèles précédents. Bien qu’il souffre encore de certaines des limitations de GPT-3.5, des améliorations significatives dans plusieurs domaines et l’ajout de nouvelles capacités font de ce modèle une nouvelle étape passionnante dans la poursuite de modèles de langage d’IA véritablement intelligents.