Aller au contenu

GPT-4

Un article de Wikipédia, l'encyclopédie libre.
GPT-4

Informations
Développé par OpenAIVoir et modifier les données sur Wikidata
Première version Voir et modifier les données sur Wikidata
Écrit en PythonVoir et modifier les données sur Wikidata
Type Grand modèle de langage
Modèle d'intelligence artificielle (d)
Transformateur génératif pré-forméVoir et modifier les données sur Wikidata
Licence Licence propriétaireVoir et modifier les données sur Wikidata
Site web openai.com/gpt-4Voir et modifier les données sur Wikidata

Chronologie des versions

GPT-4 (acronyme de Generative Pre-trained Transformer 4) est un modèle de langage multimodal (en), de type transformeur génératif pré-entraîné, développé par la société OpenAI et sorti le . Il succède à GPT-3.

Caractéristiques

[modifier | modifier le code]

OpenAI annonce, sur son blog, GPT-4 comme étant « plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5 »[1]. L'organisation a produit deux versions de GPT-4 avec des fenêtres contextuelles de 8 192 et 32 768 jetons, une amélioration significative par rapport à GPT-3.5 et GPT-3, qui étaient limités à 4 096 et 2 048 jetons respectivement[2]. Contrairement à son prédécesseur, GPT-4 peut prendre des images ainsi que du texte comme entrées.

OpenAI adopte une approche fermée en ce qui concerne les détails techniques de GPT-4 ; le rapport technique s'est explicitement abstenu de spécifier la taille, l'architecture, le matériel ou la méthode de formation du modèle. Le rapport affirme que « le paysage concurrentiel et les implications sur la sécurité des modèles à grande échelle » sont des facteurs qui ont influencé cette décision. Le nombre précis de paramètres de GPT-4 reste inconnu, mais The Verge cite des rumeurs selon lesquelles GPT-4 augmenterait considérablement le nombre de paramètres de GPT-3 de 175 milliards à 100 000 milliards. Le PDG d'OpenAI, Sam Altman, qualifie ces rumeurs de « conneries complètes ». Un nombre plus fréquemment avancé est celui de 1000 milliards de paramètres[3],[4].

Les représentants américains Don Beyer et Ted Lieu ont confirmé au New York Times qu'Altman s'était rendu au Congrès des États-Unis en janvier 2023 pour faire la démonstration du GPT-4 et de ses "contrôles de sécurité" améliorés par rapport aux autres modèles d'IA.

Aussi, même si cette version est améliorée par rapport à son prédécesseur, GPT-4 peut halluciner[5] et présenter des biais[6].

Applications

[modifier | modifier le code]

ChatGPT Plus

[modifier | modifier le code]

GPT-4 est accessible via une application web appelée ChatGPT Plus, version payante, plus rapide et améliorée de l'application gratuite ChatGPT.

Des modules complémentaires sont développés par des tiers pour étendre les fonctionnalités de ChatGPT Plus et connecter le robot à leurs propres services. Open AI développe également ses propres modules d'extensions (plugin) dont un « Interprète (informatique) » dit Advanced data analysis (précédemment appelé Code interpreter)[7]. Un outil permettant au robot de traiter des fichiers en exécutant lui-même du code Python, ce qui permet à l'utilisateur de réaliser des traitements de données et des cartes ou graphiques en langage naturel, comme s'il avait accès à la programmation, mais sans savoir coder (grâce au code Python qui sera généré et exécuté par ChatGPT)[8]. Ce module permet d'envoyer des fichiers afin d'étayer des prompts, et il améliore les capacités de résolution de problèmes en mathématiques, physique et chimie[9] et il permet d'utiliser ChatGPT pour finement décrire une image, transformer une image en vidéo[réf. nécessaire], créer des images, des cartes, extraire la palette de couleur d'une image, créer des documents Word ou PowerPoint[réf. nécessaire], faire de la data visualisation, des simulations, etc. et après réponse de l'IA, dans le champ conversationnel, un bouton dédié permet d'obtenir le détail de la procédure utilisée[8].

À partir du 6 juillet 2023, il permet à ChatGPT d'éventuellement accéder aux fichiers téléchargés par l'utilisateur abonné, et — à la demande — de les modifier, d'en analyser des données, de créer des calculs et/ou des graphiques, etc. (avec une taille limite de 2 Mo pour les fichiers), l'IA pouvant écrire du code en Python et manipuler des fichiers jusqu’à 100 Mo. Une faille de sécurité a été découverte dans Code Interpreter (testée et confirmé en novembre 2023)[10].

En février 2023, Microsoft dote son moteur de recherche Bing d'un agent conversationnel reposant sur la technologie GPT-4. Cet agent répond aux questions de l'utilisateur en effectuant des recherches web. Contrairement à l'application d'Open AI, il cite ses sources, ce qui permet à l'utilisateur de les consulter lui-même[11].

Pour le New York Times, GPT-4 est plus précis que GPT-3.5, il est capable de résumer et de commenter des images ainsi que des textes compliqués. Le journal affirme également qu'il a réussi un examen du barreau et plusieurs tests standardisés, mais qu'il montre cependant une tendance à halluciner dans certaines de ses réponses[12].

Selon Patronus AI, GPT-4 est le LLM avec le plus haut taux de violation du droit d'auteur[13]. En mai 2023, Numerama rapporte déjà qu'Open AI, sur la base d'une étude de chercheurs de Berkeley, avait entrainé ses modèles sur un nombre important de livres : « Nous avons découvert que les modèles d’OpenAI ont mémorisé une vaste collection de matériaux protégés par le droit d’auteur et que le degré de mémorisation est lié à la fréquence à laquelle des extraits de ces livres apparaissent sur le web »[14].

Notes et références

[modifier | modifier le code]
  1. Wiggers, « OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art » [archive du ], TechCrunch, (consulté le )
  2. (en) « OpenAI API », platform.openai.com (consulté le )
  3. (en) « GPT-4 has more than a trillion parameters », sur The decoder, (consulté le ).
  4. (en) Reed Albergotti, « The secret history of Elon Musk, Sam Altman, and OpenAI / Semafor », sur semafor.com, (consulté le ).
  5. « Avec GPT-4, OpenAI prend le large sur les IA génératives », sur Le Monde Informatique, (consulté le )
  6. « OpenAI annonce la disponibilité de GPT-4, nouvelle version de son modèle de langage », sur L'Usine Digitale, (consulté le )
  7. (en-US) « ChatGPT plugins », sur openai.com (consulté le ).
  8. a et b Maximilien Herr, « ChatGPT intègre désormais Code Interpreter, qu'est-ce que c'est, comment ça marche, et comment l'utiliser ? », sur Clubic.com, (consulté le ).
  9. (en) Hugo G. Lapierre et Patrick Charland, « ChatGPT, allié ou adversaire pour l’enseignement des sciences et des mathématiques ? », sur The Conversation, (consulté le ).
  10. Magloire B, « ChatGPT : N’utilisez pas le Code Interpreter ! Ce bug permet aux hackers de… », sur lebigdata.fr, (consulté le ).
  11. « Avec Fabric, Microsoft veut unifier et simplifier l'analyse de données - Le Monde Informatique », sur LeMondeInformatique, (consulté le )
  12. (en-US) Cade Metz, « 10 Ways GPT-4 Is Impressive but Still Flawed », The New York Times,‎ (lire en ligne [archive du ], consulté le )
  13. « GPT-4 est le LLM avec le plus haut taux de violation du droit d'auteur », sur ZDNet, (consulté le )
  14. « OpenAI a instruit ChatGPT sans se soucier du droit d’auteur », sur Numerama, (consulté le )

Articles connexes

[modifier | modifier le code]

Liens externes

[modifier | modifier le code]