LMi-MAG22 juin - Flipbook - Page 61
© Générée par IA
Cette image d’un théâtre d’opéra spatial
a été générée en 2022 par Midjourney.
de données visuelles ou textuelles, dont la plupart sont
extraites de l’Internet, et détermine ensuite quels éléments sont les plus susceptibles d’apparaître à proximité d’autres éléments. Rappelons que le machine
learning consiste à laisser des algorithmes découvrir
des « patterns », à savoir des motifs récurrents, dans
les ensembles de données. Une grande partie du travail
de programmation de l’IA générative consiste à créer
des algorithmes capables de distinguer les « choses »
qui intéressent les créateurs de l’IA - des mots et des
phrases dans le cas de chatbots comme ChatGPT, ou des
éléments visuels pour Dall-E. Mais fondamentalement,
l’IA générative crée ses résultats en évaluant un énorme
corpus de données, puis en répondant à des invites par
quelque chose qui se situe dans le domaine de la probabilité statistique tel qu’il est déterminé par ce corpus.
L’autocomplétion - lorsque votre téléphone portable ou
Gmail vous suggère ce que pourrait être le reste du mot
ou de la phrase que vous êtes en train de taper - est une
forme d’IA générative de bas niveau. ChatGPT et Dall-E
portent l’idée à un niveau nettement plus avancé.
Qu’est-ce qu’un modèle d’IA ?
ChatGPT et Dall-E sont des interfaces avec des fonctionnalités sous-jacentes de l’IA, appelées « modèles » dans
le jargon de l’IA. Un modèle d’IA est une représentation
mathématique - mise en œuvre sous la forme d’un algorithme ou d’une pratique - qui génère des données qui
ressembleront (espérons-le) à un ensemble de données
dont vous disposez déjà. Vous verrez parfois ChatGPT
et Dall-E eux-mêmes désignés comme des modèles ; à
proprement parler, c’est incorrect, car ChatGPT est un
chatbot qui donne aux utilisateurs l’accès à plusieurs
versions différentes du modèle GPT sous-jacent. Mais
dans la pratique, ces interfaces sont la manière dont la
plupart des gens interagissent avec les modèles, et il ne
faut donc pas s’étonner de voir ces termes utilisés de
manière interchangeable. Les développeurs d’IA rassemblent un corpus de données du type de celles qu’ils
veulent que leurs modèles génèrent. Ce corpus est connu
sous le nom d’ensemble d’entraînement du modèle, et
le processus de développement du modèle s’appelle
l’entraînement. Les modèles GPT, par exemple, ont été
formés sur un énorme corpus de textes récupérés sur
l’Internet, ce qui leur permet de répondre à des requêtes
en langage naturel dans un anglais idiomatique (ou dans
un certain nombre d’autres langues dont le français, en
fonction de l’entrée).
Les modèles d’IA traitent les différentes caractéristiques des données de leurs ensembles d’apprentissage
comme des vecteurs, c’est-à-dire des structures mathématiques composées de plusieurs nombres. Une grande
partie de la sauce secrète qui sous-tend ces modèles
réside dans leur capacité à traduire les informations du
monde réel en vecteurs de manière significative, et à
déterminer quels vecteurs sont similaires les uns aux
autres de manière à permettre au modèle de générer
des résultats qui sont similaires, mais pas identiques,
à son ensemble d’apprentissage. Il existe un certain
nombre de types de modèles d’IA, mais il faut garder à
l’esprit que les différentes catégories ne s’excluent pas
nécessairement l’une l’autre. Certains modèles peuvent
entrer dans plus d’une catégorie. [Lire l’intégralité de
l’article sur lemondeinformatique.fr]
APPROFONDIR
ÉCOUTER EN LIGNE
Podcast
tinyurl.com/podcast-genai
LIRE EN LIGNE
Article
tinyurl.com/article-genai
61