Le GTP-3 est défini comme le plus grand réseau neuronal artificiel jamais créé à ce jour.
Cette percée présentée par la société de recherche et de déploiement en intelligence artificielle (IA) OpenAI a entraîné un coût de plus de 4 millions de dollars pour Elon Musk et Sam Altman. Néanmoins, l’investissement s’est avéré rentable, car il ouvre un monde de possibilités pour l’IA au-delà de notre imagination actuelle.
Indice
- Qu’est-ce que le GPT-3 ?
- Quelle est la capacité du GPT-3 ?
- Comment fonctionne le GPT-3 ?
- Certains des problèmes associés au GPT-3
Qu’est-ce que le GPT-3 ?
GPT-3 est l’abréviation de Generative Pre-training Transformer 3. Il s’agit d’un modèle de Deep Learning composé d’algorithmes capables de reconnaître des modèles de données et qui peuvent également apprendre par le biais d’exemples. À ce titre, il est considéré comme un réseau neuronal artificiel avec une mémoire à long terme.
Le GTP-3 utilise ses algorithmes pour générer du texte. Ces algorithmes ont été préalablement formés à l’aide d’une énorme base de données.
Il évalue et traite toutes les données qu’il reçoit afin de combler les lacunes en matière d’information.
Le GTP-3 a été décrit comme la percée la plus importante et la plus utile en matière d’intelligence artificielle depuis des années. Il semble être – bien qu’il soit encore dans sa version bêta – le modèle d’intelligence artificielle le plus puissant actuellement disponible.
Lire la suite | Intelligence artificielle vs Machine learning vs Deep Learning
Quelle est la capacité de GPT-3 ?
Il est capable de générer des textes entiers en commençant par une seule phrase, puis en complétant le reste de l’écriture. Pour ce faire, il traite plus de 175 milliards de paramètres. C’est un fait très pertinent, puisque sa précédente version GPT-2, qui a été lancée en 2019, ne traitait qu’environ 1,5 milliard de paramètres. Les progrès réalisés en un an seulement ont été étonnants.
GPT-3 peut traduire des textes dans d’autres langues et les adapter à différents styles d’écriture, comme celui d’un article de journal, d’un roman de fiction, etc. Il peut également écrire de la poésie ou nous livrer la meilleure réponse à toute question que nous lui posons.
En bref, le GTP-3 peut s’adapter à tout ce qui est structuré comme langage : il peut répondre à des questions, rédiger des essais, résumer de longs textes, traduire, prendre des notes et même écrire du code informatique.
Oui, vous avez bien lu : Le GTP-3 peut également programmer. À la grande surprise de tous, on a découvert qu’il est capable d’utiliser un plug-in pour Figma, un outil logiciel couramment utilisé dans la conception d’applications et de sites web. Cette caractéristique pourrait avoir des implications considérables sur la manière dont les logiciels seront développés à l’avenir.
La quantité de choses qu’il est capable de faire peut sembler incroyable, mais ses capacités potentielles sont encore plus stupéfiantes.
À lire | Intelligence augmentée : les humains et l’IA unissent leurs forces
Comment fonctionne GPT-3 ?
Afin de le former et d’atteindre une capacité opérationnelle, le GPT-3 a reçu des informations allant des textes de Wikipedia sélectionnés par OpenAI à environ 750 Go du corpus CommonCrawl. Ce corpus est un ensemble de données collectées en parcourant l’Internet et qui est accessible au grand public. En effet, un grand nombre de ressources informatiques et environ 4,6 millions de dollars ont été investis rien que pour faire suivre cette formation à GPT-3.
Sa structure algorithmique est conçue pour prendre en compte une entrée linguistique et fournir comme résultat sa meilleure prédiction de ce qui serait le message le plus utile pour l’utilisateur concernant une telle entrée. Le GPT-3 peut faire ces prédictions grâce à sa formation exhaustive avec une base de données aussi importante. C’est l’aspect clé qui le différencie des autres algorithmes qui ne sont pas capables de faire de telles prédictions.
Pour élaborer des textes et des phrases, il utilise une approche d’analyse sémantique qui va au-delà de la signification des mots et prend également en compte la façon dont leur combinaison avec d’autres mots affecte leur signification en fonction du contexte global dans lequel ils se trouvent.
14 exemples d’applications du GPT-3 sur la vidéo ci-dessous :
Apprentissage non supervisé
L’apprentissage du GPT-3 est connu sous le nom d’apprentissage non supervisé. Cela signifie qu’il n’a pas reçu de retour d’information lui permettant de savoir si ses réponses sont correctes ou incorrectes pendant sa formation. Le GPT-3 obtient toutes les informations dont il a besoin en analysant les textes composant sa base de données.
Lorsqu’il commence une nouvelle tâche linguistique, il se trompe des millions de fois au début, mais finit par trouver le mot correct. GPT-3 découvrira que son choix est le « bon » choix en vérifiant ses données d’entrée originales. Lorsqu’il sera certain d’avoir trouvé la bonne sortie, il attribuera un « poids » au processus algorithmique qui a produit le bon résultat. De cette façon, il apprend progressivement quels sont les processus les plus susceptibles de fournir des réponses correctes.
Vous pourriez également être intéressé par | 7 façons dont la big data affectera les entreprises à l’avenir
Certains des problèmes associés à GPT-3
Certains problèmes que les spécialistes de l’intelligence artificielle ont mis en garde concernent la capacité épouvantable de produire de fausses nouvelles en masse. Ces algorithmes pourraient produire ce genre de nouvelles et surcharger les réseaux, provoquant une désinformation généralisée sans que nous nous rendions à peine compte de ce qui se passe.
Vous pensez peut-être pouvoir distinguer les textes écrits par des machines de leurs homologues créés par l’homme ? Une étude réalisée par Adrian Yijie Xu a donné un résultat surprenant :
« Seuls 52% des lecteurs détectent quels textes ont été créés par GPT-3. »
Par conséquent, une partie importante de la population serait vulnérable à ces fausses nouvelles artificielles, les considérant vraies et contribuant à la désinformation générale.
Un autre problème que pose cette technologie est qu’il s’agit d’un outil très coûteux, car il nécessite une énorme puissance de calcul pour pouvoir fonctionner. Par conséquent, son utilisation est limitée à un très petit nombre d’entreprises qui peuvent se le permettre.
?Article recommandé | L’impact de l’Edge Computing sur l’avenir de l’IoT
L’avenir de GPT-3
OpenAI n’a pas révélé tous les détails du fonctionnement de ses algorithmes, si bien que quiconque s’appuie sur le GTP-3 pour obtenir des réponses ou développer ses produits est en quelque sorte aveuglé et ne sait pas exactement comment les informations récupérées ont été obtenues ou si l’on peut vraiment s’y fier.
Le système est prometteur, mais il n’est pas encore parfait : il peut élaborer des textes courts ou des applications de base, mais les résultats qu’il donne pour des tâches plus complexes relèvent davantage du charabia que d’une véritable réponse utile.
Tout de même, nous devons dire que le GPT-3 – avec toutes ses limites – a obtenu des résultats très prometteurs en un laps de temps assez court et nous espérons qu’il sera bientôt appliqué de manière pratique à notre vie quotidienne pour des améliorations au niveau des chatbots ou comme sorte d’aide et soutien aux programmeurs, par exemple.