Que s’est-il passé ?
- Comme repéré par TechCrunch, un groupe de chercheurs de l’Université informatique de Copenhague a publié MarioGPT, un modèle GPT2 affiné décrit comme le « premier modèle texte-niveau ».
- Ils ont publié un article décrivant le modèle et ses caractéristiques et ont également publié MarioGPT sur GitHub. Il a été entraîné sur Super Mario Bros. et sa suite, Les niveaux perduspour aider à générer des niveaux à base de tuiles pour le jeu en utilisant une invite textuelle.
- Contrairement aux précédents générateurs de Mario, MarioGPT s’appuie sur une IA générative plutôt que sur l’assemblage de niveaux à partir de jeux de tuiles pré-créés.
- Nintendo n’a pas encore réagi à ce projet. Cependant, ses avocats pourraient avoir des problèmes avec ce projet, étant donné les antécédents de la société en matière de litiges sur les droits d’auteur.
Comment fonctionne MarioGPT ?
- MarioGPT est basé sur le modèle d’apprentissage du langage DistilGPT2 (LLM). Cependant, il ne peut pas comprendre les niveaux de Super Mario Bros. de manière native, ils doivent donc d’abord être rendus sous forme de texte.
- Cela permet au modèle de prédire les prochaines séquences d’expressions. Les niveaux sont représentés comme des tuiles de chaînes de caractères, qui codent certains objets du jeu. Par exemple, un bloc de questions est représenté par » ? / Q », les tuiles cassables par « S », les ennemis par « E » et les pièces par « o ».
Tuiles de Mario représentées par des symboles pour MarioGPT
- Ensuite, MarioGPT sera capable de comprendre les modèles et de les reproduire sous la forme de niveaux réels dans le jeu.
Pipeline de prédiction de MarioGPT, d’une simple invite textuelle à un niveau généré.
- L’un des chercheurs de l’équipe, le cofondateur de modl.ai Sebastian Risi, a expliqué sur Twitter que pour incorporer des informations rapides, « nous utilisons un encodeur de texte gelé sous la forme d’un LLM bidirectionnel pré-entraîné (BART), et nous produisons les états cachés moyens de la passe avant du modèle ».
MarioGPT est un modèle GPT2 affiné qui est entraîné sur un sous-ensemble de niveaux de Super Mario Bros. Pour incorporer les informations d’invite, nous utilisons un encodeur de texte gelé sous la forme d’un LLM bidirectionnel pré-entraîné (BART), et nous produisons la moyenne des états cachés de la passe avant du modèle. pic.twitter.com/H6ZSPUFgdF
– Sebastian Risi (@risi1979) 14 février 2023
- Dans la plupart des cas, MarioGPT peut générer avec succès des niveaux de jeu à partir de diverses invites textuelles (par exemple, « pas de tuyaux, pas d’ennemis, beaucoup de blocs » ou « beaucoup de tuyaux, beaucoup d’ennemis, peu de blocs, faible élévation »). Cependant, des échecs peuvent se produire rarement, le modèle n’est donc pas parfait.
Exemples de niveaux de Super Mario Bros. générés à l’aide de MariorGPT ; (f) est un cas d’échec.
- « Je pense qu’avec de petits ensembles de données en général, GPT2 est mieux adapté que GPT3, tout en étant beaucoup plus léger et plus facile à entraîner », a déclaré Shyam Sudhakaran, rédacteur principal du document, à TechCrunch. « Cependant, à l’avenir, avec des ensembles de données plus importants et des invites plus compliquées, nous pourrions avoir besoin d’utiliser un modèle plus sophistiqué comme GPT3. »
Merci de nous avoir lu ! Voici quelques vidéos d’un agent A* appréciant les niveaux générés par MarioGPT. Profitez-en ! ???? pic.twitter.com/mZJdp2WV83
– Sebastian Risi (@risi1979) 14 février 2023