Emmanuel de Maistre a récemment publié un fil de discussion sur Twitter, détaillant le processus de création d’un bunker isométrique inspiré de Command & ; Conquer : Alerte Rouge. Tout cela grâce à la puissance de l’IA et à un long travail de mise au point.
Thread time 🧵
Voici comment concevoir avec précision un petit bâtiment dans un jeu (comme un bunker isométrique) en affinant les réglages. #StableDiffusion
Cet exemple a été inspiré par #RedAlertsur lequel j’ai passé d’innombrables heures (en 96-97 – ne me traitez pas de vieux 😅).
CC https://t.co/dlRJIWtD3Y pic.twitter.com/IqEaPRyZAu
– Emm (@emmanuel_2m) 30 novembre 2022
Tout d’abord, de Maistre a généré plus de 200 bâtiments en utilisant Midjourney. Il n’a pas révélé de descriptions textuelles exactes, mais voici les différents types de constructions et de véhicules qu’il a obtenus.
Ensuite, il a sélectionné 16 images – toutes différentes les unes des autres, mais restant cohérentes avec le style général – pour obtenir un ensemble de données plus petit.
Ces images ont été utilisées pour affiner la diffusion stable à l’aide des techniques suivantes Scénarioun outil à venir pour la création de ressources générées par l’IA (dont le lancement est prévu dans le courant du mois).
La cohérence du style est primordiale lorsqu’il s’agit de concevoir #game actifs.
J’ai fait un réglage fin en utilisant @Scénario_gg (alpha), à partir de 16 images (ci-dessous), inspirées des bâtiments d’Alerte Rouge/Command & Conquer.
Fait amusant : je les ai toutes générées en… @midjourney. pic.twitter.com/oj3WSUXGBh
– Emm (@emmanuel_2m) 30 novembre 2022
En suivant l’entraînement du modèle, de Maistre a essayé plusieurs invites pour générer différents types de bâtiments. Voici quelques résultats, dont une centrale nucléaire, un dôme radar et une raffinerie.
Et qu’en est-il d’un bunker ? de Maistre a généré plusieurs versions à partir d’une seule image de référence provenant de l’ensemble de données original en utilisant la traduction d’image à image.
Il a également essayé quelques autres options avant de décider de réentraîner le modèle. Il a réduit l’ensemble de données à 12 images (au lieu de 16) et a réglé l’encodeur de texte à 50% (au lieu de 100%).
J’ai donc réentraîné le modèle avec deux différences : réduction de l’ensemble de données à 12 images (pour augmenter la cohérence, au risque de diminuer la variabilité). J’ai également réglé l’encodeur de texte à 50% (au lieu de 100%)
Et cela a beaucoup mieux fonctionné. Voici un premier bunker (en forme de tour) pic.twitter.com/XRhPnEKl0c
– Emm (@emmanuel_2m) 30 novembre 2022
Finalement, de Maistre est revenu à la forme de la casemate et l’a personnalisée en utilisant l’invite suivante : « Bunker isométrique, réaliste, drapeau soviétique, rouge, jeu vidéo ». Il a également modifié un peu la description pour générer une version américaine.
Il a ensuite montré des bunkers générés par l’IA avec différents paysages et structures autour d’eux. « Trois mots, une bonne mise au point, une image choisie (pour img2img) et les possibilités sont tout simplement infinies », a noté M. de Maistre.
J’ai modifié l’image originale pour générer un bunker avec un angle plus large (et quelques structures autour).
« Bunker isométrique, réaliste, jeu vidéo ».
C’est tout. 3 mots, une bonne mise au point, une image curée (pour img2img) et les possibilités sont juste infinies. pic.twitter.com/UrUJd3jR3h
– Emm (@emmanuel_2m) 30 novembre 2022
Plus d’images et de ressources générées peuvent être trouvées dans le site Web de la Commission européenne. fil complet. Comme l’a souligné de Maistre, ces outils seront particulièrement utiles aux artistes ayant un haut niveau de créativité, de connaissances et de culture.
« Je prédis que les studios de jeux finiront par gérer des centaines (voire des milliers) de modèles affinés, qui subiront un certain processus de validation avant d’être utilisés en production par diverses équipes (artistes, développeurs, concepteurs, spécialistes du marketing…) », conclut M. de Maistre.
Si vous voulez voir d’autres exemples de ce dont les modèles d’IA sont capables entre de bonnes mains, regardez ceci collection de Fallout 2 actifs réimaginés avec la Diffusion Stable.