Nvidia transforma prompturile simple de text in modele 3D gata de jocuri

Nvidia transforma prompturile simple de text in modele 3D gata de jocuri

Nvidia tocmai a dezvăluit noul său model generativ de inteligență artificială, numit Latte3D, în cadrul evenimentului GTC 2024. Latte3D pare a fi ChatGPT pe steroizi extreme. Este un model text-to-3D care acceptă prompturi simple și scurte de text și le transformă în obiecte și animale 3D într-o secundă. Mult mai rapid decât predecesorii săi, Latte3D funcționează ca un fel de imprimantă virtuală 3D, ceea ce ar putea fi util pentru creatorii din multe industrii.

Latte3D a fost creat pentru a simplifica crearea de modele 3D pentru diverse tipuri de creatori, cum ar fi cei care lucrează la jocuri video, proiecte de design, marketing sau chiar la învățarea automată și antrenarea pentru robotică. În demonstrația Nvidia a modelului, pare extrem de simplu de utilizat. După un prompt rapid de text, IA generează un model 3D și, în curând, îl finalizează cu mult mai multe detalii. Deși rezultatul final nu este nici pe departe la fel de realist ca Sora de la OpenAI, acesta nu este scopul — este o modalitate de a accelera crearea activelor în loc să le construiești de la zero.

Modelul generează mai multe opțiuni diferite pentru utilizator de a alege, iar Nvidia spune că aceste forme pot fi „optimizate pentru o calitate superioară în câteva minute”. Designurile pot fi apoi exportate către diferite platforme, cum ar fi Omniverse de la Nvidia, și pot fi ajustate pentru a se potrivi rezultatului dorit. Nvidia a antrenat Latte3D folosind GPU-urile sale Ada A100 Tensor Core și a susținut antrenamentul cu prompturi de la ChatGPT pentru a-l pregăti pentru interacțiunea cu utilizatorii reali.

În prezent, Latte3D poate genera doar obiecte și animale. În acest sens, pare să facă o treabă solidă în discernerea diferitelor animale, texturi și tipuri de obiecte. Nvidia a demonstrat aceste capacități prezentând obiecte precum un crane comun amigurumi (croșetat) sau un câine sphynx din origami. Modelul a fost învățat să recunoască diverse specii și, astfel, poate face diferența între un greyhound italian și un Shiba Inu.

Creatorii care doresc să folosească Latte3D pentru mai mult pot să-l antreneze pe un set de date diferit, fie că este vorba despre plante sau obiecte de uz casnic, și ulterior să-l utilizeze în propriile lor scopuri. Nvidia aduce în discuție unele cazuri interesante de utilizare aici, cum ar fi antrenarea roboților asistenți personali înainte de a-i implementa. Este ușor de imaginat că Latte3D va fi util pentru dezvoltatorii de jocuri, dar potențialul său depășește cu mult doar scenariile de gaming.

Sanja Fidler, vicepreședinte al cercetării în domeniul IA la Nvidia, a remarcat cât de mult mai rapid este Latte3D în comparație cu predecesorii săi: „Cu un an în urmă, modelele AI aveau nevoie de o oră pentru a genera vizualizări 3D de această calitate — iar starea actuală a tehnologiei este acum între 10 și 12 secunde. Acum putem produce rezultate de un ordin de mărime mai rapid”, a spus Fidler.

Anunțurile recente legate de utilizarea IA în dezvoltarea de jocuri sunt cu adevărat revoluționare, iar Latte3D de la Nvidia se alătură unei liste tot mai mari de instrumente care, într-o zi, ar putea schimba complet procesul de creare a unui joc. De exemplu, Nvidia a dezvăluit recent personaje non-jucători (NPC-uri) cu dialog complet generat de IA. Între timp, ultima actualizare a motorului Unreal Engine poate genera vizuale de calitate cinematografică în jocuri în timp real, cu ajutorul învățării automate.