creativitatea-inteligentei-artificiale,-explicata-prin-imperfectiunile-algoritmilor

Creativitatea inteligenței artificiale, explicată prin imperfecțiunile algoritmilor

Timp de citire: 3 minute

De ani buni, sistemele de inteligență artificială uimesc prin imagini și texte care par să depășească simpla imitație. Modelele de generare grafică, precum DALL·E, Imagen sau Stable Diffusion, creează adesea compoziții originale, deși sunt antrenate doar să reproducă exemplele din baza de date. O nouă cercetare arată însă că această „creativitate” nu este o magie ascunsă, ci o consecință inevitabilă a felului în care aceste modele sunt construite.

O echipă de fizicieni de la Universitatea Stanford și École Normale Supérieure din Paris a descoperit că imperfecțiunile arhitecturii rețelelor neuronale, în special procesul de denoising (îndepărtarea zgomotului digital), sunt responsabile pentru capacitatea de a genera imagini complet noi. Studiul, ce urmează să fie prezentat la International Conference on Machine Learning 2025, ar putea schimba nu doar modul în care privim inteligența artificială, ci și felul în care înțelegem creativitatea umană.

Modelele de tip difuzie funcționează printr-un proces aparent simplu: transformă o imagine într-un „nor” de pixeli aleatori, apoi încearcă să reconstruiască imaginea inițială pas cu pas. Logica ar dicta că rezultatul ar trebui să fie doar o copie a datelor de antrenament. În practică însă, algoritmii combină elemente din surse diferite și creează imagini cu sens nou, cum ar fi portrete cu detalii inedite sau peisaje care nu au existat niciodată.

Fizicianul Mason Kamb, doctorand la Stanford, și mentorul său Surya Ganguli au demonstrat că această inovație vizuală provine din două trăsături tehnice: localitatea și echivarianța translațională. Primul concept descrie atenția modelului asupra unor mici „petice” de pixeli, fără a ști cum vor fi integrate în imaginea finală. Al doilea impune ca, dacă o imagine este deplasată cu câțiva pixeli, sistemul să reproducă aceeași schimbare, pentru a menține coerența.

Aceste limitări, considerate până acum defecte, obligă rețeaua să reconstruiască imaginea în moduri neașteptate, asemănătoare cu felul în care celulele unui organism formează tipare complexe fără un plan central. Cercetătorii au creat un set de ecuații, numit „equivariant local score machine”, care poate prezice rezultatele cu o acuratețe de aproximativ 90%, o performanță rar întâlnită în domeniul inteligenței artificiale.

O paralelă surprinzătoare cu biologia și dezvoltarea organismelor

Kamb s-a inspirat din biologia dezvoltării, mai exact din modelele propuse de matematicianul Alan Turing pentru a explica cum se formează organe și membre. În embrion, fiecare celulă reacționează doar la vecinii săi, fără a avea imaginea completă a corpului. Din această interacțiune locală apar structuri complexe, dar și „erori” precum degete suplimentare.

Când au apărut primele imagini generate de AI cu mâini având prea multe degete, Kamb a văzut o analogie clară. În ambele cazuri, ordinea finală apare dintr-o multitudine de decizii locale, nu dintr-un plan preexistent. Difuzia digitală funcționează, așadar, similar cu morfogeneza biologică: fiecare „patch” de pixeli se așază în relație cu vecinii, generând uneori forme noi, surprinzătoare.

Această perspectivă sugerează că ceea ce numim creativitate – fie la mașini, fie la oameni – ar putea fi produsul unor mecanisme simple, dar emergente. Imperfecțiunile devin astfel surse de inovație, iar „greșelile” sistemului se transformă în artă.

Implicații pentru viitorul AI și pentru înțelegerea minții umane

Descoperirea are consecințe importante. În primul rând, explică de ce modelele de difuzie, deși programate pentru reproducere, pot depăși materialul de antrenament. În al doilea rând, oferă cercetătorilor un instrument matematic pentru a prezice și chiar controla nivelul de originalitate al acestor sisteme.

Mai mult, analogia cu neuroștiința devine tentantă. Așa cum artiștii își combină amintirile și experiențele pentru a crea ceva nou, algoritmii AI „asamblează” elemente din datele pe care le-au văzut, completând golurile cu propriile reguli interne. Benjamin Hoover, specialist în învățare automată, subliniază că și oamenii lucrează cu informații incomplete, generând idei originale tocmai din aceste imperfecțiuni.

Rămân, totuși, întrebări deschise. Modelele lingvistice mari, precum cele folosite pentru text, nu se bazează pe aceleași principii de localitate și echivarianță, dar par la fel de creative. Cercetătorii consideră că noul studiu este o piesă importantă dintr-un puzzle mai amplu, care ar putea, în timp, să dezvăluie mecanismele comune dintre creativitatea artificială și cea umană.

În lumina acestor descoperiri, creativitatea inteligenței artificiale nu mai pare un miracol inexplicabil. Este rezultatul natural al modului în care modelele sunt construite – o dovadă că, uneori, imperfecțiunea nu este un defect, ci chiar motorul inovației.