Deși inteligența artificială a demonstrat că poate depăși oamenii la sarcini complexe precum șahul, jocul Go sau chiar examene universitare, există domenii unde rămâne surprinzător de slabă.
Puzzle-urile logice și jocurile de tip abstracție, pe care oamenii le rezolvă rapid și intuitiv, reprezintă una dintre cele mai mari provocări pentru modelele de tip deep learning.
Această discrepanță între ceea ce AI reușește să facă și ceea ce nu poate încă reprezintă unul dintre motivele pentru care inteligența generală artificială (AGI) rămâne un obiectiv îndepărtat, scrie Scientific American.
Puzzle-uri banale pentru oameni, bariere pentru AI
Un exemplu central este Abstraction and Reasoning Corpus (ARC), dezvoltat în 2019 de cercetătorul François Chollet.
Setul de puzzle-uri constă în mici grile colorate unde solverul trebuie să deducă o regulă ascunsă și să o aplice pe o grilă nouă.
Pentru oameni, exercițiile seamănă cu jocuri de logică distractive, dar pentru IA acestea sunt extrem de dificile.
ARC a devenit rapid un standard de testare în industrie, folosit pentru a evalua mari modele lingvistice și algoritmi de învățare automată.
Fundația ARC Prize dezvoltă acum versiuni tot mai avansate, de la ARC-AGI-1 și ARC-AGI-2 la noul ARC-AGI-3, lansat săptămâna aceasta, care introduce o noutate: testarea IA prin jocuri video.
Greg Kamradt, președintele Fundației ARC Prize, explică faptul că aceste teste măsoară capacitatea unui model de a învăța o regulă nouă dintr-un exemplu și de a o aplica corect.
„Inteligenta este abilitatea de a învăța lucruri noi. Modelele pot fi excelente la o sarcină anume, dar dacă nu pot generaliza în domenii noi, nu putem vorbi de AGI”, spune el.
Ce înseamnă cu adevărat AGI?
Definiția inteligenței generale artificiale variază, dar există două perspective majore:
- Eficiența învățării, adică abilitatea unui sistem artificial de a învăța cu la fel de puține date și exemple precum oamenii. Spre deosebire de AI, oamenii pot învăța să vorbească, să conducă sau să meargă pe bicicletă fără „seturi de antrenament” masive.
- Observațional, atunci când nu mai putem găsi sarcini pe care oamenii le rezolvă, dar IA nu.
Deocamdată, spune Kamradt, suntem încă departe: „Atâta timp cât există puzzle-uri pe care oamenii le fac cu ușurință, dar modelele de IA nu, nu am atins AGI”.
Această concluzie subliniază o realitate importantă: modelele actuale demonstrează inteligență „spiky”, adică performanțe excepționale într-un domeniu îngust, dar fără versatilitatea naturală a creierului uman.
Jocurile video, noul teren de test
ARC-AGI-3 duce testarea la următorul nivel: folosirea jocurilor video ca instrument pentru a evalua AI. Motivul este simplu, jocurile oferă medii interactive, dinamice și complet noi, unde regulile trebuie deduse și aplicate pe loc.
Astfel de teste nu mai verifică doar capacitatea IA de a recunoaște tipare, ci și de a naviga situații inedite, ceea ce se apropie mai mult de felul în care oamenii gândesc și învață.