un-nou-model-ai-depaseste-chatgpt-la-testele-de-rationament.-cum-functioneaza-hrm?

Un nou model AI depășește ChatGPT la testele de raționament. Cum funcționează HRM?

Timp de citire: 2 minute

Un model de inteligență artificială bazat pe mecanisme similare celor din creierul uman a reușit să obțină rezultate mai bune decât cele mai avansate LLM-uri în teste de raționament complex.

Cercetători de la compania Sapient din Singapore au dezvoltat un nou tip de inteligență artificială, denumit hierarchical reasoning model (HRM), care promite să schimbe modul în care sunt abordate sarcinile de raționament.

Spre deosebire de modelele lingvistice de mari dimensiuni (LLM) precum ChatGPT, HRM se inspiră din felul în care creierul uman procesează informații la diferite intervale de timp și niveluri de abstractizare, scrie Live Science.

Potrivit studiului încă nevalidat prin peer-review, HRM funcționează cu mult mai puțini parametri și necesită un volum redus de date de antrenament, ceea ce îl face mai eficient.

În timp ce modelele de ultimă generație folosesc miliarde sau chiar trilioane de parametri, HRM operează cu doar 27 de milioane și 1.000 de exemple de antrenament.

Performanțe peste modelele consacrate

Cea mai notabilă reușită a fost în cadrul benchmark-ului ARC-AGI, unul dintre cele mai dificile teste concepute pentru a evalua cât de aproape sunt sistemele AI de inteligența generală artificială (AGI).

HRM a obținut un scor de 40,3% în testul ARC-AGI-1, depășind o3-mini-high de la OpenAI (34,5%), Claude 3.7 de la Anthropic (21,2%) și Deepseek R1 (15,8%). În versiunea mai dificilă, ARC-AGI-2, noul model a atins 5%, comparativ cu 3% pentru o3-mini-high și sub 1,5% pentru ceilalți competitori.

Spre deosebire de lanțul de raționamente (Chain-of-Thought, CoT), utilizat de majoritatea LLM-urilor pentru a împărți problemele complexe în pași intermediari, HRM folosește două module care lucrează complementar: unul pentru planificare abstractă și altul pentru calcule rapide și precise. Acest mecanism reflectă într-o anumită măsură organizarea diferitelor regiuni ale creierului uman.

Mai mult, HRM utilizează o tehnică de iterative refinement prin care soluțiile sunt perfecționate treptat, în mici „rafale de gândire”, până la obținerea unui rezultat final. Această abordare a permis modelului să rezolve corect probleme complexe de tip Sudoku sau să găsească trasee optime în labirinturi – provocări la care LLM-urile obișnuite eșuează de regulă.

În ce direcție merge cercetarea

Chiar dacă performanțele obținute sunt notabile, studiul ridică și semne de întrebare. Organizatorii benchmark-ului ARC-AGI, care au încercat să reproducă rezultatele după ce modelul a fost publicat pe GitHub, au confirmat scorurile, dar au observat că arhitectura ierarhică nu a contribuit atât de mult la performanță.

Potrivit acestora, o etapă de rafinare insuficient documentată în faza de antrenament ar fi fost decisivă pentru rezultate.

În pofida acestor incertitudini, HRM marchează un pas important în direcția dezvoltării unor AI-uri care nu se bazează exclusiv pe cantitatea de date și pe dimensiunea parametrilor.

Dacă aceste rezultate vor fi confirmate și prin evaluări independente, tehnologia ar putea deschide drumul către sisteme mai inteligente, mai eficiente și mai apropiate de modul de gândire uman.