![]() |
|
Mecanismul prin care neuronii învață prin recompense și pedepse, descoperit de cercetătorii de la ConeuralIunie 2007 Răzvan Florian, cercetător în cadrul Coneural, a descoperit un mecanism prin care o rețea de neuroni simulați pe calculator poate să învețe să aibă un anumit comportament, doar pe baza recompenselor și pedepselor primite de la cel care antrenează rețeaua. Învățarea prin recompense și pedepse este tipul de învățare prin care, de exemplu, se dresează un animal. Chiar dacă un câine nu înțelege inițial care este sensul unei comenzi, dacă execută din întâmplare comanda și este apoi recompensat cu o bomboană, va învăța ulterior să facă lucrul cerut doar auzind comanda. Analog, dacă un animal sau un copil este pedepsit pentru că a făcut un anumit lucru, comportamentul respectiv va fi făcut mai rar în viitor. Mecanismul descoperit de Florian elucidează modul în care această învățare poate avea loc prin modificarea tăriei conexiunilor dintre neuroni (celulele din creier). Modificarea tăriei unei conexiuni (sinapse) depinde de intervalele de timp dintre pulsurile emise de cei doi neuroni conectați și de mărimea recompenselor, respectiv a pedepselor primite. Mecanismul a fost descoperit prin deducție matematică și eficacitatea lui a fost demonstrată ulterior prin simulări pe calculator. De exemplu, un vierme simulat pe calculator a învățat pe baza acestui mecanism să găsească o sursă de mâncare. Mecanismul folosește componente deja observate de neurologi în creier, și este deci foarte probabil ca să funcționeze și în creierul nostru. Articolul care prezintă această descoperire a apărut în revista Neural Computation, cea mai importantă revistă științifică din domeniul rețelelor neuronale, revistă editată de prestigiosul Massachusetts Institute of Technology (MIT) din SUA. Este pentru prima dată când un articol din România este acceptat spre publicare în această revistă, înființată acum 18 ani. Cercetătorii clujeni vor folosi în viitor metoda de învățare descoperită pentru instruirea roboților. "Prin acest tip de învățare, roboții ar putea fi instruiți de către orice utilizator, și ar putea să îndeplinească o gamă variată de sarcini, spre deosebire de roboții care pot avea doar comportamente stereotipe, implementate de programatori înainte de livrarea roboților către utilizatorii finali", spune Florian. Capacitatea de a învăța permanent, în interacțiune cu mediul, este crucială pentru ca roboții să poată fi folosiți în medii ale căror caracteristici se schimbă tot timpul, așa cum sunt o banală bucătărie, în care permanent apar schimbări în pozițiile obiectelor sau obiecte noi. Mecanismele de învățare de genul celui descoperit de Răzvan Florian sunt deci elemente critice pentru ca să putem avea în viitor roboți care să facă curățenie sau de mâncare în casă. Conform fondatorului Microsoft, Bill Gates, robotica va fi în următorii ani cel mai "fierbinte" domeniu al tehnologiei, urmând ca roboții să fie din ce în ce mai prezenți în viața noastră, în domenii cum ar fi asistența pentru oamenii în vârstă sau cu dizabilități sau industria construcțiilor.
Ecouri în mass-media: Cotidianul, Europa
FM, Clujeanul,
Informația
de Cluj,
Stiinta.info Direcționați 2% din impozitul dvs. pe venit pentru sprijinirea cercetărilor de la Coneural! |
||||