211service.com
Un concetto in psicologia sta aiutando l'IA a navigare meglio nel nostro mondo
Categoria: Intelligenza artificiale Inserito 17 luglio

Il concetto: Quando guardiamo una sedia, indipendentemente dalla sua forma e colore, sappiamo che possiamo sederci su di essa. Quando un pesce è in acqua, indipendentemente dalla sua posizione, sa che può nuotare. Questa è conosciuta come la teoria dell'affordance, un termine coniato dallo psicologo James J. Gibson. Afferma che quando gli esseri intelligenti guardano il mondo percepiscono non solo gli oggetti e le loro relazioni, ma anche le loro possibilità . In altre parole, la sedia offre la possibilità di sedersi. L'acqua offre la possibilità di nuotare. La teoria potrebbe spiegare in parte perché l'intelligenza animale è così generalizzabile: spesso sappiamo immediatamente come interagire con nuovi oggetti perché riconosciamo le loro possibilità.
L'idea: I ricercatori di DeepMind stanno ora utilizzando questo concetto per sviluppare un nuovo approccio all'apprendimento per rinforzo . Nell'apprendimento per rinforzo tipico, un agente impara attraverso tentativi ed errori, partendo dal presupposto che qualsiasi azione sia possibile. Un robot che impara a spostarsi dal punto A al punto B, ad esempio, presumerà di potersi muovere attraverso pareti o mobili fino a quando ripetuti fallimenti non diranno il contrario. L'idea è che se al robot venisse invece prima insegnata l'accessibilità del suo ambiente, eliminerebbe immediatamente una parte significativa delle prove fallite che dovrebbe eseguire. Ciò renderebbe il suo processo di apprendimento più efficiente e lo aiuterebbe a generalizzare in diversi ambienti.
Gli esperimenti: I ricercatori hanno creato un semplice scenario virtuale. Hanno posizionato un agente virtuale in un ambiente 2D con un muro nel mezzo e hanno chiesto all'agente di esplorare il suo raggio di movimento fino a quando non ha appreso cosa l'ambiente gli avrebbe permesso di fare: le sue possibilità. I ricercatori hanno quindi dato all'agente una serie di semplici obiettivi da raggiungere attraverso l'apprendimento per rinforzo, come spostare una certa quantità a destra oa sinistra. Hanno scoperto che, rispetto a un agente che non aveva appreso le affordances, evitava qualsiasi mossa che lo avrebbe bloccato dal muro a metà del suo movimento, preparandolo per raggiungere il suo obiettivo in modo più efficiente.
Perchè importa: Il lavoro è ancora nelle sue fasi iniziali, quindi i ricercatori hanno utilizzato solo un ambiente semplice e obiettivi primitivi. Ma la loro speranza è che i loro esperimenti iniziali aiuteranno a gettare una base teorica per ampliare l'idea fino ad azioni molto più complesse. In futuro, vedono che questo approccio consentirà a un robot di valutare rapidamente se può, ad esempio, versare del liquido in una tazza. Avendo sviluppato una comprensione generale di quali oggetti offrono la possibilità di trattenere liquidi e quali no, non dovrà più saltare la tazza e versare liquidi su tutto il tavolo per imparare a raggiungere il suo obiettivo.