I potenti algoritmi di visione artificiale ora sono abbastanza piccoli da poter essere eseguiti sul tuo telefono

Categoria: Intelligenza artificiale Inserito 11 ottobre Un Un





I ricercatori hanno ridotto i modelli di visione artificiale all'avanguardia per l'esecuzione su dispositivi a bassa potenza.

Dolori crescenti: Il riconoscimento visivo è l'abilità più forte del deep learning. Gli algoritmi di visione artificiale stanno analizzando immagini mediche, abilitando auto a guida autonoma e potenziando il riconoscimento facciale. Ma i modelli di formazione per riconoscere le azioni nei video sono diventati sempre più costosi. Ciò ha alimentato le preoccupazioni sull'impronta di carbonio della tecnologia e sulla sua crescente inaccessibilità in ambienti con risorse limitate.

La ricerca: I ricercatori del MIT-IBM Watson AI Lab hanno ora sviluppato una nuova tecnica per addestrare modelli di riconoscimento video su un telefono o altro dispositivo con capacità di elaborazione molto limitata. In genere, un algoritmo elaborerà il video suddividendolo in frame di immagine ed eseguendo algoritmi di riconoscimento su ciascuno di essi. Quindi mette insieme le azioni mostrate nel video vedendo come cambiano gli oggetti nei fotogrammi successivi. Il metodo richiede che l'algoritmo ricordi ciò che ha visto in ogni frame e l'ordine in cui lo ha visto. Questo è inutilmente inefficiente.



Nel nuovo approccio, l'algoritmo estrae invece gli schizzi di base degli oggetti in ogni fotogramma e li sovrappone uno sopra l'altro. Piuttosto che ricordare cosa è successo quando, l'algoritmo può avere un'idea del passare del tempo osservando come gli oggetti si spostano nello spazio negli schizzi. Durante i test, i ricercatori hanno scoperto che il nuovo approccio ha addestrato modelli di riconoscimento video tre volte più veloci rispetto allo stato dell'arte. È stato anche in grado di farlo rapidamente classificare i gesti delle mani con un piccolo computer e una fotocamera che funzionano solo con l'energia sufficiente per alimentare una luce per bicicletta.

Perchè importa: La nuova tecnica potrebbe aiutare a ridurre il ritardo e i costi di calcolo nelle applicazioni commerciali esistenti della visione artificiale. Potrebbe, ad esempio, rendere più sicure le auto a guida autonoma accelerando la loro reazione alle informazioni visive in arrivo. La tecnica potrebbe anche sbloccare nuove applicazioni che in precedenza non erano possibili, ad esempio consentendo ai telefoni di aiutare a diagnosticare i pazienti o analizzare immagini mediche.

IA distribuita: Man mano che sempre più ricerche sull'IA vengono tradotte in applicazioni, aumenterà la necessità di modelli più piccoli. Il documento MIT-IBM fa parte di una crescente tendenza a ridurre i modelli all'avanguardia a dimensioni più gestibili.



Per ricevere più storie come questa direttamente nella tua casella di posta, iscriviti alla nostra newsletter AI nominata da Webby The Algorithm. È gratis.