211service.com
Ottenere valore dai tuoi dati non dovrebbe essere così difficile
Fornito da Hewlett Packard Enterprise
Il potenziale impatto dell'esplosione mondiale di dati in corso continua ad eccitare l'immaginazione. Un rapporto del 2018 ha stimato che ogni secondo di ogni giorno, ogni persona produce 1,7 MB di dati in media e la creazione di dati annuali ha più che raddoppiato da allora e si prevede che raddoppierà nuovamente entro il 2025. Un rapporto del McKinsey Global Institute stima che un uso abile dei big data potrebbe generare un ulteriore $ 3 trilioni nell'attività economica, consentendo applicazioni diverse come auto a guida autonoma, assistenza sanitaria personalizzata e filiere alimentari tracciabili.
Ma l'aggiunta di tutti questi dati al sistema crea anche confusione su come trovarli, usarli, gestirli e condividerli in modo legale, sicuro ed efficiente. Da dove viene un determinato set di dati? Chi possiede cosa? Chi può vedere certe cose? Dove risiede? Si può condividere? Si può vendere? Le persone possono vedere come è stato utilizzato?
Man mano che le applicazioni dei dati crescono e diventano sempre più onnipresenti, produttori, consumatori, proprietari e amministratori dei dati scoprono di non avere un playbook da seguire. I consumatori vogliono connettersi ai dati di cui si fidano in modo da poter prendere le migliori decisioni possibili. I produttori hanno bisogno di strumenti per condividere i propri dati in sicurezza con chi ne ha bisogno. Ma le piattaforme tecnologiche non sono all'altezza e non ci sono vere fonti comuni di verità per collegare entrambe le parti.
Come troviamo i dati? Quando dobbiamo spostarlo?
In un mondo perfetto, i dati fluirebbero liberamente come un'utilità accessibile a tutti. Potrebbe essere imballato e venduto come materia prima. Potrebbe essere visionato facilmente, senza complicazioni, da chiunque sia autorizzato a vederlo. Le sue origini e i suoi movimenti potrebbero essere rintracciati, eliminando qualsiasi preoccupazione su usi nefasti da qualche parte lungo la linea.
Il mondo di oggi, ovviamente, non funziona in questo modo. La massiccia esplosione di dati ha creato un lungo elenco di problemi e opportunità che rendono difficile condividere porzioni di informazioni.
Con i dati creati quasi ovunque all'interno e all'esterno di un'organizzazione, la prima sfida è identificare ciò che viene raccolto e come organizzarlo in modo che possa essere trovato.
La mancanza di trasparenza e sovranità sui dati e sull'infrastruttura archiviati ed elaborati apre problemi di fiducia. Oggi, lo spostamento dei dati in posizioni centralizzate da più stack tecnologici è costoso e inefficiente. L'assenza di standard di metadati aperti e interfacce di programmazione delle applicazioni ampiamente accessibili possono rendere difficile l'accesso e l'utilizzo dei dati. La presenza di ontologie di dati settoriali può rendere difficile per le persone esterne al settore beneficiare di nuove fonti di dati. Molteplici stakeholder e difficoltà di accesso ai servizi dati esistenti possono rendere difficile la condivisione senza un modello di governance.
L'Europa è in testa
Nonostante i problemi, i progetti di condivisione dei dati vengono intrapresi su larga scala. Uno che è sostenuto dall'Unione Europea e un gruppo senza scopo di lucro sta creando uno scambio di dati interoperabile chiamato Gaia-X , dove le aziende possono condividere i dati sotto la protezione delle rigide leggi europee sulla privacy dei dati. Lo scambio è concepito come una nave per condividere i dati tra i settori e un repository per informazioni sui servizi di dati relativi all'intelligenza artificiale (AI), all'analisi e all'Internet delle cose.
Hewlett Packard Enterprise ha recentemente annunciato a quadro della soluzione per supportare la partecipazione di aziende, fornitori di servizi e organizzazioni pubbliche a Gaia-X. La piattaforma Dataspaces, attualmente in fase di sviluppo e basata su standard aperti e cloud native, democratizza l'accesso ai dati, l'analisi dei dati e l'IA rendendoli più accessibili agli esperti di dominio e agli utenti comuni. Fornisce un luogo in cui gli esperti delle aree di dominio possono identificare più facilmente set di dati affidabili ed eseguire in modo sicuro analisi sui dati operativi, senza richiedere sempre il costoso spostamento dei dati verso posizioni centralizzate.
Utilizzando questo framework per integrare origini dati complesse negli ambienti IT, le aziende saranno in grado di fornire trasparenza dei dati su larga scala, in modo che tutti, siano essi scienziati o meno, sappiano quali dati hanno, come accedervi e come utilizzarli in tempo reale.
Anche le iniziative di condivisione dei dati sono in cima all'agenda delle imprese. Un'importante priorità che le aziende devono affrontare è il controllo dei dati utilizzati per addestrare l'IA interna e i modelli di machine learning. L'intelligenza artificiale e l'apprendimento automatico sono già ampiamente utilizzati nelle imprese e nell'industria per promuovere miglioramenti continui in tutto, dallo sviluppo del prodotto al reclutamento fino alla produzione. E abbiamo appena iniziato. IDC prevede che il mercato globale dell'IA lo farà crescere da $ 328 miliardi nel 2021 a $ 554 miliardi nel 2025.
Per sbloccare il vero potenziale dell'IA, i governi e le imprese devono comprendere meglio l'eredità collettiva di tutti i dati che stanno guidando questi modelli. In che modo i modelli di intelligenza artificiale prendono le loro decisioni? Hanno pregiudizi? Sono affidabili? Persone non affidabili sono state in grado di accedere o modificare i dati su cui un'azienda ha addestrato il proprio modello? Collegare i produttori di dati ai consumatori di dati in modo più trasparente e con maggiore efficienza può aiutare a rispondere ad alcune di queste domande.
Costruire la maturità dei dati
Le aziende non risolveranno come sbloccare tutti i loro dati dall'oggi al domani. Ma possono prepararsi a sfruttare le tecnologie e i concetti di gestione che aiutano a creare una mentalità di condivisione dei dati. Possono garantire che stanno sviluppando la maturità per consumare o condividere i dati in modo strategico ed efficace piuttosto che farlo su base ad hoc.
I produttori di dati possono prepararsi per una più ampia distribuzione dei dati adottando una serie di passaggi. Hanno bisogno di capire dove sono i loro dati e capire come li stanno raccogliendo. Quindi, devono assicurarsi che le persone che consumano i dati abbiano la possibilità di accedere ai set di dati giusti al momento giusto. Questo è il punto di partenza.
Poi arriva la parte più difficile. Se un produttore di dati ha consumatori, che possono trovarsi all'interno o all'esterno dell'organizzazione, devono connettersi ai dati. Questa è sia una sfida organizzativa che tecnologica. Molte organizzazioni desiderano la governance sulla condivisione dei dati con altre organizzazioni. La democratizzazione dei dati, almeno la possibilità di trovarli tra le organizzazioni, è un problema di maturità organizzativa. Come lo gestiscono?
Le aziende che contribuiscono all'industria automobilistica condividono attivamente i dati con fornitori, partner e subappaltatori. Ci vogliono molte parti e molta coordinazione per assemblare un'auto. I partner condividono prontamente informazioni su qualsiasi cosa, dai motori agli pneumatici, ai canali di riparazione abilitati al Web. Gli spazi dati automobilistici possono servire fino a 10.000 fornitori. Ma in altri settori, potrebbe essere più insulare. Alcune grandi aziende potrebbero non voler condividere informazioni riservate nemmeno all'interno della propria rete di unità aziendali.
Creare una mentalità dei dati
Le aziende su entrambi i lati del continuum consumatore-produttore possono far progredire la loro mentalità di condivisione dei dati ponendosi queste domande strategiche:
- Se le aziende creano soluzioni di intelligenza artificiale e machine learning, da dove prendono i dati i team? Come si connettono a quei dati? E come fanno a tenere traccia di tale cronologia per garantire l'affidabilità e la provenienza dei dati?
- Se i dati hanno valore per gli altri, qual è il percorso di monetizzazione che il team sta intraprendendo oggi per espandere tale valore e come sarà governato?
- Se un'azienda sta già scambiando o monetizzando dati, può autorizzare un insieme più ampio di servizi su più piattaforme, in locale e nel cloud?
- Per le organizzazioni che hanno bisogno di condividere i dati con i fornitori, come avviene oggi il coordinamento di tali fornitori con gli stessi set di dati e aggiornamenti?
- I produttori vogliono replicare i loro dati o costringere le persone a portare loro modelli? I set di dati potrebbero essere così grandi da non poter essere replicati. Un'azienda dovrebbe ospitare sviluppatori di software sulla sua piattaforma in cui si trovano i suoi dati e spostare i modelli dentro e fuori?
- In che modo i lavoratori di un dipartimento che consuma dati possono influenzare le pratiche dei produttori di dati a monte all'interno della loro organizzazione?
Prendere l'iniziativa
La rivoluzione dei dati sta creando opportunità di business, insieme a molta confusione su come cercare, raccogliere, gestire e ottenere informazioni da quei dati in modo strategico. I produttori di dati e i consumatori di dati stanno diventando sempre più disconnessi tra loro. HPE sta costruendo una piattaforma che supporta sia on-premise che il cloud pubblico, utilizzando l'open source come base e soluzioni come la piattaforma software HPE Ezmeral per fornire il terreno comune di cui entrambe le parti hanno bisogno per far funzionare la rivoluzione dei dati per loro.
Leggi l'articolo originale su Enterprise.nxt .
Questo contenuto è stato prodotto da Hewlett Packard Enterprise. Non è stato scritto dalla redazione del MIT Technology Review.
