Ottenere il massimo dalla tua trasformazione basata sui dati: 10 principi chiave

Fornito da Hewlett Packard Enterprise





L'importanza dei dati per le aziende di oggi non può essere sopravvalutata. Studi mostrano aziende basate sui dati hanno il 58% in più di probabilità di superare gli obiettivi di fatturato rispetto alle società non basate sui dati e il 162% in più di probabilità di superare in modo significativo i ritardi. L'analisi dei dati sta aiutando quasi la metà di tutte le aziende prendere decisioni migliori su tutto, dai prodotti che consegnano ai mercati a cui si rivolgono. I dati stanno diventando fondamentali in ogni settore, sia che aiutino le aziende agricole aumentare il valore delle colture che producono o fondamentalmente cambiare il gioco del basket .

Usati in modo ottimale, i dati non sono altro che una risorsa di importanza critica. Il problema è che non è sempre facile far funzionare i dati. Il Rapporto sui dati di Seagate Rethink , con la ricerca e l'analisi di IDC, ha rilevato che solo il 32% dei dati a disposizione delle imprese viene utilizzato e il restante 68% non viene utilizzato. Dirigenti non sono del tutto sicuri nella loro attuale capacità, né nei loro piani a lungo termine, di estorcere livelli ottimali di valore dai dati che producono, acquisiscono, gestiscono e utilizzano.



Qual è la disconnessione? Se i dati sono così importanti per la salute di un'azienda, perché è così difficile da padroneggiare?

Nelle aziende più gestite, i sistemi che connettono produttori e consumatori di dati sono sicuri e facili da implementare. Ma di solito non lo sono. Le aziende devono trovare dati e sfruttarli per scopi strategici. Le fonti dei dati sono difficili da identificare e ancora più difficili da valutare. I set di dati utilizzati per addestrare i modelli di intelligenza artificiale per l'automazione delle attività possono essere difficili da convalidare. Gli hacker cercano sempre di rubare o compromettere i dati. E trovare dati di qualità è una sfida anche per i data scientist più esperti.

La mancanza di un sistema end-to-end per garantire dati di alta qualità e condividerli in modo efficiente ha ritardato indirettamente l'adozione dell'IA .

Le lacune nella comunicazione possono anche far deragliare il processo di fornitura di insight di grande impatto. I dirigenti che finanziano i progetti sui dati e gli ingegneri e gli scienziati dei dati che li portano a termine non sempre si capiscono. Questi professionisti dei dati possono creare un piano dettagliato, ma se il professionista non inquadra correttamente i risultati, il dirigente aziendale che li ha richiesti potrebbe dire che stavano cercando qualcosa di diverso. Il progetto sarà etichettato come un fallimento e la possibilità di generare valore da questo sforzo cadrà nel dimenticatoio.



Le aziende incontrano problemi con i dati, non importa dove si trovino in termini di maturità dei dati. Stanno cercando di capire come rendere i dati una parte importante del loro futuro, ma stanno lottando per mettere in pratica i piani.

Se sei in questa posizione, cosa fai?

Le aziende si sono trovate in un punto di svolta simile negli anni 2010, cercando di sistemare i loro posti nel cloud. Ci sono voluti anni per sviluppare le proprie strategie cloud, pianificare le migrazioni cloud, scegliere piattaforme, creare Cloud Business Office e strutturare le proprie organizzazioni per sfruttare al meglio le opportunità basate sul cloud. Oggi ne stanno raccogliendo i frutti: il passaggio al cloud ha consentito loro di modernizzare le app e i sistemi IT.



Le aziende ora devono prendere decisioni simili sui dati. Devono considerare molti fattori per assicurarsi che i dati forniscano una base per il futuro della loro attività. Dovrebbero porre domande come:

  • I dati di cui l'azienda ha bisogno sono prontamente disponibili?
  • Quali tipi di fonti di dati sono necessari? Esistono insiemi di dati distribuiti e diversificati di cui non si è a conoscenza?
  • I dati sono puliti, aggiornati, affidabili e in grado di integrarsi con i sistemi esistenti?
  • Il resto del livello C è a bordo con l'approccio del chief data officer?
  • I data scientist e gli utenti finali comunicano in modo efficace su ciò che è necessario e su ciò che viene fornito?
  • Come vengono condivisi i dati?
  • Come posso fidarmi dei miei dati?
  • Ogni persona e organizzazione che ha bisogno di accedere ai dati ha il diritto di utilizzarli?

Non si tratta solo di business intelligence. Si tratta di sfruttare un'opportunità che sta prendendo forma. L'uso dei dati sta esplodendo, gli strumenti per sfruttarli stanno diventando più efficienti e l'esperienza degli scienziati dei dati sta crescendo. Ma i dati sono difficili da padroneggiare. Molte aziende non sono preparate per utilizzare al meglio i dati che hanno a portata di mano. Le imprese devono fare investimenti nelle persone, nei processi e nelle tecnologie che lo faranno guidare le loro strategie sui dati .

Con tutto questo in mente, ecco 10 principi che le aziende dovrebbero seguire quando sviluppano le proprie strategie sui dati:



1. Comprendi quanto sono davvero preziosi i tuoi dati

Quanto valgono per te i tuoi dati? Questo può essere misurato in diversi modi. Esistono metriche tradizionali da considerare, come i costi di acquisizione dei dati, il costo per archiviarli e trasmetterli, l'unicità dei dati acquisiti e l'opportunità di utilizzarli per generare entrate aggiuntive. Le metriche del mercato influiscono sul valore dei dati, come la qualità dei dati, l'età dei dati e la popolarità di un prodotto dati.

I tuoi dati potrebbero essere preziosi anche per altri. Ad esempio, supponiamo che un ospedale raccolga i set di dati dei pazienti che possono generare valore per i tuoi dati. In tal caso, quei dati potrebbero essere di interesse per i ricercatori sulle malattie, i produttori di farmaci, le compagnie assicurative e altri potenziali acquirenti. È in atto un meccanismo per rendere anonimi, aggregare, controllare e identificare potenziali utenti dei tuoi dati?

L'opportunità, bilanciata dal costo necessario per realizzarla, è un modo per determinare il valore potenziale dei tuoi dati.

2. Determina cosa rende i dati preziosi

Sebbene possa essere difficile attribuire un valore in dollari effettivo ai tuoi dati, è più facile definire gli elementi che contribuiscono al fatto che i dati abbiano un alto grado di valore. Può essere ridotto a una semplice equazione di pensiero:

Completezza + Validità = Qualità

Qualità + Formato = Usabilità

Dati utilizzabili + Un esperto di dati che li usa bene = VALORE

Il tuo progetto di dati non può procedere senza dati validi. La qualità dei tuoi dati è sufficientemente alta per essere utile? Ciò dipenderà, in parte, da quanto è completo il campione che hai raccolto. Mancano i campi dati? La qualità dipende anche dalla validità delle informazioni. È stato raccolto da una fonte affidabile? I dati sono aggiornati o il tempo ne ha degradato la validità? Raccogliete e archiviate i vostri dati in conformità con le ontologie e gli standard di settore e di settore?

I tuoi dati devono essere utilizzabili affinché siano degni di un investimento. L'impostazione di sistemi per i professionisti dei dati per utilizzare e analizzare bene i dati e connetterli con leader aziendali che possono sfruttare le informazioni dettagliate chiude il cerchio.

3. Stabilisci dove ti trovi nel tuo viaggio di dati

Posizionare un'azienda per sfruttare appieno il cloud computing è un viaggio. Lo stesso pensiero dovrebbe valere per i dati.

Le decisioni che le aziende prendono in merito alle loro strategie sui dati dipendono in gran parte da dove si trovano durante i loro viaggi di dati. A che punto sei nel tuo viaggio con i dati? Gli strumenti di valutazione e i progetti possono aiutare le aziende a individuare le proprie posizioni. Le valutazioni dovrebbero andare oltre l'identificazione degli strumenti presenti nello stack tecnologico di un'azienda. Dovrebbero esaminare il modo in cui i dati vengono trattati in un'organizzazione in molti modi, tenendo conto della governance, della gestione del ciclo di vita, della sicurezza, dell'importazione e dell'elaborazione, delle architetture dei dati, del consumo e della distribuzione, della conoscenza dei dati e della monetizzazione dei dati.

Il consumo e la distribuzione da soli possono essere misurati in termini di capacità di un'organizzazione di applicare servizi che vanno dalla business intelligence allo streaming di dati alle applicazioni self-service di analisi dei dati. L'azienda ha implementato il supporto per l'utilizzo dei dati da parte delle singole persone? Supporta le singole API? Considerando la conoscenza dei dati come una categoria, quanto sono avanzati i dizionari di dati, i glossari aziendali, i cataloghi e i piani di gestione dei dati principali dell'azienda?

Il punteggio di ciascuna serie di capacità rivela i punti di forza e di debolezza di un'azienda in termini di preparazione dei dati. Fino a quando l'azienda non darà un'occhiata più da vicino, potrebbe non rendersi conto di quanto sia vicina o lontana da dove ha bisogno o vuole essere.

4. Impara a gestire i dati provenienti da varie fonti

I dati arrivano nelle organizzazioni da tutte le direzioni: dall'interno dell'azienda, dai dispositivi IoT e dai sistemi di videosorveglianza all'edge, dai partner, dai clienti, dai social media e dal Web. Le centinaia di zettabyte dei dati mondiali dovranno essere gestiti, protetti e ottimizzati in modo selettivo per un uso conveniente e produttivo.

Questa è una sfida per le aziende che non hanno sviluppato sistemi per la raccolta e la governance dei dati. Ovunque provengano i dati, è necessario un meccanismo per standardizzarli in modo che i dati siano utilizzabili per un maggiore vantaggio.

Diverse aziende e diversi paesi impongono regole diverse su cosa e come le informazioni possono essere condivise. Anche i singoli dipartimenti all'interno della stessa azienda possono scontrarsi con le regole di corporate governance che designano i percorsi che determinati set di dati devono seguire. Ciò significa applicare politiche di accesso e distribuzione ai dati. Per cogliere queste opportunità di dati, le aziende devono progettare percorsi per scoprire nuovi set di dati e imporre regole di governance per gestirli.

Nella produzione, le aziende su una catena di fornitura misurano la qualità delle loro parti e dei loro fornitori. Spesso i macchinari e la robotica che utilizzano sono di proprietà dei fornitori. I fornitori potrebbero voler stipulare contratti per vedere chi ha il diritto di utilizzare i dati per proteggere i propri interessi commerciali e i produttori dovrebbero definire in anticipo i propri requisiti di condivisione dei dati con i propri partner e fornitori.

5. Ottieni un impegno strategico dalla C-suite

I dati avvantaggiano molti livelli di un'organizzazione e le persone a ciascuno dei livelli interessati faranno pressioni per un aspetto particolare del processo di valore dei dati. I data scientist vogliono una tecnologia più potente e facile da usare. I leader line-of-business spingono per insight migliori e più rapidi. In cima alla piramide c'è la C-suite, che dà priorità alla canalizzazione dei dati verso il valore aziendale.

È fondamentale coinvolgere i dirigenti di livello C con una strategia di dati olistica. Farlo bene, dopo tutto, può essere dirompente. Per estrarre il massimo valore dai dati, un'organizzazione deve assumere personale con nuove competenze, riallineare la propria cultura, riprogettare i vecchi processi e riprogettare la vecchia piattaforma dati. È un progetto di trasformazione che non può essere realizzato senza ottenere il consenso dei massimi livelli di un'azienda.

La C-suite è sempre più aperta all'espansione dell'utilizzo dei dati da parte delle organizzazioni. Oltre al coinvolgimento dei clienti, la seconda area strategica di maggiore interesse a livello di consiglio è sfruttare i dati e migliorare il processo decisionale per rimanere competitivi e sfruttare le mutevoli condizioni di mercato, secondo il rapporto IDC 'Market Analysis Perspective: Worldwide Data Integration and Intelligence Software, 2021.' Nello stesso rapporto, l'83% dei dirigenti ha articolato la necessità di avere più dati guidati rispetto a prima della pandemia.

In che modo le organizzazioni dovrebbero garantire che la C-suite entri a bordo? Se sei uno stakeholder senza un titolo di livello C, il tuo lavoro è lavorare con i tuoi colleghi per trovare uno sponsor esecutivo che porti il ​​messaggio ai leader che controllano il processo decisionale. I dati sono un asset strategico che determinerà il successo di un'azienda nel lungo periodo, ma non succederà senza sponsorizzazioni ai massimi livelli.

6. Nei dati di cui ci fidiamo: assicurati che i tuoi dati siano irreprensibili

Man mano che l'intelligenza artificiale si espande in quasi ogni aspetto della vita moderna, i rischi di pratiche di intelligenza artificiale corrotte o difettose aumentano esponenzialmente. Ciò dipende dalla qualità dei dati utilizzati per addestrare i modelli di intelligenza artificiale. Come sono stati prodotti i dati? Era basato su un sensore difettoso? È stata generata un'origine dati distorta nel set di dati? La selezione dei dati proveniva da una posizione anziché da un insieme di dati statisticamente valido?

Un'IA affidabile dipende dalla disponibilità di dati affidabili che possono essere utilizzati per costruire modelli trasparenti, affidabili, imparziali e solidi. Se sai come viene addestrato un modello e sospetti di ottenere risultati errati, puoi interrompere il processo e riqualificare il modello. Oppure, se qualcuno mette in dubbio il modello, puoi tornare indietro e spiegare perché è stata presa una decisione particolare, ma devi disporre di dati puliti e convalidati a cui fare riferimento.

Ai governi viene spesso chiesto dai cani da guardia delle politiche di supportare il modo in cui utilizzano l'IA e di dimostrare che le loro analisi non sono basate su dati distorti. La validità degli algoritmi utilizzati ha acceso dibattiti sugli sforzi per fare affidamento sull'apprendimento automatico come guida decisioni di condanna e prendere decisioni in merito richieste di prestazioni sociali o altre attività governative.

La formazione del modello avviene per fasi. Costruisci un modello basato sui dati. Quindi testare il modello e raccogliere dati aggiuntivi per testarlo nuovamente. Se passa, lo trasformi in un modello di produzione più robusto. Il viaggio continua aggiungendo più dati, massaggiandoli e stabilendo nel tempo se il tuo modello resiste al controllo.

La mancanza di un sistema end-to-end per garantire dati di alta qualità e condividerli in modo efficiente ha ritardato indirettamente l'adozione dell'IA. Secondo IDC , il 52% degli intervistati ritiene che la qualità dei dati, la quantità e le sfide di accesso stiano ostacolando le implementazioni dell'IA.

7. Cogli l'opportunità dei metadati

I metadati sono definiti in modo ellittico come 'dati che forniscono informazioni su altri dati'. È ciò che fornisce ai dati il ​​contesto di cui gli utenti hanno bisogno per comprendere una parte delle caratteristiche delle informazioni, in modo che possano determinare cosa farne in futuro.

Gli standard dei metadati sono comunemente usati per scopi di nicchia, come applicazioni industriali specifiche cataloghi astronomici o tipi di dati come File XML . Ma c'è anche un caso da sostenere per un framework di metadati più forte in cui non solo possiamo definire i dati in modi comuni, ma anche contrassegnare utili artefatti di dati lungo il loro viaggio. Da dove ha avuto origine questo dato? Chi l'ha visto? Chi l'ha usato? A cosa serve? Chi ha aggiunto quale pezzo del set di dati? I dati sono stati verificati? È vietato l'uso in determinate situazioni?

Lo sviluppo di questo tipo di meccanismo di metadati richiede un livello tecnologico aperto al contributo di coloro che visualizzano e toccano un particolare dato. Richiede anche l'impegno di ampi gruppi di stakeholder che vedono il valore di poter condividere i dati in modo strategico e trasparente.

La creazione di un ulteriore livello di metadati aperto sarebbe un passo importante verso consentendo la democratizzazione dell'accesso ai dati consentendo la condivisione trasparente degli attributi chiave dei dati necessari per l'accesso, la governance, la fiducia e il lignaggio. Hewlett Packard Enterprise approccio agli spazi dati consiste nell'aprire uno standard di metadati universale che eliminerebbe le attuali complessità associate alla condivisione di diversi set di dati.

8. Abbracciare l'importanza della cultura

Le organizzazioni vogliono assicurarsi di ottenere il massimo dalle risorse che stanno alimentando e, per farlo, devono creare culture che promuovano le migliori pratiche per la condivisione delle informazioni.

Hai dei silos? Ci sono barriere culturali all'interno della vostra organizzazione che ostacolano la corretta diffusione delle informazioni alle giuste fonti al momento giusto? Dipartimenti diversi ritengono di possedere i propri dati e non devono condividerli con altri nell'organizzazione? Le persone accumulano dati preziosi? Hai impostato canali e procedure che promuovano una condivisione dei dati senza attriti? Hai democratizzato l'accesso ai dati, offrendo agli stakeholder aziendali la possibilità non solo di richiedere dati, ma anche di partecipare a pratiche di interrogazione e condivisione?

Se uno qualsiasi di questi fattori blocca il libero flusso dello scambio di dati, l'organizzazione deve sottoporsi a una valutazione della gestione del cambiamento incentrata sulle sue esigenze tra persone, processi e tecnologia.

9. Apri le cose, ma non fidarti di nessuno

In tutti gli aspetti del business, le organizzazioni bilanciano i concetti spesso contrastanti di promuovere la condivisione libera e aperta delle risorse e una sicurezza strettamente controllata. Il raggiungimento di questo equilibrio è particolarmente importante quando si tratta di dati.

I dati devono essere condivisi, ma molti produttori di dati si sentono a disagio nel farlo perché temono la perdita del controllo e come i loro dati potrebbero essere utilizzati contro di loro, o come i loro dati potrebbero essere modificati o utilizzati in modo inappropriato.

La sicurezza deve essere una priorità assoluta. I dati provengono da così tante fonti, alcune che controlli, altre no, e vengono passate attraverso così tante mani. Ciò significa che le politiche di sicurezza relative ai dati devono essere progettate con un modello zero-trust in ogni fase del processo. La fiducia deve essere stabilita attraverso l'intero stack, dall'infrastruttura e dai sistemi operativi ai carichi di lavoro che si trovano sopra quei sistemi, fino al livello del silicio.

10. Creare una pipeline di servizi dati completamente funzionante

Lo spostamento dei dati tra i sistemi richiede molti passaggi, incluso lo spostamento dei dati nel cloud, la riformattazione e l'unione con altre origini dati. Ciascuno di questi passaggi richiede solitamente un software separato.

L'automazione delle pipeline di dati è una best practice fondamentale nel percorso dei dati. Una pipeline di dati completamente automatizzata consente alle organizzazioni di estrarre i dati all'origine, trasformarli in una forma utilizzabile e integrarli con altre origini.

La pipeline di dati è la somma di tutti questi passaggi e il suo compito è garantire che questi passaggi avvengano in modo affidabile per tutti i dati. Questi processi dovrebbero essere automatizzati, ma la maggior parte delle organizzazioni ha bisogno di almeno uno o due ingegneri per la manutenzione dei sistemi, la riparazione dei guasti e l'aggiornamento in base alle mutevoli esigenze dell'azienda.

Inizia oggi il viaggio dei dati

Il modo in cui le aziende sfruttano i propri dati, ovunque essi risiedano, determinerà il loro successo negli anni a venire. Ricerca sulle costellazioni progetti Il 90% dell'attuale Fortune 500 sarà unito, acquisito o fallito entro il 2050. Se non iniziano ora, saranno lasciati indietro. L'orologio sta ticchettando.

Leggi l'articolo originale su Enterprise.nxt .

Questo contenuto è stato prodotto da Hewlett Packard Enterprise. Non è stato scritto dalla redazione del MIT Technology Review.

nascondere