Come diventare Data Scientist: pratica, intuito e specializzazione

I suggerimenti di Irion per chi vuole svolgere questa professione

 

Negli ultimi mesi si è sentito spesso parlare di Data Scientist; ma chi è, cosa fa e quali competenze deve avere questa figura professionale? E, soprattutto, come si diventa Data Scientist? Alcuni consigli per districarsi in questo stimolante ma insidioso contesto, arrivano da Irion, software house italiana specializzata nell’Enterprise Data Management, partner dell’Università degli Studi di Torino e da sempre attenta a formazione, ricerca e sviluppo.

 

Innanzitutto, per essere in grado leggere, analizzare e gestire i “big data” è necessario avere un solido background in matematica applicata, statistica, informatica o fisica, oltre a specifiche competenze di machine learning e data mining. In un contesto in rapidissima evoluzione come quello delle tecnologie digitali, in base alle quali vengono riprogettati un numero sempre maggiore di processi aziendali, le skill tradizionali non sono però più sufficienti, e l’aggiornamento continuo è fondamentale. I “maghi del dato” sono molto ricercati (e ben remunerati!), proprio perché per intraprendere questa professione, e svolgerla con profitto, è necessario un complesso background di competenze e attitudini.

[amazon_link asins=’8891743399,193550469X,012802044X,B01JXOJ5N6,B011YT2G6Q’ template=’ProductCarousel’ store=’antoniosavare-21′ marketplace=’IT’ link_id=’07d15c72-c074-11e7-8c0b-b1b088b7731a’]

 

Ecco quindi i tre suggerimenti di Alberto Scavino, CEO di Irion:

       Integrare la pratica allo studio teorico: Sembra banale, ma è la realtà. Un robusto background accademico è fondamentale per un Data Scientist, ma è ancora più importante “sporcarsi le mani” e lavorare su dati reali. Molte delle skill necessarie al professionista si possono infatti apprendere solo sul campo. Quindi, è essenziale accumulare esperienze, che siano stage o collaborazioni – già durante gli studi. Solo in questo modo, è possibile comprendere a pieno, e anticipare, i principali trend del settore.

       Sviluppare l’intuito: Un buon Data Scientist non deve solo avere forti competenze tecniche, ma deve anche essere dotato di un ottimo intuito. Non si tratta di gettare dati grezzi in uno strumento in grado di elaborarli, e aspettarsi che ne venga fuori qualcosa di buono: prima di tutto bisogna accertarsi che ciò che si sta facendo abbia un senso. Ad esempio, bisogna essere in grado di capire quali caratteristiche sono importanti e quali implicazioni vi stanno dietro, oltre a comprendere quale modello utilizzare in base a come i dati sono distribuiti.

       Massima specializzazione: In tutti i settori, dal finance, al pharma, alle utilities, solo per fare alcuni esempi, si registra una sempre crescente domanda di professionisti in grado di interpretare con precisione la mole di informazioni che quotidianamente le aziende ricevono: questo per trarre vantaggio competitivo, ma anche per conformarsi alle normative vigenti, in termini di privacy, protezione e sicurezza dei dati: uno su tutti il GDPR. Nelle infinite possibilità di applicazione, per un giovane che si avvia al mestiere, è fondamentale specializzarsi: le imprese ricercano infatti competenze sempre più specifiche.

        

In qualsiasi campo, dalla medicina alla finanza, passando per il marketing, è dunque necessario convergere e interpretare dati e informazioni, trasformandoli in indicazioni utili per il progresso di un’organizzazione. Per questo motivo, tra i profili più ricercati dalle aziende di ogni settore, negli anni a venire continueranno ad esserci proprio loro, gli “scienziati del dato”: professionisti dell’innovazione in grado di leggere, analizzare e gestire enormi quantità di informazioni digitali, permettendone l’utilizzo in infiniti ambiti applicativi, ponendo la massima attenzione su qualità, privacy e sicurezza.

 

Di conseguenza, anche il mondo accademico si sta muovendo per formare risorse con le competenze necessarie al ruolo di Data Scientist: all’Università La Sapienza di Roma, è nato persino un corso di laurea magistrale in Data Science, il primo del genere in Italia, che nei giorni scorsi ha visto la proclamazione dei suoi primi quattro laureati; l’Università di Torino, in collaborazione con il Collegio Carlo Alberto, propone invece il MADAS, Master in Data Science for Complex Economic System che, grazie a interventi curati da professionisti e aziende del settore, tra cui la stessa Irion, permette di coniugare lo studio teorico ad esercitazioni pratiche.

 

MapR e Talend collaborano per offrire una soluzione per la gestione dei data lake nel rispetto del GDPR

Un’offerta integrata per aiutare le aziende a essere conformi ai requisiti chiave del regolamento GDPR su data inventory, portabilità, anonimato e altro ancora

 

MapR Technologies, Inc., provider della piattaforma di convergenza per l’integrazione dei dati con processi operativi  in tempo reale, e Talend (NASDAQ: TLND), leader mondiale nelle soluzioni software di integrazione cloud e big data, annunciano la stretta collaborazione sullo sviluppo di una soluzione che aiuti i clienti a rispettare la legislazione europea relativa al regolamento GDPR (General Data Protection Regulation).

Grazie all’offerta di MapR e Talend, le aziende possono gestire i data lake restando conformi anche ai più rigorosi requisiti riguardanti archiviazione, inventory, protezione, conservazione, portabilità e sicurezza imposti dal GDPR.

In vigore dal prossimo maggio 2018, il GDPR riguarda qualsiasi azienda che raccolga o processi i dati personali relativi a soggetti residenti nell’Unione Europea. Secondo Gartner, entro la fine del 2018, oltre il 50% delle aziende non risponderanno del tutto ai requisiti richiesti dal GDPR.*

 “Il percorso verso il rispetto della regolamentazione GDPR non è complicato, ma le organizzazioni devono agire ora”, dichiara Ciaran Dynes, senior vice president of products di Talend.  “Grazie alla collaborazione con MapR, stiamo aiutando i clienti nel garantire la trasparenza dei dati utilizzando appropriate pratiche di gestione dei metadata, nel stabilire un approccio collaborativo per la data governance e nel modernizzare la loro piattaforma dati consentendo lo sviluppo dei data lake nel pieno rispetto del GDPR”.

[amazon_link asins=’1785888080,148913882X,B073B866RS,1787281345′ template=’ProductCarousel’ store=’antoniosavare-21′ marketplace=’IT’ link_id=’4134d70c-72d2-11e7-adad-99ed8504c1c1′]

I data lake sono utilizzati per centralizzare le informazioni delle aziende, includendo i dati personali provenienti da diverse fonti come le banche, i social media, le strutture che erogano cure mediche e altro ancora. La soluzione integrata MapR e Talend consente alle aziende a gestire i data lake in conformità ai seguenti aspetti:

     Classificazione e lineage dei dati

     Acquisizione e integrazione dei dati

     Anonimato dei dati

     Gestione e certificazione dei dati in modalità automatica

     Portabilità e accessibilità dei dati

 

“Secondo il GDPR, le aziende multinazionali dovranno dimostrare che i dati personali vengono acquisiti, condivisi e gestiti in modo controllato, legittimo ed equo,” dichiara Anoop Dawar, Vice Presidente, product marketing di MapR Technologies. “L’offerta congiunta MapR e Talend aiuta le aziende ad accelerare gli sforzi nell’adeguarsi al regolamento GDPR per mettere in atto i necessari meccanismi di governance dei dati”.

 

La piattaforma MapR Converged Data offre analytics e operation in un’unica soluzione software che integra i big data e le tecnologie open source con un accesso veloce e nativo allo streaming, funzionalità in tempo reale del database e storage scalabile su cloud. La piattaforma offre diverse funzionalità in conformità al GDPR, compresi i MapR Volume, che raggruppano logicamente i dati personali e applicano immediatamente a questi dati la policy e le autorizzazioni; auditing ad alte prestazioni per l’accesso ai dati; il mirroring e la replica per tracciare i dati “portatili”.

 

Talend Data Fabricè la prima piattaforma di integrazione che supporta nativamente MapR Streams e che aiuta i clienti a sincronizzare continuamente l’elaborazione dei dai attraverso i database, in quanto l’informazione viene aggiornata in tempo reale fornendo una visione accurata. Talend integra inoltre funzioni per il data quality, il metadata management, il data stewardship, il data lineage e i big data per raccogliere, standardizzare, riconciliare, certificare, proteggere e gestire il PII (Personally Identifiable Information).

 

Per ulteriori informazioni su come l’offerta MapR e Talend supporti i clienti nel soddisfare i requisiti GDPR, visita il sito:

https://mapr.com/why-mapr/regulatory-standards/ leggere questo blog.

 

Hai apprezzato questa notizia? Condividila con questo tweet: .@Talend e @MapR collaborano sulla soluzione di data lake che aiuta a soddisfare i requisiti del GDPR – http://bit.ly/2twZ2yW

 

* Gartner Insight, Focus on Five High-Priority Changes to Tackle the EU GDPR, Pubblicato il 30 Settembre 2016 ID: G00311301 by Bart Willemsen

Exit mobile version

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fonire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o clicchi su "Accetta" permetti al loro utilizzo.

Chiudi