Quando si opera con i dati è fondamentale partire da una base di informazioni che sia normalizzata il più possibile. Occorre creare un database contente tutte le informazioni, che pensiamo possano esserci utili ai fini delle nostre analisi e creazione dei report. In questo articolo analizziamo le peculiarità di Power Query excel.

 

Normalizzazione dati e funzioni di excel

Spesso l’integrazione di database con informazioni aggiuntive provenienti da altre fonti, viene effettuata sfruttando le diverse funzioni che lo strumento excel mette a disposizione dell’analista. Ci riferiamo ad esempio alle funzioni testuali, alle funzioni logiche, alla classica cerca.vert, alla funzione composta indice e confronta, alle formula annulla.spazi, alla funzionalità trova e sostituisci.

Questo processo può richiedere molto tempo a seconda del dato grezzo, che si ha a disposizione e dalla cultura del dato aziendale, che è presente nell’ambiente in cui si opera.

Pensate a un database contente i nomi del cliente scritto senza una regola precisa.

Ad esempio il cliente Pippo, senza regole predefinite di inserimento dati potrebbe essere stato scritto in diversi modi:

Pippo

Pippo SpA

Pippo S.p.A.

Una simile situazione rende difficile la sintesi dei dati per aggregazione, con il rischio di un dato poco attendibile. Se dovessimo stilare la classifica dei top client per venduto rischieremmo di avere Pippo scritto tre volte e non aggregato.

Questo problema è molto diffuso quando si hanno dati provenienti da diversi sistemi o quando è molto utilizzato lo strumento excel e pertanto i dipartimenti utilizzano diversi file duplicati ma non perfettamente identici,

Tornando al nostro esempio del nome  Pippo, la normalizzazione del nome del cliente può avvenire in diversi modi utilizzando:

– trova e sostituisci,

– i filtri

– utilizzo tabelle pivot e aggregazione del nome del cliente.

– ordinando la colonna Clienti dalla A alla Z e sistemazione dei dati non omogenei.

 

Ricorda: prima di realizzare dashboard o output di sintesi dei tuoi dati assicurati di avere una base dati normalizzata e che periodicamente riceve un’adeguata attività di data cleaning.

 

Siamo nella situazione delle molteplici isole di dati separate tra loro e del continuo processo di copia e incolla o nella continua necessità di verificare o allineare i dati comparando i diversi file.

Quantomeno ove possibile cercate di utilizzare la condivisione dei fogli di lavoro con il vostro team e cercate sempre di procedere  a una periodica fase di manutenzione del dato o pulizia del dato.

 

Excel è evoluto nel tempo e ora potete utilizzare anche la funzione excel online e accedere con più tenti per caricare i dati. Ma questa non è la sola opportunità offerta da excel. Qualora ci troviamo a dover sistemare una base dati già creata e con dati da normalizzare ci viene in aiuto Power Query.

Power Query

La logica di questo add in excel è molto semplice e si basa sui seguenti step:

Connessione a una o più fonte dati;

– Fase di trasformazione dati mantenendo la connessione all’origine;

– Fase di creazione di un modello di dati;

– Fase di condivisone della query da cui partire per creare report o dashboard.

Power Query per pulire i tuoi dati

Questo importante funzionalità può davvero esserci di grande aiuto quando dobbiamo effettuare trasformazione di dati. Power Query permetterà di fare un bel restyiling del tuo database andando ad aggregare, sintetizzare  e automatizzare le tue informazioni. Infatti sarà possibile caricare dati provenienti da svariate fonti e poi operare attraverso le varie colonne attraverso diverse funzionalità molto dinamiche, che in poco tempo ti permetteranno di arrivare a risultati di valore, senza dover creare formule e continui copia incolla.

 

Ricorda: Con Power Query è possibile creare query semplici o complesse in base alle necessità. E poiché Power Query usa il linguaggio M per registrare ed eseguire i passaggi, è possibile creare query da zero (o modificarle manualmente) per sfruttare la potenza e la flessibilità degli script di dati, tutto in Power Query – Support-Office Microsoft

 

Infatti con Power Query sarà possibile creare un flusso dati, che si aggiornerà in automatico quando il file sorgente sarà alimentato di nuovi dati.

Sarà inoltre possibile predisporre una base dati con inclusi solo i campi dati, che ci serviranno e con l’opportunità di ritornare sui nostri passi nel caso volessimo fare delle variazioni.

 

Risorse per approfondire

Power query l’add in excel per ottenere dati da più fonti

Unpivot table con Power Query

PowerBi desktop per i tuoi dashboard

Introduzione al mondo Power Query