Quando abbiamo a che fare con dati aziendali, capita molto spesso di dover attingere da diverse fonti ed avere la necessità di organizzare ed aggregare i dati in un certo modo oppure ancora di dover omogeneizzare o normalizzare le informazioni. Power Query Excel ci può davvero dare un grosso supporto nelle operazioni di data cleasing
Scopo di questo articolo è quello di prendere in esame alcune funzionalità di questo add in del foglio di calcolo di casa Microsoft e evidenziarne i vantaggi di quando si procede a fasi di sistemazione dei dati aziendali.
Che cos’è il data Cleansing?
La pulizia dei dati o data cleaning rappresenta un processo plurifase finalizzato a rilevare e a correggere o sistemare alcune informazioni contenute in una tabella o in un database. L?obiettivo è quello di sistemare i meglio i dati in modo da creare omogeneità per poi facilitare l’aggregazione e la sintesi dei dati. Trattasi di una fase molto laboriosa e noiosa, tuttavia con il supporto di strumenti come Power Query, può essere rese decisamente più rapida e indolore.
Power Query a cosa serve?
Se state leggendo questo articolo e non sapete cosìè Power Query vi suggeriamo di leggere alcuni articoli, che abbiamo già pubblicato sul tema e che possono esservi di aiuto per inquadrare meglio l’argomento e le potenzialità dello strumento:
– Power Query come si usa e a cosa serve
– Un esempio di applicazione pratica per comprendere meglio il suo utilizzo e le sue peculiarità
– Lo strumento per aggregare e organizzare i tuoi dati aziendali
– PowerQuery Excel e suo utilizzo per il data cleaning
– Add in per importare dati provenienti da più fonti
– Come fare la trasposizione delle tabelle con PowerQuery attraverso la funzione unpivot
Data cleansing: alcune funzionalità utili di Power Query
Power Query excel, come evidenziato è decisamente un prezioso supporto per le attività di data cleaning.
Nella sezione home di Power Query potrete trovare alcune opzioni interessanti come ad esempio le seguenti:
– Chiudi e carica: vi servirà per salvare la query creata creando una connessione o una tabella
– Gestione colonne e righe per mantenere o eliminare informazioni non necessarie
– Dividi colonne per spezzettare alcune informazioni contenute in una cella definendo certe regole o individuando dei delimitatori
– Raggruppa per: funzione molto utile per aggregare dati e fare somme, conteggi, estrapolazione del minimo, massimo, punto medio, mediano, righe distinte.
– Tipologia di dati per scegliere il formato
– Pulsante “usa la prima riga come intestazione”
– Sostituisci valori: la versione “Trova e sostituisci”, che avrete usato sicuramente nella versione classica di excel
– Merge e accodamento di Query
Nella sezione Trasforma di Power Query possiamo avere a disposizione un kit di tool molto utili, come ad esempio:
– Trasponi, inverti righe e conteggio righe
– Trasforma colonna tramite unpivot
– Personalizzazioni dei campi che contengono date
– Estrai terso prima , dopo o tra il delimitatore
– Inverti righe
– Sposta
– Formato
– Funzioni matematiche, statistiche e trigonometriche
– Espandi, aggrega ed estrai valori.
Nella sezione Aggiungi colonna di Power Query possiamo trovare:
– Colonna da esempi: funzione molto utile per personalizzare le informazioni delle colonne- Si digita l’esempio di come si vorrebbe scrivere le informazioni e se Power query comprende la regola replica in tutti i record della colonna. Ad esempio, se nella colonna interessata ho società per azioni con il solo nome e voglio anche riportare S.p.a., scriverò nel primo campo della nuova “colonna da esempi” il nome della società e poi S.p.A. Una volta cliccato su “Ok”, il sistema avendo compreso la regola mi restituirà tutti i nomi della società con l’aggiunta di S.p.A.
– Colonna personalizzata: aggiunge una colonna che viene calcolata da altra colonne attraverso l’applicazione di una formula. Ad esempio se ho una colonna con l’onorario e una con la % di sconto, con la colonna personalizzata andrò a calcolare il prezzo scontato.
– Colonna condizionale: aggiunge una colonna condizionale che viene calcolata da altre condizioni
– Colonna indice per attribuire un indice da partire da zero o da 1 oppure personalizzato
– Duplica colonna: per duplicare una colonna
Come potete osservare Power Query contiene una serie di funzioni e applicazioni molto intuitive e preziose per il data cleansing. In pochi click potrete organizzare al meglio la vostra query e il vostro set di dati di aggiornare progressivamente al variare della base dati. In questo modo eviterete di ripetere noiose operazioni di copia e incolla, matching di dati.
E dopo il data cleansing?
Una volta che hai sistemato i tuoi dati, a questo punto sei pronto per creare i tuoi report di sintesi o creare Dashboard aziendali per monitorare ad esempio i tuoi indicatori di performance. Se ti interessano questi argomenti ti ricordiamo che abbiamo già dedicato diversi articoli su B2corporate, come ad esempio:
Come realizzare dashboard in excel
Data storytelling: idee e suggerimenti per raccontare i tuoi dati aziendali