Quando abbiamo a che fare con dati aziendali, capita molto spesso di dover attingere da diverse fonti ed avere la necessità di organizzare ed aggregare i dati in un certo modo oppure ancora di dover omogeneizzare o normalizzare le informazioni. Power Query Excel ci può davvero dare un grosso supporto nelle operazioni di data cleasing

Scopo di questo articolo è quello di prendere in esame alcune funzionalità di questo add in del foglio di calcolo di casa Microsoft e evidenziarne i vantaggi di quando si procede a fasi di sistemazione dei dati aziendali.

 

Che cos’è il data Cleansing?

La pulizia dei dati o data cleaning rappresenta un processo plurifase finalizzato a rilevare e a correggere o sistemare alcune informazioni contenute in una tabella o in un database. L?obiettivo è quello di sistemare i meglio i dati in modo da creare omogeneità per poi facilitare l’aggregazione e la sintesi dei dati. Trattasi di una fase molto laboriosa e noiosa, tuttavia con il supporto di strumenti come Power Query, può essere rese decisamente più rapida e indolore.

 

Power Query a cosa serve?

Se state leggendo questo articolo e non sapete cosìè Power Query vi suggeriamo di leggere alcuni articoli, che abbiamo già pubblicato sul tema e che possono esservi di aiuto per inquadrare meglio l’argomento e le potenzialità dello strumento:

– Introduzione a Power Query

Power Query come si usa e a cosa serve

Panoramica su Power Query

– Un esempio di applicazione pratica per comprendere meglio il suo utilizzo e le sue peculiarità

– Lo strumento per aggregare e organizzare i tuoi dati aziendali

– PowerQuery Excel e suo utilizzo per il data cleaning

– Add in per importare dati provenienti da più fonti

– Come fare la trasposizione delle tabelle con PowerQuery attraverso la funzione unpivot

 

Data cleansing: alcune funzionalità utili di Power Query

Power Query excel, come evidenziato è decisamente un prezioso supporto per le attività di data cleaning.

Nella sezione home di Power Query potrete trovare alcune opzioni interessanti come ad esempio le seguenti:

 

Chiudi e carica: vi servirà per salvare la query creata creando una connessione o una tabella

Gestione colonne e righe per mantenere o eliminare informazioni non necessarie

Dividi colonne per spezzettare alcune informazioni contenute in una cella definendo certe regole o individuando dei delimitatori

Raggruppa per: funzione molto utile per aggregare dati e fare somme, conteggi, estrapolazione del minimo, massimo, punto medio, mediano, righe distinte.

Tipologia di dati per scegliere il formato

Pulsante “usa la prima riga come intestazione”

Sostituisci valori: la versione  “Trova e sostituisci”, che avrete usato sicuramente nella versione classica di excel

Merge e accodamento di Query

 

Nella sezione Trasforma di Power Query possiamo avere a disposizione un kit di tool molto utili, come ad esempio:

 

power query

 

Trasponi, inverti righe e conteggio righe

Trasforma colonna tramite unpivot

Personalizzazioni dei campi che contengono date

Estrai terso prima , dopo o tra il delimitatore

Inverti righe

Sposta

Formato

Funzioni matematiche, statistiche e trigonometriche

Espandi, aggrega ed estrai valori.

 

Nella sezione Aggiungi colonna di Power Query possiamo trovare:

data cleansing

Colonna da esempi: funzione molto utile per personalizzare le informazioni delle colonne- Si digita l’esempio di come si vorrebbe scrivere le informazioni e se Power query comprende la regola replica in tutti i record della colonna. Ad esempio, se nella colonna interessata ho società per azioni con il solo nome e voglio anche riportare S.p.a., scriverò nel primo campo della nuova “colonna da esempi” il nome della società e poi S.p.A. Una volta cliccato su “Ok”, il sistema avendo compreso la regola mi restituirà tutti i nomi della società con l’aggiunta di S.p.A.

Colonna personalizzata: aggiunge una colonna che viene calcolata da altra colonne attraverso l’applicazione di una formula. Ad esempio se ho una colonna con l’onorario e una con la % di sconto, con la colonna personalizzata andrò a calcolare il prezzo scontato.

Colonna condizionale: aggiunge una colonna condizionale che viene calcolata da altre condizioni

Colonna indice per attribuire un indice da partire da zero o da 1 oppure personalizzato

Duplica colonna: per duplicare una colonna

 

Come potete osservare Power Query contiene una serie di funzioni e applicazioni molto intuitive e preziose per il data cleansing. In pochi click potrete organizzare al meglio la vostra query e il vostro set di dati di aggiornare progressivamente al variare della base dati. In questo modo eviterete di ripetere noiose operazioni di copia e incolla, matching di dati.

 

E dopo il data cleansing?

Una volta che hai sistemato i tuoi dati, a questo punto sei pronto per creare i tuoi report di sintesi o creare Dashboard aziendali per monitorare ad esempio i tuoi indicatori di performance. Se ti interessano questi argomenti ti ricordiamo che abbiamo già dedicato diversi articoli su B2corporate, come ad esempio:

Come realizzare dashboard in excel

Data storytelling: idee e suggerimenti per raccontare i tuoi dati aziendali

Cruscotti aziendali e utilizzo dinamico delle forme

Corso on line sull’analisi dei dati con Power Query