Normalizer è una trasformazione attiva, utilizzata per convertire una singola riga in più righe e viceversa. È un modo intelligente per rappresentare i tuoi dati in modo più organizzato.
Se in una singola riga sono presenti dati ripetuti in più colonne, è possibile dividerli in più righe. A volte abbiamo dati in più colonne ricorrenti. Per esempio
Nome dello studente | Punteggio di classe 9 | Punteggio di classe 10 | Punteggio di classe 11 | Punteggio di classe 12 |
Studente 1 | 50 | 60 | 65 | 80 |
Studente 2 | 70 | 64 | 83 | 77 |
In questo caso, la colonna del punteggio della classe si ripete in quattro colonne. Usando il normalizzatore, possiamo dividerli nel seguente set di dati.
Nome dello studente | Classe | Punto |
Studente 1 | 9 | 50 |
Studente 1 | 10 | 60 |
Studente 1 | 11 | 65 |
Studente 1 | 12 | 80 |
Studente 2 | 9 | 70 |
Studente 2 | 10 | 64 |
Studente 2 | 11 | 83 |
Studente 2 | 12 | 77 |
Passaggio 1 : creare la tabella di origine "sales_source" e la tabella di destinazione "sales_target" utilizzando lo script e importarle in Informatica
Scarica il file Sales_Source.txt sopra
Passaggio 2: creazione di una mappatura con origine "sales_source" e tabella di destinazione "sales_target"
Passaggio 3 : dal menu di trasformazione creare una nuova trasformazione
- Seleziona normalizzatore come trasformazione
- Inserisci il nome, "nrm_sales"
- Seleziona l'opzione di creazione
Passaggio 4 : verrà creata la trasformazione, selezionare l'opzione Fine
Passaggio 5 : fare doppio clic sulla trasformazione del normalizzatore, quindi
- Seleziona la scheda normalizzatore
- Fare clic sull'icona per creare due colonne
- Immettere i nomi delle colonne
- Imposta il numero di occorrenze su 4 per le vendite e 0 per il nome del negozio
- Seleziona il pulsante OK
Le colonne verranno generate nella trasformazione. Vedrai 4 colonne del numero di vendite quando impostiamo il numero di occorrenze su 4.
Passaggio 6 : quindi nella mappatura
- Collega le quattro colonne del qualificatore di origine dei quattro quarti rispettivamente alle colonne del normalizzatore.
- Collega la colonna del nome del negozio alla colonna del normalizzatore
- Collega le colonne nome_store e vendite dal normalizzatore alla tabella di destinazione
- Collega la colonna GK_sales dal normalizzatore alla tabella di destinazione
Salvare la mappatura ed eseguirla dopo aver creato la sessione e il flusso di lavoro. Per ogni trimestre di vendita di un negozio, verrà creata una riga separata dalla trasformazione del normalizzatore.
L'output della nostra mappatura sarà come:
Nome del negozio | Trimestre | I saldi |
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
I dati di origine avevano colonne ripetute, ovvero QUARTER1, QUARTER2, QUARTER3 e QUARTER4. Con l'aiuto del normalizzatore, abbiamo riorganizzato i dati per adattarli a una singola colonna di QUARTER e per un record di origine vengono creati quattro record nella destinazione.
In questo modo, puoi normalizzare i dati e creare più record per un'unica fonte di dati.