La mappatura è una raccolta di oggetti di origine e di destinazione collegati tra loro da un insieme di trasformazioni. Queste trasformazioni consistono in una serie di regole che definiscono il flusso di dati e il modo in cui i dati vengono caricati nelle destinazioni.
Una mappatura è costituita dal seguente insieme di oggetti
- Definizione dell'origine: la definizione dell'origine definisce la struttura e le caratteristiche dell'origine, i tipi di dati sottostanti, il tipo dell'origine dati, ecc.
- Trasformazione : gli oggetti di trasformazione definiscono il modo in cui i dati di origine vengono trasformati e varie funzioni possono essere applicate durante il processo
- Definizione del target: la definizione del target definisce il target finale in cui verranno caricati i dati.
- Collegamenti : i collegamenti collegano la definizione di origine a diverse trasformazioni e tabelle di destinazione. Definisce il modo in cui i dati fluiscono dall'origine alla destinazione e le trasformazioni.
In questo tutorial imparerai
- Perché hai bisogno della mappatura?
- Componenti della mappatura
- Cos'è lo Stage Mapping?
- Come creare una mappatura
- Parametri e variabili di mappatura
- Come creare un parametro di mappatura
- Come creare una variabile di mappatura
Perché hai bisogno della mappatura?
La mappatura è un oggetto in Informatica con l'aiuto del quale è possibile definire come i dati di origine vengono modificati prima che raggiungano la destinazione o l'oggetto di destinazione. Ad esempio, se il nome del dipendente è "Bill Clinton" nel sistema di origine e nel sistema di destinazione il requisito è di avere il nome del dipendente nel formato "Clinton Bill", tali operazioni possono essere progettate a livello di mappatura. In termini di base, ciò che fai con i dati di origine è definito a livello di mappatura.
La mappatura è l'oggetto di base di Informatica con l'aiuto del quale possiamo definire i dettagli della trasformazione dei dati e le caratteristiche dell'oggetto di origine / destinazione. Le mappature ci aiutano a definire la trasformazione dei dati a livello di singola colonna per ogni riga. Anche in una singola mappatura puoi gestire più sorgenti e target.
Componenti della mappatura
I componenti di base di una mappatura sono
- Tabelle di origine
- Parametri e variabili di mappatura
- Oggetti di destinazione
- Trasformazioni di mappatura
Ci sono vari oggetti che costituiscono una mappatura. Una mappatura può essere costituita da sorgenti, destinazioni, parametri di mappatura e variabili, mapplet, varie trasformazioni e funzioni definite dall'utente .
- Sorgente di mappatura : le sorgenti di mappatura sono gli oggetti da cui si recuperano i dati di origine. Può essere una tabella di database, un file flat, un'origine XML o un'origine file COBOL
- Target di mappatura: il target di mappatura è il nostro oggetto di destinazione in cui vengono caricati i dati elaborati finali. La destinazione della mappatura può essere una tabella relazionale di un database, un file flat o un file XML. Fonti e destinazioni sono obbligatorie in qualsiasi mappatura, il loro tipo può differire
- Parametri e variabili di mappatura: la mappatura di parametri e variabili aiuta a creare oggetti variabili temporanei che ti aiuteranno a definire e memorizzare valori temporanei durante la mappatura dell'elaborazione dei dati. I parametri e le variabili di mappatura sono tipi di dati definiti dagli utenti opzionali, che possono essere creati per una mappatura e possono essere referenziati e aggiornati per un requisito specifico. Impareremo di più sulla mappatura di parametri e variabili in questa sezione
- Mapplet : sono oggetti che consistono in un insieme di trasformazioni, sorgenti o target. Le mapplet vengono generalmente create per riutilizzare le funzionalità esistenti di un insieme di trasformazioni. Può essere utilizzato in qualsiasi numero di mappature.
Cos'è lo Stage Mapping?
Una mappatura dello stage è una mappatura in cui creiamo la replica della tabella di origine. Ad esempio, in un sistema di produzione, se si dispone di una tabella "dipendente", è possibile creare una tabella identica "impiegato_stage" nello schema ETL.
Avere una tabella di fase locale offre vari vantaggi, come i tempi di inattività della produzione, non influirà sul sistema ETL perché si dispone della propria tabella "Employee_stage", invece di fare riferimento alla tabella "Employee" di produzione. In un sistema di produzione, possono esserci altre operazioni e processi che influiscono sulle prestazioni. Tuttavia, quando si dispone della tabella di staging della replica, solo i processi ETL vi accederanno. Ciò offre vantaggi in termini di prestazioni.
In Stage Mappings,
- Le tabelle di origine e di destinazione hanno strutture identiche
- I dati nella tabella di destinazione sono una replica dei dati della tabella di origine o
- I dati nella tabella della fase (destinazione) sono un sottoinsieme dei dati di origine.
Ad esempio, se la tabella di origine contiene i dettagli dei dipendenti dei dipartimenti 10, 20, 30 e 40. La tabella di staging può essere una tabella con record dei dipendenti solo dei dipartimenti 10 e 30.
Lo scopo della creazione di tabelle di fase nel data warehouse è di rendere efficiente il processo di trasformazione dei dati recuperando solo i dati che sono rilevanti per noi e anche di ridurre al minimo la dipendenza di ETL / Data Warehouse dal sistema operativo in tempo reale.
Come creare una mappatura
In questo esercizio creeremo una mappatura dello stage, in cui la sorgente sarà "emp table" e la destinazione sarà "emptgt".
Convenzione di denominazione : i nomi di mappatura hanno il prefisso "m_" seguito dai nomi delle tabelle di origine e di destinazione separati dal segno di sottolineatura.
Esempio: se stai caricando la tabella emp_target dalla tabella emp, il nome della mappatura può essere "m_emp_emp_target".
Passaggio 1 : avvio di Mapping Designer
- Apri Informatica Designer Tool
- Fare clic sull'icona Mapping Designer per avviare Mapping Designer
Passaggio 2 : in Mapping Designer
- Fare clic sul menu Mapping
- Seleziona Crea opzione
Passaggio 3 : immettere il nome della mappatura come "m_emp_emp_target" e selezionare il pulsante OK.
La mappatura verrà creata ed elencata nella cartella delle mappature.
Una mappatura deve avere almeno una sorgente e una destinazione , aggiungerai sorgenti e destinazioni alla mappatura.
Passaggio 4 : in questo passaggio faremo
- Seleziona la tabella di origine "emp" nella cartella delle fonti.
- Trascina e rilascia la tabella "emp" nel mapping designer.
In Mapping Designer, verrà mostrata la tabella di origine importata.
Nota : quando si importa una tabella relazionale (database) in una mappatura, verrà creato anche un oggetto aggiuntivo di tipo qualificatore di origine. Questa trasformazione del qualificatore di origine è necessaria e consente al servizio di integrazione di Informatica di identificare la tabella del database di origine e le sue proprietà. Ogni volta che si importa una tabella di origine, verrà creata anche la trasformazione del qualificatore di origine. Non si dovrebbe mai eliminare un oggetto qualificatore di origine in una mappatura.
Passaggio 5 : in questo passaggio faremo
- Seleziona la tabella di origine "emp_target" nella cartella Target.
- Trascina e rilascia la tabella "emp_target" nel designer di mappe
In mapping designer, la "tabella di destinazione" verrà importata e mostrata.
Per gestire lo spazio di visualizzazione, è possibile iconizzare questi oggetti nella mappatura.
Passaggio 6: fare clic con il pulsante destro del mouse in un punto qualsiasi dell'area di lavoro vuota del progettista di mappe e selezionare l'opzione - Disponi tutti gli elementi iconici.
Dopo aver selezionato l'opzione "Disponi tutti gli iconici", l'area di lavoro sarà simile a questa.
Passaggio 7 : in Informatica, progettiamo con il flusso da sinistra a destra. Quindi, le tabelle di origine dovrebbero essere sul lato sinistro e le tabelle di destinazione dovrebbero essere a destra. Per disporre le tabelle nel nostro spazio di lavoro, seleziona la tabella "emp_target" quindi trascinala sul lato destro della tabella emp.
Dopo questa riorganizzazione, l'area di lavoro sarà simile a questa.
Nota : utilizzare periodicamente la scorciatoia "ctrl + s" per salvare le modifiche al repository.
Passaggio 8: ora sono presenti tabelle di origine e di destinazione nella mappatura, ma la mappatura non è ancora completa. Le tabelle di origine e di destinazione devono essere collegate per completare una mappatura.
Per collegare sorgente e destinazioni
Fare doppio clic sulla tabella SQ_EMP e sulla tabella EMP_TARGET per cambiarne la visualizzazione da iconica a grafica.
Passaggio 9 - Fare clic con il pulsante destro del mouse sull'area di lavoro del progettista di mappe e selezionare l'opzione "Collegamento automatico" per nome.
Passaggio 10: collegare l'origine con la tabella di destinazione
- Seleziona colonne della tabella di origine.
- Trascina e rilascia le colonne nella tabella di destinazione.
Le tabelle di origine e di destinazione verranno collegate e le frecce di connessione appariranno dall'origine alla tabella di destinazione.
Nota : qui hai collegato tutte le colonne di origine alla rispettiva colonna della tabella di destinazione. Significa che per ogni record di origine recuperato, verranno caricate tutte le colonne della destinazione. Se desideri escludere una colonna specifica dal caricamento, fai clic sul collegamento di quella colonna e premi il tasto Canc dalla tastiera. Il collegamento verrà rimosso e la colonna di destinazione non verrà caricata.
Passaggio 11 : utilizzare la scorciatoia "ctrl + s" per salvare le modifiche alla mappatura. Nella finestra di output, puoi vedere il messaggio di convalida / analisi della mappatura. Conferma che la tua mappatura è valida. Inoltre, ci sarà un segno di spunta verde temporaneo accanto al nome della mappatura nella struttura delle cartelle di mappatura che indica che la mappatura è stata eseguita correttamente.
Nelle mappature può esserci un requisito, in cui è necessario passare la variabile alla mappatura oppure può esserci uno scenario in cui è necessario calcolare variabili temporanee e ulteriormente richiesto di memorizzarle per l'esecuzione della sessione successiva della mappatura. Per questi scopi, creiamo parametri e variabili di mappatura.
Parametri e variabili di mappatura
Come ogni linguaggio di programmazione, Informatica ha il proprio modo di definire parametri e variabili. Ma a differenza di altri linguaggi di programmazione, Informatica non è un linguaggio basato su codice. Per creare parametri e variabili in Informatica, è necessario seguire la sintassi e la navigazione predefinite.
Differenza tra parametri e variabili -
Parametri di mappatura |
Variabili di mappatura |
I parametri di mappatura sono quei tipi di dati il cui valore, una volta assegnato, rimane costante per tutta la corsa di mappatura. Ad esempio, se hai creato un parametro di mappatura deptno = 20, il valore 20 sarà costante per l'intera esecuzione della mappatura. Il parametro in cui verrà fatto riferimento restituirà sempre il valore 20 per quell'istanza di esecuzione della mappatura. Per una nuova istanza di mappatura, il valore del parametro può essere ridefinito. |
Le variabili di mappatura sono oggetti a cui è possibile fare riferimento durante l'esecuzione della mappatura (per accedere ai loro valori) e i loro valori possono essere riassegnati. Ad esempio, una variabile di mappatura total_salary può essere utilizzata in una mappatura e il suo valore può essere aggiornato in base agli stipendi. |
I parametri e le variabili di mappatura sono specifici solo per una mappatura. Non possono essere referenziati in un'altra mappatura.
Come creare un parametro di mappatura
Quando si crea un parametro di mappatura, durante l'esecuzione del servizio di integrazione della mappatura cerca il valore assegnato. Questi valori possono essere assegnati ai seguenti luoghi.
- All'interno del file dei parametri
- Nell'assegnazione di variabili pre-sessione
- Valore iniziale nel repository
- Valore predefinito assegnato durante la creazione della variabile
Passaggio 1 - Per creare un parametro di mappatura - In Mapping Designer,
- Seleziona il menu delle mappature
- Selezionare il menu parametri e variabili
Passaggio 2 : nella schermata successiva,
- Fare clic sul menu Aggiungi nuova variabile
- Dal menu a discesa, seleziona il tipo come parametro
- Immettere il nome del parametro come $$ Deptno
- Immettere un valore iniziale di 10
- Seleziona il pulsante OK
Ora, hai creato un parametro di mappatura deptno, con valore inizialmente assegnato di 10, e questo parametro può essere referenziato all'interno della mappatura.
Come creare una variabile di mappatura
Passaggio 1: in mapping designer
- Seleziona il menu delle mappature
- Selezionare il menu parametri e variabili
Passaggio 2 : nella schermata successiva
- Fare clic sul menu Aggiungi nuova variabile
- Dal menu a discesa, seleziona il tipo come variabile
- Immettere il nome della variabile come $$ TotalSalary
- Seleziona DataType come decimale
- Immettere un valore iniziale di 0
- Seleziona il pulsante OK
Questo creerà una variabile di mappatura.
Nota : i nomi dei parametri e delle variabili di mappatura iniziano sempre con $$.
Sommario
Le mappature sono importanti in Informatica per abbinare i dati di origine con la destinazione in base ai requisiti del progetto. Abbiamo discusso le mappature degli stadi e il concetto di variabili e parametri di mappatura.