SAP DS (Data Services) in HANA

Anonim

Cosa sono i servizi dati SAP?

SAP Data services è uno strumento ETL che fornisce una singola soluzione a livello aziendale per l'integrazione dei dati, la trasformazione, la qualità dei dati, la profilazione dei dati e l'elaborazione dei dati di testo dalla sorgente eterogenea in un database di destinazione o in un data warehouse.

Possiamo creare applicazioni (lavoro) in cui è possibile eseguire la mappatura e la trasformazione dei dati utilizzando il Designer. (L'ultima versione di SAP BODS è la 4.2).

Caratteristiche dei servizi dati

  • Fornisce trasformazioni parallele ad alte prestazioni.
  • Dispone di strumenti amministrativi e di reportistica completi.
  • Supporta multiutente.
  • SAP BODS è molto flessibile con applicazioni basate su servizi web.
  • Consente il linguaggio di scripting con ricchi set di funzioni.
  • Data Services può integrarsi con SAP LT Replication Server (SLT), con

    Tecnologia basata su trigger. SLT aggiunge funzionalità delta a ogni tabella di origine SAP o non SAP

    Ciò consente di utilizzare l'acquisizione dei dati per la modifica e il trasferimento dei dati delta di

    la tabella di origine.

  • Convalida dei dati con dashboard e audit di processo.
  • Strumento di amministrazione con funzionalità di pianificazione e monitoraggio / dashboard.
  • Debug e creazione di profili e visualizzazione dei dati.
  • Supporto SAP BODS Ampia origine e destinazione.
    • Qualsiasi applicazione (ad esempio SAP).
    • Qualsiasi database con caricamento di massa e modifica dell'acquisizione dei dati
    • File: larghezza fissa, delimitato da virgole, COBOL, XML, Excel.

Componente dei servizi di dati

I servizi SAP DATA hanno sotto il componente:

  1. Designer : è uno strumento di sviluppo mediante il quale possiamo creare, testare ed eseguire un lavoro che popola un data warehouse.

    Consente allo sviluppatore di creare oggetti e configurarli selezionando un'icona in un diagramma di flusso da origine a destinazione.

    Può essere utilizzato per creare un'applicazione specificando flussi di lavoro e flussi di dati.

    Per aprire Data Service Designer andare su Menu Start -> Tutti i programmi -> SAP Data Services (4.2 qui) -> Data Service Designer.

  1. Job Server : è un'applicazione che avvia il motore di elaborazione dei servizi dati e funge da interfaccia per il motore e la Data Services Suite.
  2. Motore - Il motore del servizio dati esegue i singoli lavori definiti nell'applicazione.
  3. Repository - Repository è un database che memorizza oggetti predefiniti del designer e oggetti definiti dall'utente (metadati di origine e di destinazione, regole di trasformazione).

    I repository sono di due tipi:

  • Repository locale (utilizzato da Designer e Job Server).
  • Repository centrale (utilizzato per la condivisione di oggetti e il controllo della versione)
  1. L'accesso Server- server Accesso passa i messaggi tra le applicazioni web, server di servizi dati lavoro e motori.
  2. Amministratore - L'amministratore Web fornisce l'amministrazione basata su browser delle risorse dei servizi dati, i dettagli sono i seguenti:
  • Configurazione, avvio e arresto dei servizi in tempo reale.
  • Pianificazione, monitoraggio ed esecuzione di lavori batch.
  • Configurazione dell'utilizzo di Job Server, Access Server e Repository.
  • Gestione degli utenti.
  • Pubblicazione di lavori batch e servizi in tempo reale tramite servizi Web
  • Configurazione e gestione degli adattatori.

Architettura dei servizi dati -

L'architettura dei servizi di dati ha il seguente componente:

  • Repository centrale: viene utilizzato per le configurazioni dei repository sui server dei lavori, la gestione della sicurezza, il controllo della versione e la condivisione degli oggetti
  • Designer: utilizzato per creare progetto, lavoro, flusso di lavoro, flusso di dati ed esecuzione.
  • Repository locale (qui è possibile creare modifiche e avviare lavori, flusso di lavoro, flusso di dati).
  • Server e motore di lavoro - Gestisce i lavori.
  • Server di accesso: viene utilizzato per eseguire i lavori in tempo reale creati dagli sviluppatori nei repository.

Nell'immagine sottostante, vengono mostrati i servizi dati e la relazione dei componenti.

Architettura SAP BODS

Dettaglio finestra Designer: per prima cosa esaminiamo il primo componente del servizio dati SAP: Designer

I dettagli di ciascuna sezione del progettista del servizio dati sono i seguenti:

  1. Barra degli strumenti (utilizzata per Apri, Salva, Indietro, Convalida, Esegui, ecc.).
  2. Area del progetto (contiene il progetto corrente, che include Job, Workflow e Dataflow. In Data Services, tutte le entità sono oggetti.
  3. Spazio di lavoro (l'area della finestra dell'applicazione in cui definiamo, visualizziamo e modificiamo gli oggetti).
  4. Libreria oggetti locale (contiene oggetti del repository locale, come trasformazioni, lavoro, flusso di lavoro, flusso di dati, ecc.).
  5. Tavolozza degli strumenti (i pulsanti sulla tavolozza degli strumenti consentono di aggiungere nuovi oggetti all'area di lavoro).

Gerarchia degli oggetti

Il diagramma seguente mostra le relazioni gerarchiche per i tipi di oggetti chiave all'interno di Data Services.

>

Nota:

Flussi di lavoro e Condizionale * sono facoltativi

Gli oggetti utilizzati nei dettagli dei servizi dati SAP sono i seguenti:

Oggetti Descrizione
Progetto Un progetto è un oggetto di livello più alto nella finestra Designer. I progetti forniscono un modo per organizzare gli altri oggetti creati in Data Services. È aperto solo un progetto alla volta (dove "aperto" significa "visibile nell'area del progetto").
Lavoro Un "lavoro" è la più piccola unità di lavoro che puoi programmare indipendentemente per l'esecuzione.
Script Un sottoinsieme di righe in una procedura.
Flusso di lavoro Un "flusso di lavoro" è l'incorporazione di diversi flussi di dati in un flusso di lavoro coerente per un intero lavoro. Il flusso di lavoro è facoltativo. Il flusso di lavoro è una procedura.
  • Chiama flussi di dati
  • Chiama un altro flusso di lavoro
  • Definisci l'ordine dei passaggi da eseguire nel tuo lavoro
  • Passaggio di parametri da e verso i flussi di dati.
  • Specificare come gestire gli errori che si verificano durante l'esecuzione.
  • Definire le condizioni per l'esecuzione di sezioni del progetto.
Flusso di dati Un "flusso di dati" è il processo mediante il quale i dati di origine vengono trasformati nei dati di destinazione. Un flusso di dati è un oggetto riutilizzabile. Viene sempre chiamato da un flusso di lavoro o da un lavoro.
  • Identifica i dati di origine che desideri leggere.
  • Definisci le trasformazioni che vuoi eseguire sui dati.
  • Identifica la tabella di destinazione in cui desideri caricare i dati.
Archivio dati Canale logico che collega i servizi dati ai database di origine e di destinazione dell'archivio dati.
  • Deve essere specificato per ogni database di origine e di destinazione.
  • Vengono utilizzati per importare i metadati per i database di origine e di destinazione nel pository
  • Vengono utilizzati da Data Services per leggere i dati dalle tabelle di origine e caricare i dati nelle tabelle di destinazione
Bersaglio Tabella o file in cui Data Services carica i dati dall'origine.

Esempio di Data Services caricando i dati dalla tabella di origine SAP

Tutto in Data services è un oggetto. Dobbiamo separare l'archivio dati per ogni database di origine e di destinazione.

Passaggi per il caricamento dei dati dalla tabella di origine SAP: i BOD SAP hanno molti passaggi, in cui è necessario creare un archivio dati per origine e destinazione e mapparli.

  • Crea archivio dati tra Source e BODS
  • Importa i metadati (strutture) in BODS.
  • Configura server di importazione
  • Importa i metadati nel sistema HANA.
  • Crea archivio dati tra BODS e HANA.
  • Crea progetto.
  • Crea lavoro (batch / tempo reale)
  • Crea flusso di lavoro
  • Crea flusso di dati
  • Aggiungi oggetto in Dataflow
  • Esegui il lavoro
  • Controlla l'anteprima dei dati in HANA

Passaggio 1) Crea archivio dati tra SAP Source e BODS

  1. Per caricare i dati da SAP Source a SAP HANA tramite SAP BODS, è necessario un archivio dati. Quindi creiamo prima un archivio dati come mostrato di seguito -

    Progetto -> Nuovo -> Archivio dati

  2. Apparirà un pop-up per Crea nuovo archivio dati, inserisci i dettagli come di seguito -
    1. Immettere il nome dell'archivio dati "ds_ecc".
    2. Selezionare il nome del tipo di archivio dati come "Applicazioni SAP".
    3. Immettere il nome del server del database
    4. Nome utente e password.
    5. Fare clic sul pulsante "Applica".
    6. Fare clic sul pulsante "OK".

  3. L'archivio dati verrà creato e visualizzerà l'archivio dati creato come di seguito-
  1. Vai alla Libreria oggetti locale
  2. Seleziona la scheda DataStore.
  3. Verrà visualizzato l'archivio dati "ds_ecc".

Passaggio 2) Importa i metadati (struttura) nel server BODS.

Abbiamo creato un archivio dati per ECC to BODS; ora importiamo metadati da ECC a BODS. Per importare segui i passaggi seguenti:

  1. Selezionare Datastore "ds_ecc" e fare clic con il tasto destro.
  2. Seleziona l'opzione Importa per nome.

    Verrà visualizzato un popup per Importa per nome. Immettere i dettagli come di seguito -

    1. Seleziona Tipo come tabella.
    2. Immettere il nome della tabella, che si desidera importare. Qui stiamo importando la tabella KNA1.
    3. Fare clic sul pulsante "Importa". La tabella KNA1 apparirà sotto il nodo della tabella dell'origine dati "ds_ecc".

I metadati della tabella verranno importati, nel datastore ds_ecc come di seguito -

Passaggio 3) Configurare il server di importazione

Fino ad ora abbiamo importato la tabella nei dati memorizzati "ds_ecc" creata per ECC in SAP BODS Connection. Per importare i dati in SAP HANA, è necessario configurare il server di importazione,

  1. Per fare ciò, vai su Visualizzazione rapida-> Configura server di importazione come di seguito -

  2. Apparirà un pop-up per Seleziona sistema, Seleziona il sistema SAP HANA (HDB qui) come di seguito-

  1. Fare clic sul pulsante "Avanti". Apparirà un altro popup per le credenziali del servizio dati, inserire i seguenti dettagli
  1. Indirizzo server SAP BODS (qui BODS: 6400)
  2. Immettere il nome del repository SAP BODS (nome del repository HANAUSER)
  3. Immettere l'origine dati ODBC (ZTDS_DS).
  4. Immettere la porta predefinita per il server SAP BODS (8080).

Fare clic sul pulsante "Fine".

Passaggio 4) Importa i metadati nel sistema HANA

1. Fino ad ora abbiamo configurato il server di importazione, ora importeremo i metadati dal server SAP BODS.

  1. Fare clic sull'opzione Importa in Visualizzazione rapida.
  2. Verrà visualizzato un popup per l'opzione di importazione. Seleziona l'opzione "Importazione selettiva dei metadati".

Fare clic sul pulsante "Avanti".

2. Verrà visualizzato un pop-up per "Importazione selettiva di metadati", in cui selezioniamo il sistema di destinazione.

  1. Seleziona SAP HANA System (HDB qui).

Fare clic sul pulsante "Avanti".

Passaggio 5) Crea archivio dati tra BODS e HANA

Come sappiamo, in BODS dobbiamo creare un datastore separato per origine e destinazione. Abbiamo già creato un archivio dati per l'origine, ora dobbiamo creare un archivio dati per la destinazione (tra BODS e HANA). Quindi, creiamo un nuovo archivio dati con il nome "DS_BODS_HANA".

  1. Vai a Progetto -> Nuovo -> Datastore.

  1. Apparirà una schermata per Crea nuovo datastore come di seguito.
    1. Immettere il nome del datastore (DS_BODS_HANA).
    2. Immettere il tipo di archivio dati come database.
    3. Immettere il tipo di database come SAP HANA.
    4. Seleziona la versione del database.
    5. Immettere il nome del server di database SAP HANA.
    6. Immettere il nome della porta per il database SAP HANA.
    7. Immettere il nome utente e la password.
    8. Spunta su "Abilita trasferimento dati automatico".

Fare clic su "Applica" e quindi sul pulsante "OK".

L'archivio dati "DS_BODS_HANA" verrà visualizzato nella scheda archivio dati della Libreria oggetti locale come

Sotto-

  1. Ora importiamo la tabella nell'archivio dati "DS_BODS_HANA".
    1. Seleziona l'archivio dati "DS_BODS_HANA" e fai clic con il pulsante destro del mouse.
    2. Seleziona Importa per nome.

  1. Apparirà un pop-up per Importa per nome come mostrato di seguito-
    1. Seleziona Tipo come tabella.
    2. Immettere il nome come KNA1.
    3. Il proprietario verrà visualizzato come Hanauser.
    4. Fare clic sul pulsante Importa.

La tabella verrà importata nel datastore "DS_BOD_HANA", per visualizzare i dati nella tabella segui i passaggi seguenti:

  1. Fare clic sulla tabella "KNA1" nell'archivio dati "DS_BODS_HANA".
  2. I dati verranno visualizzati in formato tabulare.

Passaggio 6) Definizione del progetto: gruppo di progetti e organizzazione degli oggetti correlati. Il progetto può contenere un numero qualsiasi di lavori, flusso di lavoro e flusso di dati.

  1. Vai al menu Progetto Designer.
  2. Seleziona una nuova opzione.
  3. Seleziona l'opzione Progetto.

Di seguito viene visualizzato un POP-UP per la creazione di un nuovo progetto. Immettere il nome del progetto e fare clic sul pulsante Crea. Creerà una cartella del progetto nel nostro caso BODS_DHK.

Passaggio 7) Definisci lavoro: un lavoro è un oggetto riutilizzabile. Contiene flussi di lavoro e flusso di dati. I lavori possono essere eseguiti manualmente o come pianificazione. Per eseguire il processo BODS è necessario definire il lavoro.

Creiamo un lavoro come JOB_Customer.

  1. Selezionare il progetto (BODS_DHK) creato nel passaggio 1, fare clic con il tasto destro e selezionare "Nuovo lavoro batch".

  2. Rinominalo in "JOB_Customer".

Passaggio 8) Definisci il flusso di lavoro:

  1. Seleziona il lavoro "JOB_Customer" nell'area del progetto,
  2. Fare clic sul pulsante del flusso di lavoro nella tavolozza degli strumenti. Fare clic sull'area Black Workspace. Un'icona del flusso di lavoro apparirà nell'area di lavoro.
  3. Modificare il nome del flusso di lavoro come "WF_Customer".

Fare clic sul nome del flusso di lavoro, viene visualizzata una vista vuota per il flusso di lavoro nell'area di lavoro.

Passaggio 9) Definisci il flusso di dati:

  1. Fare clic su Flusso di lavoro "WF_Customer".
  2. Fare clic sul pulsante Dataflow nella tavolozza degli strumenti. Fare clic sull'area Black Workspace. Un'icona del flusso di dati apparirà nell'area di lavoro.
  3. Modificare il nome del flusso di dati come "DF_Customer".
  4. Il flusso di dati viene visualizzato anche nell'area del progetto a sinistra sotto il nome del lavoro.

Passaggio 10) Aggiungi oggetto in Dataflow:

All'interno del flusso di dati, possiamo fornire istruzioni per trasformare i dati di origine nella forma desiderata per la tabella di destinazione.

Vedremo sotto oggetto -

  • Un oggetto per la fonte.
  • Un oggetto per la tabella di destinazione.
  • Un oggetto per la trasformazione della query. (La trasformazione della query mappa le colonne dall'origine alla destinazione.)

    Fare clic sul flusso di dati DF_Customer. Uno spazio di lavoro vuoto apparirà come di seguito:

  1. Specificare l'oggetto dalla sorgente - Vai all'archivio dati "ds_ecc" e seleziona la tabella KNA1 e trascina e rilascia nella schermata vuota del flusso di dati come sotto
  2. Specifica oggetto per destinazione: selezionare l'archivio dati "DS_BODS_HANA" dal repository e selezionare la tabella KNA1.
  3. Trascina e rilascia nell'area di lavoro e seleziona l'opzione "Crea target". Ci saranno due tabelle per l'origine e la destinazione. Qui definiremo la tabella come origine e destinazione.

  1. Query Transformation - Questo è uno strumento utilizzato per recuperare i dati in base allo schema di input per la condizione specifica dell'utente e per il trasporto dei dati dall'origine alla destinazione.
    1. Selezionare l'icona Trasforma query dalla tavolozza degli strumenti e trascinarla tra l'oggetto di origine e quello di destinazione nell'area di lavoro come di seguito:
    2. Collega l'oggetto Query all'origine.
    3. Collega oggetto query alla tabella di destinazione.

    1. Fare doppio clic sull'icona Query. In questo modo, mappiamo una colonna dallo schema di input allo schema di output.

Quando facciamo clic sull'icona Query, verrà visualizzata una finestra successiva per la mappatura, in cui eseguiamo i seguenti passaggi:

  1. La tabella di origine KNA1 è selezionata.
  2. Seleziona tutta la colonna dalla tabella di origine e fai clic con il pulsante destro del mouse e seleziona una mappa da stampare.
  3. Target Output selezionato come Query e la colonna verranno mappate.

5. Salvare e convalidare il progetto.

1. Fare clic su convalida icona.

2. Viene visualizzato un popup per la convalida riuscita.

Passaggio 11) Esegui lavoro: per eseguire il lavoro, segui il percorso seguente-

  1. Selezionare l'icona dell'area del progetto per aprire il progetto e selezionare il progetto creato.
  2. Seleziona Lavoro e fai clic con il pulsante destro del mouse.
  3. Selezionare l'opzione Esegui per eseguire il lavoro.

    1. Dopo l'esecuzione del lavoro, viene visualizzata una finestra del registro dei lavori, in cui verranno visualizzati tutti i messaggi relativi al lavoro.
    2. L'ultimo messaggio sarà Lavoro <> completato con successo.

    Passaggio 12): convalida / controlla i dati nel database SAP HANA.

    1. Accedi al database SAP HANA tramite SAP HANA Studio e seleziona lo schema HANAUSER.
    2. Seleziona la tabella KNA1 nel nodo Tabella.
    3. Fare clic con il tasto destro sulla tabella KNA1 e selezionare Apri anteprima dati.
    4. Tabella (KNA1) I dati caricati dai processi BODS come sopra verranno visualizzati nella schermata di anteprima dei dati.