Extensorul paralel DataStage (DataStage PX)

Autor: Lewis Jackson
Data Creației: 10 Mai 2021
Data Actualizării: 15 Mai 2024
Anonim
Creation of sample parallel job in IBM Infosphere DataStage 7.5
Video: Creation of sample parallel job in IBM Infosphere DataStage 7.5

Conţinut

Definiție - Ce înseamnă DataStage Parallel Extender (DataStage PX)?

DataStage Parallel Extender (DataStage PX) este un instrument de integrare a datelor IBM. Este unul dintre numeroasele instrumente de extracție, transformare și încărcare (ETL) utilizate pe scară largă în industria depozitului de date. Acest instrument poate colecta informații din surse eterogene, efectua transformări conform cerințelor unei companii și poate încărca datele în depozitele de date respective.

DataStage PX mai poate fi numit DataStage Enterprise Edition.


O introducere în Microsoft Azure și Microsoft Cloud | În acest ghid, veți afla despre ce este vorba despre cloud computing și despre cum Microsoft Azure vă poate ajuta să migrați și să conduceți afacerea din cloud.

Techopedia explică Extensia paralelă DataStage (DataStage PX)

DataStage Parallel Extender are o arhitectură paralelă pentru procesarea datelor. Cele două tipuri principale de paralelism implementate în DataStage PX sunt paralelismul de conductă și partiție. Abilitatea de a procesa datele în mod paralel grăbește prelucrarea datelor într-o mare măsură.

DataStage Parallel Extender încorporează o varietate de etape prin care datele sursă sunt procesate și consolidate în bazele de date țintă. Acestea sunt definite în termeni de terabyți. Pe lângă etape, DataStage PX folosește containere pentru a reutiliza componentele și secvențele lucrării pentru a rula și programa mai multe lucrări în același timp.

Etapele utilizate frecvent în DataStage Parallel Extender includ:


  • Transformator
  • agregator
  • Set de date
  • Copie
  • Modificare se aplică
  • Modifica
  • Filtru
  • A te alatura
  • Îmbinare
  • Privește în sus