Sistemul de fișiere distribuit Hadoop (HDFS)

Autor: Judy Howell
Data Creației: 28 Iulie 2021
Data Actualizării: 1 Iulie 2024
Anonim
What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka
Video: What is HDFS | Hadoop Distributed File System (HDFS) Introduction | Hadoop Training | Edureka

Conţinut

Definiție - Ce înseamnă sistemul de fișiere distribuit Hadoop (HDFS)?

Sistemul de fișiere distribuit Hadoop (HDFS) este un sistem de fișiere distribuit care rulează pe hardware standard sau low-end. Dezvoltat de Apache Hadoop, HDFS funcționează ca un sistem de fișiere distribuit standard, dar oferă o mai bună transfer de date și acces prin algoritmul MapReduce, toleranță ridicată la erori și asistență nativă a seturilor de date mari.


O introducere în Microsoft Azure și Microsoft Cloud | În acest ghid, veți afla despre ce este vorba despre cloud computing și despre cum Microsoft Azure vă poate ajuta să migrați și să conduceți afacerea din cloud.

Techopedia explică sistemul de fișiere distribuite Hadoop (HDFS)

HDFS stochează o cantitate mare de date plasate pe mai multe mașini, de obicei în sute și mii de noduri conectate simultan și asigură fiabilitatea datelor prin reproducerea fiecărei instanțe de date ca trei copii diferite - două într-un grup și una în alta. Aceste copii pot fi înlocuite în caz de eșec.

Arhitectura HDFS este formată din clustere, fiecare dintre ele fiind accesat printr-un singur instrument software NameNode instalat pe o mașină separată pentru a monitoriza și gestiona sistemul de fișiere al clusterului și mecanismul de acces al utilizatorului. Celelalte aparate instalează o instanță a DataNode pentru a gestiona stocarea clusterului.


Deoarece HDFS este scris în Java, are suport nativ pentru interfețele de programare a aplicațiilor Java (API) pentru integrarea și accesibilitatea aplicațiilor. De asemenea, poate fi accesat prin intermediul browserelor web standard.