Analiză de date mari de tip Open-Source

Autor: Laura McKinney
Data Creației: 1 Aprilie 2021
Data Actualizării: 14 Mai 2024
Anonim
Top 5 programe Windows utile preinstalate
Video: Top 5 programe Windows utile preinstalate

Conţinut

Definiție - Ce înseamnă Open-Source Big Data Analytics?

Analiza open-source de date mari se referă la utilizarea de software și instrumente open-source pentru analizarea unor cantități uriașe de date pentru a aduna informații relevante și acționabile pe care o organizație le poate utiliza pentru a-și continua obiectivele de afaceri. Cel mai mare jucător în analizele de date mari de tip open-source este Apaches Hadoop - este cea mai utilizată bibliotecă de software pentru procesarea unor seturi de date enorme într-un grup de calculatoare folosind un proces distribuit pentru paralelism.


O introducere în Microsoft Azure și Microsoft Cloud | În acest ghid, veți afla despre ce este vorba despre cloud computing și despre cum Microsoft Azure vă poate ajuta să migrați și să conduceți afacerea din cloud.

Techopedia explică Open-Source Big Data Analytics

Analiza open-source de date mari folosește software și instrumente open-source pentru a executa analytics de date mari, fie folosind o întreagă platformă software sau diverse instrumente open-source pentru diferite sarcini în procesul de analiză a datelor. Apache Hadoop este cel mai cunoscut sistem pentru analiza datelor mari, dar sunt necesare alte componente înainte ca un sistem de analiză reală să poată fi reunit.

Hadoop este implementarea open-source a algoritmului MapReduce pionierat de Google și Yahoo, deci este baza celor mai multe sisteme de analiză astăzi. Multe instrumente de analiză a datelor mari utilizează surse deschise, inclusiv sisteme solide de baze de date, cum ar fi MongoDB cu sursă deschisă, o bază de date NoSQL sofisticată și scalabilă, foarte potrivită pentru aplicațiile de date mari, precum și altele.


Serviciile de analiză a datelor de mare dimensiune open-source cuprind:

  • Sistem de colectare a datelor
  • Centrul de control pentru administrarea și monitorizarea clusterelor
  • Bibliotecă de învățare automată și minerit de date
  • Serviciul de coordonare a aplicațiilor
  • Calculați motorul
  • Cadrul de execuție