SQL pe Hadoop

Autor: Roger Morrison
Data Creației: 19 Septembrie 2021
Data Actualizării: 21 Iunie 2024
Anonim
Open-Source SQL-on-Hadoop Query Engines Benchmark
Video: Open-Source SQL-on-Hadoop Query Engines Benchmark

Conţinut

Definiție - Ce înseamnă SQL pe Hadoop?

SQL on Hadoop este un tip de instrument de aplicație analitică - implementarea SQL pe platforma Hadoop, care combină interogarea în stil SQL a datelor structurate cu cadrul de date Hadoop. Hadoop este o platformă relativ nouă, la fel ca datele mari în sine, și nu mulți profesioniști sunt experți în ea, însă SQL on Hadoop simplifică accesul la cadrul Hadoop și facilitează implementarea pe sistemele de întreprindere actuale.


O introducere în Microsoft Azure și Microsoft Cloud | În acest ghid, veți afla despre ce este vorba despre cloud computing și despre cum Microsoft Azure vă poate ajuta să migrați și să conduceți afacerea din cloud.

Techopedia explică SQL pe Hadoop

SQL pe Hadoop se referă la diverse implementări ale SQL pentru platforma Hadoop. MapReduce, care este mapatorul de joburi și organizatorul de rezultate al clusterului Hadoops, acceptă SQL ca un caz de utilizare major, precum și alte metode de procesare. Prin urmare, are sens să creăm instrumente puternice pentru a permite SQL, care este unul dintre cele mai utilizate limbi pentru interogarea și manipularea bazelor de date. Deoarece Hadoop câștigă popularitate pentru arhitectura de date a întreprinderii, SQL este esențială pentru adoptarea corectă atât a datelor structurate cât și a datelor structurate utilizate în Hadoop.

Driverele cheie SQL pe Hadoop includ:


  • Utilizarea abilităților SQL existente în majoritatea organizațiilor
  • Reutilizarea investițiilor de transformare a extrasului (ETL), a informațiilor de afaceri (BI) și a investițiilor în infrastructura de analiză în Hadoop

Unele implementări SQL pe Hadoop includ:

  • Apache Spark SQL
  • Apache Hive
  • Apache Tajo
  • Forajul Apache
  • HP Vertica pe MapR
  • Drivere ODBC
  • Presto
  • Rechin