Astăzi provocarea de date mari provine din varietate, nu din volum sau viteză

Autor: Judy Howell
Data Creației: 28 Iulie 2021
Data Actualizării: 1 Iulie 2024
Anonim
High Density 2022
Video: High Density 2022

Conţinut


La pachet:

Prea multe departamente IT aruncă tot ceea ce au în ceea ce privește volumul și viteza datelor, uitând să abordeze problema fundamentală a varietății de date.

Provocarea de a gestiona și de a folosi datele mari vine din trei elemente, potrivit lui Doug Laney, vicepreședinte de cercetare la Gartner. Laney a remarcat pentru prima dată cu mai mult de un deceniu că datele mari reprezintă o astfel de problemă pentru întreprindere, deoarece introduce volum, viteză și varietate greu de gestionat. Problema este că prea multe departamente IT aruncă tot ceea ce au în ceea ce privește volumul și viteza datelor, uitând să abordeze problema fundamentală a varietății de date.

În 2001, Laney a scris că „întreprinderile de lider vor folosi din ce în ce mai mult un depozit de date centralizat pentru a defini un vocabular comun de afaceri care îmbunătățește colaborarea internă și externă”. Problema acestui vocabular - și variabilitatea care împiedică companiile să-l creeze - rămâne astăzi cel mai puțin abordat aspect al conundrumului de date. (Consultați ce au de spus ceilalți experți. Consultați experții în date mari pe care să le urmați.)


Trei V-uri de date mari

Numeroase întreprinderi au găsit metode pentru valorificarea volumului și vitezei crescute a datelor. , de exemplu, poate analiza volume enorme de date. Desigur, aceste date sunt adesea prezentate de mai multe ori în cadrul acelorași parametri. Acest lucru a determinat inovații tehnologice, cum ar fi bazele de date pe coloane, care sunt acum utilizate pe scară largă de alte companii care se confruntă cu magazine la fel de importante de articole de date similare.

În ceea ce privește viteza de îmblânzire, furnizorii precum Splunk ajută întreprinderile să analizeze datele create rapid prin intermediul fișierelor de jurnal care surprind câteva mii de evenimente pe secundă. Această analiză a evenimentelor cu volum mare vizează cazuri de utilizare a monitorizării securității și performanței. Ca și în cazul provocării volumului de date, provocarea vitezei a fost abordată în mare parte prin tehnici sofisticate de indexare și analize de date distribuite care permit capacitatea de procesare la scară cu viteza crescută a datelor.


În ceea ce privește varietatea, totuși, prea multe întreprinderi se confruntă încă cu o problemă importantă în abordarea lor asupra analizelor de date mari. Această problemă este determinată de trei factori: în primul rând, datorită creșterii, achizițiilor și inovațiilor tehnologice care adaugă sisteme noi în mediu, întreprinderile sunt blocate într-un mediu extrem de eterogen și această heterogenitate nu crește decât cu timpul. Întreprinderile trebuie să urmărească o multitudine de tipuri de sisteme și să gestioneze zeci de mii de tipuri de date, precum și aceleași date să fie reprezentate folosind nomenclaturi și formate diferite.

În al doilea rând, aceste sisteme și tipuri de date raportează, în multe cazuri, atât informații relevante, cât și informații care pot fi filtrate în siguranță ca nerelevant pentru problema abordată. Este necesar să identificăm în mod fiabil informații de impact.

A treia dimensiune a provocării soiului este variabilitatea constantă sau schimbarea mediului. Sistemele sunt modernizate, sunt introduse sisteme noi, sunt adăugate noi tipuri de date și este introdusă o nouă nomenclatură. Acest lucru îngreunează în continuare capacitatea noastră de a îmblânzi provocarea pentru varietatea de date. Acest lucru adaugă un strat suplimentar la provocarea soiului. (Pentru mai multe informații, consultați datele mari: modul în care sunt capturate, croite și folosite pentru a lua decizii de afaceri.)

Abordarea problemei privind varietatea de date

Pentru a rezolva problema soiului de date, întreprinderile trebuie să înceapă cu domeniul IT, deoarece reprezintă adesea atât cei mai răi infractori, cât și cei mai răi victimi ai problemei soiului. Primul pas este să începeți cu o definiție sau o taxonomie cuprinzătoare a tuturor elementelor sau activelor IT. Aceasta oferă o bază sau o bază de referință la orice în IT sau despre IT și permite întreprinderilor să gestioneze eterogenitatea crescândă față de o taxonomie sau terminologie cunoscută.

Fără bug-uri, fără stres - Ghidul dvs. pas cu pas pentru crearea de programe care schimbă viața fără a vă distruge viața

Nu îți poți îmbunătăți abilitățile de programare atunci când nimeni nu îi pasă de calitatea software-ului.

Următorul pas este identificarea numeroaselor moduri în care același obiect este reprezentat în diferite sisteme de înregistrare. Acest lucru permite profesioniștilor din IT să privească mediul lor eterogen și să filtreze și să comprimeze datele în bucăți relevante și manevrabile.

În cele din urmă, managerii IT trebuie să adopte un proces de examinare constantă a mediului pentru modificări, cum ar fi introducerea de noi tipuri de elemente sau o nouă nomenclatură pentru a se referi la același element.

Cu acești pași, organizațiile IT pot gestiona problema varietății și pot obține perspective profunde care au evitat echipele IT. Mai mult decât atât, gestionarea problemei soiului îmbunătățește considerabil rentabilitatea investițiilor în instrumente și tehnici care abordează problemele de date și viteză mai tradiționale.