Știința datelor sau învățarea mașinii? Iată Cum să descoperiți diferența

Conţinut

Știința datelor și învățarea mașinilor: terminologie largă și îngustă
Seturi de abilități pentru știința datelor și mașină
Fără bug-uri, fără stres - Ghidul dvs. pas cu pas pentru crearea de software care poate schimba viața fără a vă distruge viața
Cum să descoperiți învățarea mașinii
Două discipline de tăiere

Sursa: Elnur / Dreamstime.com

La pachet:

Știința datelor și învățarea automată sunt diferite în moduri cheie. În unele moduri, unul poate fi văzut ca un subset al celuilalt. Ambele sunt importante în progresul IT actual.

În această nouă lume a inteligenței artificiale și a gestionării datelor, este ușor de confundat cu unii dintre termenii care sunt cel mai des folosiți în lumea IT.

De exemplu, știința datelor și învățarea mașinii au foarte multe legături între ele. Nu este surprinzător faptul că multe persoane care au doar cunoștințe trecătoare despre aceste discipline ar avea probleme să își dea seama cum diferă unele de altele.

Iată cel mai bun mod de a separa știința datelor de învățarea automată, ca principiu și ca abordare tehnologică.

Știința datelor și învățarea mașinilor: terminologie largă și îngustă

În primul rând, știința datelor este într-adevăr o categorie largă, generală de tehnologie, care cuprinde multe tipuri diferite de proiecte și creații. (Pentru mai multe despre lucrurile implicate într-un job de știință a datelor, consultați Rolul lucrării: științificul datelor.)

Știința datelor este în esență practica de a lucra cu date mari. A apărut ca legea Moore și proliferarea dispozitivelor de stocare mai eficiente a dus la colectarea unor cantități enorme de date de companii și alte părți. Apoi, platformele și instrumentele mari de date precum Hadoop au început să redefinăască calculul schimbând modul în care funcționează gestionarea datelor. Acum, prin cloud și containerizare, precum și modele noi, datele mari au devenit un motor important al modurilor în care lucrăm și trăim.

În forma sa cea mai simplă, știința datelor este modul în care gestionăm aceste date, de la curățarea și perfecționarea acestora până la utilizarea lor sub formă de perspective.

Definiția învățării automate este mult mai restrânsă. În învățarea automată, tehnologiile preiau date și le pun prin algoritmi, pentru a simula procesele cognitive umane descrise drept „învățare”. Cu alte cuvinte, după ce a preluat datele și s-a instruit pe ele, computerul este capabil să ofere propriile rezultate. , unde tehnologia pare să fi învățat din procesele pe care le-au pus programatorii.

Seturi de abilități pentru știința datelor și mașină

Un alt mod de a contrasta știința datelor și învățarea automată este să analizezi diferitele abilități care sunt cele mai valoroase pentru profesioniștii din oricare dintre aceste domenii.

Fără bug-uri, fără stres - Ghidul dvs. pas cu pas pentru crearea de software care poate schimba viața fără a vă distruge viața

Nu îți poți îmbunătăți abilitățile de programare atunci când nimeni nu îi pasă de calitatea software-ului.

Există un consens general potrivit căruia oamenii de știință de date beneficiază de abilități de analiză și matematică profunde, experiență practică cu tehnologii de baze de date și cunoștințe de limbaje de programare precum Python sau alte pachete care sunt utilizate pentru analizarea datelor mari.

„Oricine este interesat să-și construiască o carieră puternică în (știința datelor) ar trebui să dobândească abilități cheie în trei departamente: analiză, programare și cunoștințe de domeniu”, scrie Srihari Sasikumar la Simplilearn. „Trecând la un nivel mai profund, următoarele abilități vă vor ajuta să creați o nișă ca om de știință de date: cunoștințe puternice despre Python, SAS, R (și) Scala, experiență practică în codificarea bazelor de date SQL, capacitatea de a lucra cu date nestructurate din diverse surse precum video și social media, înțeleg mai multe funcții analitice (și) cunoștințe de învățare automată. "

În ceea ce privește învățarea automată, experții citează adesea abilități de modelare a datelor, cunoștințe de probabilitate și statistici și abilități de programare mai largi ca instrumente utile în setul de instrumente al inginerului de învățare automată.

Cum să descoperiți învățarea mașinii

Cheia aici este că tot felul de lucruri cuprind lucrări de știință a datelor, dar nu este învățarea automată decât dacă aveți un regim foarte strict creat pentru a ajuta computerul să învețe din inputurile sale.

Când aceasta este în vigoare, creează anumite sisteme surprinzător de capabile, care pot avea efecte largi asupra vieții noastre.

"O mare parte din ceea ce facem cu învățarea automată se întâmplă sub suprafață", a spus fondatorul Amazon, Jeff Bezos, subliniind unele dintre aplicațiile acestor tipuri de sisteme. „Învățarea automată conduce algoritmii noștri de prognoză a cererii, clasificare a căutării de produse, recomandări de produse și oferte, destinații de plasare a mărfurilor, detectare fraudă, traduceri și multe altele. Deși mai puțin vizibil, o mare parte a impactului învățării automate va fi de acest tip - îmbunătățirea liniștită, dar semnificativă a operațiilor de bază. "

Unul dintre cele mai utile exemple este apariția rețelei neuronale - este o metodă comună și populară de configurare a proceselor de învățare automată.

În forma sa cea mai de bază, rețeaua neurală este compusă din straturi de neuroni artificiali. Fiecare neuron artificial individual are o funcționalitate echivalentă cu un neuron biologic - dar în loc de sinapse și dendrite, are intrări, o funcție de activare și ieșiri eventuale.

Rețeaua neuronală este creată pentru a acționa ca un creier uman, iar profesioniștii în învățarea mașinii utilizează deseori acest model pentru a crea rezultate de învățare automată.

Totuși, aceasta nu este singura modalitate de a învăța mașinile. Unele proiecte de învățare automată mai rudimentare includ, pur și simplu, afișarea unui computer de o gamă largă de fotografii (sau furnizarea de alte date brute), introducerea ideilor prin procesul de utilizare a învățării automate supravegheate și a datelor de etichetă și de a avea computerul în cele din urmă în măsură să discrimineze diverse forme sau elemente dintr-un câmp vizual. (Pentru elementele de bază despre învățarea mașinii, consultați Machine Learning 101.)

Două discipline de tăiere

În concluzie, învățarea automată este o parte valoroasă a științei datelor. Dar știința datelor reprezintă cea mai mare frontieră și conținutul în care are loc învățarea automată.

Într-un fel, ați putea spune că învățarea automată nu s-ar întâmpla fără date mari. Datele mari în sine nu au creat învățarea automată - în schimb, după ce am adunat colectiv atât de multe date încât aproape nu știam ce să facem cu asta, mințile de top au venit cu aceste procese de simulare bio ca mod supraalimentat. de a oferi informații.

Un alt lucru bun de reținut este faptul că știința datelor poate fi aplicată în două moduri majore - putem cuprinde învățarea mașinii și inteligența artificială, lăsând calculatoarele să se gândească pentru noi sau putem readuce știința datelor la o abordare mai centrată pe oameni computerul pur și simplu prezintă rezultate și noi, ca oameni, luăm deciziile.

Acest lucru îi determină pe unii experți, inclusiv pe cei mai buni inovatori de astăzi, să solicite o contabilitate mai vibrantă a modurilor în care folosim aceste tehnologii.

„(AI) este capabil de mult mai mult decât știe aproape toată lumea, iar rata de îmbunătățire este exponențială”, a spus Elon Musk, în timp ce avertizează că învățarea mașină și programele AI necesită supraveghere.

În orice caz, atât știința datelor, cât și învățarea mașinii sunt părți esențiale ale progreselor pe care noi, în calitate de societăți, le realizăm astăzi în tehnologie.