12 sfaturi cheie pentru învățarea științei datelor

Autor: Laura McKinney
Data Creației: 3 Aprilie 2021
Data Actualizării: 1 Iulie 2024
Anonim
12 sfaturi cheie pentru învățarea științei datelor - Tehnologie
12 sfaturi cheie pentru învățarea științei datelor - Tehnologie

Conţinut


Sursa: Artinspiring / Dreamstime.com

La pachet:

Oamenii de știință de date au, evident, nevoie de abilități puternice de matematică și codificare, dar comunicarea și alte abilități soft sunt, de asemenea, esențiale pentru succes.

Data științific ocupă locul cel mai bun pentru anul 2019 în America, pe Glassdoor. Cu un salariu de bază median de 108.000 USD și un grad de satisfacție la locul de muncă de 4,3 din 5, plus un număr corect de deschideri prevăzute, nu este surprinzător. Întrebarea este: Ce trebuie să faci pentru a merge pe calea respectivă pentru a se califica pentru acest loc de muncă?

Pentru a afla, am căutat sfaturile date celor care încearcă să urce pe această cale de carieră. Mult se reduce la abilitățile grele din codificare și matematică. Numai că acea calculare puternică nu o reduce. Oamenii de știință de succes de date trebuie, de asemenea, să poată vorbi oamenilor de afaceri în termenii lor, ceea ce necesită capacitățile asociate abilităților soft și leadershipului. (Pentru a afla mai multe despre îndatoririle unui om de știință de date, consultați Rolul Jobului: Data Scientist.)


Construirea fundației educaționale: trei sfaturi primare

Drace Zhan, un om de știință de date la Academia de Știință a Datelor din NYC, subliniază necesitatea unei fundații educaționale care să includă esențialele capacității de codificare și matematică:

  1. R / Python + SQL. Dacă nu aveți abilități de codare, aveți nevoie de multă putere de rețea și de alte domenii pentru a îmbunătăți acest deficit. Am văzut oameni de știință de date cu matematică slabă și puțină experiență în domeniu, dar au fost întotdeauna gestionați de o abilitate puternică de a codifica. Python este ideal, dar R este un instrument excelent. Cel mai bine este să ai atât în ​​arsenalul tău. SQL este de asemenea extrem de important pentru un analist de date.

  2. Aptitudini matematice puternice. Înțelegerea foarte bună a câtorva dintre metodele utilizate în mod obișnuit: modele liniare generalizate, arbore de decizie, mijloace K și teste statistice este mai bună decât o imagine largă a diferitelor modele sau specializări, cum ar fi RNN.

Acestea sunt abilități centrale pe care să se bazeze, deși unii experți le adaugă. De exemplu, o listă KDnuggets include componentele de codare menționate de Zhan și adaugă câteva alte lucruri utile de știut din partea tehnică, inclusiv platforma Hadoop Apache Spark, vizualizarea datelor, datele nestructurate, învățarea mașinii și AI.


Dar dacă ne preluăm de la un sondaj cu privire la cele mai utilizate instrumente identificate pentru a fi utilizate în viața reală de un sondaj Kaggle, obținem rezultate oarecum diferite. După cum puteți vedea din graficul primelor 15 alegeri de mai jos, Python, R și SQL fac cu ușurință primele trei, dar al patrulea sunt caiete Jupyter, urmate de TensorFlow, Amazon Web Services, shell Unix, Tableau, C / C ++, NoSQL , MATLAB / Octave și Java, toate înaintea Hadoop și Spark. Un alt plus care poate surprinde oamenii este Excel Data Mining Microsoft.

Imagine curtoazie a lui Kaggle

Lista KDnuggets include și un sfat privind educația formală. Majoritatea oamenilor de știință de date au studii avansate: 46 la sută au doctorat, iar 88 la sută au cel puțin un nivel de master. Gradele de licență pe care le dețin sunt, în general, împărțite în domenii conexe. Aproximativ o treime sunt în matematică și statistici, care este cea mai populară pentru această piesă de carieră. Următoarea cea mai populară este o diplomă în informatică, deținută cu 19 la sută, și inginerie, alegerea de 16 la sută. Desigur, instrumentele tehnice specifice științei datelor nu sunt adesea studiate în programele de licență, ci în taberele de boot specializate sau prin cursuri online.

Mai mult decât cursuri: încă două sfaturi

Hank Yun, asistent de cercetare în Departamentul pulmonar la Weill Cornell Medicine și student la New York Data Science Academy, sfătuiește oamenii de știință aspiranți să planifice în jurul a ceea ce vor lucra și să găsească un mentor. El a spus:

Fără bug-uri, fără stres - Ghidul dvs. pas cu pas pentru crearea de software care poate schimba viața fără a vă distruge viața

Nu îți poți îmbunătăți abilitățile de programare atunci când nimeni nu îi pasă de calitatea software-ului.

Nu faceți greșeala pe care am făcut-o spunându-vă că știți știința datelor, deoarece ați luat un curs și ați primit un certificat. Acesta este un început minunat, dar când începeți să studiați, mergeți cu un proiect în minte. Apoi, găsește un mentor în domeniu și începe un proiect de pasiune imediat! Când ești proaspăt, nu știi ce nu știi, așa că ajută atunci când cineva este acolo să te îndrume spre ceea ce este important pentru tine și ce nu. Nu doriți să petreceți mult timp studiind, cu nimic de arătat!

Știind ce instrument să scoți din caseta de instrumente: Sfat să rămâi în fața curbei

Având în vedere diferența în clasamentul instrumentelor de știință a datelor, unii s-ar putea simți consternat cu privire la ce să se concentreze. Celeste Fralick, om de știință de date la compania de software de securitate McAfee, abordează problema într-un articol CIO care analizează abilitățile esențiale pentru un om de știință de date, afirmând: „Un om de știință de date trebuie să rămână în fața curbei în cercetare, precum și înțelegeți ce tehnologie să aplicați când ”. Asta înseamnă să nu fiți ademeniți de„ noua ”și noua, când problema reală” necesită ceva mult mai performant. „Conștientizarea costurilor de calcul pentru ecosistem, interpretabilitate, latență, lățime de bandă și alte condiții de delimitare a sistemului - precum și maturitatea clientului - în sine ajută oamenii de știință de date să înțeleagă ce tehnologie trebuie să aplice.”

Aptitudini moi esențiale: încă șase sfaturi

Punctul pe care Fralick îl prezintă se referă la abilitățile netehnice pe care le solicită jobul de știință de date. Acesta este motivul pentru care lista KDnuggets include aceste patru: curiozitate intelectuală, lucru în echipă, abilități de comunicare și cunoștințe de afaceri. Zhan a inclus, de asemenea, abilități esențiale esențiale în sfaturile sale pentru oamenii de știință de date, identificând „abilități de comunicare” precum KDnuggets, dar folosind „expertiză în domeniu” în locul „cunoștințelor de afaceri”. Afaceri. (Pentru a afla mai multe despre abilitățile de comunicare, consultați Importanța abilităților de comunicare pentru profesioniștii tehnici.)

Olivia Parr-Rud și-a oferit propriul spin în acest sens, adăugând încă două abilități moi, cu accent pe rolul creativității, afirmând: „Cred că știința datelor este o artă la fel de mult ca o știință”, ceva care necesită un desen punctele forte ale ambelor părți ale creierului. „Mulți oameni vorbesc despre știința datelor ca o carieră care folosește în principal creierul stâng. Am descoperit că pentru a avea succes, oamenii de știință de date trebuie să-și folosească întregul creier.

Ea a explicat că avansarea în domeniu necesită nu doar competența tehnică, ci și creativitatea și viziunea necesară pentru conducere:

Majoritatea sarcinilor cerebrale stângi / liniare pot fi automatizate sau aprovizionate. Pentru a oferi un avantaj competitiv ca cercetători de date, trebuie să fim capabili să recunoaștem tiparele și să sintetizăm cantități mari de informații folosind ambele părți ale creierului nostru. Și trebuie să fim gânditori inovatori. Multe dintre cele mai bune rezultate rezultă din integrarea creierului stâng și drept.

De asemenea, ea a subliniat de ce este esențială comunicarea unei viziuni:

În calitate de oameni de știință de date, obiectivul nostru este de a utiliza date pentru a ajuta clienții noștri să își crească profiturile. Majoritatea directorilor nu înțeleg ce facem sau cum o facem. Deci trebuie să ne gândim ca lideri și să comunicăm concluziile și recomandările noastre într-un limbaj pe care părțile interesate îl înțeleg și le au încredere.

Zecile de date

Sfaturile cheie includ un număr mai mare de instrumente tehnice, abilități și capacități, precum și calități mai puțin cuantificabile, cum ar fi aptitudinea pentru creativitate și leadership. În cele din urmă, nu este doar un joc de numere. Întrucât știința datelor nu se rezumă doar la crearea de modele în vid, ci să vină cu aplicații practice pentru rezolvarea problemelor din viața reală pentru companii, cei care vor reuși în domeniu trebuie să nu doar stăpânească tehnologia, ci să își cunoască domeniul de afaceri și să înțeleagă nevoile diverșii membri ai echipei la locul de muncă.