Jedan dan u životu podatkovnog znanstvenika

BrainStationov vodič za karijeru Data Scientist može vam pomoći da napravite prve korake prema unosnoj karijeri u znanosti o podacima. Čitajte dalje za pregled kako Data Scientists provode dane na poslu.

Postanite Data Scientist

Razgovarajte sa savjetnikom za učenje kako biste saznali više o tome kako vam naši kampovi i tečajevi mogu pomoći da postanete Data Scientist.



Klikom na Pošalji prihvaćate naše Pojmovi .



podnijeti

Nije moguće poslati! Osvježiti stranicu i pokušati ponovno?

Saznajte više o našem kampu Data Science Bootcamp

Hvala vam!

Uskoro ćemo se javiti.



Pogledajte stranicu Data Science Bootcamp

Jedan dan u životu podatkovnog znanstvenika

Od svih disciplina koje se ispituju u Brainstationovom istraživanju o digitalnim vještinama, znanost o podacima može obuhvatiti najširi raspon primjena. No, iako znanost o podacima postoji desetljećima, tek je nedavno došla u puni procvat. Kako se dostupnost podataka širila, tvrtke su shvatile koliko znanost o podacima može biti važna, kaže Briana Brownell, osnivačica i izvršna direktorica tvrtke Pure Strategy te znanstvenica o podacima već 13 godina. Svaka se tvrtka sada mora djelomično fokusirati na tehnologiju. Samo ovog tjedna, na primjer, McDonald's je platio oko 300 milijuna dolara za stjecanje vlastite tvrtke za velike podatke.

Stoga ne čudi da je konkurencija za Data Scientists nevjerojatno velika. U samo dvije godine očekuje se porast potražnje za 28 posto, što je ekvivalentno oko 2,7 milijuna novih radnih mjesta. To je više mjesta nego što će novi diplomanti moći popuniti - što znači da će tehnički radnici u drugim područjima morati poboljšati svoje vještine i prijeći na podatke kako bi zadovoljili ovu potražnju.

Zapravo, naše istraživanje pokazuje da se to već događa. Otprilike četiri od pet stručnjaka za podatke započeli su svoju karijeru radeći nešto drugo, a 65 posto svih Data Scientists radi na tom polju pet godina ili manje. Ovaj ogroman priljev novih umova ima dvosjekli učinak, kaže Brownell; s jedne strane, dolazi puno novih ideja, kaže ona. Kada pogledam neke sadržaje koji dolaze iz zajednice znanosti o podacima, iznenađen sam koliko ima inovacija. Druga strana je, međutim, sklonost ponovnom izumu kotača.



Velika potražnja za Data Scientists je velika ako ste to (ili razmišljate o tome da to postanete), ali za poslodavce zapošljavanje može biti zastrašujući izazov. Ovdje je prekvalifikacija očito rješenje; možda bi bilo isplativije preobučiti postojećeg zaposlenika u znanosti o podacima nego tražiti novoga.

Ali čak i ako planirate zaposliti novi tim za znanost o podacima, vaša organizacija u cjelini možda će trebati poboljšati svoju pismenost podataka, upozorava Brownell. Svatko želi raditi na nečemu što ima utjecaja na njihovo radno mjesto, što ljudima čini živote boljim, kaže ona. Ako kultura vaše tvrtke nije takva da [vaši Data Scientists] mogu utjecati, gotovo je nemoguće zaposliti. Vodstvo mora biti sposobno ne samo komunicirati potencijalnim zaposlenicima o tome kako će oni moći doprinijeti – već i razumjeti prijedloge koje njihov tim za znanost podataka na kraju iznese.

Nažalost, kaže Brownell, neugodna većina su tvrtke koje stvari nisu shvatile. Naše istraživanje to potvrđuje: većina ispitanika (52 posto) opisala je razinu podatkovne pismenosti u svojim organizacijama kao osnovnu, a srednji je sljedeći najčešći odgovor (31 posto). To sugerira da bi neka temeljna obuka za znanost o podacima mogla biti korisna za veliku većinu tvrtki - osobito u vodstvu.



Ova potreba za poboljšanom podatkovnom pismenošću — i komunikacijom — pojačana je načinom na koji je većina timova za znanost o podacima strukturirana: kao diskretni tim, obično s 10 ljudi ili manje (prema 71 posto ispitanika), a često pet ili manje (38 posto ). Ovi usko povezani timovi ne mogu si priuštiti da budu izolirani. Pojedinci koji rade u većim tvrtkama obično su unutar male grupe specifične za znanost o podacima, a njihovi klijenti su interni - drugi dijelovi organizacije, objašnjava Brownell, tako da je to tim koji mora djelovati u mnogim različitim područjima organizacije.

Što je zapravo znanost o podacima?

Uobičajena percepcija (da Data Scientists krše brojke) nije previše daleko od cilja, kaže Brownell. Postoji mnogo skupova podataka za koje je potrebno otkriti uvide iz njih, a to uključuje puno koraka kao što su izgradnja modela i čišćenje podataka, pa čak i samo odlučivanje koje podatke trebate. Ipak, u konačnici, ovaj napor je usmjeren na cilj: u svojoj srži morate nešto učiniti s podacima.

Što se toga tiče, podaci nisu uvijek brojevi. Dok je većina ispitanika (73 posto) navela da radi s brojčanim podacima, 61 posto je izjavilo da također radi s tekstom, 44 posto sa strukturiranim podacima, 13 posto sa slikama i 12 posto s grafikom (a male manjine rade čak i s video i audio —6 posto odnosno 4 posto). Ovi rezultati ankete upućuju na načine na koje se znanost o podacima širi daleko izvan financijskih tablica, angažujući ljude za takve projekte kao što su maksimiziranje zadovoljstva kupaca ili prikupljanje vrijednih uvida iz vatrogasnog crijeva društvenih medija.

Kao rezultat toga, postoji ogromna raznolikost unutar polja znanosti o podacima, kaže Brownell. Svaka industrija ima svoje vlastito shvaćanje o tome na kojim vrstama podataka Data Scientists rade, vrste ishoda koje očekuju i kako se to uklapa u vodstvenu strukturu njihove tvrtke. Međutim, u svakom slučaju cilj je iskoristiti podatke kako bi se tvrtki pomoglo u donošenju boljih odluka. To bi moglo biti poboljšanje proizvoda, razumijevanje tržišta na koje žele ući, zadržavanje više kupaca, razumijevanje njihove upotrebe radne snage, razumijevanje kako dobro zaposliti - sve vrste različitih stvari.

Poslovi u znanosti o podacima

U nekim područjima tehnologije, postati generalist može biti vaša najbolja noga na vratima - što nije tako u znanosti o podacima. Poslodavci obično traže vještine specijalizirane za njihovu djelatnost. Budući da znanost o podacima dolazi u toliko različitih okusa, naša je anketa istraživala dublje, ispitujući pet glavnih kategorija poslova: analitičar podataka, istraživač, poslovni analitičar, voditelj podataka i analitike i sam podatkovni znanstvenik.

U svim ovim nazivima poslova, prepucavanje podataka i čišćenje oduzimaju najveći dio nečijeg vremena - ali s kojim ciljem? Najčešće je cilj optimizirati postojeću platformu, proizvod ili sustav (45 posto), odnosno razviti nove (42 posto). Kopajući dublje, otkrili smo da optimizacija postojećih rješenja obično pada na poslovne analitičare i analitičare podataka, dok razvoj novih rješenja češće pada na račune znanstvenika i istraživača podataka.

Tehnike koje koriste Data Scientists također se razlikuju u različitim specijalizacijama. Linearna regresija bila je uobičajen alat u svim kategorijama, navelo ga je 54 posto ispitanika, ali bilo je nekoliko iznenađenja kada smo pogledali softver koji ljudi koriste.

Excel – taj radni konj za manipulaciju skupom podataka – praktički je sveprisutan, citira ga 81 posto svih ispitanika, i najpopularniji alat u svakoj kategoriji osim samih stručnjaka za podatke (koji se najčešće oslanjaju na Python – a također je naveo veći skup alata od drugih kategorija ). Što Excel čini tako neizbježnim, čak i u 2019.?

Ono što volim kod Excela je kako vam omogućuje da vidite podatke i dobijete intuitivan dojam za njih, objasnio je Brownell. Također koristimo puno Pythona, a u tom slučaju, kada radite analitiku na datoteci s podacima, ona je skrivena; osim ako posebno ne programirate dio svog koda za vizualizaciju sirovih podataka koje analizirate, nećete ga vidjeti. Dok je s Excelom točno ispred vas. To ima puno prednosti. Ponekad možete uočiti probleme s podatkovnom datotekom. Ne vidim da bi Excel ikada nestao iz analize.

Ipak, još uvijek postoji dugačak popis drugih programa koji se koriste u tom polju - što ne iznenađuje s obzirom na njihovu raznolikost. SQL (43 posto) i Python (26 posto) prednjače u popularnosti, a Tableau (23 posto), R (16 posto), Jupyter Notebooks (14 posto) i nekolicina drugih imaju značajne brojke - da ne spominjemo goleme 32 posto ispitanika koji su naveli druge alate, čak i s obzirom na ovaj već dugi popis.

Kakva je budućnost znanosti o podacima?

Na kraju smo pitali koji će trendovi oblikovati digitalni krajolik u sljedećih pet do 10 godina. Strojno učenje i AI – od kojih oba imaju primjenu u znanosti o podacima – bili su u velikoj većini razvoji za koje ispitanici očekuju da će imati najveći utjecaj, s 80 posto, odnosno 79 posto. I to unatoč činjenici da manje od četvrtine (23 posto) njih trenutno radi s umjetnom inteligencijom.

Umjetna inteligencija može apsolutno transformirati znanost o podacima, potvrđuje Brownell, čija tvrtka razvija AI proizvode. To je zapravo slava metoda učenja bez nadzora. Imamo samo toliko vremena da pogledamo ove skupove podataka, a pogotovo s velikim, vrlo je teško učiniti sve. Alati umjetne inteligencije mogu vam pomoći otkriti nešto što možda ne biste ni pomislili tražiti. Definitivno nam se to dogodilo.

Ostali trendovi Data Scientists očekuju da će dominirati u bliskoj budućnosti: Internet stvari (51 posto), blockchain (50 posto) i eCommerce (36 posto), proširena stvarnost i virtualna stvarnost (38 posto i 27 posto), pa čak i glasovno- temeljena iskustva (25 posto)—svi značajni rezultati i sva područja u kojima se znanost o podacima može dobro iskoristiti.

Kategori: Vijesti