Data Scientist

BrainStationov vodič za karijeru Data Scientist može vam pomoći da napravite prve korake prema unosnoj karijeri u znanosti o podacima. Čitajte dalje za pregled polja znanosti o podacima, kao i uloge Data Scientist.

Postanite Data Scientist

Razgovarajte sa savjetnikom za učenje kako biste saznali više o tome kako vam naši kampovi i tečajevi mogu pomoći da postanete Data Scientist.



Klikom na Pošalji prihvaćate naše Pojmovi .



podnijeti

Nije moguće poslati! Osvježiti stranicu i pokušati ponovno?

Saznajte više o našem kampu Data Science Bootcamp

Hvala vam!

Uskoro ćemo se javiti.



Pogledajte stranicu Data Science Bootcamp

Što je Data Scientist?

Data Scientists prikupljaju, organiziraju i analiziraju velike skupove velikih podataka – strukturiranih i nestrukturiranih podataka – kako bi stvorili djelotvorna poslovna rješenja i planove za tvrtke i druge organizacije. Kombinirajući smisao za matematiku, informatiku i poslovanje, Data Scientists moraju posjedovati i tehničke vještine za obradu i analizu velikih podataka i poslovnu sposobnost da otkriju djelotvorne uvide skrivene u tim podacima.

Data Science vs. Data Mining

Postoji nekoliko razlika između znanosti o podacima i rudarenja podataka. Pogledajmo pobliže:

Znanost o podacima

  • Široko je polje koje uključuje strojno učenje, umjetnu inteligenciju, prediktivnu kauzalnu analitiku i preskriptivnu analitiku
  • Bavi se svim vrstama podataka, uključujući strukturirane i nestrukturirane podatke
  • Nastoji izgraditi proizvode usmjerene na podatke i donijeti odluke temeljene na podacima
  • Usredotočuje se na znanstveno proučavanje podataka i uzoraka

Data Mining

  • Podskup je znanosti o podacima koji uključuje čišćenje podataka, statističku analizu i prepoznavanje uzoraka, a ponekad uključuje vizualizaciju podataka, strojno učenje i transformaciju podataka
  • Bavi se prvenstveno strukturiranim podacima, a ne nestrukturiranim podacima
  • Cilj mu je uzeti podatke iz različitih izvora i učiniti ih upotrebljivim
  • Fokusira se na poslovnu praksu

Što radi Data Scientist?

Data Scientist analizira velike skupove podataka kako bi otkrio obrasce i trendove koji vode do djelotvornih poslovnih uvida i pomažu organizacijama da riješe komplicirane probleme ili identificiraju prilike za prihod i rast. Data Scientist može raditi u gotovo svakom polju i mora biti vješt u rukovanju strukturiranim i nestrukturiranim skupovima podataka. To je multidisciplinaran posao i da biste postali Data Scientist, morate posjedovati razumijevanje matematike, informatike, poslovanja i komunikacije kako biste učinkovito obavljali svoj posao.



Iako će se specifične radne dužnosti i odgovornosti Data Scientist-a uvelike razlikovati ovisno o industriji, poziciji i organizaciji, većina uloga Data Scientist-a uključivat će sljedeća područja odgovornosti:

Istraživanje

Data Scientist mora razumjeti mogućnosti i bolne točke specifične za industriju i pojedinačnu tvrtku.

Priprema podataka

Prije nego što se dođu do bilo kakvih vrijednih uvida, Data Scientist mora definirati koji skupovi podataka su korisni i relevantni prije prikupljanja, izdvajanja, čišćenja i primjene strukturiranih i nestrukturiranih podataka iz različitih izvora.



Izrada modela i algoritama

Koristeći principe strojnog učenja i umjetne inteligencije, Data Scientist mora biti sposoban stvoriti i primijeniti algoritme potrebne za implementaciju alata za automatizaciju.

Analiza podataka

Za Data Scientist je važno da može brzo analizirati svoje podatke kako bi identificirao obrasce, trendove i prilike.

Vizualizacija i komunikacija

Data Scientist mora biti sposoban ispričati priče otkrivene putem podataka stvaranjem i organizacijom estetski privlačnih nadzornih ploča i vizualizacija, a također mora posjedovati komunikacijske vještine kako bi uvjerio dionike i druge članove tima da se na nalaze u podacima isplati djelovati.

Najnovija BrainStationova anketa o digitalnim vještinama pokazala je da profesionalci za podatke provode većinu svog vremena na prepirku i čišćenje podataka. Ispitanici su također zaključili da im je cilj rada najčešće optimizacija postojeće platforme, proizvoda ili sustava (45 posto), ili razvoj novih (42 posto).

Vrste znanosti o podacima

Šire polje znanosti o podacima uključuje mnoge različite discipline, uključujući:

Inženjering podataka

Projektiranje, izgradnja, optimizacija, održavanje i upravljanje infrastrukturom koja podržava podatke kao i protok podataka u cijeloj organizaciji.

Priprema podataka

Čišćenje i transformacija podataka.

Data mining

Ekstrahiranje (i ponekad čišćenje i transformacija) upotrebljivih podataka iz većeg skupa podataka.

Prediktivna analitika

Korištenje podataka, algoritama i tehnika strojnog učenja za analizu vjerojatnosti različitih mogućih budućih ishoda na temelju analize podataka.

Strojno učenje

Automatizacija izgradnje analitičkog modela u procesu analize podataka radi učenja iz podataka, otkrivanja obrazaca i osnaživanja sustava za donošenje odluka bez puno ljudske intervencije.

Vizualizacija podataka

Korištenje vizualnih elemenata (uključujući grafikone, karte i grafikone) za ilustriranje uvida pronađenih u podacima na pristupačan način kako bi publika mogla razumjeti trendove, odstupanja i obrasce pronađene u podacima.

Prednosti znanosti o podacima

Tvrtke u svim industrijama u svim dijelovima svijeta posvećuju sve više novca, vremena i pažnje znanosti o podacima i žele dodati Data Scientist u svoj tim. Istraživanja pokazuju da su tvrtke koje uistinu prihvaćaju donošenje odluka temeljeno na podacima produktivnije, profitabilnije i učinkovitije od konkurencije.

Znanost o podacima ključna je za pomoć organizacijama da identificiraju prave probleme i prilike, dok istovremeno pomaže u stvaranju jasne slike ponašanja i potreba kupaca i klijenata, učinkovitosti zaposlenika i proizvoda te potencijalnih budućih problema.

Znanost o podacima može pomoći tvrtkama:

  • Donosite bolje odluke
  • Saznajte više o kupcima i klijentima
  • Iskoristite trendove
  • Predvidjeti budućnost

Kako znanost o podacima može poboljšati vrijednost za tvrtku?

Znanost o podacima tako je sve popularnije ulaganje za tvrtke jer je potencijalni ROI na otključavanje vrijednosti velikih podataka ogroman. Znanost o podacima je vrijedno ulaganje jer:

    Uklanja nagađanja i pruža djelotvorne uvide.Tvrtke donose bolje odluke temeljene na podacima i mjerljivim dokazima.Tvrtke bolje razumiju svoje mjesto na tržištu.Znanost o podacima pomoći će tvrtkama da analiziraju konkurenciju, istraže povijesne primjere i daju preporuke temeljene na brojevima.Može se iskoristiti za identificiranje vrhunskih talenata.U velikim podacima kriju se mnogi uvidi o produktivnosti, učinkovitosti zaposlenika i ukupnoj izvedbi. Podaci se također mogu koristiti za zapošljavanje i obuku talenata.Saznat ćete sve o svojoj ciljnoj publici, klijentu ili potrošaču.Svi sada generiraju i prikupljaju podatke, a tvrtke koje ne ulažu ispravno u znanost o podacima jednostavno prikupljaju više podataka nego što znaju što im je činiti. Uvidi u ponašanje, prioritete i preferencije prošlih ili potencijalnih kupaca ili klijenata su neprocjenjivi i oni jednostavno čekaju da to otkrije kvalificirani Data Scientist.

Plaće za podatkovne znanstvenike

Iako se plaće za Data Scientist uvelike razlikuju po regiji i industriji, prosječna plaća za Data Scientist u SAD-u je od 96.000 do 113.000 dolara, ovisno o izvoru. Viši Data Scientist može u prosjeku donijeti otprilike 130.000 dolara.

Potražnja za znanstvenicima podataka

Data Scientists su u velikoj potražnji i nedostatku u gotovo svim industrijama. Izvješće Deloitte Access Economicsa pokazalo je da 76 posto tvrtki planira povećati potrošnju tijekom sljedećih godina na sposobnosti analize podataka, dok je IBM predvidio porast potražnje za znanošću podataka od 28 posto početkom desetljeća.

Američki ured za statistiku rada predvidio je rast znanosti o podacima od 31 posto u sljedećih 10 godina. U međuvremenu, Izvješće o tržištima i tržištima pokazalo je da se predviđa da će globalno tržište velikih podataka narasti na 229,4 milijarde dolara do 2025., a platforma za znanost o podacima porasti za 30 posto do 2024. godine.

Čini se da se svugdje u svijetu očekuje porast ulaganja u znanost podataka, a time i potražnja za Data Scientists.

Koje alate koriste Data Scientists?

Data Scientists koriste niz različitih alata i programa za aktivnosti uključujući analizu podataka, čišćenje podataka i stvaranje vizualizacija.

Python je najbolji programski jezik za podatkovne znanstvenike koji su ispitani u BrainStation Digital Skills Survey. Programski jezik opće namjene, Python je koristan za aplikacije za obradu nacionalnih jezika i analizu podataka. R se također često koristi za analizu podataka i rudarenje podataka. Za veće mjerenje brojeva popularni su alati temeljeni na Hadoopu kao što je Hive. Za strojno učenje, Data Scientists mogu birati između širokog spektra alata uključujući h2o.ai, TensorFlow, Apache Mahout i Accord.Net. Alati za vizualizaciju također su važan dio arsenala Data Scientist-a. Programi kao što su Tableau, PowerBI, Bokeh, Plotly i Infogram pomažu Data Scientists stvoriti vizualno privlačne dijagrame, toplinske karte, grafike, dijagrame raspršenja i još mnogo toga.

Data Scientists bi također trebali biti izuzetno zadovoljni i SQL (koji se koristi na nizu platformi, uključujući MySQL, Microsoft SQL i Oracle) i programima za proračunske tablice (obično Excel).

Koje vještine trebaju Data Scientists?

Postoji niz vještina koje bi svi budući znanstvenici podataka trebali razviti, uključujući:

    Excel.Najkorišteniji alat za 66 posto stručnjaka za podatke koji su ispitani u anketi BrainStation Digital Skills Survey, Excel je još uvijek ključan za podatkovne znanstvenike.SQL.Ovaj jezik upita nezamjenjiv je u upravljanju bazom podataka i koristi ga otprilike polovica ispitanika.Statističko programiranje.Python i R obično koriste Data Scientists za izvođenje testova, stvaranje modela i provođenje analiza velikih skupova podataka.Vizualizacija podataka.Alati kao što su Tableau, Plotly, Bokeh, PowerBl i Matplotlib pomažu Data Scientists stvoriti uvjerljive i pristupačne vizualne prikaze svojih otkrića.

Putovi karijere Data Scientist

Kao relativno nova profesija, karijera Data Scientist nije zapisana u kamenu, a mnogi ljudi pronalaze put do znanosti o podacima iz pozadina u informatici, IT-u, matematici i poslovanju. No četiri glavne osi za karijeru Data Scientist općenito su podaci, inženjering, poslovanje i proizvod. Mnoge multidisciplinarne uloge u znanosti o podacima zahtijevaju ovladavanje nekoliko ili svih tih područja.

Ljudi koji rade u znanosti o podacima na samom su čelu tehnoloških promjena koje će najviše utjecati na budućnost. Budući da znanost o podacima može pridonijeti napretku u gotovo svim drugim područjima, Data Scientists su u poziciji za daljnja istraživanja u svemu, od financija i trgovine do aktuarske statistike, zelene energije, epidemiologije, medicine i farmaceutskih proizvoda, telekomunikacija – popis je gotovo beskonačan. Svaka industrija prometuje svojim različitim vrstama podataka, koristeći ih na različite načine za postizanje različitih ciljeva. Gdje god se to dogodi, Data Scientists mogu voditi bolje donošenje odluka, bilo da se radi o razvoju proizvoda, analizi tržišta, upravljanju odnosima s kupcima, ljudskim resursima ili nečemu sasvim drugom.

Ne samo da su aplikacije za znanost o podacima široke, koje se dotiču mnogih različitih sektora, već postoje i različite vrste znanosti o podacima. Ono što je zajedničko svim ovim aktivnostima je da sve one pokušavaju podatke pretvoriti u znanje. Točnije, Data Scientists koriste metodički pristup za organiziranje i analizu sirovih podataka kako bi identificirali obrasce iz kojih se korisne informacije mogu identificirati ili zaključiti.

S obzirom na opseg njihovog utjecaja, nije ni čudo da Data Scientists zauzimaju vrlo utjecajna mjesta - i vrlo tražena. Iako put do postajanja Data Scientist može biti zahtjevan, sada postoji više resursa za ambiciozne Data Scientist nego ikad i više mogućnosti za njih da izgrade karijeru kakvu žele.

Ali za sve načine na koje Data Scientists mogu doprinijeti različitim industrijama i sve različite puteve karijere koje Data Scientist može slijediti, vrste posla koje obavljaju mogu se podijeliti u nekoliko glavnih kategorija. Ne uklapa se sva znanost o podacima u te skupine, posebno na čelu računalne znanosti, gdje se neprestano probijaju novi tereni – ali oni će vam dati neku ideju o načinima na koje znanstvenici podataka pretvaraju podatke u uvid.

Statistika

U središtu znanosti o podacima, statistika je područje matematike koje opisuje različite karakteristike skupa podataka, bilo da su to brojevi, riječi, slike ili neka druga vrsta mjerljivih informacija. Velik dio statistike koncentriran je na jednostavno identificiranje i opisivanje onoga što se nalazi – posebno s vrlo velikim skupovima podataka, samo znati što informacije čine, a što ne uključuju je zadatak za sebe. U području znanosti o podacima, to se često naziva deskriptivna analitika. Ali statistika može ići još dalje, testirajući jesu li vaše pretpostavke o onome što se nalazi u podacima točne, ili, ako je točna, jesu li značajne ili korisne. To može uključivati ​​ne samo ispitivanje podataka, već i manipuliranje njima kako bi se izvukle njihove istaknute značajke. Postoji mnogo različitih načina da se to učini – linearna regresija, logistička regresija i diskriminantna analiza, različite metode uzorkovanja i tako dalje – ali u konačnici, svaka od ovih tehnika odnosi se na razumijevanje značajki skupa podataka i koliko su te značajke točne. odražavaju neku smislenu istinu o svijetu kojem odgovaraju.

Analiza podataka

Iako je izgrađena na temelju statistike, analiza podataka ide malo dalje, u smislu razumijevanja uzročnosti, vizualizacije i priopćavanja nalaza drugima. Ako statistika ima za cilj definirati što i kada skupa podataka, analiza podataka pokušava utvrditi zašto i kako. Analitičari podataka to čine čišćenjem podataka, sažimanjem, transformacijom, modeliranjem i testiranjem. Kao što je gore spomenuto, ova analiza nije ograničena samo na brojeve. Iako većina analiza podataka koristi numeričke podatke, također je moguće provesti analizu i na drugim vrstama podataka – na primjer, pisanim povratnim informacijama korisnika ili postova na društvenim mrežama, ili čak slikama, audio i video zapisima.

Jedan od glavnih ciljeva analitičara podataka je razumjeti uzročnost, koja se zatim može koristiti za razumijevanje i predviđanje trendova u širokom rasponu aplikacija. U dijagnostičkoj analizi analitičari podataka traže korelacije koje sugeriraju uzrok i posljedicu, a taj se uvid može koristiti za promjenu ishoda. Prediktivna analiza na sličan način traži obrasce, ali ih zatim dalje proširuje, ekstrapolirajući njihove putanje izvan poznatih podataka kako bi se pomoglo predvidjeti kako bi se neizmjereni ili hipotetski događaji – uključujući buduće događaje – mogli odigrati. Najnapredniji oblici analize podataka usmjereni su na pružanje smjernica za specifične odluke modeliranjem i predviđanjem ishoda različitih izbora kako bi se identificirao najprikladniji smjer djelovanja.

Umjetna inteligencija i strojno učenje

Jedan od velikih napretka koji se trenutačno događa u znanosti o podacima – i koji će imati ogroman utjecaj u budućnosti – je umjetna inteligencija, točnije, strojno učenje. Ukratko, strojno učenje uključuje osposobljavanje računala za obavljanje zadataka za koje bismo obično mislili da zahtijevaju neki oblik inteligencije ili prosuđivanja, kao što je sposobnost prepoznavanja objekata na fotografiji. To se obično postiže pružanjem obilnih primjera vrste determinacije za koju obučavate mrežu. Kao što možete zamisliti, za to su potrebni i hrpe (obično strukturiranih) podataka i sposobnost da se računalo natjera da shvati te podatke. Jake statističke vještine i vještine programiranja su neophodne.

Blagotvorni učinci strojnog učenja gotovo su neograničeni, ali prije svega je sposobnost obavljanja zamršenih ili dugotrajnih zadataka brže nego što bi bilo koji čovjek ikada mogao, kao što je prepoznavanje specifičnog otiska prsta iz skladišta milijuna slika ili unakrsno referenciranje desetke varijabli u tisućama medicinskih kartoteka kako bi se identificirale udruge koje bi mogle ponuditi naznake o tome što uzrokuje bolest. S dovoljno podataka, stručnjaci za strojno učenje mogu čak i trenirati neuronske mreže za proizvodnju originalnih slika, izdvajanje smislenih uvida iz masivnog pisanog teksta, predviđanja budućih trendova potrošnje ili drugih tržišnih događaja i dodjeljivanja resursa koji ovise o vrlo složenoj distribuciji, poput energije , s maksimalnom učinkovitošću. Prednost korištenja strojnog učenja za obavljanje ovih zadataka, za razliku od drugih oblika automatizacije, je u tome što nenadzirani A.I. sustav može automatski učiti i poboljšavati se tijekom vremena - čak i bez novog programiranja.

Poslovna inteligencija

Kao što ste mogli pretpostaviti iz ranijeg spominjanja tržišnih događaja, svijet poslovanja i financija jedno je od mjesta na koje je strojno učenje imalo jedan od svojih najranijih i najdubljih utjecaja. Zahvaljujući ogromnoj količini dostupnih brojčanih podataka – marketinške baze podataka, ankete, bankovne informacije, podaci o prodaji i tako dalje, od kojih je većina vrlo organizirana i relativno jednostavna za rad – Data Scientists mogu koristiti statistiku, analizu podataka i strojno učenje za dobivanje uvida u bezbroj aspekata poslovnog svijeta, usmjeravanje donošenja odluka i optimizaciju rezultata, do te mjere da je poslovna inteligencija postala samo za sebe polje znanosti o podacima.

Često programeri poslovne inteligencije ne gledaju jednostavno sve podatke koji su dostupni kako bi vidjeli što mogu otkriti; proaktivno provode prikupljanje podataka i razvijaju tehnike i proizvode kako bi odgovorili na određena pitanja i postigli određene ciljeve. U tom smislu, programeri i analitičari poslovne inteligencije ključni su za strateški razvoj u svijetu poslovanja i financija – pomažu vodstvu da donosi bolje odluke i donosi ih brže, razumije tržište kako bi prepoznao poslovne prilike i izazove i poboljšao ukupnu učinkovitost poslovni sustavi i rad, a sve sa sveobuhvatnim ciljem postizanja konkurentske prednosti i povećanja profita.

Inženjering podataka

Posljednje veliko polje studija u kojem znanstvenici podataka često rade obuhvaća cijeli niz različitih naziva poslova – inženjer podataka, arhitekt sustava, arhitekt aplikacija, arhitekt podataka, arhitekt poduzeća ili arhitekt infrastrukture, da spomenemo samo neke. Svaka od ovih uloga ima svoj skup odgovornosti, pri čemu neki razvijaju softver, drugi dizajniraju IT sustave, a treći usklađuju internu strukturu i procese tvrtke s tehnologijom koju koristi za ostvarivanje svojih poslovnih strategija. Ono što ih sve povezuje je da znanstvenici podataka koji rade na ovom području primjenjuju podatke i informacijsku tehnologiju za stvaranje ili poboljšanje sustava s određenom funkcijom na umu.

Arhitekt aplikacija, na primjer, promatra kako tvrtka ili drugo poduzeće koristi određena tehnološka rješenja, zatim dizajnira i razvija aplikacije (uključujući softver ili IT infrastrukturu) za poboljšane performanse. Data Architect na sličan način razvija aplikacije – u ovom slučaju rješenja za pohranu podataka, administraciju i analizu. Arhitekt infrastrukture može razviti sveobuhvatna rješenja koja tvrtka koristi za obavljanje svakodnevnog poslovanja kako bi osigurala da ta rješenja udovoljavaju zahtjevima sustava tvrtke, bilo da je to izvan mreže ili u oblaku. Inženjeri podataka se, sa svoje strane, usredotočuju na obradu podataka, osmišljavanje i implementaciju podatkovnih cjevovoda koji prikupljaju, organiziraju, pohranjuju, dohvaćaju i obrađuju podatke organizacije. Drugim riječima, definirajuća značajka ove široke kategorije znanosti o podacima je da uključuje projektiranje i izgradnju stvari: sustava, struktura i procesa pomoću kojih se znanost o podacima provodi.

Koji su poslovi u znanosti o podacima najviše traženi?

Znanost o podacima općenito je vrlo tražena vještina, tako da postoji mnogo mogućnosti koje se mogu pronaći u svakom području i specijalnosti polja. Zapravo, 2019. LinkedIn je Data Scientist naveo kao posao koji najviše obećava u godini, a QuantHub je predvidio akutni nedostatak kvalificiranih Data Scientists u godini koja je pred nama.

Ključna riječ ovdje je kvalificirana. Često su tehnički zahtjevi koje Data Scientist mora ispuniti toliko su specifični da može potrajati nekoliko godina iskustva rada u industriji kako bi se izgradio potreban raspon kompetencija, počevši kao generalist, a zatim polako dodajući sve više i više sposobnosti i sposobnosti u njihov skup vještina.

Ovo su samo neki od najčešćih načina na koje Data Scientists to mogu učiniti – postoji onoliko potencijalnih karijera koliko postoji Data Scientists, ali u svakom slučaju, napredak u karijeri ovisi o stjecanju novih vještina i iskustva tijekom vremena.

Analitičar podataka

Kao što ime sugerira, analitičari podataka analiziraju podatke – ali taj kratki naslov bilježi samo mali dio onoga što analitičari podataka zapravo mogu postići. Kao prvo, podaci rijetko započinju u obliku koji je jednostavan za korištenje, a analitičari podataka su obično odgovorni za identificiranje vrste potrebnih podataka, njihovo prikupljanje i sastavljanje, a zatim čišćenje i organiziranje – pretvaranje u više podataka. upotrebljiv oblik, određivanje što skup podataka zapravo sadrži, uklanjanje oštećenih podataka i ocjenjivanje njihove točnosti. Zatim je tu i sama analiza – korištenjem različitih tehnika za ispitivanje i modeliranje podataka, traženje uzoraka, izdvajanje značenja iz tih obrazaca i ekstrapoliranje ili modeliranje. Konačno, analitičari podataka stavljaju svoje uvide na raspolaganje drugima predstavljajući podatke na kontrolnoj ploči ili bazi podataka kojoj drugi ljudi mogu pristupiti, i komunicirajući svoje nalaze drugima putem prezentacija, pisanih dokumenata i grafikona, grafikona i drugih vizualizacija.

Karijera analitičara podataka

Data Analyst je izvrsna ulazna točka u svijet Data Science; može biti početni položaj, ovisno o potrebnoj razini stručnosti. Novi analitičari podataka obično ulaze u polje odmah nakon škole – sa diplomom iz statistike, matematike, informatike ili slično – ili prelaze na analizu podataka iz srodnog područja poput poslovanja, ekonomije ili čak društvenih znanosti, obično nadogradnjom svojih vještine usred karijere kroz bootcamp analize podataka ili sličan program certificiranja.

No, bez obzira na to jesu li oni nedavno diplomirani ili iskusni profesionalci koji se mijenjaju u sredini karijere, novi Data Scientists obično započinju obavljanjem rutinskih zadataka poput stjecanja i manipulacije podacima s jezikom poput R ili SQL, izgradnjom baza podataka, obavljanjem osnovne analize i generiranjem vizualizacije pomoću programa poput Tableaua. Neće svaki analitičar podataka morati znati kako raditi sve ove stvari – može postojati specijalizacija, čak i na mlađoj poziciji – ali trebali biste biti u mogućnosti obavljati sve te zadatke ako se nadate napredovanju u karijeri. Fleksibilnost je velika prednost u ovoj ranoj fazi.

Kako napredujete kao analitičar podataka ovisi u određenoj mjeri o industriji u kojoj radite – marketingu, na primjer, ili financijama. Ovisno o sektoru i vrsti posla koji obavljate, možete se odlučiti specijalizirati za programiranje u Pythonu ili R-u, postati profesionalac u čišćenju podataka ili se koncentrirati isključivo na izgradnju složenih statističkih modela ili generiranje prekrasnih vizuala; s druge strane, također možete odlučiti naučiti ponešto o svemu, što će vas postaviti da preuzmete vodeću poziciju dok preuzimate titulu Senior Data Analyst. S dovoljno širokim i dubokim iskustvom, viši analitičar podataka spreman je preuzeti vodeću ulogu nadzireći tim drugih analitičara podataka, te na kraju postati voditelj odjela ili direktor. Uz dodatnu obuku o vještinama, analitičari podataka također su u jakoj poziciji da pređu na napredniju poziciju Data Scientist.

Data Scientist

Sami znanstvenici podataka obično mogu učiniti sve što mogu učiniti analitičari podataka, plus još nekoliko stvari – zapravo, uz odgovarajuću obuku i iskustvo, analitičar podataka može na kraju napredovati do pozicije Data Scientist. Dakle, da, Data Scientists bi trebali biti sposobni stjecati, čistiti, manipulirati, pohranjivati ​​i analizirati podatke – ali i razumjeti i raditi s različitim metodama strojnog učenja, te biti sposobni programirati na Pythonu, R ili sličnom statističkom programskom jeziku za izgraditi i procijeniti naprednije modele.

Karijera Data Scientist

Mnogi ljudi ulaze u polje kao analitičari podataka prije nego što steknu iskustvo i dodane vještine potrebne da se nazivaju znanstvenicima podataka. Zatim, od Junior Data Scientist, sljedeći korak je tipično Senior Data Scientist – iako ta jednostavna promjena u naslovu pobija rad koji je potreban za taj prijelaz; Viši Data Scientist ili će posjedovati vrhunsko razumijevanje gotovo svih aspekata znanosti o podacima – AI, skladištenja podataka, rudarenja podataka, računalstva u oblaku i tako dalje – uz njihovo poznavanje polja specifičnih za industriju kao što je poslovna strategija ili analitika zdravstvene skrbi , ili će se specijalizirati za jedno od ovih područja sa stručnošću na razini gurua.

Vrijedno je spomenuti da dok neki znanstvenici podataka započinju karijeru u analitici i napreduju do viših pozicija u specijaliziranim područjima kao što su psihologija, marketing, ekonomija i tako dalje, drugi počinju kao profesionalci u jednom od tih različitih područja prije nego što pređu u podatke. znanstvena uloga.

Za mnoge je viši Data Scientist krajnji cilj karijere; ovo je već toliko napredna uloga da se, barem u području znanosti o podacima, često radi o najvišoj poziciji koja se može postići – jednostavno postajete bolji, sposobniji viši podatkovni znanstvenik s većim područjima specijalizacije. Međutim, za neke, osobito one koji imaju generalistički pristup, moguće je dodatno napredovati na rukovodećoj poziciji kao što je vodeći stručnjak za podatke, vođenje tima ili odjela, ili čak glavni službenik za podatke, koji vodi strategiju podataka institucije na najvišoj razini i odgovara samo izvršnom direktoru.

Inženjer podataka

Ono što inženjere podataka razlikuje od ostalih profesionalaca koji rade na području podataka je činjenica da oni dizajniraju i grade cijele sustave – uključujući infrastrukturu i procese koje tvrtka koristi kako bi maksimalno iskoristila te podatke. To jest, inženjeri podataka su ljudi koji određuju načine na koje drugi znanstvenici podataka mogu obavljati svoj posao. Koje oblike podataka može prihvatiti sustav tvrtke? Koje se metode koriste za prikupljanje podataka iz prodaje i marketinga ili rezultata ankete o zdravstvenoj zaštiti i njihovo stavljanje na raspolaganje za analizu? Da bi to učinili, inženjeri podataka moraju biti vrlo upoznati s vrstama posla koje obavljaju drugi stručnjaci za znanost podataka – administratori baze podataka, analitičari podataka, arhitekti podataka i tako dalje – do te mjere da inženjeri podataka često mogu obavljati svaku od ovih uloga kao dobro. No, budući da su oni graditelji, inženjeri podataka obično provode više vremena radeći na razvoju od drugih profesionalaca u znanosti o podacima - pišu softverske programe, grade relacijske baze podataka ili razvijaju alate koji tvrtkama omogućuju dijeljenje podataka između odjela.

Karijera inženjera podataka

Kao i drugi poslovi koji se bave podacima, prvi korak da postanete Data Engineer često je sveučilišna diploma (obično diplomirani ili magistar inženjerstva, informatike ili matematike) – ali ne uvijek. Netko s bogatim iskustvom u IT-u ili razvoju softvera mogao bi otkriti da već ima sve potrebne vještine da postane Data Engineer osim samih podatkovnih vještina, u kojem slučaju neke prekvalifikacije, kao što je podatkovni bootcamp, mogu pomoći da ih steknu do brzine. Mnoge vještine koje su potrebne inženjeru podataka (kao što su SQL, UNIX i Linux, razvoj ETL-a ili konfiguriranje IT sustava) mogu se razviti radom u susjednom području; drugi (poput strojnog učenja ili izgradnje podatkovnih cjevovoda) zahtijevat će fokusiranije učenje.

Uzimajući to u obzir, većina inženjera podataka započinje svoju karijeru radeći u nekom podpodručju računalne znanosti prije nego što stekne sve vještine koje su potrebne da postanu mlađi inženjer podataka – štoviše, većina oglasa za posao mlađih inženjera podataka zahtijeva između jedne i pet godina radnog iskustva. Odatle je sljedeći logičan korak do višeg inženjera podataka i glavnog inženjera podataka. No, s njihovim poznavanjem toliko mnogo aspekata IT-a, softverskog inženjerstva i znanosti o podacima, postoji mnogo drugih radnih mjesta koja su otvorena i za inženjere podataka – uključujući arhitekta podataka, arhitekta rješenja ili arhitektu aplikacija. Za nekoga tko želi raditi manje praktičnog posla i više upravljanja zaposlenicima, druge opcije uključuju voditelja razvoja proizvoda – ili, na kraju, s obzirom na prave vještine ljudi, čak i glavnog voditelja podataka ili glavnog službenika za informiranje.

Mogu li Data Scientists raditi od kuće?

Poput mnogih poslova u području tehnologije, uloge Data Scientist-a često se mogu obavljati na daljinu - ali to u konačnici ovisi o tvrtki u kojoj radite i vrsti posla koji obavljate.

Kada podatkovni znanstvenici mogu raditi na daljinu?

Pozicije u znanosti o podacima koje rade s vrlo osjetljivim ili povjerljivim podacima i informacijama (što uključuje velik broj njih, čak i izvan područja koja su teška za privatnost kao što su bankarstvo i zdravstvo, budući da vlasnički podaci mogu biti jedna od najvrjednijih sredstava velike tvrtke) otkrit će da suočavaju se s mnogo više ograničenja u pogledu rada na daljinu. U tim slučajevima vjerojatno ćete morati raditi u uredu tijekom radnog vremena.

Neki drugi čimbenici koje treba uzeti u obzir:

  • Koliko je vaša tvrtka tradicionalna. Veće, starije tvrtke obično nisu tako pristupačne udaljenim - iako je COVID možda donio velike promjene na ovom području.
  • Kako jednostavno možete daljinski raditi s drugim suigračima i odjelima. Ako je vaš posao vrlo suradnički, vjerojatnije je da ćete se morati osobno pojaviti.
  • Podatkovni znanstvenici koji rade po ugovoru — ili čak na konzultantskoj osnovi — također mogu imati veću fleksibilnost pri odabiru vlastite lokacije.

Kategori: Vijesti