Data Scientist – posao 21. stoljeća

Poslovna analitika

Data Scientist – posao 21. stoljeća

Prije 5 godina opis posla „data scientist“ jednostavno nije postojao. Nitko nije ni oglašavao da traži eksperta u području zvanom „data science“ te nismo ni mogli ići na fakultete koji su specijalizirani upravo za to. Tako je bilo sve do pojave članka u Harvard Business Reviewu pod naslovom „The sexiest job of the 21st century“. To ne znači da je tu taj naziv “data scientist” nastao, već da je stekao najveću popularnost. Sam naziv je nastao 2008. godine kada su dvojica analitičara iz LinkedIn-a i Facebooka „skovali“ termin data scientist. Danas možemo reći da se uistinu radi o ogromnom zanimanju za ovaj tip zaposlenika te je također zanimljivo da ga trenutačno najviše traže obavještajne službe. Područje rada je veoma široko te se proteže sve od upravo spomenutog obavještajnog rada, rada u svemirskim agencijama, znanosti, osiguravajućim kućama, bankama pa sve do sporta. Amerikanci još vole spominjati i činjenicu da će ovih zaposlenika nedostajati na tržištu gotovo 200 000, a ako se tome dodaju i menadžeri i analitičari dođemo do brojke od gotovo 2 milijuna. Plaće im se u SAD-u kreću oko 110 000 $. Na slici ispod možemo vidjeti ogroman porast zanimanja za ovaj tip posla.

data science jobs

 

Izvor : www.indeed.com

Osim što je mogućnost zapošljavanja u raznim granama gospodarstva velika, za ovaj posao je potrebno i veliko interdisciplinarno znanje. Tako se u knjizi „ Analyzing the Analyzers “ spominju 4 tipa ili grupe data scientista. No, prije ta 4 tipa nužno je napomenuti da se često vole miješati pojmovi big data i data science. Često ljudi smatraju da ako se osoba ne bavi big data analitikom da nije data scientist i to nije točno. Dapače, pokazalo se da većina ovih znanstvenika uopće ni ne koristi toliko često ogromne količine podataka (petabajte pa čak i terabajte – vidi sliku ispod) tj. jedan od onih V  Big Data analitike.

data scientist skills

Izvor : www.fastcolabs.com

Na ovoj slici možete primijetiti 5 vještina koje su veoma bitne za jednog znanstvenika koji se želi baviti ovim područjem i pokazuje tek dio njihove interdisciplinarnosti. Promatrajući tih 5 vještina u knjizi se došlo i do zaključka kako postoje 4 tipa data scientista kao što smo i spomenuli, a oni idu redom : Data Businessperson, Data Creative, Data Developer i Data Researcher.

Data Businessperson se fokusira na pitanje kako uvidi u podatke mogu utjecati na tvrtku ili kako oni to prigodno zovu kako prebaciti P- vrijednost u profit. Ova grupa je najsličnija onom našem old school nazivu Data Analyst i bitno je naglasiti da se samo ¼ ove grupe smatra data scientistom. Također je zanimljivo da ova grupa ima najviše žena u odnosu na ostale grupe data scientista (no opet tek ¼ su žene). Spominje se  i to da većina imaju završene MBA te su menadžeri ili imaju svoju tvrtku.

Zatim dolaze Data Creatives. Oni imaju najširi raspon vještina u provedenom istraživanju. Znaju programirati, doprinosili su open source projektima, ¾ ih ima akademsko iskustvo te imaju čak i veći postotak onih koji su zaposleni pod ugovorom ili imaju svoj posao od grupe prije (Data Businessperson). Ova grupa ljudi se voli opisivati kao umjetnici i uglavnom se radi o psiholozima, ekonomistima, politolozima što je iznenadilo i same autore.

Data Developers razvijaju infrastrukturu za podatke i igru s njima te razvijaju algoritme za strojno učenje (Machine learning). Ova grupa ljudi programira na dnevnoj bazi i voli se igrati s Hadoopom i ostalim igračkama današnje moderne djece. Polovica ih ima završen fakultet u području računalnih znanosti.

Zadnji su Data Researchers koji se od svih grupa čine najsličniji upravo terminu „scientist“. Gotovo ¾ ove grupe su osobe koje su objavile članak u znanstvenim časopisima i više od ½ ih ima doktorat. Statistika im je glavna vještina, ali imaju najmanji broj onih koji su pokrenuli svoj posao i koji vode tvrtke. Također, ovdje ima dosta psihologa, ekonomista i politologa kao u grupi Data Creatives.

Data scientist groups

Izvor : www.fastcolabs.com

Nakon što smo identificirali grupe tj. tipove naših znanstvenika red bi bio da se osvrnemo i na akademsku zajednicu te da vidimo kako ona odgovara na ovu potrebu na tržištu. Columbia je ponudila novi diplomski studij, a University of San Francisco je dobio svoje prve diplomirane studente u ovom području. Osim njih tu su još i New York University, Stanford, Northwestern, George Mason, Syracuse, University of California at Irvine, Indiana University i ostali te se iz dana u dan taj broj povećava. Columbia ima prvi kolegij koji sadržava data science u nazivu (Introduction to Data Science).

Kad bi morali definirati data scientista onda bi to bila osoba koja ima jedinstveni mix vještina koji u isto vrijeme mogu dati uvid u podatke i ispričati fantastičnu priču pomoću njih. Kad gledamo RH ,naša akademska zajednica je dobila nekoliko smjerova na raznim fakultetima koji pokušavaju dati znanja u ovom području, ali to je još sve u samom začetku i daleko od današnjih akademskih svjetskih trendova. Vrijeme kad ćemo doživjeti fakultet orijentiran samo na edukaciju osoba za data science ćemo još morati pričekati.

Na kraju se postavlja pitanje da li se uopće radi o pravoj znanosti. Znanost možemo definirati kao objektivno, sistematizirano i argumentirano znanje o zakonitostima, činjenicama, pojavama i njihovim vjerojatnim uzrocima. Stečeno je i provjereno egzaktnim promatranjem, organiziranim pokusom i pravilnim razmišljanjem. Također, znanost nije samo skup znanja, već i način razmišljanja i gledanja stvarnosti. Iako odluka još nije donesena moje mišljenje je da je ovo već odavno dio znanosti i da se oko samog naziva ne treba previše brinuti. Ako malo bolje pogledamo onda ćemo vidjeti da je većina znanstvenika zapravo znanstvenik podataka (data scientist), jer koriste upravo podatke kako bi dokazali neke hipoteze, dobili uvide ili razvili proizvode. Što god bilo radi se o „half hacker, half analyst“ ljudima kako ih je opisao znanstvenik Rogati iz LinkedIna. Podaci su oduvijek bili uključeni u znanost i kako vrijeme odmiče bit će još i više.

Ukoliko želite ući u ovo zanimljivo i popularno područje evo preporuke za dobre temelje (literatura).

Izvor naslovne slike : www.computing.co.uk