Moć slova R

BI alati

Moć slova R

Slovo R se pojavljuje u brojnim rečenicama svakodnevnog govora, no samo slovo i nema neko određeno značenje (barem meni). No, nakon tečaja Coursere to prekrasno 23. slovo abecede poprima sasvim novo značenje i u meni budi asocijacije na neslućene potencijale i mogućnosti, možemo reći same vrhunce današnje tehnologije (nije loše za jedno „obično“ slovo). Radi se o programskom jeziku pod nazivom R. Veoma jednostavnog naziva, ali ogromnog potencijala i zadnjih mjeseci neslućene medijske pažnje. Novinar NY Timesa ga je prigodno nazvao lingua franca ili jezik koji prelazi granice zemlje u kojoj se govori, a ono to uistinu i je te je postao univerzalni jezik velikog broja svjetskih korporacija i sveučilišta. Neki korisnici su među ostalim Google, Bank of America,  Stanford University itd. Ova lista može ići u nedogled.

Čemu je ovaj jezik zaslužio ovoliku pozornost i popularnost u svijetu ? Po meni ključna riječ bi bila jednostavnost i možda bih još dodao činjenicu da se radi o open source projektu. Statističari, inženjeri i znanstvenici upravo jednostavnost ističu kao ključ uspjeha. Osobno podržavam njihovo mišljenje i jednostavno obožavam raditi u njemu, jer uz jednostavnost daje i ogromnu fleksibilnost prije svega zbog ogromne količine paketa (packages – oko gotovo 5000). Pa tako možete skinuti pakete za razne vrste regresija, algoritme za rudarenje podataka, pakete za poboljšanje izvođenja raznih simulacija, vizualizacije podataka itd. (uz one pakete koji dolaze već uz sam jezik ili R studio). Drugim riječima možemo modificirati R na koji god način želimo i kako god želimo te ga neki još i zovu „supercharged version of Microsoft’s Excel “. Činjenica koja doprinosi svemu ovome je to što je riječ o open source projektu iza kojeg stoji velika zajednica entuzijasta koji konstantno nude nove pakete i savjete za sve koji žele znati nešto više o R-u. Oni koji su već koristili C ili Javu mogu očekivati sličan jezik koji je spreman izvoditi različite vrste računalnih zadataka. Statističarima je on SVE upravo zbog već uključenih mehanizama za organiziranje podataka, izvođenje kalkulacija te kreiranje različitih vizualizacija na veoma jednostavan način. Te tako mogu izvoditi kompleksne analize bez poznavanja „krvotoka“ računalnih sustava.

Nakon ovih riječi jedino što se možemo zapitati je : Tko je kreator ovog čuda ? Riječ je o profesorima statistike Rossu Ihaki i Robertu Gentlemanu sa University of Auckland i prvi put se naš R pojavio 1996.godine. Željeli su napraviti tehnologiju koja bi bila jednostavna statističarima, jer su dotadašnje softvere radili naravno hard core informatičari, koji nisu gledali na potrebe korisnika prilikom korištenje pa su uglavnom ti softveri bili teški za ostale. Prije njih John M. Chambers sa Stanford Universitya je pokušao napraviti isto i njegov se jezik zvao S (preteča našeg R-a), no projekt nije dobio naklonost većine možda zbog činjenice što nije bio open-source projekt te je na kraju je završio u rukama Tibco Softwarea. Sam tvorac R-a Ihaka, priznaje da su kojim slučajem odlučili prijeći u komercijalne vode da bi vjerojatno prodali 5 kopija, a ovako im se broj korisnika procjenjuje na nekih 2 milijuna diljem svijeta. Kao takav naravno predstavlja veliku prijetnju ostalim komercijalnim softverima te je uzeo veliki dio kolača, pogotovo na sveučilištima.

Toliko za sada o R-u, a ukoliko imate bilo kakvih pitanja slobodno nas kontaktirajte. Svi oni koji žele pročitati nešto više i skinuti materijale ili sam R neka posjete linkove ispod. Također Vam donosim link s materijalima profesora Jeff Leeka iz SAD-a od kojega sam i naučio sve što znam o R-u (Coursera tečaj). Pretpostavljate, radi se o statističaru i to biostatističaru. Ugodnu analitiku Vam želim.

Službena stranica R-a : http://www.r-project.org/

Knjige : http://www.r-project.org/doc/bib/R-books.html

Lista paketa : http://cran.mirror.garr.it/mirrors/CRAN/

RStudio okruženje za R (definitivno preporučam) : http://www.rstudio.com/

Github materijali za učenje : https://github.com/jtleek/dataanalysis

Izvor slike : http://blog.revolutionanalytics.com (izrađena pomoću R-a)