U početku bijaše riječ

Poslovna analitika

U početku bijaše riječ

Napretkom tehnologije i analize podataka u današnjem svijetu, svakodnevno pomičemo granice te dolazi do iskorištavanje onih podataka o čijoj smo analizi nekada samo mogli sanjati. Jedna od tih analiza je svakako analiza mišljenja. Ono što se laici odmah zapitaju je kako je uopće moguće analizirati nečije mišljenje. Naravno, zaboravljamo upravo pomake u znanosti i analizi podataka, koji dovode upravo do toga da je danas sve moguće (gotovo) pa tako i provedba jedne ovakve analize. U Bibliji (Evanđelje po Ivanu) piše: U početku bijaše riječ … I doista ako gledamo važnost riječi u našoj komunikaciji, jasno nam je da postoji i želja za analizom tih riječi. Došli smo do tog stupnja da možemo naučiti računala da to odrade za nas. Nema više dugotrajnog i mukotrpnog pretraživanja po knjižnicama, kako se to nekada radilo. Današnjom tehnologijom jednostavno računalu naredimo da nam npr. prikaže sve knjige napisane od 1945.- 2000. godine u kojima se spominje riječ, evo recimo, gospodarski rast, inflacija ili gospodarska kriza. Možemo se koncentrirati na sport, kulturu, povijest ili jednostavno pretraživati stare recepte u potrazi za zaboravljenim receptom koji će nam pomoći da napravimo burek. Mogućnosti su gotovo neograničene i sve ovisi o našoj mašti. Nekako kao ekonomist sam više u doticaju s ekonomskim frazama pa ću Vam ipak pokušati dočarati taj dio.

Na internetu su nalazi ogromna, uistinu ogromna, količina podataka, generirana od strane korisnika tj. svih nas. Uglavnom se radi o nestrukturiranim podacima (kad govorimo o tekstu). No, to nam danas ne predstavlja neki veliki problem. Relativno lako pristupimo podacima s interneta (Facebook, Twitter, LinkedIn, TripAdvisor, Forumi, blogovi…) te ih možemo na jednostavan način ili nešto složeniji ovisno o volji, analizirati. Npr. podaci s TripAdvisora nam pružaju uvid u mišljenja ljudi o određenim hotelima te možemo vidjeti što ljudi misle o hotelima u gradu Splitu ili Zagrebu, možemo vidjeti što ljudi određene nacionalnosti misle o određenom hotelu (da li postoje razlike između različitih državljana) i ti podaci su uglavnom gramatički ispravni te ih je relativno jednostavno analizirati.

S druge strane imamo gotovo pa noćnu moru, zvanu Twitter. Oni koji ga koriste znaju za Twitterov 140 character limit. Upravo taj limit dovodi do toga da korisnici skraćuju svoje riječi koje nam otežavaju njihovu analizu. Ako uzmete u obzir da obično objave i link ili sliku, broj korisnih riječi koji nam pomažu u detekciji mišljenja se sužava. Inače praksa je da se mišljenje dijeli na pozitivno, negativno ili neutralno. Postoje i podjele na više kategorija (izvrsno, dobro, neutralno, loše, veoma loše), ali držimo se jednostavnosti. Tako da nam za detekciju polariteta (pozitivno, negativno, neutralno) mišljenja čak i smajlići igraju ulogu. Naravno trebamo se u startu oprostiti od savršenog modela koji će u 100% slučajeva detektirati točno polaritet nečijeg mišljenja, ali rezultati mogu biti i više nego dobri. Ekonomski potencijal ovakvog tipa analize je ogroman, jer pruža tvrtkama da čak i real-time saznaju što ljudi pričaju o njima, o njihovom proizvodu ili usluzi. Veoma zanimljivo je bilo pratiti situaciju za vrijeme Olimpijskih igara, gdje smo uistinu mogli detektirati zanimljive događaje generirane od korisnika Twittera (užasnu uslugu u hotelima, atmosferu u gradu…)

Facebook je također veoma zanimljiva priča. Prisjetite se samo koliko ste vi osobno generirali sadržaja dok ste ga koristili, a sad zamislite samo koliko toga se tu nalazi. Ne govorim o narušavanju privatnosti, već o javnim stranicama i javnim komentarima, statusima, gdje možemo vidjeti da je npr. XY % korisnika reagiralo pozitivno na novi izlazak iPhonea ili Samsung Galaxyja. Također, možemo vidjeti koje se riječi najviše pojavljuju uz njih. Uistinu ovakvim vidom analize možemo doći do onih podataka, informacija i znanja koje nam je do sada bilo skriveno. Sama analiza se može kretati od izrade countera polariteta mišljenja, prikaz word clouda učestalih riječi koji se pojavljuju uz određenu ključnu riječ (npr. iPhone), do možda izračunavanja frekvencija pojavljivanja nekih riječi ili izrade „stabala“ riječi unutar teksta, koji nam otkrivaju strukturu. Čak možemo otkriti i stil pisanja  ili provjeriti polaritet po evanđeljima u Bibliji (već provedeno).

Još puno toga nas čeka u analizi mišljenja i uistinu će biti zanimljivo sve to pratiti.

Izvor slike :  www.ampyourstrat.com