Social network analysis – analiza (ne)društvenih mreža – 1.dio

Big data / Poslovna analitika / Rudarenje podataka

Social network analysis – analiza (ne)društvenih mreža – 1.dio

Nekoliko zadnjih godina bombardirani smo nazivima social networks ili social media. To ponajprije možemo zahvaliti fenomenu Facebook-a, Twitter-a ili LinkedIn-a. Međutim ovaj članak neće biti vezan uz društvene mreže kao virtualnu uslugu nego analiza društvenih mreža kao analitički pojam. Ipak smo mi analitički portal.

Social Network Analysis (SNA) ili analiza društvenih mreža je pojam koji postoji dugo vremena te je  primjenjiv u većini znanosti počevši od ekonomije, sociologije, geografije, računarstva, astronomije, kemije ili biologije. Ukoliko vas ove znanosti dovoljno ne impresioniraju i mislite da vam ovaj članak neće pomoći u vašem svakodnevnom životu i poslovanju, morati ću vas razočarati. Zapravo svi mi živimo u jednoj velikoj društvenoj mreži, ne u onoj virtualnoj uz koju se ovaj pojam najčešće veže. Vaši odnosi s roditeljima, prijateljima, prijateljima prijatelja čine jednu ogromnu mrežu. Međutim, ova se znanost nije bila zanimljiva znanstvenicima i velikim tvrtkama, jer nisu mogli prikupiti dovoljno podataka o realnom svijetu gdje bi se analizirala velika i složena skupina odnosa među jedinkama sustava. Razvojem tehnologije i  društvenih mreža, ovaj posao postaje zanimljiviji, jer danas jedan Facebook, Twitter ili LinkedIn imaju hrpu podataka o vama. Tko ste vi, tko su vaši prijatelji, koju glazbu slušate, koje knjige volite čitati su podaci koji Facebook  ili Twitter posjeduju. I više od toga. Oni znaju tko bi vam mogli biti idealni prijatelji ili partneri na temelju vaših odnosa unutar vaše mreže.

Naravno SNA nisu samo društvene mreže, nego su primjenjive na sve odnose koje poznajemo u realnom životu. Odnos različitih kemijskih spojeva, odnosi među državama, biološkim pojmovima ili poziva u telekomunikacijskim mrežama.

Međutim kako bi vam sve bilo lakše razumjeti koristiti ćemo neke jednostavne tehničke pojmove te ćemo sve pojmove primijeniti na telekomunikacije pozive.

Cijela društvena mreža se sastoji od dva glavna pojma:

– Čvorišta (node)

– Veze / poveznice (edge, links)

Čvorišta se odnose na jedinke u društvenoj mreži. Primjeri čvora su jedna osoba, jedan broj mobitela, jedna država. Skup jedinki čvorova tvore čvorišta. Logično, zar ne 🙂

S obzirom da čvorovi unutar mreže moraju komunicirati među sobom, imaju poveznice među sobom. U slučaju veza/poveznica imamo ih dvije vrste:

1.) Direktne (Directed) – osoba A daje osobi B 10kn, osoba B zove osobu C. Ovakav oblik veza među čvorištima je jednosmjeran, a može biti i dvosmjeran ukoliko čvorišta međusobno razmjenjuju odnose.

2.) Indirektne (Undirected) – primjerice osoba A i osoba B su prijatelji, rodbina ili neka drugi oblik veze u kojem se kad se veza uspostavi ima oblik dvosmjeran oblik.

Capture

Slika 1. Vrste veza i prikaz u matrici (Barabási Albert-László, Network Science)

Ukoliko ne bi sve bilo tako jednostavno, veze među čvorištima imaju određenu težinu/ponder (weight). Primjerice ako osoba A ima 10 upućenih poziva, a osoba B ima 3 upućena poziva, naivno bi donijeli zaključak da je osoba A važnija od osobe B, jer ima veći broj poziva. Međutim ako nam podaci pokazuju da osoba A u 10 poziva ima 4omin (prosjek 4 min/poziv) razgovora, a osoba B 120min (40min/poziv), onda odluku u važnost prebacujemo na osobu B. Ovo je primjer kad zaključke ne možemo donositi na temelju “jediničnih” veza među čvorištima.

Glavne metrike u opisivanju društvenih mreža su: prosječni broj mreža, prosječni broj ulaznih mreža i prosječni broj izlaznih mreža.

Primjerice ukoliko nam SNA softver prikazuje ove podatke za primjerice  telekomunikacijske pozive:

  • Average degree : 10
  • Average indegree: 5
  • Average outdegree: 6

onda,

Average degree 10 znači da svaki čvor u mreži ima u prosjeku 10 poziva, bilo odlaznih ili dolaznih dnevno/mjesečno/etc.

Average indegree 5 znači da svaki čvor u mreži ima u prosjeku 5 dolaznih poziva dnevno/mjesečno/etc.

Average outdegree 6 znači da svaki čvor u mreži ima u prosjeku 6 odlaznih poziva dnevno/mjesečno/etc.

U svakoj mreži neka metrika je od većeg značaja, primjerice u telekomunikacijskoj industriji veći značaj ima onaj čvor koji ima veći broj primljenih poziva, nego odlaznih, jer po teoriji liderstva, lider je onaj koji ima velik broj dolaznih poziva što automatski označava da se radi o važnoj osobi. Međutim od liderstvu i prijenosu informacija među čvorovima ćemo u drugom članku.

 

SNA

Slika 2. Prikaz društvene mreže (Facebook mreža autora članka)

 

U prvom dijelu članka smo pričali o osnovnim pojmovima analize društvenih mreža, u drugom dijelu članka ćemo pričati o otkrivanju zajednica unutar društvene mreže, algoritmima za prepoznavanje važnih osoba (autoriteta i hub-ova) i softverskim alatima za analizu društvenih mreža.