24
ponavlja. Jednom kada je proces gotov izgeneriran je slijed sličica koji prikazuje razvoj grafa u
intervalima od jednog dana pri čemu je jedan dan predstavljen s 50 sličica.
6.5. Rezultati obrade
Rezultat obrade prikupljenih podataka jest graf koji prikazuje kako se komunikacija
izmeĎu blogova mijenjala kroz period od 19.05. 2004. do 08.04.2013. Sadrži ukupno 11 152
čvora povezanih s 38 599 veza. Svaki čvor predstavlja jedan blog, a njegova veličina odreĎena je
vrijednosti blizine centriranosti koji sam Gephi izračunava za svaki pojedini čvor. Veza
predstavlja komentar izmeĎu dva bloga, a težina veze označava koliko je puta prvi blog ostavio
komentar na drugi blog. Što je veći broj komentara to će veza izmeĎu dva bloga biti deblja. Boja
koju odreĎeni blog nosi predstavlja pripadanje pojedinoj podskupini. Tu vrijednost nazivamo
modularnost, a izračunava je sam program. Konačan graf sa svim pripadnim česticama prikazan
je na slici 6.3.
25
Slika 6.4 Konačan graf
Rezultat dinamičke obrade komunikacijskih trendova meĎu blogovima je video isječak
kojim je prikazano kako se komunikacija razvijala kroz period od 19.05.2004. do 01.09.2006.
Razlog vizualizacije ovako skraćenogprikaza jest taj što je već i pri ovom isječku od otprilike
dvije godine, obrada podataka vremenski i memorijski poprilično zahtjevna, te je za prikaz ovih
28 mjeseci bilo potrebno dulje od jednog dana za obradu. Na ovaj način prikazan je usmjereni
graf koji se sastoji od 2 896 čvorova povezanih s 6 002 veze. I ovdje pojedini čvor predstavlja
blog čija je veličina odreĎena blizinom centriranosti koja je, kao i modularnost kojom je
odreĎena boja koja označava pripadnost skupini, konstantna za cijeli graf te se navedene
vrijednosti ne mijenjaju tijekom video prikaza. Promjene možemo vidjeti na debljinama veza
tako da pojedina veza postaje deblja kako se povećava broj komentara izmeĎu blogova. Razvoj
grafa od početnog do krajnjeg datuma video isječka možemo vidjeti na slici 6.4.
27
Već na prvi pogled uočavamo kako su pojedini blogovi formirali podgrupe.One su, radi
zornijeg prikaza, označne različitim bojama i predstavljaju povezanost unutar sebe. Ovdje je
važno napomenuti kako je formiranje podgrupa na prikazan način dijelom posljedica načina
prikupljanja podataka. Naime, od ukupnog broja čestica na cijelom grafu, potpuno ih je obraĎeno
samo 168. Prilikom obrade svakog pojedinog bloga čitaju se komentari koji mu pripadaju i u
listu blogova koje je tek potrebno obraditi zapisujemo blog koji šalje komentar. Dakle, blogovi
koji šalju komentare, ukoliko se nisu već ranije pojavili, u tom trenutku dospijevaju u bazu
podataka što znači da će biti prikazani na grafu, ali još nisu obraĎeni u punom smislu, s toga ne
znamo koji su blogovi njima ostavili komentare. Rezultat je da potpuno obraĎeni blogovi prema
sebi privlače velik broj onih koji su na njih komentirali, ali koji nisu obraĎeni u punom smislu, te
na taj način formiraju podgrupe koje možemo vidjeti na slici 6.4. Ipak, blogovi oko kojih se
formira podgrupa predstavljaju popularnije blogove meĎu onim obraĎenima.
28
7.
Zaključak
Za potrebe ovog rada odabran je prikaz komunikacije izmeĎu blogova kroz period od 2004.
do 2013. godine.
Počevši s 19.05.2004. godine, s blog.hr servisa, pomoću programa pretraživača, prikupljeni
su komentari, odnosno podaci o autoru bloga koji komentira i vremenu komentiranja, te su ti
podaci spremljeni u bazu podataka.Iz baze podataka su eksportirani u Gephi datoteku, vizualno
prikazani u Gephiju te je dio njih obraĎen u konačan video prikaz. Kao početni blog nasumično
je odabran jedan od trenutno predstavljenih na stranicama blog.hr-a te se novi blogovi za obradu
pronalaze u komentarima. Ovaj način prikupljanja podataka u konačnici se pokazao manjkavim
zbog toga što finalna vizualna reprezentacija koja prikazuje graf od ukupno 11 152 čvora formira
podgrupe u čijem se centru nalaze blogovi koji su potpuno obraĎeni, odnosno oni blogovi čiji su
komentari u potpunosti pročitani. Ti blogovi na sebe privlače velik broj onih koji su na njih
komentirali, te iako su se blogovi koje nalazimo u centrima podgrupa filtrirali kao popularniji
meĎu obraĎenima, nije moguće tvrditi da su upravo oni najkomentiraniji blogovi upravo zbog
toga što se meĎu neobraĎenim blogovima možda kriju blogovi na koje je ostavljen znatno veći
broj komentara.
Iako su podaci o komunikacijskim trendovima prikupljeni za period od gotovo osam godina,
dinamička obrada prikazuje podatke za tek nešto više od dvije godine, točnije od 19.05.2004. do
1.09.2006. godine. Razlog tome je što je već i pri ovom, relativno malom vremenskom isječku
obrada podataka prilično zahtjevna te je za nju bilo potrebno dulje od jednog dana. Ipak, na
prikazanom isječku jasno vidimo kako pojedini blogovi nastaju, izmjenjuju komentare i s
vremenom formiraju podgrupe te nagovještavaju kako bi izgledao dinamički prikaz
komunikacijskih trendova za cjelokupan broj prikupljenih podataka.