Ponašanje studenata prilikom traženja informacija u elektroničkom okruženju

Iščekivanja korisnika od informacijskih sustava

Yüklə 281,6 Kb.

səhifə	4/12
tarix	14.09.2018
ölçüsü	281,6 Kb.
	#68135

1 2 3 4 5 6 7 8 9 ... 12

3.3. Bradfordov zakon i ostali zakoni distribucije
3.4. Veličina tezaurusa za označivanje

3.2. Iščekivanja korisnika od informacijskih sustava

Uspješnost pretraživanja informacija u informacijskom sustavu uvelike ovisi o odabiru termina za pretraživanje. Kako bi bolje shvatili kako korisnici odabiru termine za pretraživanje, informacijski stručnjaci konzultiraju lingvistička i antropološka istraživanja o razvoju jezika i prepoznatljivosti određenih termina. Jedan od fenomena često proučavan u prethodno spomenutim istraživanjima, koji je značajan za informacijske stručnjake jest pojam folk (narodna) klasifikacija. Folk klasifikacije su, najjednostavnije rečeno, skupovi kategorija koje koriste različite kulture kako bi opisali biljke, životinje, boje, itd ⁶³. Znanstvenici su otkrili da, neovisno o kulturi ili jeziku, postoje određeni izrazi koji su lako prepoznatljivi širokom krugu ljudi, te da se navedeni izrazi uklapaju u određenu klasifikaciju unutar koje se nalaze generički i specifični termini⁶⁴. Generički izrazi su neprepoznatljiviji, jer se uvelike međusobno razlikuju po fizičkim ili drugim karakteristikama. Primjer generičkog izraza je recimo mačka ili hrast, dok je primjer specifičnog izraza perzijska mačka ili hrast lužnjak.

Folk klasifikacije potječu iz naroda kao instinktivne klasifikacije koje ljudi razumiju i koje očekuju vidjeti u informacijskim sustavima. Folk klasifikacije se u kontekstu informacijskih znanosti mogu proučavati kao folk pristup (folk access). Istraživanja komunikacije korisnika s referentnim knjižničarima pokazala su da korisnici prvo postavljaju šira pitanja (generički termini) te postupno postavljaju specifičnija pitanja dok ne dođu do traženog pojma⁶⁵. S tim saznanjima, možemo zaključiti da korisnici očekuju sličnu interakciju i s informacijskim sustavima. Bates argumentira da, ukoliko se korisnicima omogući pregledavanje sadržaja koji sustav nudi pomoću klasifikacije koja se kreće od generičkih prema specifičnim pojmovima i time osigura upoznavanje korisnika s mogućnostima sustava, korisnici će biti opremljeni potrebnim informacijama kako bi uspješnije formulirali upite koji će ih dovesti do traženog rezultata⁶⁶.

3.3. Bradfordov zakon i ostali zakoni distribucije

Istraživanjem statističkih značajki baza podataka primijećen je velik broj obrazaca ili distribucija indeksnih termina koji se mogu pronaći u bibliografskim i full-text bazama podataka⁶⁷. U informacijskoj znanosti statistički fenomeni promatrani su u skupu statističkih distribucija poznatih pod nazivom Zipfove distribucije u koje se ubraja i Bradfordov zakon, a koje karakteriziraju dugi 'repovi' u grafikonima⁶⁸. Zipfove distribucije pokazuju kako u bazama podataka najčešće postoji velik broj termina s manjim frekvencijama pojavljivanja i vrlo malen broj termina s velikim frekvencijama.

Samuel Bradford je istraživao distribuciju stručnih članaka u značajnim časopisima iz tog polja. Došao je do zanimljivog zaključka da većina relevantnih članaka o određenoj temi izlazi u nekolicini ključnih časopisa, ali je moguće pronaći relevantne članke u drugim časopisima u kojima se članci na traženu temu vrlo rijetko objavljuju⁶⁹. Može se povući jasna paralela između opisane situacije i indeksnih termina u bazama podataka. Naime, u kontekstu indeksnih termina u bazama podataka, možemo pretpostaviti da će manji broj „pravih“ upita rezultirati većim brojem relevantnih izvora, ali mali broj relevantnih izvora moći će se pronaći detaljnijom pretragom⁷⁰. Istraživanja su pokazala da, ako promatramo bazu podataka sa 10 000 indeksnih termina i 100 000 zapisa te da je svakom zapisu dodijeljen samo jedan termin, velika je vjerojatnost da će se nekolicina termina koristiti nekoliko tisuća puta, dok će se velik broj termina spominjati možda jednom ili dvaput⁷¹. Za korisnike informacijskih sustava ova situacija predstavlja problem, jer čak i ako uspiju odabrati termin koji će rezultirati velikim brojem relevantnih rezultata, Bradfordov zakon kaže da će mali dio relevantnih rezultata ostati neotkriven te će morati napraviti dugotrajnu i kompliciranu pretragu kako bi ih pronašli.

Ova je problematika vrlo jasna, iako Bates preporuča da bi se trebala napraviti značajnija istraživanja na ovu temu kako bismo uvidjeli realnu situaciju, no jasno je da unatoč i dosadašnjim istraživanja, indekseri nisu uspjeli pronaći rješenje kojim bi se izbjegla ova situacija.

3.4. Veličina tezaurusa za označivanje

Razvoj informacijskih sustava od abecednog predmetnog kataloga do današnjih baza podataka s nekoliko milijuna zapisa u sustavu predstavlja neprestane izazove informacijskim stručnjacima i indekserima. Informacijski sustavi u konstantnom su rastu s produkcijom sve većeg broja publikacija. Tu se postavlja pitanje hoće li sustav koji danas funkcionira biti jednako uspješan za nekoliko godina kada informacijski sustav bude 10 ili 100 puta veći⁷²? Problem za korisnike i indeksere u ovom slučaju se pojavljuje kada se zahtijeva opis sve većeg broja zapisa jedinstvenim terminima o kojima ovisi dohvat relevantnih rezultata iz baze. Naime, baze podataka su u porastu, ali vokabular ostaje isti. Procijenjeno je da pojedinac ima vokabular od približno 45-50 000 riječi (podatak se odnosi na pojedince u SAD-u)⁷³. Dakle ako uzmemo bazu podataka od 1 000 000 zapisa, s pretpostavkom da je svakom zapisu dodijeljeno 20 termina (prosječan broj termina po zapisu u bazi podataka je 10-40), korisnik će pretraživanjem samo jednog termina dobiti 400 rezultata, što je previše za većinu korisnika⁷⁴. Broj dobivenih rezultata može se smanjiti kombiniranjem nekoliko termina pretraživanja pomoću Booleovih operatera, no to onda dovodi do problema odabira termina za kombiniranje. Odabir krivog termina može rezultirati pronalaskom velikog broja rezultata koji nisu relevantni korisniku, čime je možda eliminiran problem prevelikog broja rezultata, ali se dovodi u pitanje kvaliteta dobivenih rezultata⁷⁵. Za prebiranje izvora, ovakva situacija je u potpunosti prihvatljiva, ali ako se fokusiramo na direktno, usmjereno pretraživanje, jasno je da su potrebna nova rješenja kako bi se olakšalo pretraživanje i pronalaženje relevantnih izvora korisnicima. Bates sugerira da će inovacije na ovom području svakako uključivati u većem dijelu poboljšanja automatiziranog procesa indeksiranja, no i najbolji algoritmi neće biti u mogućnosti nositi se sa svim opisanim problemima⁷⁶.

Yüklə 281,6 Kb.

Dostları ilə paylaş:

1 2 3 4 5 6 7 8 9 ... 12