Kako otprilike web pretrazivači funkcionišu? - Uputstvo za internet
uputstva
zaštita voća

Kako otprilike web pretrazivači funkcionišu?

29.04.2010, 11:54
Zadatak pretrage je da što efikasnije vrati što kvalitetniji rezultat.
Efikasnost se meri brzinom koja protekne od klika na dugme do pojave
rezultata, a kvalitet se meri sa brojem rezultata (stranica) koje
pretraživač vrati i njihovom relevantnošću. Za brzinu zadužen je proces
indeksiranja i algoritmi koji sortiraju podatke prilikom parsiranja.
Broj rezultata zavisi od broja indeksiranih stranica, odnosno broja
stranica koje Web spajder pretraživača poseti i preuzme u bazu.
Relevantnost predstavlja povezanosti sadržaja sajta sa traženim pojmom
i zavisi od kvaliteta algoritama koje pretraživač koristi.

Proces pretrage počinje dolaskom korisnika na stranicu web pretraživača i
unošenjem faze. Klikom na dugme pretraga (Eng. Search) fraza se
prosleđuje do parsera koji parsira frazu. Izbacuju se one reči koje se
nalaze na stop listi a sve ostale proveravaju da li postoje u
Lexicon-u. Ukoliko fraza nije pronađena u Lexicon tabeli korisnik
dobija poruku da ne postoji ni jedan dokument koji sadrži traženu
frazu. U suprotnom za svaku reč iz fraze dobija se Id pod kojom je ta
reč snimljena u Lexicon tabeli.

Nakon dobijanja identifikatora za reči koje se nalaze u frazi izvršava se upit nad inverted index
tabelom koji vraća sve dokumente koji ih sadrže. Ovde se proces
pretrage završava za one pretraživače koji se ne bave relevantnošću
rezultata. Za sve ostale sledeći korak je upravo ono što razlikuje
dobre od loših – rangiranje rezultata.

Rangiranje rezultata
predstavlja proces sortiranja na osnovu relevantnosti. Najpre se za
svaki od dokumenata koji sadrži tražene reči broji broj pojavljivanja
fraze na istom. Zatim za svako pojavljivanje reči gleda se pozicija u
dokumentu (naslov, anchor, URL, H1,H2,H3 tag…) i da li je ta reč
posebno naglašena (podebljana, zakrivljena, podvučena). Svaka od
pozicija i naglašavanje reči nosi određeni težinski faktor. Sabiranjem
težinskih faktora svih pojavljivanja dobija se samo delić vrednosti po
kojoj se posle dokumenti sortiraju. Ostali faktori relevantnosti zavise
od samog web pretraživača.

Nakon završenog sortiranja dokumenata
(svih onih koji sadrže unetu frazu) po relevantnosti web pretraživač
korisnika prebacuje na novu stranicu na kojoj se nalaze izlistani
sortirani linkovi ka dokumentima.
Postavio clan: Uputstvo_84
Podeli na Facebooku Podeli sa prijateljima na facebook-u

Komentari

Trenutno nema komentara, komentarisite clanak pomocu forme koja se nalazi ispod

Da bi ste mogli da komentarisete clanke morate se registrovati


Obavestenje: Komentari nisu zvanicni stavovi ovog sajta već subjektivna mišljenja. Sajt Uputstva.rs nije odgovoran za stavove koji su iznešeni u komentarima i oni su vlasništvo njihovih autora.