Obrazovanje:Nauka

Šta je relevantnost

Kada unesete upit na stranici pretraživača ili u polju za pretragu (na vrhu ekrana), pretraživač počinje da primi događaje koji su skriveni od običnih korisnika. Kako su, onda, informacije na prostranom World Wide Webu, a šta je relevantnost pretrage? Sama reč nastala je iz latinskog "relevo" i prevedena je na ruski jezik kao "podizanje" ili "olakšanje". Angleški ekvivalent termina je "relevantnost". U tački 3.5.1 GOST 7.73-96 ovaj koncept se dešifruje, a "relevantnost" i "relevantna" imaju istu definiciju, što je u skladu sa informacijama dobijenim putem korisničkog zahtjeva za informacijama.

Ovaj državni standard sadrži i druge korisne standardizovane pojmove i definicije koji se odnose na oblast pronalaženja informacija i njegovu diseminaciju pomoću informacionih automatizovanih sistema. Dokument pomaže da se razume značenje mnogih reči u informacijama, objavljivanju ili bibliotečkim aktivnostima, a ne samo takvu jedinicu jezika kao "relevantnost". Definicija pojmova "per- tentnost" i "kontinentalna" takođe se tumači u tački 3.5.2 GOST 7.73-96. Treba ih tumačiti kao konzistentnost dobijenih podataka informativnih informacija. Često je ovaj koncept zbunjen sa relevantnošću, što u suštini nije tačno, jer u jednom slučaju to je pitanje usklađivanja upita, au drugom slučaju o korespondenciji potrebe. Takođe je pogrešno odgovoriti na pitanje: "Šta je relevantnost?" Da odgovorite da je ovaj pojam blizu pojmu "adekvatnosti", odnosno praktične primenljivosti rezultata.

Ali kako je to informacija? Pretraživač koristi vojsku bota - samostalne programe koji posjećuju web stranice i čuvaju informacije o njima. Ime proizilazi iz engleske riječi "bot", odnosno skraćenica od "robota". Ovi programi pronalaze nove sajtove, a zatim idite na glavnu stranicu i pretražite njegov sadržaj. Bots nauči stranice povezane sa kućnim (u pretraživaču koje je prvo učitano) interne veze. Takođe, bots gledaju na veze koje ukazuju na druge lokacije, odnosno spoljne veze. Čuvajući ove informacije, oni pređu preko njih, otkrivaju sve nove lokacije i saznaju kako su povezani web izvori. Stoga neumorno proučavaju "mapu" World Wide Weba. Ali šta je relevantno? Šta ima veze sa bocama?

Na konkretnom primeru, da vidimo šta pretraživači Yandex i Google nude. Na pitanje "šta je relevantno?" U izdanju Yandex-a, bilo je 28 miliona odgovora, a Google-a 155.000. Ovdje možete reći da svi ispunjavaju zahtjev, a potrebe nisu uvijek, to jest, neće svi biti trajni. Na primjer, stranice na kojima je izvršni direktor Wikipedije dato objašnjenje ovog koncepta sigurno će biti korisni, a stranica o relevantnim i nebitnim troškovima u donošenju odluka nije relevantna za ovu temu. Još jasniji primer je to što kada je Yandex izdao 31 miliona odgovora na zahtev za "ruke gore", što je značilo dobijanje informacija o muzičkoj grupi, a među njima postoji i članak koji poziva na podizanje ruku, jer je to, po mišljenju fizioterapeuta, veoma korisno. Ovaj odgovor se ne može smatrati neprekidnim, iako od 31 miliona odgovora, on preuzima 586. poziciju u ekstradiciji.

Dakle, što je veća važnost teksta, verovatnije je da će ući u prve položaje odgovora pretrage. Ovaj indikator ima kvantitativnu procenu, ali se algoritmi za njegovu primjenu u različitim pretraživačima razlikuju i nisu poznati korisnicima i vremenom se mijenjaju, jer pretraživači, pokušavajući da povećaju rejtinge, pokušavaju da pruže relevantne informacije, skraćujući vrijeme za njegovo pretraživanje. Veoma relevantne su stranice na kojima se pojavljivanje ključne reči koja se poklapa sa upitom može biti u rasponu od 3 do 7%. Ali to nije jedini kriterijum relevantnosti dokumenta. Ovo uključuje niz internih i eksternih indikatora. Unutrašnji indikatori (osim gustine ključnih reči) su njihova pozicija u tekstu (upisivanje naslova, njihova blizina naslovu i jedni druge, formiranje vjerovatnih fraza pretrage), kao i prisustvo sinonima, potvrđujući korespondenciju sadržaja teksta u upit. Glavni spoljni indikator smatra se popularnošću u globalnoj mreži, što ukazuje PageRank od Google-a, TIC-a od Yandex-a i Tor100-a iz sistema Rambler. To jest, koliko često se stranica prebacuje sa drugih lokacija, bolje je ako su sa visokim rejtingom. To je relevantnost.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 bs.delachieve.com. Theme powered by WordPress.