InfoMenInfoKeres

A VIK Wikiből
Ugrás a navigációhoz Ugrás a kereséshez

Ez az oldal a korábbi SCH wiki-ről lett áthozva. Az eredeti változata itt érhető el.

Ha úgy érzed, hogy bármilyen formázási vagy tartalmi probléma van vele, akkor kérlek javíts rajta egy rövid szerkesztéssel.

Ha nem tudod, hogyan indulj el, olvasd el a migrálási útmutatót


Információ keresés és feltárás

  • információ visszakeresés (infromation retrieval, IR): a felhasználó információs igényének minél pontosabb kielégítése; általában félstrukturált és strukturálatlan adatokon
  • ad hoc visszakeresés: meglévő dokumentumokon
  • fitering: értesítés újonnan érkező releváns dokumntumokről
  • releváns dokumentum: kielégíti az adott információs igényt
  • fedés (recall): a releváns dokumentumok hány százalékát adja vissza a rendszer
  • pontosság (precision): a visszaadott dokumentumok hány százaléka releváns
  • rangsorolás (ranking): a relevancia szerinti rendezés
  • term: egy kulcsszó a rendszerben
  • normalizált term frekvencia (tf): egy term milyen relatív gyakorisággal fordul elő egy dokumentumban (a dokumentum leggyakoribb termjére nézve)
  • inverz dokumentum frekvencia (idf): annak az inverze, hogy milyen gyakran szerepel egy term a rendszer dokumentumai között, Együtt: tf-idf
  • Boolean modell: megmondjuk, hogy melyik szavak legyenek benne a válaszként visszaadott dokumentumokban, és melyikek ne (diszjunktív normálforma (ÉS-ek VAGY-a) segítségével)
  • vektor modell: a dokumentum term-vektora és a keresés termvektora által bezárt szög koszinusza alapján sorrendezzük a válaszokat