Informacijos paieška

  • Dalyko kodas: INF 5017
  • Apimtis ECTS kreditais: 6
  • Pavadinimas anglų kalba: Information Retrieval
  • Dalyko aprašo rengėjas(-ai):

    Prof. Tomas Krilavičius

Dalyko anotacija lietuvių kalba

Kurse aptariama informacijos modeliavimo ir paieškos teorija ir taikymai. Pristatomos klasikinės informacijos modeliavimo teorijos, bei jų taikymas paieškai. Pradedama nuo bazinių žinių, ir baigiama naujausiais iššūkiais.

Dalyko anotacija užsienio kalba

The course aims to study the theories and techniques used in modelling of information and text based retrieval. It discusses classical and modern techniques of knowledge modelling and their application for information retrieval. Students start from the basic notions and concepts, and finish with the newest challenges in the field.

Būtinas pasirengimas dalyko studijoms

Bazinės statistikos, aibių teorijos, logikos, algebros ir programinės įrangos kūrimo žinios

Dalyko studijų rezultatai

Parinkti tinkamiausius kalbos technologijų metodus ir IR modelius ir įrankius konkrečiam IR sprendimui.
Parinkti tinkamiausias sąsajas, spalvas, ribojimus ir kitas IR sistemų savybes skirtingoms vartotojų grupėms.
Sekti mokslinę ir technologinę literatūrą, spręsti problemas naudojant inovatyvius metodus ir naujausius tyrimų rezultatus, taikyti juos praktikoje.
Pritaikyti tinkamus metodus turinio analizei, indeksavimui, saugojimui ir išgavimui.
Formalizuoti reikalavimus IR sistemai, įvertinti jos efektyvumą, pritaikyti formalaus išvedimo metodus.
Pritaikyti paskirstytas sistemas skanavimui, duomenų parengimui ir išgavimui.
Projektuoti ir realizuoti IR sistemas debesyje.

Dalyko turinys

1. Įvadas į pažangią informacijos paiešką.
2. Sudėtingi teksto analizės metodai informacijos paieškoje.
3. Paskirstytas didelių duomenų kiekių indeksavimas.
4. Loginio ir vektorinio IR modelių išplėtimai.
5. Tikimybinias IR modelis.
6. Latentinis semantinis ir kiti IR modeliai.
7. Elgesio analizė, sudėtingi kokybės įvertinimo metodai.
8. Paieška žiniatinklyje: skanavimo įrankiai, apdorojimas, HITS, Page Rank.
9. Klasterizavimas: plokščias, hierarchinis, didelių duomenų kiekių klasterizavimas – savybių konstravimas ir atranka.
10. Klasifikavimas IR: naivus Bajes, SVM.
11. Fokusuotas paieška.

Dalyko studijos valandomis

Paskaitos (P) 45 val.
Darbas grupėse 5 val.
Laboratoriniai darbai (L) 10 val.
Savarankiškas darbas 100 val.
Iš viso 160 val.

Studijų rezultatų vertinimas

17% koliokviumas, 33% laboratoriniai ir 50% egzaminas

Literatūra

1. 2008 C. D. Manning, P. Raghavan, H.Schütze. Introduction to Information Retrieval. Cambridge University
Press On-line book: http://wwwcsli.stanford.edu/~hinrich/info rmation-retrieval-book.html.
2. 1979 C. J. Van Rijsberge. Information Retrieval. Butterwort hs http://www.dcs.gla.ac.uk/Keit h/Preface.html
3. 2015 W. Bruce Croft Donald Metzler Trevor Strohman. Search Engines Information Retrieval in Practice Pearson http://ciir.cs.umass.edu/downl oads/SEIRiP.pdf
Papildoma literatūra
1. Mi Islita http://www.miislita.com/
2. www.google.com www.google.com