Prepoznavanje obavijesti u tekstu
ISVU: 265522•4 ECTS•Zimski i ljetni semestar
Osnovne informacije
- Organizacijska jedinica
- Odsjek za lingvistiku
- Satnica
- Predavanja: 30 sati
- Seminar: 15 sati
Nastavnici
Cilj
Uputiti studente u osnove teorijske postavke kodiranja obavijesti u jeziku. Osposobiti studenta za samostalnu izradu sustava za prepoznavanje obavijesti na konkretnoj jezičnoj građi.
Sadržaj
- Opis pojma obavijesti, definiranje obavijesti u tekstu, što je naziv.
- Prepoznavanje i klasifikacija naziva u kontekstu lingvistike i računalne lingvistike.
- Odnos crpljenja obavijesti i pronalaženja obavijesti.
- Stupanj strukturiranosti podataka: usporedba baza podataka i slobodnog teksta
- Opis sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima.
- Opis sustava za prepoznavanje i klasifikaciju naziva zasnovanih na statistici.
- Opis hibridnih sustava za prepoznavanje i klasifikaciju naziva.
- Mjere evaluacije sustava: preciznost, odziv i f-mjera.
- Strategije izrade i osobine pravila sustava za prepoznavanje i klasifikaciju naziva.
- Konferencije o razumijevanju poruka.
- Individualna izrada pravila sustava za prepoznavanje i klasifikaciju naziva.
- Individualna izrada pravila sustava za prepoznavanje i klasifikaciju naziva.
Ishodi učenja
- Identificirati temeljne nosioce obavijesti u tekstu prema konvencionalnoj specifikaciji.
- Opisati razliku između sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima i sustava zasnovanih na strojnom učenju.
- Kritički proširiti dijelove teksta koji mogu biti od osobitog značaja istraživaču ovisno o području koje se istražuje.
- Odrediti strategije i usvojiti metodologiju za izradu gramatika za prepoznavanje i klasifikaciju naziva.
- Vrjednovati izrađena pravila na samostalno prikupljenom korpusu za evaluaciju.
Metode podučavanja
Predavanja
Seminari i radionice
Samostalni zadaci
Metode ocjenjivanja
Ocjenjuje se seminarski rad, kolokvij i usmeni ispit.
Obavezna literatura
- Grishman, Ralph (2003), Information Extraction, Handbook of Computational Linguistics, urednik Ruslan Mitkov
- Gross, Maurice (1997), The Construction of Local Grammars, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA
- Hobbs, Jerry R.; Douglas E. Appelt; John Bear; David Israel; Megumi Kameyama; Mark Stickel; Mabry Tyson (1997), FASTUS: A cascaded finite-state transducer for extracting information from natural language text, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA
Dopunska literatura
- McDonald, David (1996), Internal and external evidence in the identification and semantic categorization of proper names, Corpus Processing for Lexical Acquisition, poglavlje 2, urednici: Boguraev; Pustejovsky, The MIT Press, Cambridge, MA