Preskoči na glavni sadržaj

Prepoznavanje obavijesti u tekstu

ISVU: 2655224 ECTSZimski i ljetni semestar

Osnovne informacije

Organizacijska jedinica
Odsjek za lingvistiku
Satnica
  • Predavanja: 30 sati
  • Seminar: 15 sati

Nastavnici

Cilj

Uputiti studente u osnove teorijske postavke kodiranja obavijesti u jeziku. Osposobiti studenta za samostalnu izradu sustava za prepoznavanje obavijesti na konkretnoj jezičnoj građi.

Sadržaj

  1. Opis pojma obavijesti, definiranje obavijesti u tekstu, što je naziv.
  2. Prepoznavanje i klasifikacija naziva u kontekstu lingvistike i računalne lingvistike.
  3. Odnos crpljenja obavijesti i pronalaženja obavijesti.
  4. Stupanj strukturiranosti podataka: usporedba baza podataka i slobodnog teksta
  5. Opis sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima.
  6. Opis sustava za prepoznavanje i klasifikaciju naziva zasnovanih na statistici.
  7. Opis hibridnih sustava za prepoznavanje i klasifikaciju naziva.
  8. Mjere evaluacije sustava: preciznost, odziv i f-mjera.
  9. Strategije izrade i osobine pravila sustava za prepoznavanje i klasifikaciju naziva.
  10. Konferencije o razumijevanju poruka.
  11. Individualna izrada pravila sustava za prepoznavanje i klasifikaciju naziva.
  12. Individualna izrada pravila sustava za prepoznavanje i klasifikaciju naziva.

Ishodi učenja

  1. Identificirati temeljne nosioce obavijesti u tekstu prema konvencionalnoj specifikaciji.
  2. Opisati razliku između sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima i sustava zasnovanih na strojnom učenju.
  3. Kritički proširiti dijelove teksta koji mogu biti od osobitog značaja istraživaču ovisno o području koje se istražuje.
  4. Odrediti strategije i usvojiti metodologiju za izradu gramatika za prepoznavanje i klasifikaciju naziva.
  5. Vrjednovati izrađena pravila na samostalno prikupljenom korpusu za evaluaciju.

Metode podučavanja

Predavanja Seminari i radionice Samostalni zadaci

Metode ocjenjivanja

Ocjenjuje se seminarski rad, kolokvij i usmeni ispit.

Obavezna literatura

  1. Grishman, Ralph (2003), Information Extraction, Handbook of Computational Linguistics, urednik Ruslan Mitkov
  2. Gross, Maurice (1997), The Construction of Local Grammars, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA
  3. Hobbs, Jerry R.; Douglas E. Appelt; John Bear; David Israel; Megumi Kameyama; Mark Stickel; Mabry Tyson (1997), FASTUS: A cascaded finite-state transducer for extracting information from natural language text, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA

Dopunska literatura

  1. McDonald, David (1996), Internal and external evidence in the identification and semantic categorization of proper names, Corpus Processing for Lexical Acquisition, poglavlje 2, urednici: Boguraev; Pustejovsky, The MIT Press, Cambridge, MA