Preskoči na glavni sadržaj

Korpusi u jezičnim istraživanjima

ISVU: 2656784 ECTSLjetni semestar

Osnovne informacije

Organizacijska jedinica
Odsjek za lingvistiku
Satnica
  • Predavanja: 30 sati
  • Seminar: 15 sati

Nastavnici

Cilj

Studente se uvodi u područje korpusne lingvistike, upoznaje s ulogom korpusa u današnjim istraživanjima jezika/teksta, posebno u kontekstu neofiloloških istraživanja, te daje praktično znanje pretraživanja korpusa.

Sadržaj

  1. Povijest korpusnih istraživanja u svijetu i u nas
  2. Uloga korpusa u istraživanju jezika
  3. Definicija korpusa
  4. Računalno podržan korpus
  5. Korpusni parametri
  6. Postupci u sastavljanju korpusa: uzorkovanje, reprezentativnost
  7. Vrste podataka pretraživih iz korpusa: abecedariji, čestotnici, konkordancije
  8. Postupci obradbe korpusa: nelingvističko obilježavanje i standardi digitalnoga zapisa
  9. Postupci obradbe korpusa: lingvističko obilježavanje (segmentacija i označavanje)
  10. Postupci obradbe korpusa: lingvističko obilježavanje (označavanje vrsta riječi, lematizacija, MSD-označavanje)
  11. Postupci obradbe korpusa: lingvističko obilježavanje (označavanje sintaktičkih uloga – banke stabala; označavanje značenja riječi i semantičkih uloga)
  12. Postupci obradbe korpusa: statističke metode
  13. Praktičan rad na pretrazi korpusa: Hrvatski nacionalni korpus i drugi (nacionalni) korpusi
  14. Praktičan rad na pretrazi korpusa: Sketch Engine / No Sketch Engine / CQL i regularni izrazi
  15. Praktičan rad na pretrazi korpusa: korpusi u neofilološkim istraživanjima

Ishodi učenja

  1. Studenti će usvojiti definiciju korpusa kako ga vidi suvremena korpusna lingvistika.
  2. Studenti će moći objasniti razliku između zbirke tekstova, korpusa i računalnog korpusa.
  3. Studenti će moći opisati različite vrste korpusa.
  4. Studenti će moći objasniti i uočiti važnost primjene korpusa i korpusnolingvističkih metoda u neofilološkim istraživanjima.

Metode podučavanja

Predavanja, seminari, e-učenje

Metode ocjenjivanja

Pismeni ispit, praktični zadatak

Obavezna literatura

  1. Biber, D. (1998) Corpus Linguistics: Investigate Language Structure and Use, CUP, Cambridge.
  2. Kennedy, G. (1998) Introduction to Corpus Linguistics, Longman, London.
  3. McEnery, T. & Wilson A. (2001) Corpus linguistics, Edinburgh Univ. Press, Edinburgh.
  4. Tadić, M. (1997) Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive, Suvremena lingvistika 43-44, 387-394.
  5. Tadić, M. (2003) Jezične tehnologije. Ex Libris, Zagreb.
  6. Tognini-Bonelli, E. (2001) Corpus Linguistics at Work, Benjamins, Amsterdam.

Dopunska literatura

  1. Tadić, M. (1991) Od korpusa do čestotnoga rječnika hrvatskoga književnog jezika, Radovi Zavoda za slavensku filologiju, 27, 169-78.
  2. Tadić, M. (1996) Računalna obradba hrvatskoga i nacionalni korpus, Suvremena lingvistika 41-42, 603-611.
  3. Tadić, M. (1998) Raspon, opseg i sastav korpusa hrvatskoga jezika, Filologija 30-31, 337-347.
  4. Tadić, M. (2009) New version of the Croatian National Corpus, u: Hlaváčková, D. ; Horák, A.; Osolsobě, K.; Rychlý, P. (ur.) After Half a Century of Slavonic Natural Language Processing, Masaryk University, Brno, str. 199-205
Korpusi u jezičnim istraživanjima