Primjena korpusa u humanističkim istraživanjima
ISVU: 280618•4 ECTS•Ljetni semestar
Osnovne informacije
- Organizacijska jedinica
- Odsjek za informacijske i komunikacijske znanosti
- Satnica
- Predavanja: 15 sati
- Vježbe u praktikumu: 15 sati
Nastavnici
- Lorena Ninčevićasist.
Cilj
Studenti se upoznaju s osnovnim pojmovima i metodama vezanima uz računalne korpuse. U teorijskom dijelu im se daje pregled razvoja korpusa, primjeri iz svijeta i Hrvatske. Nadalje, objašnjavaju se vrste i obilježja korpusa te se daju konkretni primjeri primjene korpusa, odnosno različita humanistička istraživanja vezana uz njihovu upotrebu. U praktičnom dijelu uče pretraživati javno dostupne korpuse i izrađivanje vlastitog korpusa. U kolokviju se provjerava teorijsko znanje studenata. Kroz završni zadatak provjerava se usvojenost praktičnih vještina izrade i pretraživanja korpusa.
Sadržaj
- Upoznavanje s načinom rada i obvezama na kolegiju. Definiranje korpusa.
- Pregled razvoja korpusa. Hrvatski korpusi.
- Obilježja i vrste korpusa.
- Definiranje osnovnih pojmova iz područja obrade prirodnog jezika bitnih za korištenje korpusima.
- Primjeri korpusnih istraživanja u humanistici.
- Koraci u izgradnji korpusa.
- Kolokvij.
- Upoznavanje s radom alata za pretraživanje i izradu korpusa.
- Pretraživanje javno dostupnih korpusa u odabranom alatu: osnovne opcije.
- Pretraživanje javno dostupnih korpusa u odabranom alatu: napredne opcije.
- Opcije za izradu vlastitog korpusa u odabranom alatu.
- Završni zadatak: odabir građe za izradu korpusa.
- Završni zadatak: izrada korpusa.
- Završni zadatak: pretraživanje izrađenog korpusa.
- Izlaganja i diskusija o završnom zadatku.
Ishodi učenja
- Definirati pojam korpusa.
- Objasniti vrste i obilježja korpusa.
- Koristiti se osnovnim postavkama alata za pretraživanje korpusa.
- Razviti i pretraživati vlastiti korpus koristeći se dostupnim alatima.
Metode podučavanja
Predavanja, vježbe na računalima, sustav učenja na daljinu.
Metode ocjenjivanja
Kolokvij. Završni zadatak. Pismeni ispit.
Obavezna literatura
- Sarkar, Dipanjan. Text Analytics with Python: A Practitioner’s Guide to Natural Language Processing 2nd ed. Apress, 2019
- Bago, Petra; Karlić, Virna. (Računalna) pragmatika: temeljni pojmovi i korpusnopragmatičke analize. Zagreb: FF-press, 2021
Dopunska literatura
- Ebensgaard Jensen, Kim. Linguistics and the digital humanities: (computational) corpus linguistics. MedieKultur: Journal of Media and Communication Research, 30 (57), 2014
- De Koster, Richard. Corpus building and investigation for the Humanities, 2018
- Santos, Diana. Literature studies in Literateca: between digital humanities and corpus linguistics. U: Martin Doerr; Øyvind Eide; Oddrun Grønvik; Bjørghild Kjelsvik (ed.), Humanists and the digital toolbox: In honour of Christian-Emil Smith Ore. Oslo: Novus Forlag, 2019, str. 89-109