Programiranje za društvene i humanističke znanosti
ISVU: 255260•5 ECTS•Zimski semestar
Osnovne informacije
- Organizacijska jedinica
- Odsjek za informacijske i komunikacijske znanosti
- Satnica
- Predavanja: 30 sati
- Vježbe u praktikumu: 30 sati
Nastavnici
Cilj
Studenti se upoznaju s osnovnim metodama automatske obrade tekstualnih podataka na razini niza podataka.U teorijskom se dijelu
kolegija upoznaju načine kodiranja teksta kao i najčešći datotečni formati zapisa teksta. Nadalje se daje uvod u osnove statističke
obrade jezika te primjere statističkog modeliranja jezika.Praktični se dio sastoji od upoznavanja osnova programiranja u
interpretiranom jeziku Python, programiranja nad sekvencijalnim tipovima podataka, struktura, regularnih izraza, računanja čestotnih
razdioba sekvenci te primjera izgradnje jezičnih statističkih modela s primjenom. Završni zadatak predstavlja potvrdu usvojenosti
elemenata kolegija uvedenima tijekom semestra.
Sadržaj
- Uvodno predavanje. Opis kolegija. Programski jezik Python.
- Osnove kodiranja teksta. Osnove programiranja u Pythonu.
- Kodne stranice stalne duljine zapisa. Osnovne strukture podataka u Pythonu.
- Unicode i oblici kodiranja Unicode standarda. Rad s tekstualnim datotekama u Pythonu.
- Rad s modulima.
- Računanje čestotnih razdioba.
- Prvi kolokvij.
- Osnove regularnih izraza.
- Napredni regularni izrazi.
- Čestotne razdiobe n-grama znakova i riječi.
- Osnove modeliranja jezika.
- Rad na dizajnu završnog zadatka.
- Implementacija završnog zadatka.
- Implementacija završnog zadatka.
- Predstavljanje završnog zadatka.
Ishodi učenja
- Objasniti osnove pohrane i obrade teksta u računalu.
- Objasniti osnove programiranja nad tekstnim podacima.
- Objasniti osnove statističkog modeliranja jezičnih fenomena.
- Usporediti razne jezične modele.
Metode podučavanja
predavanja, vježbe, mještovito e-učenje, samostalni zadaci, multimedija i mreža
Metode ocjenjivanja
pohađanje nastave, kolokvij, istraživanje, praktični rad, usmeni ispit
Obavezna literatura
- Jurafsky, Daniel; Martin, James H. Speech and Language Processing (2nd Edition). New Jersey: Prentice Hall, 2008.
- Python Documentation. https://docs.python.org/.
- Tadić, Marko. Jezične tehnologije i hrvatski jezik. Zagreb: Ex libris, 2003.
Dopunska literatura
- Bird, Steven; Klein, Ewan, Loper, Edward. Natural Language Processing with Python. O'Reilly Media, 1999.
- Manning, Christopher D.; Schuetze, Hinrich. Foundations of Statistical Natural Language Processing. The MIT Press, 2002.