Obrada prirodnog jezika
ISVU: 225474•6 ECTS•Zimski i ljetni semestar
Osnovne informacije
- Organizacijska jedinica
- Odsjek za informacijske i komunikacijske znanosti
- Satnica
- Predavanja: 30 sati
- Seminar: 30 sati
Nastavnici
Cilj
Studenti će dobiti znanja iz područja obrade prirodnog jezika, s posebnim naglaskom na razvoj korpusa i analizu sentimenta.
Sadržaj
- Uvodno predavanje
- Uvod u obradu prirodnog jezika.
- Jezični resursi i alati za hrvatski i ostale jezike.
- Metode i alati za razvoj korpusa.
- Standardi i alati za označavanje korpusa.
- Razvoj korpusa za analizu sentimenta: prikupljanje jezičnih resurs.
- Razvoj korpusa za analizu sentimenta: čišćenje jezičnih resursa i tokenizacija.
- Razvoj korpusa za analizu sentimenta: označavanje korpusa na razini pojavnica i sintagmi (morfosintaktičke oznake, lematizacija, označavanje imenovanih entiteta).
- Kolokvij
- Analiza sentimenta uporabom leksikona
- Analiza sentimenta temeljena na pravilima
- Analiza sentimenta uz pomoć strojnog i dubinskog učenja
- Prekojezična analiza sentimenta pomoću strojnog prevođenja i leksikona
- Prekojezična analiza sentimenta pomoću vektorskih prikaza riječi i jezičnih modela.
- ZAVRŠNI ISPIT: Predstavljanje projektnog zadatka.
Ishodi učenja
- Identificirati računalnu složenost problema OPJ-a
- Analizirati tekstovne korpuse
- Primijeniti tehnologiju OPJ-a u svrhu istraživanja i boljeg razumijevanja tekstnih podataka
- Primijeniti metode OPJ-a za analizu sentimenta tekstnih dokumenata
- Interpretirati rezultate projekta iz područja OPJ-a
- Dekonstruirati stvarne probleme u manje složene probleme u području OPJ-a te osmisliti moguća rješenja
Metode podučavanja
Predavanja, rad na računalima, sustav učenja na daljinu.
Metode ocjenjivanja
Kolokvij. Seminarski rad. Usmeni ispit.
Obavezna literatura
- Daniel Jurafsky & James. H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Prentice Hall, NJ, 2000.
- Christopher D. Manning, Hinrich Schütze (1999.), Foundations of Statistical Natural Language Processing, MIT Press
- Sarkar, Dipanjan. Text analytics with Python: a practitioner's guide to natural language processing. Apress, 2019.
- Pota, M.; Ventura, M.; Catelli,R.; Esposito, M. An EffectiveBERT-Based Pipeline for TwitterSentiment Analysis: A Case Study inItalian. Sensors 2021, 21, 133.
- Pang, B.; Lee, L.; Vaithyanathan, S. Thumbs up? Sentiment Classification using Machine Learning Techniques. In Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing, EMNLP 2002, Philadelphia, PA, USA, 6–7 July 2002;pp. 79–86
- Yadav, A.; Vishwakarma, D.K. Sentiment analysis using deep learning architectures: A review. Artif. Intell. Rev. 2020,53, 4335–4385.
Dopunska literatura
- Ruslan Mitkov (ed.) (2005.), The Oxford Handbook of Computational Linguistics, Oxford University Press, USA
- Hao, Y.; Mu, T.; Hong, R.; Wang, M.; Liu, X.; Goulermas, J.Y. Cross-Domain Sentiment Encoding through Stochastic WordEmbedding. IEEE Trans. Knowl. Data Eng. 2020, 32, 1909–1922.
- Zhang, L.; Wang, S.; Liu, B. Deep learning for sentiment analysis: A survey. Wiley Interdiscip. Rev. Data Min. Knowl. Discov. 2018,8.
- Li, Y.; Pan, Q.; Yang, T.; Wang, S.; Tang, J.; Cambria, E. Learning Word Representations for Sentiment Analysis. Cogn. Comput.2017, 9, 843–851.
- Marko Tadić. Jezične tehnologije i hrvatski jezik. Exlibris, Zagreb 2003.
- Tepeš, B. Računarska lingvistika, Radovi Zavoda za informacijske studije, Knjiga 9., Zagreb, 2001.