Računalno potpomognuto prevođenje
ISVU: 255308•5 ECTS•Ljetni semestar
Osnovne informacije
- Organizacijska jedinica
- Odsjek za informacijske i komunikacijske znanosti
- Satnica
- Predavanja: 15 sati
- Seminar: 15 sati
- Vježbe u praktikumu: 15 sati
Nastavnici
Cilj
Cilj kolegija je stjecanje znanja i vještina u području računalno potpomognutog prevođenja. Studenti će usvojiti teorijska i praktična
znanja kroz rad s različitim alatima i resursima potrebnima u postupku računalno potpomognutog prevođenja (eng. Computer-
Assisted Translation). U procesu izgradnje sustava, provest će se prikupljanje paralelnih korpusa, izgradnja prijevodnih memorija
(eng. translation memories) kroz postupke sravnjivanja (eng. alignment), izgradnja terminološke baze. Svi resursi koristit će se u
sustavu za računalno potpomognuto prevođenje, kao i postojeći online sustavi za automatsko strojno prevođenje. U radu se će
koristiti različiti komercijalni i besplatni alati. Provest će se evaluacija kvalitete za odabranu domenu primjenom različitih metrika te
provesti analiza i interpretacija rezultata.
Sadržaj
- Uvodno predavanje. Primjena sustava za računalno potpomognuto prevođenje (eng. Computer-Assisted Translation).
- Stupnjevi automatizacije, primjena, prednosti i nedostaci. Resursi potrebni za izgradnju.
- Primjena strojnog prevođenja u Europskoj Uniji: alati i resursi.
- Analiza mogućih izvora podataka. Prikupljanje podataka jednojezičnih i dvojezičnih korpusa. Segmentacija.
- Sravnjivanje (eng. alignment) dvojezičnih korpusa.
- Prijevodne memorije. Ograničenja, prednosti i nedostaci, uvjeti. Izgradnja prijevodnih memorija.
- Dodavanja podataka, integracija prijevodnih memorija (eng. translation memory).
- Izgradnja terminološke baze (eng. terminology base)
- Primjena različitih CAT alata. Interoperabilnost između različitih sustava.
- Dijeljenje podataka kroz „cloud computing”. Primjena online CAT softvera kao usluge (SaaS).
- Integracija prijevodnih memorija, terminoloških baza i online alata za strojno prevođenje (eng. Machine Translation).
- Analiza sustava za strojno potpomognuto prevođenje (eng. Computer-Assisted Translation).
- Evaluacija kvalitete izgrađenog integriranog sustava (eng. benchmarking).
- Interpretacija rezultata evaluacije i primjenjivosti.
- Upravljanje projektom. Završno predavanje.
Ishodi učenja
- Razumjeti i primijeniti tehnologiju za izgradnju sustava za računalno potpomognuto prevođenje (eng. Computer-Assisted Translation)
- Izgraditi prijevodne memorije (eng. translation memories) kroz postupke sravnjivanja (eng. alignment) i terminološke baze (eng. terminology base)
- Integrirati različite resurse u odabrani sustav
- Koristiti različite CAT alate i ispitati mogućnosti interoperabilnosti
- Analizirati i procijeniti kvalitetu izlaznih rezultata integriranog računalno potpomognutog prevođenja
- Samostalno procijeniti mogućnosti primjene integriranog sustava za računalno-potpomognuto prevođenje u konkretnim situacijama
Metode podučavanja
Predavanja, seminari i radionice, vježbe, mješovito e-učenje, samostalni zadaci, laboratorij
Metode ocjenjivanja
Eksperimentalni rad, projekt, istraživanje, praktični rad, pismeni ispit, izrada samostalnih zadataka.
Obavezna literatura
- Arnold, D. Machine Translation: an Introductory Guide, 2008. Jörg Porsiel (ed.). Machine Translation. What language Professionals Need to Know. BDÜ Fachverlag 2017.
- Seljan, S.; Gašpar, A.; Pavuna, D. Sentence Alignment as the Basis For Translation Memory Database, 2007.
- Seljan, S.; Gašpar, A. Primjena prevoditeljskih alata u EU i potreba za hrvatskim tehnologijama. Zagreb : HDPL, 2009, 617-625.
- European Commission, DGT. Translation Tools and Workflow, 2012.
- Seljan, S.; Brkić, M.; Kučiš, V. Evaluation of Free Online Machine Translations for Croatian-English and English-Croatian Language Pairs // INFuture2011: Information Sciences and e-Society, 2011. 331-344.
- Kučiš, V.; Seljan, S.; Klasnić, K. Evaluation of Electronic Translation Tools Through Quality Parameters // INFuture 2009: Digital resources and knowledge sharing, 2009. 341- 351.
- Seljan, S.; Tucaković, M.; Dunđer, I. Human Evaluation of Online Machine Translation Services for English/Russian-Croatian. Springer. 353, 2015.
- Seljan, S.; Dunđer, I. Machine Translation and Automatic Evaluation of English/Russian-Croatian // Proceedings of "Corpus Linguistics, 2015. 72-79.
- Brkić, M.; Seljan, S.; Matetić, M. Machine Translation Evaluation for Croatian-English and English-Croatian Language Pairs // Proceedings NLPCS Workshop: Human-Machine Interaction in Translation. Copenhagen, 2011. 93-104
- Seljan, S.; Pavuna, D. Translation Memory Database in the Translation Process // IIS 2006, 327-332.
Dopunska literatura
- Seljan, S.; Škof Erdelja., N.; Kučiš, Vl.; Dunđer, I.; Pejić Bach, M. Quality assurance in computer-assisted translation in business environment // Natural Language Processing for Global and Local Business / Pinarbași, Fatih ; Nurdan Oncel Taskiran, M. (ur.). Hershey, PA: IGI Global, 2021, 247-270.
- Massardo, I.; van den Meer, J.; Khalilov, M. TAUS Translation Technology Landscape, 2016.
- Seljan, S. Quality Assurance (QA) of Terminology in a Translation Quality Management System (QMS) in the Business Environment // EU publications: Translation services in the digital world - A sneak peek into the (near) future. European Parliament: European Parliament, 2018. str. 92-105 doi:10.2861/668287
- Seljan, S. Sublanguage in Machine Translation // Proceedings of MIPRO, 2000. 17-20.
- Brkić, M.; Seljan, S.; Bašić Mikulić, B. Using Translation Memory to Speed up Translation Process // INFuture 2009 : Digital resources and knowledge sharing, 2009. 353-363.
- Kučiš, V.; Seljan, S. The Role of Online Translation Tools in Language Education // Babel, 60 (2014), 3; 303-324.
- Seljan, S.; Klasnić, K.; Stojanac, M.; Pešorda, B.; Mikelić Preradović, N. Information Transfer through Online Summarizing and Translation Technology // INFuture2015: e-Institutions – Openness, Accessibility, and Preservation, 2015. 197-210.
- Cruz-Lara, S.; Bellalem, N.; Ducret, J.; Kramer, I. Interoperability between translation memories and localization tools by using the MultiLingual Information Framework, EAMT 2006.