Analiza i obrada podataka
ISVU: 266159•4 ECTS•Ljetni semestar
Osnovne informacije
- Organizacijska jedinica
- Odsjek za informacijske i komunikacijske znanosti
- Satnica
- Predavanja: 15 sati
- Vježbe u praktikumu: 15 sati
Nastavnici
- Kristijan Klasanasist.
Cilj
Cilj kolegija je upoznati studente s teorijskim i praktičnim aspektima analize i obrade podataka te njihove primjena u konkretnim situacijama. Teorijski dio obuhvaća znanja i metode potrebne za dohvaćanje, pripremu, obradu i analizu podataka, kao i vizualizaciju vremenskih, geografskih i drugih vrsta podataka. Kroz praktične zadatke, studenti će biti osposobljeni primijeniti svoja znanja i vještine u različitim situacijama u radu s podacima(industrija, knjižnice, muzeji, arhivi, uslužna djelatnost itd.). Po završetku kolegija, studenti će biti osposobljeni za primjenu stečenog znanja i vještina u stvarnim situacijama, kao i za daljnji profesionalni razvoj u području analitike podataka.
Sadržaj
- Uvodno predavanje. Organizacija podataka. Vrste podataka. Formatiranje. Regionalne postavke. Zamrzavanje podataka. Osnovne matematičke funkcije. Automatska ispuna podataka. Automatsko kreiranje serija. Alati za analizu i obradu podataka. Tablični kalkulator. Organizacija podataka u ćelije i radne listove. Relativne i apsolutne reference ćelija. Izračuni datuma.
- Uvjetno oblikovanje prema jednostrukim i višestrukim kriterijima. Upoznavanje s deskriptivnom statistikom koristeći funkcije i formule tabličnog kalkulatora.
- Filtriranje i sortiranje prema više kriterija. Priprema podataka za analizu: prikupljanje, sažimanje i obrada. Logičke funkcije i ugniježđene funkcije za prikaz podataka. Tekstne funkcije. Vizualno isticanje informacija.
- Vrste grafikona. Principi vizualizacije. Kriteriji za odabir grafikona. Transformacija i vizualizacija podataka. Funkcije za analizu podataka u tabličnom kalkulatoru. Analiza i grafički prikaz analiziranih podataka. Transformacija podataka iz postojećih proračunskih tablica.
- Metode pripreme i čišćenja podataka, identifikacija i ispravljanje pogrešaka te rukovanje nedostajućim podacima. Prepoznavanje primjera čestih pogrešaka pri korištenju podataka. Primjena funkcija za pretraživanje i uklanjanje duplikata iz skupova podataka. Manipulacija s podacima primjenom funkcija u tabličnom kalkulatoru. Analiza vremenskih serija unakrsnih podataka.
- Sažimanje podataka. Zaokretne tablice. Instalacija i postavljanje okruženja. Uvoz baze podataka s računala i transformacija u pivot tablicu. Upravljanje pivot tablicama. Kreiranje veza između tablica. Prikaz i postavljanje opcija zaokretnog grafikona. Filtriranje podataka u zaokretnoj tablici.
- Primjena izraza za analizu podataka. Osnovni pojmovi modeliranja podataka i uporaba specijaliziranog dodatka u tabličnom kalkulatoru. Pregled osnovnih koncepata izraza za analizu podataka i njegove primjene. Primjena specijaliziranih formula u analizi podataka. Modeliranje i analiza složenih skupova podataka.
- Alat za trodimenzionalni prikaz podataka. Interaktivni grafikoni za geografski prikaz podataka.
- Priključni program za uvoz i povezivanja vanjskih podataka te manipulaciju podacima: grupiranje, spajanje, čišćenje. Uvoz podataka, izrada grafikona i izvještaja.
- Priključni program za „what-if“ analizu. Pronalaženje minimalnih i maksimalnih vrijednosti te ograničenja. Primjeri proračuna.
- Uloga i prednosti automatizacije procesa čišćenja podataka. Analiza podataka korištenjem namjenskog programa. Instalacija programa i uvoz podataka. Osnovne operacije: pregled podataka, navigacija i filtriranje.
- Planiranje i organizacija procesa za čišćenje podataka na stvarnim skupovima. Prikaz rezultata i dokumentiranje. Integracija podataka iz različitih izvora. Ispravljanje nekonzistentnih podataka.
- Dohvaćanje podataka s weba. Analiza različitih web izvora. Transformacija i obrada podataka.
- Primjena jezika za manipulaciju podacima. Organizacija podataka prema vrstama podataka. Transponiranje podataka. Usklađivanje podataka. Izvoz podataka.
- Validacija i verifikacija podataka. Tehnike za očuvanje točnosti i dosljednosti podataka. Metode za efektivno izvještavanje i prezentaciju podataka. Napredne tehnike vizualizacije podataka.
Ishodi učenja
- Objasniti osnovna načela analize, obrade i vizualizacije podataka.
- Primijeniti tehnike i alate za čišćenje, transformaciju, analizu, obradu i vizualizaciju podataka te preporučiti odgovarajuće alate.
- Identificirati odgovarajuće izvore podataka i interpretirati rezultate analize za donošenje informiranih odluka.
- Sintetizirati vizualizacije dobivene postupcima analize i obrade podataka.
- Obrazložiti svrhu i načine primjene alata za analizu podataka u različitim područjima primjene.
Metode podučavanja
Predavanja
Vježbe
e-učenje
Metode ocjenjivanja
Dodatna pojašnjenja (kriteriji ocjenjivanja):
Pohađanje nastave: Na predavanjima i vježbama se provjerava prisustvo studenata. Studenti su dužni prisustvovati najmanje 75% nastavnih sati.
Vježbe: Na vježbama se rješavaju praktični zadaci koji prate predavanja.
Pisani i usmeni ispit: Svaki student je obavezan pristupiti pisanom ispitu ili pisati 2 kolokvija. Svi bodovi (pisani ispit/usmeni ispit/vježbe) su ravnopravni te ulaze u konačnu ocjenu. Na svim rokovima se piše cijeli pisani ispit. Ocjena kontinuiranog praćenja se temeljem ostvarenih bodova oblikuje prema sljedećoj skali:
50 - 64 % = dovoljan (2)
65 – 77 % = dobar (3)
78 – 88 % = vrlo dobar (4)
89 – 100 % = odličan
Da ostvari pravo pristupanja ispitu (potpis), student/ica mora:
1. pohađati nastavu
2. izraditi i predati vježbe (minimalno 50%)
Da položi kolegij, student/ica mora:
1. pohađati nastavu
2. izraditi i predati vježbe (minimalno 50%)
3. položiti pisani i usmeni ispit
Obavezna literatura
- Winston W., Microsoft Excel Data Analysis and Business Modeling (Office 2021 and Microsoft 365), 7th Edition, Microsoft, 2021.
- Wilde M., Verborgh R., Open Refine, PACKT, 2013.
- Kusleika, D. Data Visualization with Excel Dashboards and Reports, 2021.. ISBN: 978-1-119-69872-2
- Materijali s predavanja i vježbi
Dopunska literatura
- Nelson S., Excel Data Analysis, A Wiley Brand, 2014. Dostupno na: http://excelpro.ir/wp-content/uploads/2015/12/Excel-Data-Analysis-for-Dummies.pdf
- Rafter C., Ultimate Guide to Cleaning Data With Excel and Google sheets, inzata. Dostupno na: https://cdn.technologynetworks.com/tn/Resources/pdf/the-ultimate-guide-to-cleaning-data-with-excel-and-google-sheets-328002.pdf
- Krauth B., Introductory Statistics for Economics. Dostupno na: https://bookdown.org/bkrauth/BOOK/
- The Ultimate Guide: Basis Data Cleaning, Socialcops. Dostupno na: https://cdn2.hubspot.net/hubfs/2287011/ebook_data_cleaning/Free%20Ebook%20-%20The%20Ultimate%20Guide%20to%20Basic%20Data%20Cleaning.pdf