Multivarijatna analiza podataka
ISVU: 266317•5 ECTS•Ljetni semestar
Osnovne informacije
- Organizacijska jedinica
- Centar za kognitivnu znanost
- Satnica
- Predavanja: 45 sati
- Auditorne vježbe: 15 sati
Nastavnici
Cilj
Multivarijatna analiza podataka čini jedan od osnovnih stupova znanosti o podacima i poopćenje je univarijatnih i bivarijatnih statističkih metoda. Multivarijatna analiza namijenjena je simultanoj analizi i vizualizaciji složenih skupova podataka sa velikim brojem nezavisnih i/ili zavisnih varijabli koje su u različitim stupnjevima međusobne koreliranosti, a njihovi se raznovrsni učinci ne mogu interpretirati zasebno. Sadržaj premeta grupiran je u tri cjeline. Prva cjelina sadrži osnovne pojmove i temeljne tehnike koje prethode samoj multivarijatnoj analizi, druga cjelina je vezana za različite naprednije regresijske tehnike i njihovo razumijevanje (s osvrtom na visokodimenzionalne podatke), a treća za tehnike temeljene na matričnim dekompozicijama (rastav na svojstvene vrijednosti i rastav na singularne vrijednosti). Cilj ovog predmeta je dati studentima pregled multivarijatnih metoda, omogućiti razumijevanje teorijskih osnova, razumijevanje mogućnosti primjene tih metoda, njihovih pretpostavki i ograničenja.
Sadržaj
- Cilj multivarijatne statističke analize. Podaci, objekti, varijable i skale (Stevensova klasifikacija). Klasificiranje multivarijantnih tehnika, Sažimanje, opisivanje i grafički prikaz multivarijatnih podataka.
- Manipuliranje podacima prije multivarijantne analize (izgubljeni podaci, outlier detekcija, transformacija podataka, standardizacija, normalnost, linearnost, homoscesivnost, homoegenost), Podaci koji su prikladni za multivarijatnu analizu: podaci, korelacija, varijantna kovarijanca, suma kvadrata i unakrsnih proizvoda matrica, ostatak, udaljenosti (statistička i Mehalanobis).
- Geometrija uzorka i slučajno uzorkovanje.
- Primijenjena korelacijska i regresijska analiza, interpretacija i odnos prema analizi varijance (ANOVA).
- Diskriminantna analiza.
- Logistička regresija.
- Analiza glavnih komponenata.
- Međuispit.
- Eksploratorna faktorska analiza.
- Analiza grupiranja.
- Multidimenzionalno skaliranje.
- Analiza korespodencije.
- Analiza preživljenja.
- Lasso metoda za visoko-dimenzionalne podatke (Lasso za linearne modele. generalizirani linearni modeli i Lasso, grupni Lasso).
- Završni ispit.
Ishodi učenja
- Definirati glavne pojmove u multivarijantnoj analizi podataka
- Objasniti matematičke pozadine glavnih procedura u multivarijantnoj statistici
- Primijeniti linearnu višestruku regresijsku analizu
- Razlikovati analizu glavnih komponenti i faktorsku analizu
- Objasniti prikladnost različitih metoda multivarijantne statistike za različite probleme
- Objasniti rezultate multivarijantne analize podataka i objasniti njihovo praktično značenje
Metode podučavanja
Predavanja, Vježbe
Metode ocjenjivanja
Pohađanje nastave, Kolokvij, Pismeni ispit
Obavezna literatura
- 1. Johnson, R. A., and D. W. Wichern, Applied Multivariate Statistical Analysis, 5th Edition, Prentice Hall (2002)
- 2. B.G. Tabachnick, L.S. Fidell, Using multivariate statistics, 6th Edition, Pearson (2018)