EN | PT | TR | RO | BG | SR
;


NEXT TOPIC

Modul 5. ANOVA, MANOVA, ANCOVA, MANCOVA, T-test, korelaciona i regresiona analiza




SADRŽAJ JEDINICE




I pored toga što generalizovani linearni model (GLM) olakšava primenu regresionih modela, u praksi se prost GLM prvenstveno koristi pril analizi varijanse (ANOVA) i analizi kovarijanse (ANCOVA) (Rutherford, 2011, str. 1-2). S druge strane, višestruki GLM se prvenstveno koristi pri višestrukoj analizu varijanse (MANOVA) i višestrukoj analizu kovarijanse (MANCOVA) (Huberti & Petoskei, 2000). U programskom paketu SPSS, višestruki GLM predstavlja poseban modul, dok se u programskom paketu SAS sprovodi u okviru PROC GLM preko naredbe MANOVA.

ANOVA je statistička tehnika koja se koristi za ispitivanje glavnih efekata i efekata interakcije kategorijskih nezavisnih varijabli (koji se nazivaju „faktori") na neprekidnu, zavisnu varijablu (Vest et al., 1996). Pomoću nje se ispituje se da li se srednje vrednosti grupa formiranih na osnovu različitih vrednosti nezavisnih promenljivih značajno razlikuju. ANOVA omogućava otkrivanje kako glavnih efekata (direktan efekat nezavisne varijable na zavisnu varijablu) tako i efekata interakcije (kombinovani efekat dve ili više nezavisnih varijabli). Za razliku od regresionih modela, koji zahtevaju eksplicitno dodavanje interakcije, ANOVA sama po sebi detektuje efekte interakcije (Jaccard, 1998). U slučaju više zavisnih varijabli, višestruki GLM primenjuje tehniku MANOVA, koja u analizu može da uvrsti kontrolne varijable kao kovarijate (MANCOVA).

Ključna statistika prilikom primene tehnike ANOVA je F-test, koji procenjuje da li su razlike između srednjih vrednosti grupa dovoljno statisički značajne da se može smatrati da nisu rezultat slučajnosti (Tian etal., 2018, str. 61). Ako se srednje vrednosti grupa ne razlikuju značajno, to znači da nezavisna varijabla nije imala značajan uticaj na zavisnu varijablu. Međutim, ako F-test ukazuje na značajan odnos između nezavisne varijable i zavisne varijable, mogu se sprovesti testovi višestrukog poređenja da bi se utvrdilo koje konkretne vrednosti nezavisne varijable najviše doprinose ovakvom odnosu.

Važno je napomenuti da ANOVA testira nultu hipotezu da su srednje vrednosti grupa jednake, a ne da su varijanse jednake. Međutim, ANOVA podrazumeva da postoji relativna homogenost varijansi, što znači da grupe koje su formirane na osnovu nezavisnih promenljivih imaju slične varijanse u odnosu na zavisnu promenljivu. Homogenost varijanse se može odrediti pomoću testova kao što je Leveneov test (Levene, 1960). Slično regresiji, ANOVA je parametarska procedura koja podrazumeva multivarijantnu normalnost zavisne varijable za svaku kategoriju vrednosti nezavisne varijable (Dattalo, 2013, str. 14).

ANCOVA se, s druge strane, koristi za testiranje glavnih efekata i efekata interakcije kategorijskih varijabli na neprekidnu, zavisnu varijablu istovremeno kontrolišući efekte odabranih neprekidnih varijabli koje kovariraju sa zavisnom promenljivom (Ankarali et al, 2018, str. 283). Ovi kovarijati, poznati i kao kontrolne varijable, mogu se koristiti za predviđanje zavisne varijable pomoću regresione analize. ANCOVA zatim sprovodi tehniku ANOVA na rezidualima (predviđene minus stvarne zavisne varijable) da bi se utvrdilo da li su faktori i dalje značajno povezani sa zavisnom varijablom nakon što se uračuna varijansa objašnjena kovarijatima. ANCOVA ima tri svrhe:

1) u kvazi-eksperimentalnom nacrtu pomaže pri uklanjanju efekata varijabli koje modifikuju odnos između kategorijskih nezavisnih varijabli i intervalne zavisne varijable;

2) u eksperimentalnim nacrtima kontroliše faktore koji se ne mogu randomizirati, ali se mogu izmeriti na intervalnoj skali; i

3) u regresionim modelima, prihvata prisustvo i kategorijskih i intervalnih nezavisnih varijabli.

Sve tri svrhe primene tehnike ANCOVA imaju za cilj smanjenje greške u modelu. ANCOVA se može posmatrati kao analize tipa „šta ako“, koja ispituje šta bi se desilo kada bi svi slučajevi imali iste vrednosti kovarijata, pri čemu dozvoljava da se isključe efekti onih faktora koji su izvan uticaja kovarijata. Tehnika ANCOVA se primenljuje u različitim nacrtima tehnike ANOVA, a pretpostavke o homogenosti varijansi i multivarijantnoj normalnosti važe i za nju.

Važno je razlikovati GLM od drugih tipova modela, kao što su generalizovani linearni modeli koji uključuju funkcije nelinearne veze (GZLM), linearni mešoviti modeli, koji manipilišu podacima na više nivoa (LMM) i generalizovani linearni mešoviti modeli, koji kombinuju funkcije nelinearne veze sa LMM (GLMM). SPSS takođe nudi analizu komponenti varijanse (VC), koja predstavlja podskup LMM i ima sličnu ulogu kao ANOVA u okviru GLM. Poređenje između GLM, LMM i VC, zajedno sa prikazom podataka, objašnjeno je u odeljku o linearnim mešovitim modelima. Iako i GLM i LMM dozvoljavaju uključivanje nasumičnih efekata u modele, LMM je generalno poželjniji kada su nasumični efekti prisutni, kao što je objašnjeno u delu posvećenom poređenju.





















Ankarali, H., Cangur, S., & Ankarali, S. (2018). A new Seyhan’s approach in case of heterogeneity of regression slopes in ANCOVA. Interdisciplinary Sciences: Computational Life Sciences, 10, 282-290.

Dattalo, P. (2013). Analysis of multiple dependent variables. Oxford University Press.

Gogtay, N. J., & Thatte, U. M. (2017). Principles of correlation analysis. Journal of the Association of Physicians of India, 65(3), 78-81.

Huberty, C. J., & Petoskey, M. D. (2000). Multivariate analysis of variance and covariance. In H. E. A. Tinsley and S. D. Brown (Eds.), Handbook of applied multivariate statistics and mathematical modeling (pp. 183-208). Academic Press.

Huberty, C. J., & Olejnik, S. (2006). Applied MANOVA and discriminant analysis. John Wiley & Sons.

Jaccard, J. (1998). Interaction effects in factorial analysis of variance (No. 118). Sage.

Kim, H. Y. (2013). Statistical notes for clinical researchers: assessing normal distribution (2) using skewness and kurtosis. Restorative Dentistry & Endodontics, 38(1), 52.

Kim, T. K. (2015). T test as a parametric statistic. Korean Journal of Anesthesiology, 68(6), 540.

Leech, N., Barrett, K., & Morgan, G. A. (2013). SPSS for intermediate statistics: Use and interpretation. Routledge.

Levene, H. (1960) Robust tests for equality of variances. In I. Olkin (Ed.), Contributions to probability and statistics (pp. 278-292). Stanford University Press.

Liu, Q., & Wang, L. (2021). t-Test and ANOVA for data with ceiling and/or floor effects. Behavior Research Methods, 53(1), 264-277.

Livingston, E. H. (2004). Who was student and why do we care so much about his t-test? 1. Journal of Surgical Research, 118(1), 58-65.

Rawlings, J. O., Pantula, S. G., & Dickey, D. A. (Eds.). (1998). Applied regression analysis: a research tool. Springer.

Razali, N. M., & Wah, Y. B. (2011). Power comparisons of shapiro-wilk, kolmogorov-smirnov, lilliefors and anderson-darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21-33.

Rutherford, A. (2011). ANOVA and ANCOVA: a GLM approach. John Wiley & Sons.

Tian, C. H. E. N., Manfei, X. U., Justin, T. U., Hongyue, W. A. N. G., & Xiaohui, N. I. U. (2018). Relationship between Omnibus and Post-hoc Tests: An investigation of performance of the F test in ANOVA. Shanghai Archives of Psychiatry, 30(1).

Uyanık, G. K., & Güler, N. (2013). A study on multiple linear regression analysis. Procedia-Social and Behavioral Sciences, 106, 234-240.

West, S. G., Aiken, L. S., & Krull, J. L. (1996). Experimental personality designs: Analyzing categorical by continuous variable interactions. Journal of Personality, 64(1), 1-48.

Westfall, P. H., & Henning, K. S. (2013). Understanding advanced statistical methods (Vol. 543). Boca Raton, FL: CRC Press.

Digital Source: https://www.mathsisfun.com/data/standard-normal-distribution.html (Accessed: 01.06.2023)