Normalnosti je jedna od najvažnijih pretpostavki u analizi tipa ANOVA. Dakle, važno je proveriti da li svaka varijabla uključena u analizu ima normalnu distribuciju.
Postoji nekoliko mera i indikatora koje se mogu koristiti za proveru pretpostavke o normalnosti.
- Mogu se pregledati statistika asimetrije (engl. skewness) i spljoštenosti (engl. kurtosis), vrednosti i rezultati Z-testa.
- Mogu se koristiti Kolmogorov-Smirnov (KS test) i Šapiro-Vilkov test (Razali & Vah, 2011).
- Može se pregledati histogram ili bilo koji drugi grafikon.


Oba testa polaze od nulte hipoteze da su podaci normalno raspoređeni. Dakle, p-vrednosti treba da budu veće od 0,05 da bi se nulta hipoteza mogla prihvatiti. Međutim, ako je veličina uzorka veća od 300, treba uzeti u obzir vrednosti asimetrije i spljoštenosti.
Provežbajmo proveru normalnosti!
Odberite: cross_sell.sav
Kliknite na dugme Analyze na meniju na vrhu ekrana. Zatim idite na Descriptive Statistics i kliknite na dugme Explore.
Odaberite sledeće varijable i prebacite ih na listu zavisnih varijabli:
Special offer purchases [buyoff] (Kupovina po posebnoj ponudi)
CD purchases [buycd] (Kupovina CD-ova)
Book purchases [buybk] (Kupovina knjiga)
CD club discount [disccd] (Popust CD kluba)
Book club discount [discbk] (Popust kluba knjiga)
Log of CD club discount [lndisccd] (Evidencija popusta CD kluba)
Log of Book club discount [lndiscbk] (Evidencija popusta kluba knjiga)

Zatim kliknite na dugme Plots na meniju sa desne strane.
Odaberite Histogram u odeljku Descriptive i izaberite opciju Normality plots with tests. Potom kliknite na Continue.

Na glavnom meniju kliknite OK da bi se testovi izvršili i da biste videli rezultate:

Posmatranje deskriptivne statistike po varijablama:
Varijabla: Special offer purchases (Kupovina po posebnoj ponudi)
Simetrija: Statistik: 0,01 Standardna greška: 0,243 – vrednost Z-Testa: 0,01 / 0,243 = 0,041
Spljoštenost: Statistik: -0,313 Standardna greška: 0,481 – vrednost Z-Testa: -0,313 / 0,481 = -0,65
Varijabla: CD purchases (Kupovina Cd-ova)
Simetrija: Statistik: 0,237 Standardna greška: 0,243 – vrednost Z-Testa: 0,237 / 0,243 = 0,975
Spljoštenost: Statistik: 0.099 Standardna greška: 0.481 – vrednost Z-Testa: 0.099 / 0.481 = 0.203
Varijabla: Book purchases(Kupovina knjiga)
Simetrija: Statistik: -0,194 Standardna greška: 0,243 – vrednost Z-Testa: -0,194 / 0,243 = -0,798
Spljoštenost: Statistik: -0,177 Standardna greška: 0,481 – vrednost Z-Testa: -0,177 / 0,481 = -0,368
Varijabla: CD club discount (Popust CD kluba)
Simetrija: Statistik: 0,615 Standardna greška: 0,243 – vrednost Z-Testa: 0,615 / 0,243 = 2,53
Spljoštenost: Statistik: -0,778 Standardna greška: 0,481 – vrednost Z-Testa: -0,778 / 0,481 = -1,617
Varijabla: Book club discount (Popust kluba knjiga)
Simetrija: Statistik: 0,682 Standardna greška: 0,243 – vrednost Z-Testa: 0,682 / 0,243 = 2,81
Spljoštenost: Statistik: -0,425 Standardna greška: 0,481 – vrednost Z-Testa: -0,425 / 0,481 = -0,88
Varijabla: Log of CD club discount (Evidencija popusta CD kluba)
Simetrija: Statistik: -0,332 Standardna greška: 0,243 – vrednost Z-Testa: -0,332 / 0,243 = -1,37
Spljoštenost: Statistik: -1,095 Standardna greška: 0,481 – vrednost Z-Testa: -1,095 / 0,481 = -2,28
Varijabla: Log of Book club discount ((Evidencija popusta kluba knjiga)
Simetrija: Statistik: -0,407 Standardna greška: 0,243 – vrednost Z-Testa: -0,407 / 0,243 = -1,674
Spljoštenost: Statistik: -0,870 Standardna greška: 0,481 – vrednost Z-Testa: -0,870 / 0,481 = -1,808
Pošto je veličina uzorka za svaku varijablu 99, vrednosti Z-testa mogu se svrstati u opseg od -3.29 do +3.29. Stoga se može reći da kod svih varijabli postoji normalna distribucija.
Međutim, potrebno je sagledati i rezultate testa normalnosti. Rezultati Kolmogorov-Smirnovog i Šapiro-Vilkovog testa pokazuju da su varijable Kupovina po posebnoj ponudi, Kupovina CD-ova i Kupovina knjiga normalno distribuirane jer su njihove vrednosti značajnosti (Sig./p-vrednost) veće od 0,05. Za ostale varijable nulta hipoteza se mora odbaciti. Kada se uporede vrednosti ovih testova, bez obzira na različite p-vrednosti, rezultati su usaglašeni.

Distribucija se može proveriti i pomoću histograma varijabli. Na slici ispod dat je primer savršene normalnosti distribucije:


Pregledom histograma, može se videti da su histogrami prve tri varijable, za koje je potvrđena normalnost distribucije prema rezultatima testa normalnosti, sličniji primeru savršene normalne distribucije. Histogrami ostalih varijabli počinju sa visokom frekvencijom koja se postepeno smanjuje i/ili fluktuira.