EN | PT | TR | RO | BG | SR
;


NEXT TOPIC

SADRŽAJ JEDINICE




POGLAVLJE 8. Regresiona analiza




Rezime:

Upoznavanje sa regresionom analizom, njenom svrhom, osnovnim konceptima i vrstama.

 

Ciljevi učenja:

Razumevanje koncepta regresione analize i njene primene u modeliranju povezanosti među varijablama.

Sticanje znanja o različitim vrstama regresione analize, uključujući prostu linearnu regresiju i višestruku regresiju.

Upoznavanje sa situacijama u kojima se može koristiti regresiona analiza i sa načinom za efikasno tumačenje dobijenih rezultata.



Regresiona analiza je statistička metoda koja se koristi za ispitivanje odnosa između zavisne varijable i jedne ili više nezavisnih varijabli (Uianık & Guler, 2013, str. 234). Zasniva se na konceptu podešavanja regresionog modela podacima i utvrđivanja koeficijenata koji predstavljaju odnos između varijabli.

Teorijska pozadina regresione analize zasniva se na konceptu linearne povezanosti varijabli. Linearna regresija pretpostavlja da postoji linearna povezanost između nezavisnih varijabli i zavisne varijable. To znači da se efekat nezavisnih varijabli na zavisnu varijablu može predstaviti pravom linijom u dijagramu rasejanja.

Cilj regresione analize je određivanje parametara (koeficijenata) linearne jednačine koja najbolje odgovara podacima. Najčešći oblik linearne regresije naziva se prosta linearna regresija i ona obuhvata jednu zavisnu promenljivu i jednu nezavisnu promenljivu. Jednačina za prostu linearnu regresiju je:

 

       Y = β0 + β1X + ε

(2)

 

gde je Y zavisna varijabla, X je nezavisna varijabla, β0 je y-presek (vrednost Y kada je X jednako 0), β1 je nagib (promena u β kada se X promeni za jednu jedinicu), a ε je termin greške (koji predstavlja varijabilnost ili slučajnost koja nije objašnjena modelom).

Koeficijenti β0 i β1 se uvrđuju primenom metode koja se naziva Obični najmanji kvadrati (OLS), a koja minimizira zbir kvadrata razlika između posmatranih vrednosti zavisne varijable i vrednosti predviđenih na osnovu regresione jednačine (Ravlings et al., 1998, str. 2-4).

Višestruka linearna regresija proširuje koncept proste linearne regresije na više od jedne nezavisne promenljive. Jednačina glasi:

 

              Y = β0 + β1X1 + β2X2 + ... + βnXn + ε

(3)

 

gde su X1, X2, ..., Xn nezavisne promenljive, a β1, β2, ..., βn su odgovarajući koeficijenti.

Pretpostavka od koje se polazi je da se tačke podataka zavisne varijable, označene kao Y, smatraju slučajnim uzorcima iz populacija slučajnih varijabli, gde je prosek svake populacije predstavljen sa Y. Da bi se obuhvatila razlika između posmatranja Y i proseka njegove populacije Y, slučajna greška se uvodi u statistički model (Ravlings et al., 1998, str. 2).

Regresiona analiza ima za cilj da utvrdi koeficijente (β0, β1, β2, ..., βn) koji najbolje odgovaraju podacima i omogućavaju predviđanje zavisne varijable na osnovu nezavisnih varijabli. Ovi koeficijenti ukazuju na pravac i veličinu veze između varijabli. Pozitivan koeficijent ukazuje na pozitivnu vezu (kako se nezavisna varijabla povećava, zavisna varijabla ima tendenciju povećanja), dok negativan koeficijent ukazuje na negativnu vezu.

Pored toga, regresiona analiza omogućava testiranje hipoteza i procenu statističke značajnosti koeficijenata. Testovi hipoteza kao što su t-testovi ili F-testovi se koriste da bi se utvrdilo da li se koeficijenti značajno razlikuju od nule, što ukazuje na smislenu vezu između varijabli.

Sve u svemu, regresiona analiza pruža statistički okvir za razumevanje i kvantifikaciju odnosa između varijabli, utvrđivanje koeficijenata i za predviđanje na osnovu regresione jednačine. Omogućava otkrivanje ključnih faktora koji utiču na zavisnu varijablu i pomaže u otkrivanju obrazaca unutar podataka.

Primer 1: Predviđanje cena kuća na osnovu njihovih karakteristika

Pretpostavimo da ste agent za nekretnine i želite da predvidite cene kuća na osnovu različitih karakteristika, kao što su: veličina kuće, broj spavaćih soba, lokacija i starost. Prikupljate podatke o nedavno prodatim kućama, uključujući informacije o ovim karakteristikama i odgovarajućim prodajnim cenama.

Da biste izvršili analizu podataka pomoću regresione analize, koristite model višestruke linearne regresije. Cenu kuće posmatrate kao zavisnu varijablu, a karakteristike kuće (veličina, broj spavaćih soba, lokacija, starost) kao nezavisne varijable. Regresiona analiza omogućava da procenite odnos između nezavisnih varijabli i zavisne varijable, pružajući uvid u to kako svaka karakteristika doprinosi varijacijama u ceni kuća. Možete analizirati koeficijente regresije da biste razumeli pravac i jačinu efekta svake nezavisne varijable na cenu kuća.

Primer 2: Ispitivanje veze između vremena učenja i rezultata na ispitu

Recimo da želite da istražite odnos između količine vremena koje studenti provode učeći i njihovih rezultata na ispitima. Prikupljate podatke od grupe studenata, beležeći broj sati koje provode učeći i njihove rezultate na ispitima.

Da biste izvršili analizu podataka pomoću regresione analize, koristite prost model linearne regresije. Rezultate ispita biste tretirali kao zavisnu promenljivu, a vreme učenja kao nezavisnu varijablu. Regresiona analiza omogućava da se procene nagib i presek linije regresije, koji predstavlja prosečnu promenu rezultata ispita povezanu sa svakim dodatnim satom učenja. Ispitivanjem koeficijenta determinacije (vrednost R-kvadrata) možete odrediti proporciju varijabilnosti u rezultatima ispita, koja se može objasniti varijablom vreme učenja.

U oba primera, regresiona analiza omogućava da se razume odnos između zavisne promenljive i jedne ili više nezavisnih promenljivih. Pomaže da se utvrde koeficijenti i proceni značaj povezanosti, omogućavajući predviđanje i razumevanje uticaja nezavisnih promenljivih na zavisnu promenljivu.