EN | PT | TR | RO | BG | SR
;


NEXT TOPIC

1.7 Regresyon Analizi




Regresyon Analizi


Regresyon analizi, bağımlı bir değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiyi incelemek için kullanılan istatistiksel bir yöntemdir (Uyanık & Güler, 2013: 234). Bu yöntem, veriye bir regresyon modeli uyarlama ve değişkenler arasındaki ilişkiyi temsil eden katsayıları tahmin etme kavramına dayanır.

Regresyon analizinin teorik temeli, değişkenler arasındaki doğrusal ilişki kavramına dayanır. Doğrusal regresyon, bağımsız değişkenler ile bağımlı değişken arasında doğrusal, eklemeli bir ilişki olduğunu varsayar. Bu, bağımsız değişkenlerin bağımlı değişken üzerindeki etkisinin bir saçılım grafiğinde düz bir çizgi ile temsil edilebileceği anlamına gelir.

Regresyon analizinin amacı, veriye en iyi uyan doğrusal denklemin parametrelerini (katsayılarını) tahmin etmektir. En yaygın doğrusal regresyon biçimi, bir bağımlı değişken ve bir bağımsız değişken içeren basit doğrusal regresyon olarak adlandırılır. Basit doğrusal regresyonun denklemi:

       Y = β0 + β1X + ε

(2)

 

Burada YYY bağımlı değişken, XXX bağımsız değişken, β0\beta_0β0 y-kesişim noktası (X sıfır olduğunda Y'nin değeri), β1\beta_1β1 eğim (X'teki bir birimlik değişim için Y'deki değişim) ve ε\varepsilonε hata terimi (model tarafından açıklanamayan değişkenlik veya rastgelelik) anlamına gelir.

Katsayılar β0\beta_0β0 ve β1\beta_1β1, Gelişigüzel En Küçük Kareler (OLS) yöntemi kullanılarak tahmin edilir, bu yöntem bağımlı değişkenin gözlemlenen değerleri ile regresyon denklemi temel alınarak tahmin edilen değerler arasındaki kare farklarının toplamını en aza indirir (Rawlings ve diğerleri, 1998: 2-4).

Çoklu doğrusal regresyon, basit doğrusal regresyon kavramını birden fazla bağımsız değişkeni içerecek şekilde genişletir. Denklem şu şekilde olur:

 

              Y = β0 + β1X1 + β2X2 + ... + βnXn + ε

(3)

 

burada X1, X2, ..., Xn bağımsız değişkenlerdir ve β1, β2, ..., βn karşılık gelen katsayılardır.

Varsayım, bağımlı değişkenin veri noktalarının (Y ile gösterilen), rastgele değişkenlerin popülasyonlarından rastgele örnekler olarak kabul edilmesidir ve her popülasyonun ortalaması Y ile temsil edilir. Bir gözlem YYY ile popülasyon ortalaması YYY arasındaki farkı dahil etmek için, istatistiksel modele rastgele bir hata eklenir (Rawlings ve diğerleri, 1998: 2).

Regresyon analizi, verilere en iyi uyumu sağlayan ve bağımsız değişkenlere dayalı olarak bağımlı değişkeni tahmin etmeye olanak tanıyan katsayıları (β0,β1,β2,...,βn\beta_0, \beta_1, \beta_2, ..., \beta_nβ0,β1,β2,...,βn) tahmin etmeyi amaçlar. Bu katsayılar, değişkenler arasındaki ilişkinin yönünü ve büyüklüğünü gösterir. Pozitif bir katsayı, pozitif bir ilişkiyi (bağımsız değişken arttıkça, bağımlı değişken de artar) öngörürken, negatif bir katsayı negatif bir ilişkiyi öngörür.

Ayrıca, regresyon analizi, katsayıların istatistiksel anlamlılığını değerlendirmek ve hipotez testi yapmayı sağlar. t-testleri veya F-testleri gibi hipotez testleri, katsayıların sıfırdan anlamlı şekilde farklı olup olmadığını değerlendirerek, değişkenler arasında anlamlı bir ilişki olup olmadığını gösterir.

Genel olarak, regresyon analizi, değişkenler arasındaki ilişkiyi anlama ve niceliklendirme, katsayıları tahmin etme ve regresyon denklemi temelinde tahminler yapma konusunda istatistiksel bir çerçeve sağlar. Bağımlı değişkeni etkileyen anahtar faktörlerin belirlenmesine olanak tanır ve verilerdeki desenler ve içgörüler ortaya çıkarır.

 

Örnek 1: Özelliklere Göre Ev Fiyatlarını Tahmin Etme

Bir emlakçı olduğunuzu ve ev fiyatlarını, evin boyutu, yatak odası sayısı, konum ve mülkün yaşı gibi çeşitli özelliklere dayanarak tahmin etmek istediğinizi varsayalım. Yakın zamanda satılan evler hakkında bu özellikler ve karşılık gelen satış fiyatları hakkında veri toplarsınız.

Verileri regresyon analizi kullanarak analiz etmek için, çoklu doğrusal regresyon modeli kullanırsınız. Ev fiyatını bağımlı değişken olarak ve ev özelliklerini (boyut, yatak odası sayısı, konum, yaş) bağımsız değişkenler olarak ele alırsınız. Regresyon analizi, bağımsız değişkenler ile bağımlı değişken arasındaki ilişkiyi tahmin etmenize olanak tanır, her bir özelliğin ev fiyatlarındaki değişime nasıl katkıda bulunduğunu anlamanızı sağlar. Regresyon katsayılarını, her bir bağımsız değişkenin ev fiyatları üzerindeki etkisinin yönünü ve büyüklüğünü anlamak için yorumlayabilirsiniz.

Örnek 2: Çalışma Süresi ile Sınav Puanları Arasındaki İlişkinin İncelenmesi

Diyelim ki, öğrencilerin ders çalışma süreleri ile sınav puanları arasındaki ilişkiyi araştırmak istiyorsunuz. Bir grup öğrenciden, ders çalışma saatlerini ve buna karşılık gelen sınav puanlarını kaydederek veri topluyorsunuz.

Verileri regresyon analizi kullanarak analiz etmek için, basit doğrusal regresyon modeli kullanırsınız. Sınav puanını bağımlı değişken ve ders çalışma süresini bağımsız değişken olarak ele alırsınız. Regresyon analizi, regresyon doğrusunun eğimini ve kesişimini tahmin etmenizi sağlar; bu, her ek çalışma saatine karşılık gelen sınav puanındaki ortalama değişimi temsil eder. Belirleme katsayısını (R-kare değeri) inceleyerek, sınav puanlarındaki değişkenliğin ne kadarının ders çalışma süresi değişkeni tarafından açıklanabileceğini belirleyebilirsiniz.

Her iki örnekte de, regresyon analizi, bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiyi anlamanızı sağlar. Katsayıları tahmin etmenize ve ilişkilerin önemini değerlendirmenize olanak tanır, böylece tahminlerde bulunabilir ve bağımsız değişkenlerin bağımlı değişken üzerindeki etkisini anlayabilirsiniz.