Elearning CORE Project

Psikolojik ölçek geliştirmede güvenirliğin değerlendirilmesi, ölçme araçlarının tutarlılığını ve istikrarını sağlamak için kritik bir adımdır. Güvenilirliği değerlendirmek için çeşitli yöntemler ve istatistiksel endeksler kullanılır; en yaygın kullanılan yöntemlerden ikisi Cronbach alfa ve test-tekrar test güvenilirliğidir. Ek olarak, paralel formların güvenilirliği, değerlendiriciler arası güvenilirlik ve iki yarının güvenilirliği de psikolojik ölçeklerin güvenilirliğini ölçmek için gerekli tekniklerdir.

» Cronbach'ın Alfası

Cronbach alfa, iç tutarlılık güvenilirliğinin yaygın olarak tanınan ve kullanılan bir ölçüsüdür (Nunnally ve Bernstein, 1994). İç tutarlılık güvenirliği, bir ölçekteki maddelerin birbirleriyle ne kadar iyi korelasyon gösterdiğinin değerlendirilmesine odaklanır. Yüksek Cronbach alfa değerleri, maddelerin sürekli olarak aynı temel yapıyı ölçtüğünü gösterir; bu da özelliğin doğru ve güvenilir bir şekilde ölçüldüğünü kanıtlar. Tersine, düşük bir Cronbach alfa değeri, maddelerin sürekli olarak aynı yapıyı ölçmediğini ya da bazı maddelerin gözden geçirilmesi ya da kaldırılması gerektiğini gösterir.

Cronbach's alfa, bir ölçek içindeki maddeler arasındaki karşılıklı ilişkiler temel alınarak hesaplanır. Cronbach's alfa formülü, 0 ile 1 arasında bir değer verir ve daha yüksek bir değer, daha büyük iç tutarlılığı gösterir. Genellikle, 0.70 veya daha yüksek bir Cronbach's alfa değeri kabul edilebilir olarak değerlendirilirken, 0.80'in üzerindeki bir değer arzu edilir (Nunnally & Bernstein, 1994). Araştırmacılar ve test geliştiriciler, maddelerin birbirleriyle güçlü bir şekilde ilişkili olduğunu ve dolayısıyla ölçek içinde yüksek düzeyde iç tutarlılığı gösterdiğini kanıtlamak için yüksek bir alfa değeri hedefler.

Cronbach's alfa, bir ölçeğin iç tutarlılığına ilişkin güvenilirliğini değerlendirmek için sağlam ve verimli bir yol sağlar. Bu yöntem, diğer maddelerle iyi korelasyon göstermeyen maddeleri tanımlamada ve dolayısıyla potansiyel revizyonlar veya ölçekten çıkarılma için daha yakından incelenmesi gereken maddeleri belirlemede değerli bir yöntemdir.

» Test-Tekrar Test Güvenilirliği

Test-tekrar test güvenilirliği, puanların zaman içindeki istikrarını değerlendirir. Test-tekrar test güvenilirliğini değerlendirmek için bir grup kişiye aynı ölçek iki ayrı zamanda uygulanır ve iki uygulamadan alınan puanlar ilişkilendirilir. İki puan seti arasındaki yüksek korelasyonlar, ölçeğin zaman içinde istikrarlı olduğunu göstermektedir (Streiner ve Norman, 2008).

Bununla birlikte, test-tekrar test güvenilirliğini değerlendirirken iki uygulama arasındaki süre çok önemli bir husustur. Aralık çok kısaysa bireyler önceki yanıtlarını hatırlayabilir ve bu da güvenirlik katsayılarının yapay olarak şişirilmesine yol açar. Öte yandan, aralık çok uzunsa bireysel özellikler veya dış faktörler değişebilir ve bu da iki test uygulaması arasındaki korelasyonun azalmasına neden olabilir. Test uygulamaları arasında uygun bir aralığın seçilmesinde dengenin sağlanması, güvenilir ve anlamlı sonuçlar elde etmenin anahtarıdır. Araştırmacıların, testler arasındaki en uygun zaman dilimini belirlerken, ölçülen spesifik yapının yanı sıra pratik ve etik hususları da dikkate alması gerekir.

Test-tekrar test güvenilirliği, psikolojik özelliklerin veya zaman içinde sabit kalması beklenen niteliklerin değerlendirilmesi için özellikle önemlidir. Örneğin, zekâ veya kişilik özellikleri gibi özellikler, tekrarlanan testlerde tutarlı sonuçlar göstermelidir. Test-tekrar test güvenilirliği sağlandığında araştırmacılar, belirli bir zaman dilimi boyunca ölçülen yapının stabilitesini güvenle yorumlayabilirler.

» Paralel Formların Güvenilirliği

Paralel form güvenirliği, diğer adıyla alternatif form güvenirliği, aynı testin iki paralel formunun bir grup bireye uygulanmasını içerir. Bu iki form, içerik, zorluk ve ölçüm açısından eşdeğer olmalıdır (Crocker ve Algina, 1986). Her iki form da uygulandıktan sonra, iki formda elde edilen puanların korelasyon değerleri hesaplanır. Yüksek korelasyonlar, her iki formun da aynı yapının güvenilir ölçümleri olduğunu gösterir.

Paralel form güvenirliği, aynı testin tekrar tekrar uygulanmasıyla ilişkili pratik veya bellek etkilerini en aza indirme ihtiyacı olduğunda özellikle yararlıdır. Bu yöntem, eğitim değerlendirmeleri, klinik testler veya aynı madde setiyle tekrarlanan testlerin uygulanmasının pratik olmadığı ya da önyargılı sonuçlara yol açma olasılığının bulunduğu herhangi bir bağlamda sıklıkla kullanılır.

Örneğin, eğitimsel değerlendirmede, hafızanın veya uygulamanın sonuçlar üzerindeki etkisini azaltmak için öğrencilere bir matematik testinin iki eşdeğer formu uygulanabilir. Araştırmacılar, her iki formda elde edilen puanları ilişkilendirerek, iki formun aynı matematiksel yeteneği ölçmede tutarlı olup olmadığını belirleyebilirler.

» Değerlendiriciler Arası Güvenilirlik

Değerlendirmede öznel yargının söz konusu olduğu durumlarda, değerlendiriciler arası güvenirlik değerli bir yöntemdir. Aynı içeriği veya davranışı değerlendiren iki veya daha fazla değerlendirici veya hakemin uyum derecesini değerlendirir. Yüksek değerlendiriciler arası güvenirlik, farklı değerlendiricilerin tutarlı değerlendirmeler ürettiğini ve bu yargıların farklı değerlendiriciler arasında genellenebilir olduğunu gösterir (Hallgren, 2012).

Değerlendiriciler arası güvenirlik psikoloji, tıp ve eğitim gibi çeşitli alanlarda subjektif değerlendirmelerin gerekli olduğu durumlarda yaygın olarak kullanılmaktadır. Örneğin, klinik bir ortamda, birden fazla sağlık uzmanı bir hastanın semptomlarını bağımsız olarak değerlendirebilir ve bunların değerlendirmeleri, tutarlı teşhisler ve tedavi planları sağlamak için değerlendiriciler arası yüksek güvenilirlik sergilemelidir.

Değerlendiriciler arası güvenilirliği sağlamak için farklı değerlendiriciler aynı içeriği veya davranışı değerlendirir ve daha sonra yargıları karşılaştırılır. Değerlendiriciler arasındaki anlaşma düzeyi, genellikle Cohen'in Kappa'sı veya sınıf içi korelasyon (aynı sınıfta veya kategoride) katsayıları gibi istatistiksel ölçümler kullanılarak ölçülür. Bu istatistikler araştırmacıların, değerlendiricilerin kararları arasındaki fikir birliğinin veya tutarlılığın derecesini ölçmelerine yardımcı olur.

» Yarıya Bölme Güvenilirliği

Yarıya bölme güvenirliği, bir ölçeğin iç tutarlılığını değerlendirmek için kullanılan bir yöntemdir. Bu yöntemde ölçek iki yarıya bölünür; genellikle ölçek, tek ve çift maddeler olarak ayrılır. Her yarının puanları daha sonra karşılaştırılarak ölçeğin güvenirliği değerlendirilir (Crocker & Algina, 1986). Spearman-Brown tahmin formülü de dahil olmak üzere çeşitli teknikler, her yarının daha kısa uzunluğunu dikkate alarak güvenirlik tahminini ayarlamak için kullanılabilir.

Bu yöntem, iki yarının puanları arasındaki korelasyona dayanarak ölçeğin güvenilirliğine ilişkin bir tahmin sağlar. Yarıya bölme güvenirliğinin ardındaki mantık, eğer bir ölçek sürekli olarak aynı yapıyı ölçüyorsa, iki yarıdan alınan puanların yüksek düzeyde korelasyona sahip olması gerektiğidir.

Örneğin, bir özsaygı ölçeğinin güvenirliğini değerlendiren bir çalışmada, ölçek iki yarıya bölünebilir ve tek numaralı maddelere verilen yanıtlar, çift numaralı maddelere verilen yanıtlarla karşılaştırılabilir. İki yarı arasındaki yüksek korelasyonlar, ölçeğin iyi bir iç tutarlılık güvenirliği gösterdiğini düşündürür.

Sonuç olarak, psikolojik ölçek geliştirmede güvenirliği belirlemek için kullanılan yöntemler, ölçümlerin doğruluğunun ve tutarlılığının belirlenmesinde önemli rol oynamaktadır. Cronbach alfa, test-tekrar test güvenilirliği, paralel form güvenilirliği, değerlendiriciler arası güvenilirlik ve iki yarı güvenilirliğini içeren bu yöntemler, araştırmacılara güvenilirliğin farklı yönlerini değerlendirmek için değerli kanıtlar sunar. Bu teknikleri kullanarak araştırmacılar, psikolojik ölçeklerinin tutarlı bir şekilde güvenilir ve doğru sonuçlar vermesini sağlayabilir ve psikolojik değerlendirmelerin ve araştırmaların genel kalitesini ve etkinliğini artırabilir.

Modül 6: Güvenilirliğin Değerlendirilmesi

Güvenilirliği Ölçme Yöntemleri