Psikolojik ölçüm alanında geçerlilik kavramı, bir ölçeğin değerlendirmeyi amaçladığı psikolojik yapıları doğru bir şekilde ölçmesini sağlayan bir temel taşıdır. Bir aracın ölçmek istediği şeyi ölçtüğü dereceyi yansıtan ölçümün omurgasıdır. Güçlü bir geçerlilik temeli olmadan, psikolojik ölçümlerden elde edilen veriler, araştırma ve uygulamayı bilgilendirmek için gereken güvenilirlik ve uygunluktan yoksun olabilir. Bu temel konuyu ele almak için psikologlar, farklı amaçlara hizmet eden ve ölçme araçlarının kalitesine ilişkin ayrıntılı bilgiler sağlayan farklı geçerlilik türleri geliştirdiler. Bu kapsamlı inceleme içerik, kriter ve yapı geçerliliğini derinlemesine inceleyerek bunların tanımlarını, tarihsel gelişimlerini, çağdaş bakış açılarını ve pratik uygulamalarını ortaya koymaktadır. Bunların psikolojik araştırmalardaki önemini ve bunları değerlendirmek için kullanılan yöntemleri araştıracağız.
İçerik geçerliliği, bir psikolojik ölçekteki maddelerin, ölçüm için hedeflenen belirli yapıyı gerçekten, kapsamlı ve doğru bir şekilde temsil etme derecesidir (American Educational Research Association, American Psychological Association ve National Council on Measurement in Education, 2014). Daha basit bir ifadeyle, ölçekteki maddelerin yalnızca ilgili olmasını değil, aynı zamanda incelenen psikolojik özellik, davranış veya nitelikle de yakından uyumlu olmasını sağlar.
İçerik geçerliliği kavramının kökeni 20. yüzyılın başlarında eğitimsel ve psikolojik testlerin geliştirilmesine kadar uzanmaktadır. Önemi, ölçmeyi amaçladıkları içeriği temsil edecek test maddelerinin gerekliliğini vurgulayan E. L. Thorndike gibi eğitim psikologları tarafından kabul edildi. İçerik geçerliliği o zamandan beri gelişti ve klinik ve danışmanlık psikolojisinden eğitim ve endüstriyel-örgütsel psikolojiye kadar psikolojinin çeşitli alanlarında uygulamalar buldu.
İçerik geçerliliği, psikolojik ölçek geliştirmenin kritik bir bileşeni olmaya devam etmektedir. Ölçme teorisi ve teknolojisindeki gelişmelerle birlikte içerik geçerliliğini değerlendirme yöntemleri daha karmaşık ve sistematik hale geldi. Araştırmacılar, ölçeklerin ilgilenilen yapıları kapsamlı bir şekilde yakalamasını sağlamak için yaklaşımlarını sürekli olarak geliştiriyorlar.
İçerik geçerliliği, uzman incelemeleri, madde oluşturma ve İçerik Geçerlilik Oranı (CVR) gibi tekniklerle değerlendirilir. Uzman incelemeleri, ölçek maddelerinin konu bilgisine sahip, ilgililik, açıklık ve temsil edilebilirlik gibi faktörleri değerlendiren kişiler tarafından değerlendirilmesini içerir. CVR, maddenin uygunluğu konusunda uzman görüş birliğinin niceliksel bir ölçüsünü sağlar.
Benlik saygısı, iş tatmini veya kişilik özellikleri gibi çok yönlü yapıları kapsayan ölçüm ölçekleri geliştirirken içerik geçerliliği hayati önem taşır. Ölçeğin kapsamlılığını ve doğruluğunu sağlamak için araştırmacılar alandaki uzmanlarla etkileşime geçiyor, maddeleri hassaslaştırıyor ve KGO (Kapsam Geçerlik Oranı) puanlarını hesaplıyor. Yinelemeli süreç, maddelerin yapının temel öğelerinden etkili bir şekilde faydalanmasını garanti ederek ölçüm aracının kalitesini ve geçerliliğini artırır.
Kriter/ölçüt geçerliliği, bir psikolojik ölçeğin dış ölçütleri veya sonuçları ne ölçüde tahmin edebileceğini veya bunlarla ilişkilendirebileceğini değerlendirir. Yeni bir ölçekte elde edilen puanların, ölçülen yapı için bir kıyaslama görevi gören, köklü bir kriterden elde edilen puanlarla karşılaştırılmasını içerir.
Kriter geçerliliğinin gelişimi, Charles Spearman gibi öncülerin geçerliliğe yönelik istatistiksel yaklaşımların temelini attığı psikometrinin ilk günlerine dayanmaktadır. Kriter geçerliliği eğitimsel testlerde, klinik psikolojide ve endüstriyel organizasyon psikolojisinde önemli bir kullanım alanı bulmuştur.
Kriter geçerliliği, özellikle uygulamalı alanlarda önemli bir geçerlilik türü olmaya devam etmektedir. İstatistiksel tekniklerdeki ilerlemeler ve daha karmaşık kriter ölçümlerinin geliştirilmesi, kriter geçerliliğinin belirlenmesine yönelik yöntemleri geliştirmiştir.
Araştırmacılar kriter geçerliliğini eşzamanlı ve tahmine dayalı geçerlilik gibi yöntemlerle değerlendirir. Eşzamanlı geçerlilik, yeni ölçek ile yerleşik bir ölçüt ölçüsü arasındaki ilişkiyi aynı anda inceler. Tahmin geçerliliği, ölçeğin gelecekteki kriterleri veya sonuçları tahmin etme yeteneğini değerlendirir.
Kriter geçerliliği, araştırmacılar bir ölçüm aracının gerçek dünyaya uygulanabilirliğini belirlemeyi amaçladığında etkilidir. Örneğin, klinik psikoloji alanında bir depresyon ölçeği, ruh sağlığı uzmanları tarafından konulan klinik tanıları tahmin etme yeteneği değerlendirilerek doğrulanabilir. Bu tür bir geçerlilik, bir ölçüm aracının pratik uygunluğunu ve kullanışlılığını belirlemeye yardımcı olur.
Yapı geçerliliği, psikolojik yapının teorik temelleriyle ve bir ölçeğin amaçlanan psikolojik özelliği veya özelliği ne kadar iyi ölçtüğüyle ilgilidir. Bir ölçüm aracının bir yapının karmaşıklığını ve çok yönlü doğasını ne ölçüde yakaladığını değerlendirir.
Yapısal geçerlilik kavramı psikolojik testlerin ortaya çıkmasıyla önem kazanmıştır. 20. yüzyılın ortalarında Lee J. Cronbach gibi öncüler, yapıların çok yönlü doğasına ve sıkı doğrulama ihtiyacına dair içgörü sağladılar. O zamandan beri yapı geçerliliği psikolojik ölçüm alanında merkezi bir odak noktası olmuştur.
Yapı geçerliliği, çağdaş psikologların çok yönlü yapılar ve modern ölçüm yöntemleri bağlamında inceliklerini araştırdığı canlı bir araştırma alanı olmayı sürdürüyor. Araştırmacılar yapı geçerliliğini değerlendirmek için ileri istatistiksel teknikler geliştiriyor ve iyileştiriyor.
Araştırmacılar, yapı geçerliliğini değerlendirmek için faktör analizi, yakınsak ve ıraksak/ayırt edici geçerlilik ve çok özellikli-çok yöntemli (MTMM) analiz gibi teknikleri kullanırlar. Faktör analizi, bir yapının altında yatan boyutları belirlemeye yardımcı olurken, yakınsak ve ayırt edici geçerlilik ölçeğin ilişkili ve ilişkisiz yapılarla olan ilişkilerini inceler. MTMM analizi, birden fazla özellik ve değerlendirme yöntemi arasındaki ilişkiler hakkında bilgi sağlar.
Araştırmacılar zekâ, kişilik veya tutumlar gibi karmaşık yapıları araştırırken yapı geçerliliği esastır. Örneğin, yeni bir zekâ testinin, diğer yerleşik zekâ testleriyle yakınsak geçerliliği ve ilgisiz yapılardan ıraksak/ayırt edici geçerliliği göstererek zekanın çok yönlü doğasını ölçtüğünü göstermesi gerekir. Yapı geçerliliğinin sağlanması, ölçüm aracının hedeflenen psikolojik özelliğin zenginliğini ve karmaşıklığını yakalamasını sağlar.