Psikometri ve ölçme-değerlendirme alanının temel taşlarından biri olan geçerlik, bir ölçme aracının ölçmeyi amaçladığı şeyi gerçekten ölçüp ölçmediği ile ilgilenir. Basitçe ifade etmek gerekirse: "Ölçtüğümüz şey, ölçmek istediğimiz şey midir?" sorusuna yanıt arar. Geçerlik, bir testin veya ölçeğin amaca hizmet etme derecesi olarak tanımlanabilir.
Geçerlik, mutlak bir "var" ya da "yok" kavramı değil, dereceli bir özelliktir. Yüksek geçerlik, ölçüm sonuçlarının kullanım amacına ve yapılacak yorumlara son derece uygun olduğunu gösterir. Bu nedenle, bir ölçüm aracı bir amaç için yüksek geçerliğe sahipken, başka bir amaç için düşük geçerliğe sahip olabilir.
Bir testin, ölçmeyi hedeflediği davranışların veya konu alanının tümünü kapsayıp kapsamadığını inceler. Örneğin, bir matematik sınavının tüm ünite konularını temsil edip etmediğinin değerlendirilmesidir.
Test puanlarının, dışarıdan belirlenmiş bir ölçüt (kriter) ile ilişkisini inceler. İkiye ayrılır:
Testin, ölçmeyi iddia ettiği soyut kavramı (yapıyı) teorik olarak ne kadar iyi ölçtüğünü inceler. "Zeka", "kaygı", "motivasyon" gibi gözlemlenemeyen yapılar için kritiktir.
Geçerlik, bir ölçme aracının en temel niteliğidir ve "Bu test neyi ölçüyor?" ve "Elde ettiğimiz puanlara dayanarak yaptığımız yorumlar ne kadar doğru?" sorularına yanıt verir. Tek bir geçerlik katsayısı yoktur; farklı kanıtlar (kapsam, ölçüt, yapı) bir arada değerlendirilerek testin belirli bir amaç için geçerli olup olmadığına karar verilir. Unutulmamalıdır ki, geçerlik bir süreçtir, bir kerelik bir kanıt değildir.