Testlerde Güvenirlik

Fadime Çağlar 26 Aralık 2019

0 3 dakika okuma süresi

Bilimim temel esaslarından birisi olan görgül araştırmalara dayanma kuralı bizleri çeşitli test ve ölçeklere götürmekte bu durumda da kullandığımız bu test ve ölçeklerin geçerlik ve güvenirlik problemleriyle uğraşmak zorunda kalıyoruz. Birçoğumuzun derslerinde defalarca bu konuları görmüş ve bir türlü sağlam bir zemine oturtup bütünlük kazandıramamışlığımız olmuştur. İsterseniz geçerliği bir sonraki sefere bırakıp (aslında yazacaktım ama yazı düşündüğümden uzun oldu), güvenirlik konusunu bir de zamanında bu konudan çokça çekmiş sonunda bir şeyler anlayabilmiş gibi olan bir öğrenci perspektifinden ele alalım.

Güvenirlik

Testlere geçmeden önce güvenirlik deyince ilk aklımıza ne geliyor, kimlere güvenilir diyoruz bunu düşünelim. Günlük hayatta bir insana güvenilir diyebilmemiz için onun tutarlı davranmasını bekleriz. Gerek bize gerekse başkalarına karşı, farklı zaman dilimlerinde aynı davranış paternini sergilemesini isteriz. Testlerde de aynı mantığı sürdürürüz aslında. Bir testin tutarlı olmasını, farklı zaman dilimlerinde (test tekrar test güvenirliği) aynı sonucu vermesini bekleriz. Bu açıdan bakıldığında güvenirlik aslında bir tutarlılık meselesidir. Bir testin güvenirliğini hesaplarken de farklı kestirim yöntemleri kullanırız.

Test tekrar test güvenirliği

Bir bireyin, bir testin farklı zamanlarda uygulanmasından aldığı puan çiftleri arasındaki korelasyondur. Yani ben aynı teste hem şimdi hem de iki hafta sonra maruz kaldığımda bu iki uygulamadan aldığım puanlar ne kadar birbirine yakınsa test o kadar tutarlıdır diyoruz. Burada testin ölçtüğü şeyin görece kalıcı bir özellik olması gerekmektedir. Mesela durumluk kaygı testini iki hafta arayla katılımcılara verdiğimde aradaki bu süreden ve bu süre zarfında katılımcıların maruz kaldıkları çevresel etkenlerden dolayı durumluk kaygıları değişecektir, bu da testin güvenirliğinin düşük çıkmasına neden olacaktır. Bu sebeple test tekrar test yöntemi kişilik özellikleri, zeka, tutum gibi daha durağan özelliklerin ölçümünde kullanılabilir.

Paralel – Alternatif formlar

Paralel formlar teorik olarak testin, her bir formu için test puanlarının ortalamalarının ve varyanslarının eşit olması durumunda söz konusudur. Alternatif formlar ise bir testin paralel olacak şekilde düzenlenen farklı nüshalarıdır. Bu alternatif formlar paralel olarak adlandırılmak için gerekli koşulları karşılamadıkları halde içerdikleri maddelerin kapsamları ve zorluk düzeyleri eşit olacak şekilde geliştirilirler. Alternatif formlar güvenirliği ve paralel formalar güvenirliği kestirmesiyle test tekrar test güvenirliği arasında iki açıdan benzerlik vardır;

1) Aynı bireyler üzerinde yapılan iki uygulama gerektirir. Test tekrar testte kişilere aynı test belli bir zaman aralığından sonra tekrar verirken paralel formlarda ve alternatif formlarda iki form aynı kişilere aynı zaman diliminde verilmektedir.

2) Test puanları alışma, yorgunluk, motivasyon, öğrenme gibi faktörlerden etkilenirler.

İki yarı güvenirliği

Geliştirilen bir testin eş değerini bulmak veya geliştirmek oldukça zor olduğu durumlarda [genellikle her zaman 😉 ] elimizdeki testi iki yarıya bölüp bu iki yarıyı birbiriyle karşılaştırabiliriz. Bu yöntem tek bir test uygulamasını gerektirmekte, bu noktada diğer iki yöntemden ayrılmaktadır. iki yarı güvenirliğinde unutmamız gereken noktalardan birisi de testin uzunluğu yarıya düştüğü için güvenirlik katsayısı da otomatik olarak azalacaktır. Testi ikiye bölerken de dikkat etmemiz gereken noktalar karşımıza çıkmaktadır. Şöyle ki testi ortadan ikiye böldüğümüzde katılımcıların testin ilk yarısını cevaplarken gösterdikleri, motivasyonla son yarısını cevaplarken gösterdikleri motivasyon bir olmayacaktır. Testin sonuna doğru katılımcılar yorulacak veya alışma gerçekleştireceklerdir. Bu durum da sonuçları etkileyecektir. Bunun önüne geçebilmek için testi tek numaralı sorular ve çift numaralı sorular olarak ikiye bölmek tercih edilebilir. Bir diğer yöntem olarak test maddelerini seçkisiz olarak ikiye bölmek de kullanılabilir. Bu yöntemi kullanırken testin iki yarısının güvenirliği Spearman-Brown formülü ile hesaplanmaktadır. Çok fazla uzatmamak adına formülü burada vermemekle birlikte son derece basit bir formüldür. Gözünüzü korkutmasına asla izin vermeyin.

İç Tutarlılığı Kestirme

Maddeler arası tutarlılık olarak da adlandırılan iç tutarlılık, bir ölçekteki tüm maddeler arasındaki korelasyonu ifade eder. Maddeler arası tutarlılık indeksi aslında testin homojenliğini de verir bize. Heterojenlik ise bir testteki farklı boyutları (faktörleri) ölçme derecesini gösterir. dolayısıyla bir test homojenleştikçe daha fazla maddeler arası korelasyon gösterir. testin homojenleşmesi ise istendik bir durumdur çünkü sonuçları yorumlamayı kolaylaştırır. testten alınan puanın hangi özelliğe tekabül ettiği daha açık olur. Bu yüzden birden fazla alt boyutu olan testlerde her bir alt boyut için ayrı olarak güvenirlik hesaplanmalıdır. Bu yöntem de iki yarı güvenirliği gibi tek bir uygulama gerektirir.

Kuder Richardson (KR-20/ KR-21)

Kuder Richardson 20 formülü iki kategorili testlerde kullanılır. genellikle evet/hayır tipi cevap gerektiren veya doğru/yanlış şeklinde kategorilendirme yapılan sorularda maddeler arası tutarlılığı belirlemek için kullanılan bir yöntemdir.

Kuder Richardson 21 ise testteki tüm maddelerin aynı güçlük derecesine sahip olması varsayımına dayanır. bu varsayım çok nadir sağlanabildiğinden bu formülü kullanma şansına pek erişemiyoruz.

Cronbach Alfa Katsayısı

İç tutarlılık güvenirliğini kestirmeye yönelik bir yöntemdir. KR-20′ nin aksine iki kategorili olmayan testler için de kullanılabilir. kavramsal olarak veri kümelerinin ne kadar benzer olduğunu yordamaya yönelik kullanıldığı için 0 ile 1 arasında değer alır. 0 kesinlikle benzerlik yok, 1 ise tamamen benzer anlamına gelmektedir. Alfa değeriyle ilgili ne kadar yüksek o kadar iyi yönünde bir kanı olsa da .90 ‘nın üzerindeki alfa değerleri de testte gereksiz maddeler olduğunu gösterir.

Yargıcılar Arası Güvenirlik

Puanlayıcı güvenirliği, yargıcı güvenirliği, derecelendiriciler arası güvenirlik, gibi çeşitli isimlerde adlandırılan güvenirlik çeşidi, belirli bir ölçüm ile ilgili iki ya da daha fazla puanlayıcı arasındaki tutarlılığın ve örtüşmenin derecesidir. puanlayıcılar arsındaki tutarlılığın derecesini belirlemenin en kolay yolu bir korelasyon hesaplamaktır. hesaplanan bu korelasyon değerine de puanlayıcılar arası güvenirlik katsayısı denmektedir.

Yazdıklarım umarım yerince anlaşılır olmuştur. Konuyla ilgili aklınıza takılan noktaları veya merak ettiklerinizi yorum kısmından yazabilirsiniz.

Fadime Çağlar 26 Aralık 2019

0 3 dakika okuma süresi