99
ölçek tek boyutludur. Bu araştırmada BMS’in 18 test öğesinin
kolaydan zora doğru bir ileri gidiş gösteriyor olması gerekir
(hipotez 1). Bununla birlikte, PCM, ardışık ve birbiriyle
ilintili yeterlik seviyeleri bulunan öğeler üzerindeki deneklerin
performanslarını analiz etmek için uygundur (Masters, 1982).
BMS’in test öğesi başına ardışık altbölümlerinin her biri, o test
öğesindeki kısmi ve yükselen başarıya işaret eder.
Ölçümler, deneklerle test öğelerini karşılaştırmak ve standart
tahmin hatalarını hesaplamak için aralıklı-ölçekli skorlar olarak
analiz edilirler. Test öğesi başına altbölümlerin varsayılmış sırası
PCM kullanılarak analiz edilebilir (hipotez 2). Postüral kontrolde
daha yeterli olan deneğin BMS’de daha az yeterli olan denekten
daha yüksek skor yapacağı varsayılır ve bu yeterlilik de yaşla
artacaktır. Bir deneğin BMS’deki performansları total skora götürür.
BMS skoru ile yaş arasındaki ilişki test edilebilir (hipotez 3).
PCM, her bir çocuk için, bir test öğesinde hangi skor
seviyesinin bekleneceğini kararlaştırmak için kullanılabilir. BMS’in
yapılandırılması için; bir test öğesinin, deneklerin beklenen
skordan sapan skorlarını ne kapsamda sağlayacağı üzerine
düşünmek önemlidir. Sapmış skorlar, PCM ile “fit’in iyiliği”nin
analizi anlamında görülebilir hale getirilebilir. Deneklerin
skorlarındaki, beklenen skorlardan sapmanın derecesi
standardize edilmiş “geri kalan” (rezidüal) ile ifade edilebilir.
Bu geri kalanlar, her bir test öğesi için fit skoruna dönüştürülür.
PCM, bir test öğesinin ölçüm dağılımının içerisinde kalan sapmış
skorlar (uyumlu-infit) ile bu dağılımın sınırındaki sapmış skorlar
(uyumun dışında-outfit) arasındaki ayrımı yapar. Çok büyüklü
test öğelerinde, “misfit” (norm: <-2 ve > +2) yani “uymayan”
analiz edilebilir. “Fit’in iyiliği” analizi BMS’in tek boyutluluğuna bir
anlayış sağlayacaktır. Deneklerin infit ve outfit’i PCM ile özdeş bir
yolla hesaplanabilir. Beklenen skorlardan sapmış skorlara sahip
denekler bu skorların baz aldığı test öğeleri ile birlikte, daha ileri
bir analiz için işaretlenir. Analiz, deneklerin BMS’deki skorlarının
homojenliğine bir anlayış getirir. Big Steps bilgisayar programı
(Wright&Linacre, 1992) ölçek yapılandırması ve sırasallık
üzerinde test hipotezi 1 ve 2’ye göre ayarlandı. One-parameter
Logistic Model (OPLM) adlı programla bir kontrol sürdürüldü
(Verhelst, Glas&Verstralen, 1995). Statistical Product and Service
Solutions (SPSS/PC+) program paketi kullanılarak, yaş ile BMS
skoru arasındaki ilişkiyle ilgili hipotez 3 tetkik edildi.
100
Test, bir test lideri (fizyoterapist) tarafından standardize edilmiş
şartlarda 6 değişik lokasyonda sürdürüldü. Bir çocuğu test
etmek, 15 ila 30 dakika sürdü. Bütün çocuklar işbirliği içinde test
edildi. Her bir test standardize edilmiş bir prosedüre göre videoya
kaydedildi. Her bir video kaset bağımsız olarak
(gözlemciler arası güvenilirlik) iki farklı gözlemci (fizyoterapistler)
tarafından skorlandı. 3 ay, 10 test sonrasında gelişigüzel olarak
seçilerek tekrar değerlendirildi (tek bir gözlemci tarafından yapılan
değerlendirme güvenirliği). Veri analizine bakılırsa, ham skorlarda
3 problem ortaya çıkar. İlk olarak, iki gözlemcinin skorları birkaç
farklılık gösterir. Ancak veri işlemek, tek anlamlı skorlar gerektirir.
Test öğelerinin sırasallığı ve altbölümler kesinlikle tek anlamlı
skorlardan saptandığından, video kayıtları baz alınarak verilmiş
skorlardan üçüncü gözlemci tarafından bir seçim yapıldı. İkinci
olarak, deneklerin sayısının, tanımlanan altbölümler için tam bir
skor seti çıkaramayacak kadar az olduğu anlaşıldı. Test öğesi
başına düşen altbölümlerin sayısı 4 ila 9 arasında değişti.
Altbölümlerin test öğesi başına 4 skor kategorisine (0, 1, 2, 3) ve
sonucunda da 18X4 =72 olası skor kategorisine ayrılmasına karar
verildi. Örneğin, test öğesi 10’nun (oturmada postüral kontrol) 6
adet altbölümü vardır (tablo 5.3). Altbölümler 1, 2 ve 3 skor
kategorisi 1’de; altbölümler 4, 3 ve 5 kategori 2’de birleştirildi.
Altbölüm 6 ise skor kategorisi 3’ü temsil etti. Üçüncü olarak,
her BMS yönetimi 18 skorla sonuçlanmadığından, birkaç skor
doldurulamamıştır. Tamamlanmamış skorlar üç farklı durumda
meydana gelmiştir. Birincisi istenen davranışı gösterecek
motor yeterliliğe sahip olmayan çocuklarla yapılan daha yüksek
test öğelerinde (0-skor)... İkincisi, bağımsız oturabilen küçük
yaştaki çocuklarda... Bu çocuklar gerçek gelişim dağılımının uygun
şekilde kayıt edilmesine izin vermişler ama yüzüstü ve sırtüstü
pozisyonlardaki test öğelerinin sürdürülmesinde yeterli derecede
işbirliği yapmamışlar, oturmuşlardır (3 skor). Buna bir başka
örnek daha verebiliriz: Sırtüstü pozisyondan yüzüstü pozisyona
(test öğesi 9) dönerek geçiş de böyle vakalarda idare edilebilir
(çocuk oturmaya geçer) ama yüzüstünden sırtüstüne dönerken
(test öğesi 6) yapılamaz. Üçüncü olarak ayakta durabilen,
yürüyebilen ve desteksiz ayağa kalkabilen çocukların skorları da
doldurulamamıştır. Destekle ilişkili test öğeleri yönetilmemiştir
(3 skor). Veriyi istatistiksel olarak işlemek için, her bir
deneğin tamamlanmış seride 18 skoru olmalıdır. Ancak
5.2.3 Prosedür
101
tamamlanmamış skorlar, belirli bir dağılımı olan gelişimsel alanın
değerlendirmesinde, ölçüm araçlarının kullanımında içseldir.
BOS 2-30’un (van der Meulen, Smrkovsky, 1983) yönetiminde,
bir çocuğun gerçek gelişimsel alanını belirleyip sonra çocuğun
tamamladığı gelişimsel alanı pozitif olarak değerlendirmek
normaldir. Bu, daha temel motor becerilerin daha karmaşık motor
becerilere entegre olduğu gerçeğine dayanır. Şunu söylemek
gerekir ki, biz burada BMS’e karşıt olarak, normalize edilmiş
bir ölçüm aracı ile ilgileniyoruz. Bu karar, deneğin gerçek
gelişimsel alanını kararlaştırmak için verilmiştir. Bu alanın
altındaki tamamlanmamış skorlar 3-skor ile; bu alanın üstündeki
tamamlanmamış skorlar ise 0-skor ile doldurulmuştur. Gelişimsel
alanın içinde tamamlanmamış skorlar, çocuğun BMS’in yönetimi
sırasındaki motor performansı baz alınarak yorumlayıcı bir şekilde
doldurulmuştur. Bu 42 deneğe totalde 18X42=756 skor tahsis
edilmiştir. Bunlardan, 516’sı (%68.3’ü) gözlemciler tarafından video
materyali baz alınarak sağlanmıştır. 204 skor (%27’si) gerçek
gelişimsel alanın dışında, tamamlanmamış 0-skor ve 3-skorlara
ilişkilendirilmiştir. 36 tamamlanmamış skor (%4.7’si) bir çocuğun
gelişimsel alanı içerisinde yorumlayıcı skorlar doğurmuştur.
18 test öğesinin gözlemciler arası güvenilirliği (Cohen’in
anlam ayrımı (kappa’sı)) .61 ile 1.00 arasında değişmektedir. Test
öğesi 3’ten (.61) ayrı olarak, tüm test öğeleri .71’in üzerindeydi.
Cohen’in kappası ortalamada .85 idi. Ortalama tek bir gözlemci
tarafından yapılan değerlendirme güvenirliğinin test öğesi başına
hesaplaması .89’du (Cohen’in kappası). Cronbach’ın alfası ise
ortlamada .94’du (içsel tutarlılık).
Takibinde, 18 test öğesi üzerinde “fit’in iyiliği” analizi sürdürüldü.
Tablo 5.6 test öğelerini tahmini postüral kontrol seviyesine göre
klasifiye eder ve her bir test öğesi başına bir infit ve bir de outfit
değeri verir. Bu değerler test öğesi bir için “aşırı” olarak çıkmıştır.
Geri kalan test öğelerinin infit değeri misfit kriteri olan -2 ile +2
sınırının kapsamına girer. Test öğeleri 7, 8, 6, 5 ve 9 çok yüksek
outfit değerleri gösterirler (5.1, 4.6, 2.8, 2.4 ve 2.2). Bu bulgular
OPLM programıyla yapılan analiz sonuçlarıyla kuvvetle
desteklenir. Tablo 5.7, 42 deneğin bu test öğelerindeki skor
5.3 Sonuçlar
5.3.1 Güvenilirlik
5.3.2 “Fit” Analizi
Dostları ilə paylaş: |