Seans


15 Ağustos 2011 Pazartesi

Parametrik Olmayan (Non-Parametric) Hipotez Testleri

Parametrik Olmayan (Non-Parametric) Hipotez Testleri
1. Giriş


Hipotez testleri istatistik biliminin en önemli konularından birisini oluşturur. Elimizdeki herhangi bir istatistiksel yargının (hipotezin) doğru ve geçerli olup olmadığını, geçerliyse geçerliliğine ne kadar güvenebileceğimizi hipotez testlerinin yardımıyla bulabiliriz. Herhangi bir üretim, pazarlama, ya da benzer bir süreçte ana kütleye ait bir değerin, öngörülen ya da tahmin edilen bir değere eşit olup olmadığı bu testler yardımıyla tespit edilir. Örneğin elektrik ampulü üreten bir fabrika için ürettiği ampullerin ortalama ömrünün istenen standartta olması çok önemli olabilir. Ya da üretim sürecinin baştan sona tekrar düzenlenmesini gerektirecek kadar büyük hatalar olup olmadığı öğrenilmek istenebilir. üretim sürecinin sonucunda elde edilen mamulün –örneğin ekmek- ortalama maliyetinin belirlenmesi için ağırlığı ya da başka bir değeri hakkında hipotez testlerine ihtiyaç duyarız. Ancak bu tespiti elde edilen tüm ürünler için yapmamız bazen imkânsız, bazense çok zor ve maliyetli olabilir. Bu yüzden sözkonusu tespiti ana kütleden (üretilen malların tamamı) belirli yöntemlerle seçilen ve ana kütleyi mümkün olan en iyi şekilde temsil ettiği düşünülen bir örnekle yapılır. Ancak seçilen örnek ne kadar iyi olursa olsun, bir hata riski her zaman için mevcuttur. Bu yüzden testi yaparken belirli bir hata yapma riskini peşinen kabul etmiş oluruz. Yaptığımız testin önemine göre bu hata olasılığını kendimiz seçebiliriz. Örneğin bir deterjan fabrikası işletmesi için hazırladığı ambalajların ortalama ağırlığının istenen değere eşit olup olamadığını yüzde 85’lik bir olasılıkla bilmek yeterli olabilirken bir ilaç fabrikası için ilacın muhtemel etkileri konusunda yüzde 99’luk bir olasılık bile çok yüksek bir belirsizlik anlamına gelebilir.

Daha terimsel bir açıklama yapacak olursak; ana kütle parametreleri hakkında bir varsayımın belirli bir anlamlılık seviyesinde geçerliliğinin, örnek istatistiklerinden hareketle araştırılmasına hipotez testi denir.[1] Bu tanıma ek olarak, test edilebilecek konular arasına, birden fazla ana kütlenin parametreleri arasındaki ilişkinin öngörülen şekilde olup olmadığını da katabiliriz.

Hipotez testleri, aralık ve oran ölçülerine dayanan, ana kütle dağılımları hakkında belirli varsayımların geçerli olmasını gerektiren parametrik hipotez testleri ve genellikle nominal ve sıralama bildiren değerlere dayalı olarak yapılan, ana kütle dağılımı hakkında herhangi bir varsayımın geçerliliğinden bağımsız olarak gerçekleştirilebilen parametrik olmayan hipotez testleri olarak ikiye ayrılabilir. Bu çalışmada ikinci tür testler, yani parametrik olmayan hipotez testleri incelenecektir.

Parametrik olsun ya da olmasın, hipotez testleri dört aşamada yapılır:
· Hipotezlerin oluşturulması
· Anlamlılık seviyesinin belirlenmesi
· Örnek istatistiğinin standart rassal değişkene dönüştürülmesi
· Karar aşaması


Hipotez testi sonucunda belli bir hata yapma riskinin bulunduğundan yukarıda bahsedilmişti. Şimdi yapılması muhtemel olan hata türlerini inceleyelim:

Hipotez testinin ilk aşamasında bir hipotez oluşturulur ve daha sonraki aşamalar gerçekleştirildikten sonra bu hipotezin doğru olup olmadığı belirli bir olasılıkla tespit edilir. Oluşturulan hipotez için iki olasılık vardır: Hipotez doğru olabilir; hipotez yanlış olabilir. Temel hipotezimiz (H0) doğu olduğu halde test sonucunda hipotez reddedilmişse, I. tip hata (a tipi hata) yapılmış olur. Temel hipotez (H0) yanlış olduğu halde reddedilmezse II. tip hata (b tipi hata) yapılmış demektir.

Bir tabloyla gösterecek olursak:


H0 Reddedilmez
H0 Reddedilir
H0 Doğru
Doğru Karar
(1-a)
Yanlış Karar
(a tipi hata)
H0 Yanlış
Yanlış Karar
(b tipi hata)
Doğru Karar
(1-b)


Yapacak olduğumuz testi tasarlarken hangi tür hatanın bizim için daha zararlı olduğunu tespit edip hata yapma olasılıklarımızı (dolayısıyla testin güven olasılığını) önceden belirleriz.


2. Parametrik olmayan Hipotez Testleri

Parametrik testlerin aralık ya da oran ölçeğine göre elde edilmiş verilerle ve ana kütlenin dağılımı hakkında belirli varsayımların geçerliliği altında yapılabildiğinden yukarıda bahsedilmişti. Parametrik testlerin uygulanabilmesi için örnek sayısı da önemli bir faktördür. Bu bilgiler ışığında şu sonuca varabiliriz: bir parametrik testin uygulanabilmesi için şu kısıtlar söz konusudur:
· Veri türü
· Dağılım türü
· Örnek sayısı

Eğer bu şartları sağlayan bir ana kütle ve örnek varsa parametrik bir test uygulanabilir ve ana kütlenin bir parametresine ilişkin bazı sonuçlara varılabilir. Ancak her zaman istenen dağılımda, bir ana kütlemiz, istenen türde verilerimiz ve yeterli sayıda örneğimiz olmayabilir. Böyle durumlarda parametrik olmayan testlere başvurulur.

Parametrik olmayan testler nominal değerler, sıralama bildiren değerler ve farkları anlamlı olmayan değerler için kullanılabilir.[2] Elimizde bir grup bebeğin ağırlıklarını gösteren bir dağılım olsun; bu dağılımdan rastgele seçtiğimiz iki değer arasındaki fark, iki bebek arasındaki ağırlık farkını göstrecektir. Dolayısıyla seçtiğimiz sayılar farkları anlamlı olan iki sayıdır. Elimizde bu türden bir seri olduğunda, diğer koşullar da sağlanıyorsa parametrik bir test yapabiliriz. Bu defa da elimizde bir yarışı tamamlayan yarışmacıların sıralamalarının olduğunu varsayalım; Bu durumda rastgele seçtiğimiz iki değer arasındaki fark (örneğin ikinci ile beşinci arasındaki fark), rastgele seçilen diğer bir ikilinin farkına (örneğin yedinci ile onuncu arasındaki fark) gerçekte hiçbir benzerlik olmadığı halde eşitmiş gibi bulunabilecektir. Bu tür veriler farkları anlamlı olmayan veriler olarak adlandırılır. Elimizde bu tür veriler bulunduğunda da gerçekleştirilmesi için çok fazla kısıtın bir arada sağlanması gerekmeyen parametrik olmayan hipotez testlerine başvurulur.
Parametrik olmayan hipotez testleri, parametrik testler kadar hassas sonuçlar ve kesin değerler vermek yerine değerler hakkında genel bilgilere sahip olmamızı sağlarlar. Bu yüzden, yapacağımız çalışalarda, eğer mümkün olabiliyorsa, parametrik testleri uygulmayı tercih etmeliyiz.
İzleyen bölümlerde en çok bilinen parametrik olmayan hipotez testleri incelenecektir.


2.1 İşaret Testi [3]

Parametrik olmayan testlerin en eskisidir. Bu testle, normal dağılmayan bir serinin merkezi eğiliminin pozitif mi, negatif mi olduğu anlaşılabilmektedir. Test hem tek taraflı, hem de çift taraflı yapılabilir. Tüm hipotez testlerinde olduğu gibi bu testte de dör aşama vardır:

i) Hipotezlerin oluşturulması:

H0: m=m0
H1: m¹m0

ii) Güven olasılığının ya da hata payının belirlenmesi
iii) Test istatistiğinin hesaplanması:

Test istatistiğinin hesaplanması için belirlenen m0 değeri herbir gözlemden tek tek çıkarılır ve altına işareti (+ ya da -) yazılır. Test istatistiği yapılan testin türüne göre (tek taraflı ya da çift taraflı) değişiklik gösterir. Eğer sol taraflı test yapılıyorsa pozitif işaretli farkların sayısı, sağ taraflı test yapılıyorsa negatif işaretli farkların sayısı, çift taraflı test yapılıyorsa pozitif ya da negatif fark sayılarından küçük olanı test istatistiği olarak alınır.

iv) Karar Alma:

Elde edilen test istatistiği ve örnek/gözlem sayısına karşılık gelen “işaret testi” tablosundaki olasılık değeri, testin ikinci aşamasında belirlediğimiz olasılık değeriyle karşılaştırılır. Eğer bulunan olasılık değeri seçilen güven olasılığından yüksekse H0 reddedilmez. Eğer bulunan olasılık seçilen güven olasılığından küçükse H0 reddedilir.

H0’ın reddedilememesi, seçilen güven olasılığıyla, elimizdeki değerlerin ortalamasının seçtiğimiz m0 değerine eşit olduğunu, reddedilmesi ise ortalamanın seçilen m0 değerine eşit olmadığını gösterir.


2.2 Wilcoxon Sıra Toplamı Testi [4]

Wilcoxon sıra toplamı testi, iki bağımsız, basit rassal örnek sonuçlarından yola çıkarak, sürekli bir değişkeni olan iki ana kütlenin (A ve B), birbirine benzeyip benzemediğini test etmek için kullanılır.
Bu durumda hipotezlerimiz şu şekilde oluşturulur:

H0: A ve B serileri benzerdir
H1: A ve B serileri benzer değildir

Bu test yapılırken nA ve nB sayıda gözleme sahip iki örneğin tüm birimleri en küçüğüne “1” sıra numarası verilerek bir arada sıralanır ve sonuç olarak (nA+nB) sayıda gözleme sahip bir serimiz olur. Bu seri oluşturulurken tekrar eden değerlerin sıra numaraları toplanır ve aritmetik ortalamaları alınır. Elde edilen ortalama değer, tekrar eden üm değerlere verilir ve numaralamaya bir sonraki rakamdan devam edilir.

W= A ya da B örneklerinin sıra toplamı
Olmak üzere, w değerinin, nA ve nB’nin 10’dan büyük olduğu ve iki ana kütlenin birbirine benzediği durumlarda normal dağılıma yaklaşmaktadır.

W’nun ortalaması ve standart sapması ise:

`Xw= nA (nA+nB+1)/2

sw=((nAnB(nA+nB+1))/12)1/2

olarak belirlenir. Bu değerlerden yola çıkarak hesaplanan test istatistiği (Z değeri) ise;

Z= (W-`Xw)/sw olur.

Eğer çift taraflı test yapıyorsak Za/2, tek taraflı test yapıyorsak Za değerleriyle karşılaştırma yapıp diğer hipotez testlerinde olduğu gibi karar verilir.

Yani,
|Z| < Za ya da |Z| < Za/2 ise H0 reddedilmez; |Z| > Za ya da |Z| > Za/2 ise H0 reddedilir.


2.3 Wilcoxon İşaretli Sıralar Testi [5]

Bu test iki bağımlı örnek değerleri arasındaki farkın negatif ya da pozitif olup olmadığının araştırılmasına dayanır.

Öncelikle hipotezler oluşturulur:

H0: Ana kütleler arasında fark yoktur
H1: Ana kütleler arasında fark vardır

Bir sonraki adımda iki ana kütleden çekilen bağımlı örnek değerleri arasındaki farklar hesaplanır. Eğer farklarda bazıları sıfıra eşitse bunlar hem testten, hem de örnek sayısından çıkarılır. Elde edilen farkların mutlak değerleri en küçüğe bir gelecek şekilde numaralanır. Aynı sırada birden fazla fark varsa sıra numaralarının ortalaması alınarak aynı olanların tamamına bu değer verilir. Her sıra numarasına asıl farkın işareti verilerek (-) ve (+) işareti alan farklar kendi aralarında toplanır. Bu toplamların birbirine olan farkı alınarak T değeri hesaplanır ve test istatistiği elde edilerek karar verme aşamasına gelinmiş olur.

Şayet iki ana kütle birbirine benzer bir dağılım gösteriyorsa farkların yarısının pozitif, yarısının negatif olması gerekir. Dolayısıyla pozitif ve negatif farkların toplamı sıfır olacaktır.
T’nin dağılımının ortalaması (`XT) =0 olacaktır. T’nin standart sapması ise,
sT=(n(n+1)(2n+1)/6)1/2
olacaktır.

Bu durumda Z=(T-`XT)/ sT olur.

`XT= 0 olduğundan

Z= T/sT olarak kabul edilir.

Karar aşamasında:

|Z| < Za ya da |Z| < Za/2 ise H0 reddedilmez; |Z| > Za ya da |Z| > Za/2 ise H0 reddedilir.

H0’ın reddedilemediği durumda “iki ana kütle benzer olasılık dağılımlarına sahiptir” soncuna varılır.


2.4 Mann-Whitney U Testi [6]

İki bağımsız örneğin aynı ana kütleden gelip gelmediğinin araştırılmasına dayanan çift taraflı bir testtir. İki örnek ortalaması arasında fark olup olmadığını parametrik olarak test edemiyorsak bu testten yararlanabiliriz.

Testi yapmak için önce hipotezlerimizi oluşturalım:

H0: İki örnek aynı ana kütleden gelmektedir (ortalamalar eşittir)
H1: İki örnek aynı ana kütleden gelmememktedir (ortalamalar eşit değildir)

Hipotezimizi test etmek için öncelikle U değerini hesaplamamız gerekir. Bunun için iki örnekteki gözlemler bir arada ve en küçüğe 1 denk gelecek şekilde sıralanıp numaralandırılır.
Bu durumda;

U=nAnB + (nA(nB+1)/2) – RA

olarak formüle edilir. Formüldeki RA Değeri, birinci örnekteki değerlerin sıraları toplamını göstermektedir. U istatistiğinin ortalaması;

`XU = (nAnB)/2

Standart Sapması;

sT = (nAnB(nA+nB+1)/12)1/2

Olarak formüle edilir.

Test istatistiği yine

Z=(U-`XU)/ sU

Olarak kabul edilir.
Karar aşamasında, çift taraflı bir test yaptığımız için;

|Z| < Za/2 ise H0 reddedilmez; |Z| > Za/2 ise H0 reddedilir.

H0’ın reddedilemediği durumda “iki örneğin aynı ana kütleden gelmektedir” sonucuna ulaşırız.


2.5 Cochran Q Testi [7]

Nominal ölçekli ikiden fazla bağımlı gözleme ait bilgiler için geliştirilmiş çift taraflı bir testtir. Örneğin üretilen bir mal için hazırlanan k adet reklam filminden hangisinin daha etkili olduğunun tespiti için rassal olarak seçilen belirli sayıdaki izleyiciye çekilen filmler arasında en çok beğendiklerine 1, diğerlerine 0 vermeleri istenir. Daha sonra hipotezler oluşturulup test gerçekleştirilmeye başlanır.

Hipotezlerimiz;

H0: k adet alternatif arasında belirlenen özellik açısından fark yoktur
(filmler arasında fark yoktur)
H1: Alternatifler arasında belirlenen özellikler açısından fark vardır
(filmler arasında fark vardır)

Bu test için kullanacağımız test istatistiği,
k k
Q=((k-1)(k S Sj2 – (S Sj)2)/k(SL)-SL2
j=1 j=1

olarak formüle edilmiştir.

Formülkde
k: Örnek sayısını (değerlendirilecek film sayısı);
S Sj: 1 değeri verilen seçeneklerin sütun toplamı (tercih edilen filmler)nı;
S Sj2: Bu toplamların kareler toplamını;
L: 1 değeri verilen seçeneklerin satır toplamını;
L2: Bu toplamların kareler toplamını;

göstermektedir.

Q istatistiği, k-1 serbestlik dereceli, c2 dağılımı göstermektedir.

Karar verme aşamasında ise;

Q>c2a/k-1 ise H0 reddedilir (k alternatif arasında anlamlı bir fark vardır).
Q£c2a/k-1 ise H0 reddedilemez (k alternatif arasında anlamlı bir fark yoktur)

sonuçlarına varılır.


2.6 Kruskal-Wallis Testi [8]

Kruskal-Wallis testi, (k>2 olmak üzere) k farklı, bağımsız ana kütleden elde edilen örneklerle, ana kütlelerin benzer yapıda olup olmadığının araştırılmasına dayanır.

Test için hipotezler şu şekilde oluşturulur:

H0: Anakütleler biribirine benzer yapıdadır
H1: Anakütleler biribirine benzer yapıda değildir

Ana kütlelerden alınan bağımsız örnekler bir araya getirilerek sıralanır ve her örneğin sıra toplamıyla H istatistiği hesaplanır.

H= ((12/n(n+1))(SWi2/ ni)) – (3(n+1))

Formülünde
n: Örneklerdeki birim sayılarını;
Wi: Her örneğin sıraları toplamını;
ni: her örnekteki birim sayısını;

göstermektedir.

Her örnekteki birim sayısı 5’ten büyük olduğunda, H istatistiği, c-1 (c, anakütle sayısını göstermektedir) serbestlik dereceli c2 dağılımına yaklaşmaktadır.[9]

Karar aşamasında H istatistiği, c2a/c-1 değeri ile karşılaştırılmaktadır.

Q>c2a/c-1 ise H0 reddedilir (c adet ana kütle birbirine benzer yapıda değildir).
Q£c2a/c-1 ise H0 reddedilemez (c adet ana kütle birbirine benzer yapıdadır)


2.7 Spearman Sıra Korelasyon Testi [10]

Spearman korelasyon katsayısı ilişkilerin derecesi ve yönünün ölçülmesinde kullanılan bir yöntemdir. Katsayının hesaplanması için iki yöntem vardır.

Birinci yöntemde;

rs = SSUV / ((SSUU) (SSVV))1/2

olarak bulunur. Bu formülde;

SSUV = SUi -`UVi -`V = S Ui Vi – (SUi S Vi)/n

Hiç yorum yok:

Yorum Gönder