Wstępem do analiz statystycznych zebranego materiału badawczego jest wykonanie statystyk opisowych naszych zmiennych (liczebność grup badanych, średnie, odchylenie standardowe, mediana itp) oraz ocena czy nasze zmienne ciągłe (np. wiek, ciężar ciała) mają rozkład normalny.

 

Jeśli nasze zmienne mają rozkład normalny w dalszych analizach możemy stosować testy parametryczne. Jeśli nasze zmienne nie mają rozkładu normalnego wtedy stosujemy testy nieparametryczne.

Testy  parametryczne badają średnie a ich wyniki są łatwiejsze do interpretacji i prezentacji. Testy nieparametryczne nie są tak dokładne jak parametryczne i badają inne cechy zmiennej np. medianę.

 Rozkład normalny – to charakterystyczna krzywa dzwonowa, definiowana średnią i odchyleniem standardowym.

Rozkad_normalny3

 Jak ocenić czy badana zmienna ma rozkład normalny?

1. Pierwsza ocena jest wizualna. Oglądając wykres patrzymy czy wiek równomiernie dzieli się w poszczególne kategorie. Dokonywanie takiej oceny wymaga doświadczenia, dlatego warto sprawdzić czy mamy rację analizując inne wskaźniki.

2. Oceniamy skośność i kurtozę (patrz rozdział Rozkłady i miary centralnej tendencji, zmienności, asymetrii i koncentracji).

 

N ważnych

Średnia

Mediana

Odch.Std.

Skośność

Kurtoza

wiek

337

45,88131

43,00000

18,68961

0,411360

-0,707931

 Skośność wynosi 0,4 (<1,5) a kurtoza -0,7 (<3) co mówi nam, że wiek ma rozkład normalny.

 3. Wykonujemy testy badające normalność rozkładu np. W Shapiro – Wilka (zmienna nie ma rozkładu normalnego jeśli p<0,05).