Grażyna
Wieczorkowska oraz
Piotr Kochański Magdalena Eljaszuk
STATYSTYKA Wprowadzenie do analizy danych sondażowych i eksperymentalnych
I
Wydawnictwo Naukowe Scholar Warszawa 2003
Spis treści Redakcja i korekta: Magdalena Eljaszuk, Magdalena Pluta
9
Wstęp
Rozdział 1 Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
Grafiki w tekście i na okładce: Rafał Kucharczuk
1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7.
Copyright © 2003 by Wydawnictwo Naukowe Scholar,
14
Literatura
Projekt okładki: Marta Kurczewska
Spółka
z 0.0., Warszawa
Wprowadzenie Operacjonalizacja zmiennych teoretycznych Badania korelacyjne Badania eksperymentalne Porównanie badań eksperymentalnych i korelacyjnych Analiza przykładów badań Test intuicji psychologicznej: zbiór danych "LEARN". Sposób zapisywania wyników w komputerze 1.8. Co oznaczają liczby w naukach społecznych? Skale pomiarowe. Zmienne nominalne, porządkowe i ilościowe (przedziałowe i ilorazowe) 1.9. Typ skali pomiarowej a rodzaj dopuszczalnych przekształceń
.
15
. . . . . .
15 18 20 22 24 27
.
30
. .
35 41
. .
45
. . . .
51
Rozdział
ISBN 83-7383-047-2
Tytuł
dotowany przez Ministerstwo Edukacji Narodowej i Sportu
2 Rozkład zmiennej w próbie i w populacji. Miary tendencji centralnej i rozproszenia 2.1. Rozkład zmiennej w próbie 2.2. Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia 2.3. Standaryzacja 2.4. Rozkład zmiennej w populacji 2.5. Rozkład normalny (rozkład Gaussa) 2.6. Sposoby wykorzystania informacji dotyczącej normalności rozkładu zmiennej w populacji Rozdział
Wydawnictwo Naukowe "Scholar" Spółka z 0.0. ul. Krakowskie Przedmieście 62, 00-322 Warszawa tel./fax 828 95 63, 826 59 21,8289391 dział handlowy 6357404 wew. 219 lub jw. wew. 105, 108 e-mail:
[email protected] http://www.scholar.com.pl Wydanie pierwsze Skład i łamanie: WN "Scholar" (Jerzy Łazarski) Druk i oprawa: Paper & Tinta, Warszawa
60 63 66
.
70
.
75
. . . .
75 80 83
3
Wizualizacja danych. Tworzenie wskaźników złożonych 3.1. 3.2. 3.3. 3.4.
45
Tworzenie wskaźników Typowe problemy występujące przy tworzeniu wskaźników Trafność i rzetelność wskaźnika. Współczynnik IX Cronbacha Ograniczenia i wady IX Cronbacha
86
r
3.5. Przykład zastosowania analizy czynnikowej do tworzenia wskaźników . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6. Wprowadzenie do wizualizacji danych. . . . . . . . . . . . . . . . . . . . . . . . . . 3.7. Wizualizacja rozkładu zmiennej 3.8. Wizualizacja zależności między zmiennymi. . . . . . . . . . . . . . . . . . . . .. Rozdział
88 97 99 111
4,
Testowanie hipotez statystycznych.
Rozkład
statystyki. . . . . . . . . . . . . . ..
117
4.1. Jak na podstawie próby możemy wnioskować o całej populacji? ..... 4.2. Rozkład zmiennej w populacji i w próbie oraz rozkład statystyki, na przykładzie populacji marsjańskiej. . . . . . . . . . . . . . . . . . . . . . . . . .. 4.3. Miary tendencji centralnej rozkładu statystyki. . . . . . . . . . . . . . . . . . .. 4.4. Miary rozproszenia rozkładu statystyki 4.5. W jaki sposób praktycznie wykorzystujemy znajomość rozkładu średnich (statystyki.M)? 4.6. Porównanie trzech typów rozkładów. . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.7. Centralne Twierdzenie Graniczne. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.8. Hipotezy statystyczne 4.9. Kierunkowe i bezkierunkowe hipotezy badawcze. . . . . . . . . . . . . . . . .. 4.10. Etapy testowania hipotez. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.11. Etapy wnioskowania statystycznego na podstawie wydruku komputerowego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.12. Ryzyko błędu. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
117
Rozdział
118 123 124 126 128 130 134 138 140 154 155
5.
Test t Studenta.
Przedział ufności.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
159
5.1. Rozkład t Studenta 5.2. Zastosowanie testu t Studenta do testowania hipotezy dla pojedynczej próby '. . . . . . . . . . . .. 5.3. Zastosowanie testu t do testowania hipotezy o równości średnich na podstawie dwóch prób zależnych (schemat badawczy: Pretest-Posttest) 5.4. Zastosowanie testu t do porównania średnich na podstawie prób niezależnych ~ . . . . . . . . . . . . .. 5.5. Przedział ufności dla średnich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
159
Rozdział
6.1. Ograniczenia stosowalności testu t Studenta. Dlaczego 3 jest lepsze niż 2? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.2. Jednoczynnikowa analiza wariancji. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.3. RozkładFFishera . . . .. . .. .. . .. .. . . . . . . . . .. . ... . . .... . . . . . ..
193 210
Rozdział 7. Dwuczynnikowa analiza wariancji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
217
7.1. Efektinterakcji 7.2. Testowanie efektów głównych i interakcyjnych. . . . . . . . . . . . . . . . . .. 7.3. Porównanie wyników jednoczynnikowej analizy wariancji " z analizą dwuczynnikową 7.4. Analiza wariancji z powtarzanymi pomiarami
217 221 232 237
Rozdział 8,
Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej i analiza regresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8.1. 8.2. 8.3. 8.4. 8.5.
8.6. 8.7. 8.8.
Związek liniowy między zmiennymi ilościowymi. Wykres korelacyjny (rozrzutu). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej niezależnej. Błąd predykcji. . . . . . . . . . . . . . . . . . . . . . . . . . .. Testowanie istotności współczynnika korelacji. . . . . . . . . . . . . . . . . . .. Problemy w interpretacji współczynnika korelacji . . . . . . . . . . . . . . . .. Zastosowanie analizy regresji w badaniu LEARN. Modyfikujący wpływ trzeciej zmiennej (grupa eksperymentalna) na otrzymane zależnośd Regresja wielokrotna. Określanie związku zmiennej zależnej z więcej niż jednym predyktorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . .. Korelacje cząstkowe Wprowadzenie zmiennych nominalnych do równania regresji. . . . . . ..
242 242 245 253 257
258 260 264 267
161 Rozdział
9
2
166 172 181
6,
Jednoczynnikowa analiza wariancji. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
6.4. Zastosowanie analizy wariancji do testowania hipotez o równości średnich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.5. Testy porównań poszczególnych średnich w analizie wariancji. . . . . ..
186 186 187 190
Test X dla zmiennych nominalnych 9.1. Test hipotezy o zgodności rozkładu empirycznego z teoretycznym (oczekiwanym). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9.2. Test hipotezy o niezależności dwóch zmiennych nominalnych 9.3. Wyliczanie współczynników siły związku. . . . . . . . . . . . . . . . . . . . . . .. Rozdział
270 270 275 285
10.
Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
288
Tablice
303
Książkę dedykuję Januszowi Grzelakowi i Eugene 'owi Burnsteinowi, moim - w chronologicznej kolejności - profesorom, współpracownikom i przyjaciołom. Spędziłam z nimi wiele godzin, analizując dane zarówno eksperymentalne, jak i sondażowe.
G.W
Wstęp Od kilkunastu lat byłam namawiana do napisania podręcznika do statystyki. Nalegali na to zarówno psychologowie, jak i lekarze, których dane (tak eksperymentalne,jak i sondażowe) analizowałam i którzy cenili sobie wysoko wyniki współpracy. Jest tak zapewne dlatego, że mimo ukończonych studiów matematycznych statystyka interesuje mnie tylko o tyle, o ile pomaga nam w wydobywaniu interesują cych informacji ze zgromadzonych danych. Sama od ponad 20 lat rozwiązuję zagadki psychologiczne i jestem przekonana, że wiedzielibyśmy już znacznie więcej, gdyby badacze rozumieli, po co zbierają dane i co dalej się z nimi dzieje. Zrozumienie istoty statystyki jest potrzebne także tym, którzy sami nie przeprowadzają badań, ale je wykorzystują. Wszyscy dowiadujemy się, że wyniki badań wykazały wzrost notowań rządu, że należy pić sok pomidorowy itd. Jeżeli nie rozumiemy istoty statystyki, nie jesteśmy w stanie trafnie ocenić tych doniesień. Analizowałam sporo badań z różnych dziedzin psychologii, socjologii, edukacji, medycyny i widziałam bezradność na przykład w oczach lekarzy, którzy nie rozumieli, co mogą, a czego nie mogą powiedzieć na podstawie otrzymanych wyników. A przecież nie jest to trudne. Trzeba mieć tylko dobrego nauczyciela lub dobry podręcznik, który wskaże drogę. Niniejszy podręcznik jest efektem doświadczenia, jakie zebrałam w czasie prowadzenia dwuletniej specjalizacji "Metodologia badań społecznych" na Wydziale Psychologii Uniwersytetu Warszawskiego i wykładu "Metodologia ze statystyką" w Szkole Wyższej Psychologii Społecznej. Zaprosiłam do współpracy dwójkę młodych asystentów, którzy uczą "Zastosowań komputerów w psychologii" w SWPS. Piotr Kochański (który napisał m.in. część dotyczącą wizualizacji wyników) jest doktorem fizyki od lat pracującym z psychologami. Magda Eljaszukjest magistrem psychologii i doktorantkąInstytutu Studiów Społecznych Uniwersytetu Warszawskiego. To, jak należy uczyć analizy danych wszyscy troje mieliśmy okazję podpatrywać u mistrzów - profesorów wykładających w najlepszej szkole letniej w zakresie metodologii badań ilościowych w naukach społecznych, organizowanej już od 40 lat przez ICPSR (Inter-University Consortium for Political Science). Ja w 1990 roku, Piotr w 1999, Magda w 2002 roku. Było to możliwe dzięki stypendiom uzyskanym za pośrednictwemInstytutu Studiów Społecznych UW od Institute for Social Research, University ofMichigan, Ann Arbor.
9
10
Moi koledzy dziwią się, że nie nudzi mi się uczenie, co to jest wariancja, wynik istotny statystycznie itd. Nie nudzi mi się, ponieważ cały czas szukam najlepszego sposobu przekazania tej wiedzy. Zdecydowana większość moich studentów to ofiary nauczycieli matematyki, którzy wyrobili w nich przekonanie, że ta dziedzina nauki jest dla nich nie do pojęcia. Czasem mam wrażenie, że zamiast kursu statystyki prowadzę kurs zmiany postaw. Na początku wielu studentów twierdzi, że oni niczego, co jest związane z matematyką, nie są w stanie się nauczyć. Myślę sobie wtedy nie najlepiej o ich wiedzy psychologicznej. Powinni przecież wiedzieć, że zamiast pytania "CZY" należy postawić pytanie "JAK". I - jak wynika ze znanego porzekadła "Kto chce, szuka sposobów, kto nie chce, szuka powodów", należy się zastanowić, w jaki sposób zorganizować naukę, aby jak najlepiej odpowiadała naszym preferencjom poznawczym. "Statystyka" - to brzmi dla większości humanistów bardzo groźnie. Tym samym terminem określany jest przedmiot wykładany na matematyce, ekonomii, zarządzaniu, socjologii, psychologii. Uczy się tam jednak innych rzeczy - na matematyce przypomina to naukę budowy samochodu, na psychologii kurs jazdy samochodem. Człowiek, który zna teorię budowy samochodu może czuć się bezradny, gdy usiądzie za kierownicą. Dobry kierowca może nie znać takich szczegółów - choć jest dużo lepiej, jeżeli rozumie ogólne zasady funkcjonowania pojazdu. Podręcznik jest pisany dla praktyków, a nie teoretyków, i dlatego jest pełen uproszczeń. Stosując analogię do nauki sztuki kulinarnej, nie będziemy studiować procesów chemicznych zachodzących podczas duszenia mięsa, a skoncentrujemy się wyłącznie na heurystykach i algorytmach, jakie trzeba zastosować, aby to mięso smacznie przyrządzić. Takjak w rękach kiepskiego kucharza mięso może zostać spalone na węgiel, tak w rękach kiepskiego badacza ciekawe wyniki empiryczne mogą zostać niezauważone. Umiejętność stosowania statystyki też wymaga artyzmu. Ale zanim staną się Państwo artystami w analizowaniu danych, często obarczonych sporym szumem, czeka nas sporo palcówek. Proszę mi zaufać, choć często będą się one wydawały sztuczne, to wykonywanie ćwiczeń ma głębszy sens, niż się Państwu wydaje. Do nauki statystyki należy podejść jak do nauki języka. Najpierw trzeba nauczyć się słówek i sposobu budowania zdań. Wymaga to systematyczności. Części tych słówek będziemy się uczyć w dwóch językach równocześnie: angielskim i polskim, ponieważ ogólnie przyjęte skróty, takie jak SS na określenie sum kwadratów, pochodzą od angielskich terminów (SS - sum ojsquares). Tak jak w każdym języku, i tu jest sporo synonimów. Przykładowo,prawdopodobieństwopopełnieniabłędu L rodzaju określane jest jako poziom istotności lub poziom ufności. Symbol j3 oznacza zarówno prawdopodobieństwo popełnienia błędu II rodzaju, jak i standaryzowany współczynnik regresji itd. Treści zawarte w podręczniku są maksymalnie uproszczone. Każdy jest w stanie je przyswoić, o ile tylko zechce, tzn. będzie szukał sposobów, a nie powodów. Trzeba jednak czytać skrypt aktywnie - z ołówkiem, ewentualnie kalkulatorem, sprawdzać wszystkie obliczenia po kolei. Tylko aktywność własna może przynieść efekty. Po latach oszczędzania niepotrzebnego wysiłku uczniowi, karierę robi japońska szkoła nauczania matematyki, która podstawową rolę przypisuje wyuczeniu pew-
nych umiejętności, uzyskanie zaś wglądu jest zadaniem wtórnym. Do tego podejścia zachęcam Czytelnika. Proszę mi wierzyć - wykonanie ćwiczeń zawartych w podręczniku jest konieczne. Zostały czasem zostawione puste miejsca po to właśnie, aby skłonić Czytelnika do sięgnięcia po ołówek. Po każdym rozdziale jest kolorowa kartka, na której warto zapisać to, co powinniśmy zapamiętać. Inaczej będzie to jak oglądanie kasety z nauką jazdy samochodem. Oczywiście, że można obejrzeć, ale warto też usiąść za kierownicą. Rozwiązywanie ćwiczeń w podręczniku jest jak j azda z instruktorem. Przygotuje to Państwa do samodzielnego prowadzenia samochodu. Nawet jeżeli jesteśmy przekonani, że zrozumieliśmy co to jest wariancja, błąd standardowy, etapy testowania hipotez, to prawdziwe ukorzenienie tej wiedzy nastą pi dopiero wtedy, gdy samodzielnie przetestujemy kilkadziesiąt hipotez statystycznych. Ćwiczenia zostały tak dobrane, aby było to bardzo proste. O tym, że przyjęta przeze mnie metoda dydaktyczna jest skuteczna, przekonują mnie wysokie oceny studentów. Na 318 oceniających mnie w lutym 2003 roku studentów mediana oceny na pięciopunktowej skali na wymiarach: ciekawy wykład, kontakt ze słuchaczami, zrozumiałość wykładu wyniosła odpowiednio 4, 5, 4. To bardzo dobre oceny, biorąc pod uwagę fakt, że gdy wchodzę na salę po raz pierwszy, studenci patrzą na mnie z wielką niechęcią ze względu na nazwę przedmiotu. Zupeł nie inaczej jestem witana na pierwszym wykładzie z psychologii społecznej. Dlatego cieszą mnie dołączone do ankiet anonimowe uwagi: • ten wykładjest zrozumiały nawet dla "zatwardziałych humanistów"; • "dzięki" relacjom moich znajomych statystyka jawiła mi sięjako koszmar jakichkolwiek studiów. Dzięki pani otwartości wobec studentów oraz wyrozumiałej łopatologii, zaskakując samą siebie - polubiłam statystykę; • ponieważ nie przypuszczałam, abym rzeczywiście w życiu zawodowym korzystała z wiedzy przekazywanej w ramach przedmiotu - brak mi motywacji; JEDNAK - pani pro! tak interesująco prowadzi wykłady, iż zaczynam wierzyć, że naprawdę warto; • nigdy nie lubiłam statystyki, ale pani pro! ma talent, są to najlepsze wykłady, jakie mam w tym roku. Przedmiot trudny, wykłady bardzo pomagają, ale materiały są dla mnie nieczytelne. Odpowiedzią na ostatniąuwagęjestpodręcznik, który stanowi próbę zastąpienia moich wykładów. Na ile udaną - ocenią to Czytelnicy. Choć największy nacisk położyliśmy na wytłumaczenie,co to jest wynik istotny statystycznie, to nie należy oczekiwać, że stanie się to jasne po przeczytaniu podręcznika w ciągu jednego wieczoru. Pomalutku! Poznanie wnioskowania statystycznego można porównać do wchodzenia po drabinie. Najpierw trzeba opanować nowe słówka, potem regułę budowania zdań, aby pod koniec niespodziewanie spostrzec, że mówimy "po francusku" lub przynajmniej rozumiemy (może nie na 100%, ale dużo) ten język. Statystyki nie można nauczyć się wyrywkowo. Nie można dotrzeć na szczyt drabiny, jeżeli opuściliśmy parę szczebli. Więcej, szczebel #4 nie da się zdobyć,jeśli opuściliśmy szczebel #3. Dlatego, w odróżnieniu od nauk humanistycznych, syste-
11
matyczność
12
jest podstawą sukcesu. Nie chcę powiedzieć, że nie można wejść na szczebel #4, jeżeli się nie zrozumiało 100% materiału ze szczebla #3. Nieprawdapełne zrozumienie różnych treści może przyjść dopiero później. Zanim wejdziemy na następny szczebel, trzeba zapamiętać symbole, definicje, przykłady bez względu na to, czy się rozumie je w 100%, czy 20%. Osoby, które nie potrafią przejść dalej dopóki nie zrozumieją wszystkiego doskonale, będą miały sporo problemów, ponieważ ten podręcznik z definicji musi być pełen uproszczeń. Nie dowodzimy żadnego z wykorzystywanych twierdzeń, nie omawiamy wszystkich opcji, bo podręcznik rozrósłby się do ogromnego tomiska, które odstraszałoby większość Czytelników. Ten podręcznik zawiera tylko niezbędne minimum potrzebne psychologom, pedagogom, socjologom, specjalistom z innych nauk społecznych, w tym także lekarzom itd. do rozpoczęcia przygody z analizą i interpretacją danych. Jest to dziwne minimum, bo mimo podstawowego doboru treści, znalazły się tu zaawansowane, ale często wykorzystywane metody - na przykład użycia analizy czynnikowej do budowania wskaźników, analizy wariancji z powtarzanymi pomiarami czy regresji wielokrotnej, wizualizacji danych. Ze zrozumiałychwzględów nie są one wyczerpująco omówione (odsyłamy do literatury) - tu pokazaliśmy tylko, jak zinterpretować wyniki, które dzięki pakietom statystycznym każdy może łatwo wyprodukować, ale dużo gorzej jest z interpretacją. Niestety! Łatwo byłoby napisać podręcznik pełen wzorów matematycznych, staraliśmy się jednak ograniczaćje do niezbędnego minimum. We wszystkich wzorach dla uproszczenia zakładamy równą liczebność prób, ponieważ i tak większe analizy wykonywane są przy użyciu pakietów statystycznych. Aby je jednak zrozumieć, konieczne jest przeprowadzenie kilkunastu analiz samodzielnie. Pomijamy też często indeksy przy wzorach sumowania, zastępując je komentarzem. Podane przykłady zadań dotyczą śmiesznie małych prób po to, aby maksymalnie uprościć obliczenia. Używając statystyki w badaniach społecznych, można stosować standardy stanu idealnego: sprawdzać rygorystycznie wszystkie założenia, lub stanu normalnego, zgodnie z tym, co robią inni badacze. Przykładowo, nie ma dowodów na to, że skala odpowiedzi: (1) zdecydowanie się zgadzam, (2) zgadzam się, (3) trudno powiedzieć, (4) nie zgadzam się, (5) zdecydowanie się nie zgadzam, ma charakter przedziałowy, a jednak w badaniach publikowanych w najlepszych czasopismachjest ona tak traktowana. Dlatego w podręczniku stosujemy standardy nie rygorystyczne, ale uznawane w środowisku badaczy. Sama nie lubię powtórzeń, jednak dwudziestoletnie doświadczenie dydaktyczne nauczyło mnie, że są one niezbędne. Dlatego w skrypcie staraliśmy się nie unikać powtarzania ważnych informacji. Podręcznik można pisać, podając formuły ogólne lub też koncentrując się na ćwiczeniu wybranych przykładów w nadziei, że ich opanowanie pozwoli zapewne na generalizację. Dlatego przez cały podręcznik prowadzimy Czytelnika, posługując się przykładami z fikcyjnego badania LEARN i prowadzonego od początku lat 90. Polskiego Generalnego Sondażu Społecznego. Nie zakładamy, że Czytelnik, który dobrnie z nami do końca podręcznika będzie umiał analizować dane z badań społecznych. Nie od razu Kraków zbudowano. Cel
ostanie osiągnięty, jeżeli będzie on potrafił przeprowadzić (fizycznie i/lub mental-
~ie) wybrane analizy przedstawione w podręczniku. Gwarantujemy jednak, że statystyka przestanie być czarną magią· Do fizycznego przeprowadzenia analiz dużego zbioru danych potrzebny jest dostęp do jakiegoś pakietu statystycznego i umiejętność posługiwania się komputerem oraz tym programem. Wszystkie przykłady i sposoby prezentowane w skrypcie są wynikami używania pakietu statystycz~ego Stat~stical Pac~age for Social Scien~es (SPSS). Jest to bardzo potężne n~r~ędzl: ~~ analIzy d~nych.l ?l~tego ~d począ~~uJą cych (ale nie tylko) wymaga umleJętnoscllg~orowamaduzeJ lIc~by mformacJI. Na wydruku znajduje się wiele statystyk, które me wnoszą do badama potrzebnych danych. Początkujący użytkownik, który zechciałby zrozumieć wszystko, co jest wydrukowane, będzie skazany na klęskę· Chociaż nasze nazwiska figurują na okładce tego podręcznika, to trudno nazwać nas autorami zawartych w nim treści. Nie my pierwsi opisaliśmy rozkład normalny, analizę wariancji, etapy testowania hipotez statystycznych. Szukając najprostszego sposobu przekazu, korzystaliśmy z prac innych. Pomysł populacji marsjańskiej (choć nie tak się ona nazywała) i niektórych zadań pochodzi z podręczników amerykań skich. Zostały one jednak znacznie przystosowane do naszej koncepcji uczenia. Podręcznikpowstawał ewolucyjnie z przygotowywanych (i zmienianych co roku) materiałów do nauki statystyki. W pracy nad wersją sprzed paru lat brali udział: dr Grzegorz Król, mgr Jerzy Madej, mgr Irena Zinserling, dr Dorota Król, dr Piotr Radkiewicz, mgr Agata Bieniek, mgr Rafał Tomicki. Ostatnia edycja pracy jest zasługą mgr Marty Bizackiej. Najwyższe słowa uznania należą się profesorowi Jerzemu Brzezińskiemu, którego szczegółowe uwagi przyczyniły się do znacznego ulepszenia tekstu. Mam świadomość tego, że zbliżający się kolejny rok akademicki wymusza zakończenie pracy, choć tyle rzeczy warto byłoby poprawić, dodać. No cóż, jak powiedział Montaigne: "Umiejętności i sztuki nie powstają gotowe, jakoby odlane w formie, jeno tworzą się i kształtują pomalu, gdy się je obrabia i szlifuje..." Będziemy wdzięczni Czytelnikom za sygnalizowanie nam nieścisłości i propozycje zmian. Uspokaja mnie trochę to, co usłyszałam od dziekana MINI Politechniki Warszawskiej, że nawet w XX wydaniu zbioru zadań Gdowskiego i Plucińskiego wciąż są notowane błędy. Mogę obiecać, że dołożymy starań, aby kolejne wydanie tego bardzo potrzebnego podręcznika było jeszcze lepsze. Na stronie WWW.CQme.uw.edu.pl/gw znajdą Państwo odpowiedzi do ćwiczeń, zbiory danych, komentarze. Pracujemy też nad przygotowaniem kursu internetowego ze statystyki. Podręcznik stanowi wprowadzenie w problematykę i jestem przekonana, że po przeczytaniu go sięgną Państwo z zainteresowaniem do pozycji podanych w bibliografii. Grażyna Wieczorkowska
www.come.uw.edu.pl/gw 7 maja 2003 roku
(
[email protected]) 13
Literatura
14
[1] Aronson E., Ellsworth P.C., Carlsmith 1M., Gonzales M.H. (1990,2 wydanie). Methods ofresearch in social psychology. New York: McGraw-Hill. [2] Aronson E., Wieczorkowska G. (2001). Kontrola naszych myśli i uczuć (Skąd my to wszystko wiemy, s. 19-32, Jak odpowiadać na interesujące pytania?, s. 113-181). Warszawa: Santorski. [3] BlalockH.M. (1977). Statystyka dla socjologów (tłum. M. Tabin i in.). Warszawa: Państwowe Wydawnictwo Naukowe. [4] Brzeziński l (red.). (1987). Wielozmiennowe modele statystyczne w badaniach psychologicznych. Warszawa-Poznań: Państwowe Wydawnictwo Naukowe. [5] Brzeziński l (1996). Metodologia badań psychologicznych. Warszawa: Wydawnictwo Naukowe PWN. [6] Brzeziński l (2000). Badania eksperymentalne w psychologii i pedagogice. Warszawa: Wydawnictwo Naukowe "Scholar". [7] Cichomski B. (2000). Polskie Generalne Sondaże Społeczne: skumulowany komputerowy zbiór danych 1992-1999. Warszawa: Instytut Studiów Społecznych, Uniwersytet Warszawski. [8] Clegg F. (1994). Po prostu statystyka (tłum. E. Łakoma, W. Rzewuski). Warszawa: Wydawnictwa Szkolne i Pedagogiczne. [9] Cohen l, Cohen P. (1983). Applied multiple regressionlcorrelation analysis for the behavioral Sciences. Hillsdale: Lawrence Erlbaum. [10] Ferguson G.A., Takane Y. (1997). Analiza statystyczna wp~ychologii i pedagogice (tłum. M. Zagrodzki). Warszawa: Wydawnictwo Naukowe PWN. [11] Góralski P. (1987). Metody opisu i wnioskowania statystycznego w psychologii i pedagogice. Warszawa: Państwowe Wydawnictwo Naukowe. [12] Gómiak J., Wachnicki J. (2000). Pierwsze kroki w analizie danych. SPSS PL for Windows. Kraków: SPSS Polska. [13] Jacoby W.G. (1997). Statistical graphicsfor univariate and bivariate data. Thousand Oaks: Sage Publications. [14] Król G., Wieczorkowska G. (1996). Przykłady zastosowań modelowania strukturalnego w badaniach społecznych. Warszawa: Zeszyty Naukowe 1SS. Seria: Prace Metodologiczne. [15] Mitchell M., Jolley l (1996). Research design explained. Fort Worth: Harcourt Brace College Pub1ishers. [16] Nowojczyk M. (2002). Przewodnik po statystyce dla socjologów. Kraków: SPSS Polska. [17] Pagano R.R., Follett W.C. (1986). Understanding statistics in the behavioral sciences. St. Paul: West Publishing Co. [18] Paszkiewicz R (1985). Podstawy procesu badawczego w psychologii, w: L. Wołoszy nowa, Materiały do nauczania psychologii. Seria III, t. 4. (s. 128-158). Warszawa: Państwowe Wydawnictwo Naukowe. [19] Shaughnessy 1.1., Zechmeister RB., Zechmeister lS. (2002). Metody badawcze w psychologii. Gdańsk: Gdańskie Wydawnictwo Psychologiczne. [20] Skład M., Wieczorkowska G. (2001). Sztuka układania ankiet ewaluacyjnych, w: M. Lewicka, J. Grzelak (red.), Psychologia społeczna: jednostka - społeczeństwo ~ państwo (s. 250-266). Gdańsk: Gdańskie Wydawnictwo Psychologiczne. Wieczorkowska G., Król G. (1995/1997). O typowym zastosowaniu analizy czynniko[21] wej i skalowania wielowymiarowego w badaniach społecznych. Warszawa: Zeszyty Naukowe 1SS. Seria: Prace Metodologiczne.
Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań Pojęcia
kluczowe: badania eksperymentalne i korelacyjne; zmienne: (wskaźniki), niezależne, zależne
teoretyczne i empiryczne nominalne,
porządkowe i ilościowe (przedziałowe
(dyskretne),
wyjaśniające
i
wyjaśniane,
i kontrolowane,
i ilorazowe), ciągłe i nieciągłe
istotne i uboczne; operacjonalizacja;
skale pomiarowe
Wprowadzenie Czy normalny człowiek musi znać statystykę? Wysłuchałam [GW] niedawno audycji radiowej o żywieniu. Występująca w niej pani doktor wypowiadała się autorytatywnym tonem o tym, jak należy się odżywiać. Z pełnym przekonaniem formuło wała wnioski, które w rzeczywistości nie były uzasadnione, np. że wysoki poziom cholesterolu we krwi współwystępuje z chorobami układu krwionośnego, zatem nie należy jeść potraw zawierających cholesterol. Zależność między spożywaniem cholesterolu i wysokim poziomem tego składnika we krwi jest modyfikowana przez wiele innych zmiennych (np. w dużo większym stopniu zależy od czynności wątroby niż od rodzaju spożywanego pożywienia). Stosując taki schemat wnioskowania, można by założyć, że przy żółtaczce nie należy jeść żółtych produktów. Analogicznie nasze wnioski dotyczące pożytków ze stosowania diety wegetariańskiej są ograniczone ze wz~lęd~ na słabość badań. Wegetarianie różnią się od osób niestosujących tego rodzaJU dIety także na innych wymiarach, np. pod względem troski o własne zdrowie. Gdy z~dzwoniłam do radia i zwróciłam uwagę na ten aspekt redaktor prowadzącej audyCJę, była oburzona. "Co pani opowiada, to są przecież wyniki badań nauko-
15
Rozdział 1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
16
wych!". Tak, ale badania naukowe prowadzą do konkluzji o różnej sile pewności (większość z nich tylko uprawdopodobnia pewne tezy). Nawet jeśli sami nie prowadzimy badań naukowych, to jednak obserwujemy rzeczywistość, usiłując formułować wnioski o zależnościach przyczynowych między zmiennymi. Wyobraźmy sobie następującą sytuację· Znowu zasypiam nad sprawdzaniem prac magisterskich. Dobrze spałam w nocy, więc jestem wyspana. Może to pogoda? Muszę to zrobić do jutra. Wypiję zieloną herbatę. Nic nie pomaga, piję następną. Po godzinie czuję się świeża i wypoczęta. Czy to zasługa zielonej herbaty? Trudno powiedzieć, ponieważ mogły nastąpić zmiany w moich procesach biochemicznych, które są niezależne od tego, co robiłam. Aby być pewną wpływu zielonej herbaty, musiałabym być pewna, że JA o godzinie 10 i JA o godzinie 11 to ten sam obiekt i nic, poza wypiciem zielonej herbaty, się nie zmieniło. Tego nie mogę zagwarantować, powinnam więc powtórzyć eksperyment z zieloną herbatą w wielu punktach czasowych. Losuję dni tygodnia i godziny i o określonej porze oceniam swoje samopoczucie, następnie piję zieloną herbatę i po jakimś czasie oceniam ponownie. Podstawowe pytanie brzmi: po jakim czasie? Po 15 minutach, godzinie, 2 godzinach? Zielona herbata może mieć bardzo różny wpływ, gdy pijęją, kiedy jestem wyspana, zmęczona, podekscytowana... Sama czynność picia może mieć wpływ na zmianę samopoczucia, takjak przyjemnośćjedzenia może wynikać nie tylko z przyjmowania pokarmów, ale samego faktu używania mięśni, które zostały skojarzone z przyjemnością. Nasza pamięć zapisana jest także w mięśniach. Badania pokazały na przykład,że dowcipne rysunki podobają nam się bardziej, gdy w czasie oglądania trzymamy w ustach długopis w sposób, który wymaga układu mięśni takiego jak wówczas, kiedy się uśmiechamy, niż wtedy gdy nasze mięśnie układają się w smutny wzorzec. Pojawia się problem badacza znającego hipotezy. Jeżeli na przemian w wylosowanych punktach czasowych piję herbatę czarną i zieloną, to jestem świadoma, jaką herbatę piję i to może wpływać na moje oceny. Lepiej byłoby przygotować mieszanki zielonej i czarnej herbaty o różnym składzie procentowym, zakleić, ich opis schować do szafy pancernej i być nieświadomą, co w danej chwili piję· Myślę, że nie muszę dalej przekonywać, że bycie badanym i badaczem w jednej osobie jest bardzo trudne,jeżeli nie niemożliwe. Lepszym rozwiązaniembyłoby zbadanie wpływu zielonej herbaty na inne osoby. Mogę się zastanawiać, kto z moich znajomych pije zieloną, a kto czarną herbatę, następnie oszacować ich średnią ospałość i policzyć współczynnik korelacji (co to dokładnie oznacza, wyjaśnione jest w rozdziale 8.) między częstością picia zielonej herbaty a interesującą mnie zmienną. Załóżmy, że zaobserwowaliśmy dodatni związek - ci, którzy piją zieloną herbatę, mają wyższy poziom energii niż ci, którzy piją herbatę czarną. Czy mogę stwierdzić, że zielona herbata redukuje ospałość? Niekoniecznie, ponieważ ludzie pijący zieloną herbatę mogą różnić się od pozostałych stopniem dbania o zdrowie, częstością podejmowania aktywności fizycznej itd. Znalazłam właśnie tekst informujący, że picie określonego zestawu ziół zwiększa poziom energii. Broszura zawiera bardzo przekonujące opisy osób, których życie po rozpoczęciu picia tej mieszanki ziołowej zmieni-
Wprowadzenie
ło się radykalnie.
Czy mogę wierzyć tym argumentom? Nie bardzo! Aby ocenić wpływ tej zmiennej, musiałabym mieć informację także o tych, którzy pili i im nie pomogło. Nie ma metody, leku, który byłby skuteczny w 100% dla wszystkich. Analizując takie dane, musimy porównać cztery rodzaje informacji, tj. liczbę osób:
~
. które piły i wykazały poprawę; 2. które nie piły i wykazały poprawę; 3. które piły i nie było poprawy; 4. które nie piły i nie było poprawy.
Dopiero wtedy mogę określić stopień związku między obiema zmiennymi. Wszystkie materiały reklamowe, które "przekonują" nas o cudownych środkach gwarantujących pozbycie się nadwagi, cellulitu, trądziku itp. zawierają tylko jedną z tych informacji i dlatego są bezwartościowe. W USA wprowadzono nakaz rzetelnego informowania konsumentów i we wszystkich telewizyjnych materiałach reklamowych pojawia się maleńki napis: "Rezultaty mogą się różnić u różnych osób". Nie da się ukryć, że biznes żerujący na naszych marzeniach, aby stać się piękny mi i młodymi bez "trudu i bólu", kwitnie. Ładnie to opisał już Fromm w Sztuce istnienia. Co mamy zatem robić, aby ocenić skuteczność nowego, wspaniałego środ ka? Jedynym rozwiązaniem jest stosowanie metod naukowych, które:
o składają się z szeregu uporządkowanych procedur, stosowanych do analizowania i problemów; e korzystają z informacji zebranych w obiektywny sposób jako faktycznej podrozwiązywania
stawy do wyciągania wniosków;
O opierają się na empirycznym materiale dowodowym; O polegają na stosowaniu nietendencyjnych metod przeprowadzania obserwacji, zbierania danych i formułowania hipotez i twierdzeń (o tym, czy coś jest prawdziwe lub uznawane, nie decydują ani autorytet, ani osobiste przekonania). Spełnienie wyżej
wymienionych warunków powoduje, że uzyskujemy dane, które można zademonstrować wielokrotnie; zarówno może czynić to naukowiec, który je odkrył, jak i inne osoby. Wyniki, których nie da się uzyskać ponownie (zreplikować) nie są godne zaufania. Dla odpowiedzi na pytanie o wpływ zielonej herbaty najlepszą metodą jest eksperyment. Wystarczyłobypodzielić losowo grupę ochotników na dwie części. Następnie zmierzyć ich nastrój, poziom energii. Zaproponować im potem do wypicia zieloną lub czarną herbatę (niestety, nie można im pozwolić wybierać), zająć ich czymś przez następną godzinę i znów mierzyć ich poziom energii. Czy chcemy tego czy nie, podejmujemy codzienne decyzje, kierując się wynikami badań, bądźmy więc świadomi ich wartości. Wszystkie badania mają pewne cechy wspólne. Zaczniemy od wprowadzenia i zdefiniowania podstawowych pojęć. Badanie
17
Rozdział l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
naukowe zaczyna się od postawienia pytania. Czy zielona herbata podnosi poziom naszej energii? Czy przeżywanie stresu prowadzi do zwiększonej podatności na choroby somatyczne? Jak wpływa na nasze zachowanie oglądanie przemocy w TV? Pytanie jest dobrze sformułowane,jeżeli można na nie odpowiedzieć, dokonując obserwacji. Każde pytanie może stać się naukowym, pod warunkiem że spełnia wymóg empirycznej rozstrzygalności,a więc możliwe jest określenie,jakie fakty, zjawiska czy procesy należy zaobserwować, aby udzielić na nie odpowiedzi. Takiej możliwości nie daje np. pytanie o wpływ wyboru płci i IQ (ilorazu inteligencji) nienarodzonego dziecka na strukturęspołeczną,ponieważ rodzice jeszcze nie mogą podejmować takich decyzji. Po sformułowaniu "rozstrzygalnego empirycznie" zagadnienia musimy zdecydować, co dokładnie chcemy obserwować, żeby odpowiedzieć na pytanie.
Operacjonalizacja zmiennych teoretycznych
18
Podejście naukowe wymaga opisu rzeczywistości za pomocą zmiennych. Jeżeli chcemy sprawdzić, czy frustracja (przerwanie zachowania ukierunkowanego na cel np. z powodu jakiejś arbitralnej ingerencji innej osoby) wzbudza negatywny afekt, który wywołuje agresywne myśli, gniew oraz skłonność do zachowań agresywnych, to mamy dwie zmienne teoretyczne: frustracja i agresja. Jeżeli interesuje nas wpływ obserwacji przemocy na agresywnośćzachowania, to w tak ogólnie sformułowanym pytaniu mamy też dwie zmienne teoretyczne: oglądanie przemocy i agresja. Aby pytanie spełniało wymóg empirycznej rozstrzygalności, musimy występują ce w nim zmienne teoretyczne zoperacjonalizować, czyli wskazać operacje, które trzeba wykonać, aby określić wartość, jaką przyjmuje zmienna. Zmiennąmoże być każda cecha, która przyjmuje różne wartości (a więc nie jest stała, jak np. płeć zakonników w zakonie męskim) i jest w sposób jednoznaczny przypisana interesującym nas obiektom. Niektóre zmienne, takie jak wzrost, są ciągłe i mogą przyjmować każdą wartość z interesującego nas zakresu (a więc 173 cm i 1 mm, 173 cm i 2 mm itd.), choć nasze narzędzia pomiarowe często czynią z ciągłych zmiennych zmienne nieciągłe (dyskretne, skokowe) - przyjmujące tylko całkowite wartości z kontinuum. Inne zmienne, takie jak np. konkretne zachowania w sytuacji eksperymentalnej (1 - pomógł, 2 - odmówił pomocy, 3 - obiecał pomóc później) są z definicji nieciągłe, bo mogą przyjmować tylko określoną liczbę wartości. Aby zoperacjonalizować zmienne teoretyczne, musimy określić, jak obserwacje otaczającej nas rzeczywistości można przełożyć na coś, co będziemy mogli analizować, czyli na dane. Celem pomiaru jest umieszczenie osób badanych na pewnym kontinuum, tak aby odległość dwóch osób (różnica w wynikach w danej zmiennej empirycznej) odzwierciedlała ich odległość na kontinuum przedstawiającym zmienną teoretyczną. Jeżeli naszą zmienną teoretycznąjest POZIOM WIEDZY ze statystyki zoperacjonalizowany w postaci zmiennej empirycznej: WYNIKI z egzaminu, to oczekujemy, że różnica między poziomem wiedzy Kasi i Janka powinna odpowiadać różnicy
Operacjonalizacja zmiennych teoretycznych
w ich wynikach na egzaminie. Wiemy też, że zmienna empiryczna WYNIK egzamina~ cyjny może być lepszym lub gorszym wskaźnikiem zmiennej teoretycznej POZIOM WIEDZY, ponieważ na jej wartości wpływają także zmienne zakłócające, takie jak: stopień motywacji, poziom koncentracji, błędy w systemie oceniania, pomyłki itd. Jeżeli nasz egzamin składa się z dwóch pytań, to jego wynik będzie zapewne dużo gorszym wskaźnikiem zmiennej teoretycznej niż wtedy, gdy pytań było dwadzieścia. Zmienną teoretyczną OGLĄDANIE PRZEMOCY w TV możemy doprecyzować, mówiąc o ilości czasu, jaki dana osoba poświęca na oglądanie programów zawierających przemoc. Możemy próbować mierzyć związek między ilością czasu, jaki dziecko spędza na oglądaniu aktów przemocy w telewizji, a jego tendencją do wybierania agresywnych rozwiązań dla swych problemów. Musimy ustalić, jak zmierzymy obie zmienne. Analogicznie, musimy podjąć wiele podobnych decyzji, budując wskaźnik agresywności zachowania. I tu pojawia się często zadawane przez studentów pytanie: jak zmierzyć agresywność zachowania? Odpowiadając na to pytanie, można przytoczyć anegdotę o profesorze, który pokazał swoim studentom ziemniaka i zapytał, jak go zmierzyć. Studenci podeszli twórczo do problemu i prześcigali się w propozycjach, aby podać jego wagę, kształt, kolor, stopień zawartości wody itd. Dopiero po chwili zrozumieli, że nie można odpowiedzieć na to pytanie, zanim nie ustali się, co nas w tym ziemniaku interesuje. Chcąc określić agresywność zachowania, musimy powiedzieć dokładnie, jaki aspekt agresywności nas interesuje i sprecyzować, o co będziemy pytać rodziców, nauczycieli, rówieśników. Wskaźnikiem ilości czasu mogą być odpowiedzi badanych na pytania dotyczące tego, jakie programy oglądają i jak często. Możemyoto samo zapytać rodziców. Musimy też ocenić, które programy są niebezpieczne, np. na podstawie oceny ekspertów. Jeżeli Adaś mówi, że ogląda systematycznie filmy pełne scen przemocy, to nasz wskaźnik powinien mieć dla niego wyższą wartość niż dla Krzysia, który nie ogląda tych filmów, aj edynie filmy przyrodnicze. Bez względu na to,jakijest nasz stosunek do matematyki, operacjonalizacja zmiennej OGLĄDANIE PRZEMOCY w TV zakończysię przypisaniem każdemu dziecku pewnej liczby. Szczegóły tej operacji poznamy w następnym rozdziale. Przy budowaniu wskażników zmiennych teoretycznych wskazane jest odwoływanie się do operacjonalizacji opisanych w pracach innych autorów.
"'--t
19
Rozdział
1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje
badań
Tenninem zmienna określamy zarówno zmienne teoretyczne, jak i obserwacyjne, inaczej empiryczne. Badacze często określają swoje zmienne na różnym poziomie ogólności (np. agresywność, skłonność do udziału w bijatykach, wynik w kwestionariuszu mierzącym agresję). Brak standardowych operacjonalizacji zmiennych teoretycznych powoduje, że często badacze tworzą własne definicje (i operacjona1izacje). Po latach walki o definicje takich pojęć, jak inteligencja, motywacja czy osobowość, uznano, że są to pojęcia naturalne, których w sposób tradycyjny (przez podanie warunków koniecznych i wystarczających) zdefiniować się nie da. Nie sposób porównać wyników badań np. nad zależnościądobrostanu od inteligencji, jeżeli nie znamy operacjona1izacji zmiennych. Konsekwencją tego jest tendencja do fonnułowania hipotez w języku zmiennych empirycznych, a nie zmiennych teoretycznych. Spotkamy się więc często ze sfonnułowaniem"wpływ systemu nagradzania na wynik w teście", choć można sądzić, że badacz jest w rzeczywistości zainteresowany funkcjonowaniem intelektualnym, a nie tylko wynikiem w konkretnym teście. Zalecane jest jednak fonnułowanie hipotez w tenninach nieobserwowalnych zmiennych teoretycznych z równoczesnym wskazywaniem operacjona1izacji, czyli sposobu budowania zmiennych empirycznych (czytaj: związków wskaźników ze zmiennymi teoretycznymi). Nie sposób przecenić roli teorii w badaniach naukowych. W tym podręczniku poświęconymanalizie danych jest ona pominięta, ale zakładamy, że Czytelnik zapozna się z literaturą metodologiczną [1,5, 19].
Badania korelacyjne Każda osoba biorąca udział w badaniu jest przedstawiona jako punkt, którego pierwsza współ rzędna (X) odpowiada jej poziomowi stresu, natomiast druga współrzędna (Y) jej wynikowi
w teście.
y
~
o
!-,--~-~--~-~-------J"x STRES1
Rysunek 1.1. Przykład pozytywnego (dodatniego) liniowego związku między poziomem stresu a sprawnością intelektualną (współczynnik korelacji wynosi 0,77) y
"r-:-------------,
Badania korelacyjne Jeżeli badamy związek między dwiema zmiennymi, np. poziomem stresu egzaminacyjnego a wynikiem w teście, to może się okazać, że jest on: 1. pozytywny (współczynnikkorelacj i między dwiema zmiennymi ilościowymi omówiony w rozdziale 8. jest dodatni (patrz rysunek 1.1), co oznacza Geżeli jest istotny statystycznie), że im wyższy poziom stresu, tym wyższy wynik w teście lub 2. negatywny (ujemny-patrz rysunek 1.2), co oznacza Geże1ijest istotny statystycznie), że im wyższy poziom stresu, tym niższy wynik w teście. Jeżeli związek między poziomem stresu a sprawnością intelektualną jest krzywoliniowy, współczynnik korelacji liniowej może wynieść zero, co przez początku jących badaczy bywa błędnie interpretowane jako brak związku (patrz rysunek 1.3), a oznacza jedynie brak związku liniowego. Badania, w których obserwujemy jedynie współwystępowaniezmiennych nazywane są badaniami korelacyjnymi.
~
-_~-~--~-~-~
o!-,
x
STRES1
Rysunek 1.2. Przykład negatywnego (ujemnego) liniowego związku między poziomem stresu a sprawnością intelektualną (współczynnik korelacji wynosi -0,80) y
.1--------_._---------~ ~ '~-_o-____."----~-----J,, X STRES!
20
Ry~~n~k 1.3. Przykład krzywoliniowego związku między poziomem stresu a spraw0,05)
nosclą rntelektualną (współczynnik korelacji wynosi
21
Badania eksperymentalne
Rozdział 1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
Badania eksperymentalne Załóżmy, że stwierdziliśmy dodatnią korelację między zmiennymi OBSERWACJA PRZEMOCY i AGRESJA. Czy to oznacza, że oglądanie agresji w TV jest przyczyną agresywności u dzieci? Niekoniecznie. Może to także znaczyć, że dzieci z natury agresywne, po prostu lubią oglądać przemoc i że byłyby one równie agresywne, nawet gdyby całymi dniami oglądały ckliwe dobranocki. Aby wykazać zależność przyczynową między oglądaniem przemocy w TV a zwiększeniem agresywności, musimy przeprowadzić badania eksperymentalne. Jak można to zrobić? Na przykład dzieląc losowo dzieci na dwie grupy. Jednej grupie (grupa eksperymentalna) pokazujemy odcinek serialu telewizyjnego, w którym ludzie zachowują się bardzo agresywnie przez 50 minut w ciągu odcinka. Inne dzieci, przydzielone losowo do grupy kontrolnej, przez tyle samo czasu oglądają film niezawierający przemocy. Najważniejsze jest to, że każde dziecko ma równe szanse, iż będzie wybrane do oglądania serialu, dzięki temu w eksperymencie zostają zneutralizowane wszelkie różnice między dwiema grupami eksperymentalnymi pod względem charakteru dzieci. Jeżeli dzieci, które oglądały serial, wykazywały potem większą agresywność w zabawach niż dzieci, które oglądały neutralny film, to fakt ten wyraźnie sugeruje, że oglądanie przemocy może doprowadzić do jej stosowania. Gdy interesuje nas zależność przyczynowa, hipotetycznąprzyczynę nazywamy zmienną niezależną, ponieważ to eksperymentator ustala jej wartości - manipuluje nią. Jest ona niezależna od innych wpływów.
Zmienną niezależną nazywamy tę, której wpływ chcemy zbadać. Zmienna zależna jest tym, co mierzymy, aby ocenić skutki "działania" zmiennej niezależnej.
22
W omawianym eksperymencie "manipulowaliśmy" rodzajem oglądanej audycji telewizyjnej - zmiennąniezależną było oglądanie lub nieoglądanie filmu pokazującego przemoc. Zmienna niezależna przyjmowaławięc dwie wartości (O - film bez przemocy; 1 - film z przemocą). Efekt manipulacji eksperymentalnej powinien się przejawić w zmianach zmiennej zależnej, nazwanej tak, ponieważ eksperymentator spodziewa się wyniku zależnego od zmian wprowadzonych przez zmienną niezależną. W tym eksperymencie zmienną zależną był stopień agresji przejawianej w zachowaniu. Model teoretyczny tworzony przed rozpoczęciem badań zawiera zazwyczaj wię cej zmiennych niż te, których pomiaru dokonamy. Brzeziński [5] proponuje, aby podzielić je na istotne i nieistotne, wyróżnić zmienne uboczne - zakłócające.
Często zbieramy dodatkowe informacje, które mogą być wykorzystywane w dalszych analizach, np. notujemy płeć, wiek badanych, mierzymy u nich poziom lęku. Tego typu zmienne nazywane są zmiennymi kontrolowanymi, ponieważ możemy je wprowadzić do analizy.
Operacjonalizacja zmiennej
niezależnej
w badaniach eksperymentalnych W eksperymencie psychologicznym wartości zmiennej niezależnej wyznaczane są przez różnice w sytuacjach eksperymentalnych, a zmienna zależna jest pomiarem reakcji badanego. Zmienna musi mieć co najmniej dwie wartości - inaczej byłaby stałą. Potrzebne są co najmniej dwie wartości zmiennej niezależnej, by móc zademonstrować, że manipulacja przyniosła efekt, podczas gdy eksperyment z tylko jedną wartością zmiennej niezależnej nie pozwala określić, czy jego rezultat, wyrażany za pomocą wartości zmiennej zależnej, ma coś wspólnego z obecnością zmiennej niezależnej. W eksperymencie AGRESJA wprowadzono dwie wartości zmiennej niezależnej : oglądanie filmu z przemocą lub bez, i to one wyznaczały podział na grupę eksperymentalną (z przemocą) i grupę kontrolną (bez przemocy). Zmienne niezależne nazywane są często czynnikami, a ich wartości poziomami czynnika. Stosując tę terminologię, powiedzielibyśmy, że w naszym badaniu czynnik "przemoc" miał dwa poziomy. Kiedy pytanie zostanie już przekształcone w twierdzenie stanowiące hipotezę badawczą, eksperymentator musi zdecydować, jak zaprojektowaćprocedurę eksperymentalną. Jednym z najtrudniejszych zadań badacza jest przełożenie hipotezy na specyficzne, obserwowalne zdarzenia. Jeżeli chcemy się dowiedzieć, czy ludzie szybciej reagują (naciskając odpowiedni klawisz) na zapalające się światło, gdy towarzyszy mu dźwięk, zmienna niezależ na jest określona w sposób oczywisty - obecność lub brak dźwięku. Jeżeli jednak chcemy określić, czy agresywność dzieci wzrasta po obejrzeniu filmu z dużą dawką przemocy, zmienna niezależna - przemoc, jest dużo trudniejsza do zdefiniowania. Potrzebujemy definicji operacyjnej, czyli operacjonalizacji naszej zmiennej teoretycznej. Oznacza to, że musimy określić operacj e, jakie trzeba wykonać, aby wprowadzić daną wartość zmiennej niezależnej. Operacjonalizacja przypomina przepis kulinarny, ponieważ określa dokładnie, co inny badacz, który chce zreplikować nasz eksperyment, powinien zrobić. W badaniu poświęconym wpływowi oglądanej w telewizji agresji operacjonalizacja zmiennej niezależnej musi określać, co należy zrobić, aby uznać dany film za "niebezpieczny", tzn. zawierający dużo aktów przemocy. Możemy pokazać różne filmy losowo wybranej grupie 100 osób i określić jako niebezpieczny ten, który uzyska ponad 75% wskazań. Innym sposobem jest zadanie 10 pytań typu: "Czy w filmie pokazywano bójki?", "Czy któryś z bohaterów poniżał inną osobę?" itp. Możemy założyć, że film, który otrzymał co najmniej dwie odpowiedzi TAK, jest niebezpieczny. Analogiczny problem pojawi się przy operacjonalizacji zmiennej zależnej.
23
Rozdział
1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
W eksperymencie możemy obserwować zachowanie dziecka w pokoju z zabawkami po obejrzeniu "niebezpiecznego" filmu i porównywać je z zachowaniami dzieci, które oglądały "bezpieczny" film. Potrzebne będą skale, na których obserwatorzy (określani jako sędziowie kompetentni) będą oceniać zachowanie dzieci. Operacjonalizacja zmiennych teoretycznych jest podstawowym i bardzo trudnym krokiem, ponieważ w naukach społecznych brak jest standardowych procedur. Dla bardzo wielu zmiennych teoretycznych, takich jak: poczucie winy, niepokój, poczucie własnej godności czy agresja, nie ma jednej, "prawdziwej" operacjonalizacji. Prowadzi to do problemów w porównywaniu wyników badań, które na poziomie teoretycznym dotyczą tej samej zależności, ale w praktyce wykorzystują zupełnie inne operacjonalizacje zmiennych. Dzieje się tak dlatego, że operacjonalizacja jest ściśle związana z kontekstem eksperymentu. Nie możemy stosować tego samego filmu, badając dzieci i młodzież. Inaczej też musimy zoperacjonalizować agresywność zachowania u dzieci i młodzieży. Podobnie jest w badaniach korelacyjnych. O inne pogramy będziemy pytać dzieci, o inne młodzież. Warto zauważyć, że o ile w badaniach eksperymentalnych zmienna niezależna, którą manipulujemy, jest wyznaczona jednoznacznie, to w badaniach korelacyjnych role zmiennych możemy łatwo odwrócić. Możemy sądzić, że to agresywność dzieci wpływa na wybór programów telewizyjnych, a więc jest zmiennąniezależną, od której zależy ilość oglądanej w telewizji przemocy (zmienna zależna). Należałoby więc w badaniach korelacyjnych zrezygnować z używania terminologii "zmienna niezależna - zmienna zależna", zastępując określenia "niezależna" przez wyjaśniająca, "zależna" przez wyjaśniana. Zgodnie z umową społeczną używamy jednak pojęć "zmienna niezależna" i "zależna", także w badaniach korelacyjnych.
Porównanie badań eksperymentalnych i korelacyjnych
24
Powtórzmy: Pierwszym krokiemjest sformułowanienaszego ogólnego zainteresowania problemem w postaci konkretnego pytania badawczego ujętego jako zależność między zmiennymi teoretycznymi. Następnym krokiemjest znalezienie sytuacji, w których możemy zaobserwować interesujące nas zjawisko. Jeśli jesteśmy zainteresowani wpływem sposobu odżywiania na samopoczucie, powinniśmy określić typy diet, które mają tę różni cę w zakresie samopoczucia powodować. W przypadku pewnych pytań musimy poczekać na zaistnienie okoliczności umożliwiających obserwację. Psychologowie społeczni, którzy chcą studiować ludzkie reakcje na klęski żywiołowe, zmuszeni są "czekać na": powódź, tornado, trzęsienie ziemi lub inne nieszczęścia. Analogicznie astronomowie oczekują na zbliżenie się komety do Ziemi, aby dokonać swoich obserwacji. Eksperyment różni się od innych typów naukowych dociekań tym, że zamiast czekać na zaistnienie interesujących nas wydarzeń naturalnych, eksperymentator kreuje warunki potrzebne do obserwacji. Ma to dwie podstawowe zalety:
Porównanie
badań
eksperymentalnych i korelacyjnych
Po pierwsze, konstruowanie sytuacji eksperymentalnej pozwala na uwypuklenie czynników nieistotnych. Na przykład w badaniu ZIELONA HERBATA sytuację eksperymentalną można zaaranżować w taki sposób, że jedni badani piją zieloną herbatę na czczo, podczas gdy druga grupa pije na czczo czarną herbatę. W codziennym życiu wpływ herbaty mógłby być modyfikowany np. przez rodzaj spożywanego śniadania. Po drugie, eksperymentator może kontrolować i systematycznie zmieniać warunki, aby zbadać dokładnie tę samą sytuację zawierającą lub nie pewne elementy (np. herbata na czczo, herbata po obiedzie). Gdyby badacz chciał zastosować nieeksperymentalny schemat badania, musiałby znaleźć "naturalne" grupy pijące herbatę różnego rodzaju. Ludzie pijący herbatę niejednakowych rodzajów mogą się różnić pod wieloma względami. Znalezienie dwóch grup, które są podobne do siebie pod wszystkimi względami (dieta, aktywność, ciśnienie krwi) z wyjątkiem jednego interesującego badacza czynnika, jest bardzo trudne, jeżeli nie niemożliwe. Co ważniejsze, eksperymentator ma możliwość decydowania o tym, które osoby będą przydzielone do danych warunków eksperymentalnych. W naturalnych warunkach ludzie wybierają grupy (herbatę) w zależności od swoich preferencji. Dbający o zdrowie mogą wybierać zielonąherbatę, nie zważając na jej smak, inni natomiast lubią słod ką, czarną herbatę z cytryną. W eksperymencie losowo przydzielamy badanych do poszczególnych grup. Jeżeli badani w grupie pij ącej zieloną herbatę popełniali o wiele mniej błędów w żmudnych zadaniach rachunkowych, eksperymentator wiedział, że był to efekt wypicia zielonej herbaty, a nie preferencji czy uzdolnień badanych. Wyniki eksperymentu, w odróżnieniu od innych procedur badawczych, dają solidną podstawę do formułowania wniosków o przyczynowości. Eksperyment, choć jest najlepszą, to nie jedyną metodą odpowiadania na interesujące nas pytania i czasami wybieramy inny schemat badawczy [1, 5, 6, 15, 19]. Są trzy powody, które mogą skłonić nas do prowadzenia badań nieeksperymentalnych. Pierwszym może być brak zainteresowania przyczyną danego zjawiska. Badacz chce, na przykład, przewidzieć, kto zwycięży w następnych wyborach prezydenckich i nie interesuje go, dlaczego jeden kandydat jest bardziej popularny niż inny, lub też pragnie po prostu wykazać występowaniejakiegoś uniwersalnego zjawiska, takiego jak niezależność ekspresji mimicznej od kultury czy skłonność do przeceniania powszechności naszych gustów i zachowań (efekt fałszywej powszechności). W przypadku pytań badawczych, które nie dotyczą przyczyn danego zjawiska eksperyment nie jest nieodzowny, chociaż może być przydatny. Drugim powodem prowadzenia badań nieeksperymentalnych jest to, że pewne sytuacje w warunkach eksperymentu mogą okazać się nieetyczne lub niemożliwe do zaaranżowania. Jeżeli chcemy odpowiedzieć na pytanie, dlaczego małżeństwa niepodobnych do siebie ludzi częściej kończą się rozwodem niż małżeństwa ludzi podobnych, musimy zbadać tę kwestię nieeksperymentalnie. Nie możemy bowiem dla potrzeb eksperymentu skłonić stu kobiet do poślubienia mężczyzn podobnych do nich i stu innych kobiet - do poślubienia mężczyzn zupełnie odmiennych. Trzecim powodem, dla którego badacze podejmują badania nieeksperymentalne jest to, że ich rezultaty mogą poprzedzać lub uzupełniać wnioski z prac eksperynajważniejszych elementów i pominięcie
25
Rozdział 1.
Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
mentalnych. Przez lata zależność między paleniem papierosów i rakiem płuc była stwierdzania jedynie w badaniach korelacyjnych i można było ją podważać, dopóki w badaniach eksperymentalnych nie wykazano wpływu wyodrębnionej w dymie papierosów substancji, która powoduje raka. Oba typy badań są więc wartościowe, choć prawdziwy eksperyment - czyli taki, który umożliwia poznanie relacji przyczynowej - jest nieoceniony. Czytając o wynikach badań, trzeba umieć odróżniać badania.korelacyjne od eksperymentalnych. Badania korelacyjne mówią jedynie o współwystępowaniu zmiennych, nie pozwalając na proste wnioskowanie przyczynowe*. Ostatnio można było przeczytać, że naukowcy z Uniwersytetu w Bristolu przeprowadzili trwające 20 lat badania 2438 mężczyzn, w czasie których zmarło 835 mężczyzn. Zaobserwowano, że ci, którzy nie golą się codziennie, są bardziej podatni na ataki serca i zawały. Czy czytający te rewelacje mężczyźni mogą uchronić się przed zawałem, goląc się jak najczęściej? Nie, ponieważ jak łatwo było to przewidzieć, okazało się także, że mężczyźni, którzy nie golą się każdego dnia, mniej chętnie się żenią, częściej pracują w zawodach o niskim statusie, co wiąże się np. z paleniem papierosów i niezdrowym stylem życia, częściej też chorują na anginę. Tabela 1.1. Zestawienie na nych z korelacyjnymi Porównanie eksperymentu i badania korelacyjnego
przykładzie
Zmienna
podstawowych cech
niezależna
"oglądanie
przemocy"
Zmienna zależna "zachowanie agresywne"
badań
eksperymental-
Wnioskowanie przyczynowe
badanie eksperymentalne
manipulacja poziomy zmiennej X są losowo przypisywane osobom badanym
wystandaryzowany pomiar zachowania w jednej sytuacji
możliwe przy losowym doborze do grup
badanie korelacyjne
wystandaryzowany pomiar częstości
wystandaryzowany pomiar zachowania
w prosty sposób niemożliwe -
oglądania
dotyczący najczęściej
zależność między
"niebezpiecznych" programów
sytuacji
wielu
Analiza przykładów badań
W literaturze przedstawiany jest podział metod na: (1) obserwacyjne; (2) korelacyjne; (3) eksperymentalne. Jest to klasyfikacja myląca, ponieważ metody obserwacyjne są stosowane zarówno w badaniach korelacyjnych, jak i eksperymentalnych. Podstawowym wymiarem klasyfikacji jest stopień ingerencji badacza w analizowany proces. Ingerencja ta może dotyczyć zarówno pomiaru zmiennej, jak i manipulacji wartościami zmiennej niezależnej Metody pomiaru mogą ingerować w badany proces lub nie. Stosując nieinwazyjną metodę ob.. serwacyjną, przyglądamy się ludziom i rejestruje- {f!J I / ' . \~ my to, co robią, np. za pomocą ukrytej kamery. ~;W. Możemy interesować się m.in. zachowaniami niewerbalnymi (ekspresją mimiczną, ruchami ciała), pewnymi cechami językowymi (tempem mówienia, wysokościągło su), zachowaniami werbalnymi. W obserwacji systematycznej przeszkoleni wcześniej obserwatorzy kodują swoje spostrzeżenia według zbioru wcześniej przygotowanych kryteriów. Szczególnym przykładem nieinwazyjnej metody obserwacyjnej jest analiza danych archiwalnych, np. dokumentów, artykułów prasowych, reklam. Nawet przy zwykłej obserwacji świa domość, że jest się obserwowanym może wpływać na jej wynik. W inwazyjnych metodach pomiaru ingerujemy w badany proces, choćby zadając naszym badanym pytania, np. w formie kwestionariusza. Możemy wnioskować, jak się osoba czuje, obserwując (np. zza lustra weneckiego) jej twarz lub możemy ją o to zapytać. Ten drugi sposób wskaźnikowania zmiennej SAMOPOCZUCIE jest przykładem metody inwazyjnej, ponieważ nie jesteśmy w stanie wykluczyć, że konieczność odpowiadania na pytanie wywoła zmiany w samopoczuciu pytanego.
fe
.':?;-'
l
dwiema zmiennymi
Analiza
może być
przykładów badań
spowodowana przez trzecią zmienną, nieuwzględnioną
w badaniu
W charakterze ćwiczenia w ocenie wyników badań naukowych przeanalizujmy przykłady zaczerpnięte z artykułu Artura Włodarskiego ("Alkohol tuczy czy wy-
szczupla")*.
Podział na badania korelacyjne
i eksperymentalne jest podstawowy. Trzeba jednak pamiętać, że został on tutaj zaprezentowany w możliwie najprostszej postaci. Istnieje bardzo wiele schematów badawczych odpowiednich do zastosowania do różnych pytań badawczych, które są dokładnie omówione w podręcznikach metodologii [l, 5, 15, 19].
26
• Gdy dysponujemy wiekszą liczbą danych, możemy zwiększyć moc wnioskowania, stosując modelowanie strukturalne [por. 14].
Badanie ALKOHOL 1 "W 1991 r. Colditz zakończył serię zakrojonych na szeroką skalę badań. Pod jego kierownictwem kilkunastoosobowy zespół naukowców przeanalizował dane • Gazeta Wyborcza 26.02.2001.
27
Rozdział
Analiza przykładów badań
1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
dotyczące spożycia alkoholu, wagi ciała, sposobów spędzania wolnego czasu i nawyków żywieniowych 138 tys. osób. Ich losy śledzono przez 10 lat. Chodziło o to, by ustalić bezpośredniązależność pomiędzy tuszą a spożyciem alkoholu. Bezpośrednią, to znaczy taką, która wykluczałabywpływ innych czynników. Dzięki temu możemy teraz z czystym sumieniem powiedzieć, że ktoś jest chudszy, bo pije wino do obiadu, a nie np. dlatego, że odżywia się zdrowiej czy chodzi na basen - wyjaśnia uczony. Colditz uprzedza jednak tych, którzy już wpadli na pomysł, aby metodą wysokoprocentowąpozbyć się nadmiaru kilogramów: - Różnica nie jest duża: mniej więcej pięć procent w przypadku mężczyzn i siedem-osiem u kobiet - o tyle popijający są lżejsi od stroniących".
Zmienna
niezależna
Ilość spożywanego
wiele Zmienna
zależna
Zmienne kontrolowane
alkoholu (zmienna
przyjmująca
Zmienna
niezależna
Postać spożywanych
Zmienna
zależna
Waga
Zmienne kontrolowane
Produkty przemiany materii
Typ badania
Eksperymentalne
Uwagi
Zamiana ról jest silną stroną tego badania, bo nawet jeżeli grupa pijąca alkohol charakteryzowała się zwiększoną aktywnością mimowolną i w związku z tym szybciej spalała kalorie, to w drugiej części badania ta sama grupa była w drugim warunku eksperymentalnym. Zastrzeżenie może dotyczyć manipulacji zmienną niezależną. Nie można wykluczyć, że różnica między drinkiem grapefruitowoalkoholowym a napojem grapefruitowym była zbyt MAŁA, aby wpłynąć istotnie na wagę. Jeżeli manipulujemy np. wielkością kary, to zbyt mała różnica między karami zastosowanymi w dwóch grupach może nie wpłynąć na wyniki uczenia. Nie sposób także wykluczyć, że sok grapefruitowy modyfikuje trawienie alkoholu. Wniosek: należy powtórzyć badanie, zmieniając w tym samym schemacie eksperymentalnym operacjonalizację zmiennej niezależnej.
zapewne
wartości)
Waga (mierzona BMI? normy dla wieku,
płci
- nadwaga?)
Sposoby spędzania wolnego czasu, nawyki żywieniowe, zapewne także płeć, wiek, rodzaj wykonywanej pracy itp.
Typ badania
Korelacyjne
Uwagi
Podstawową zaletą tego badania jest duża liczba osób badanych (138 tysięcy!), która pozwala na porównywanie grup wyrównanych pod względem innych zmiennych, np.
gospodynie domowe o tym samym statusie socjoekonomicznym, wieku, wykształceniu itd. Tak naprawdę mamy zapewne do czynienia z dwoma szeregami czasowymi (10 pomiarów średniego (?) spożycia alkoholu i 10 pomiarów wagi) - możemy więc liczyć opóżnione korelacje - spożycie alkoholu w roku 1985 i waga w latach 1986, 1987, 1988, 1989,1990,1991). Bardzo interesujące możliwości, ale wiemy za mało o badaniu. Oczywiście wykazuje ono wszystkie słabości badań korelacyjnych, ale duża próba i seria pomiarów stanowią jego siłę.
kalorii (alkohol, cukier)
Badanie ALKOHOL 3 "Na uniwersytecie w Maastricht (Holandia) przez 5 tygodni organizowano specjalne sesje sałatkowe, których uczestnicy mogli raczyć się sokami owocowymi, wodą mineralną lub wysokoprocentowymi drinkami. Napoje podawano mniej więcej na pół godziny przed potrawami (makaron, szynka, ser, owoce, warzywa i dodatki). Żaden z 52 uczestników badań nie wiedział, że talerz, z którego jadł, miał wmontowaną elektronicznąwagę, a każdy kęs przełykanego jedzenia był uprzednio rejestrowany przez ukryte w blacie stołu kamery. Kiedy już wszystko zmierzono i policzono, okazało się, że ci, którzy pili drinki, jedli z reguły mniej i wolniej od tych, którzy wybierali inne napoje".
Badanie ALKOHOL 2
28
"Przez cztery miesiące 48 ochotników dzień w dzień pochłaniało tę samą ilość kalorii, ale w różnych postaciach. Pierwsze dwa tuziny popijały posiłki drinkiem grapefruitowo-alkoholowym, drudzy napojem grapefruitowym, gdzie alkohol zastąpiono odpowiadającą mu pod względem liczby kalorii ilością węglowodanów. I tak przez dwa miesiące. Potem obie grupy zamieniły się rolami. A działo się to w laboratorium naszpikowanym aparaturą do pomiaru wszystkiego, co tylko czło wiek pochłania (j edzenie, picie, powietrze), i wszystkiego tego, co z siebie wydziela (płynne, stałe i gazowe produkty przemiany materii). Wynik? - Wbrew naszym przewidywaniom, wszyscy ważyli po tyle samo. Niezależnie od tego, czy pili alkohol, czy łykali cukier. Wniosek: kaloria jest kalorią bez względu na to, czy pochodzi z ponczu, czy z pączka".
Zmienna
niezależna
Rodzaj napoju (sok, woda, alkohol)
Zmienna
zależna
Ilość
zjadanego pokarmu, czas jedzenia
Typ badania
Korelacyjne
Uwagi
Brak losowego przydziału wartości zmiennej niezależnej. Nie sposób wykluczyć, że osoby pijące drinki jadłyby mniej i dłużej od reszty nawet wtedy, gdyby wcześniej piły wodę. Należy powtórzyć badanie, wręczając badanym losowo jeden z trzech napojów, zmieniając następnego dnia przydział itd. Dla każdego badanego moglibyśmy wtedy policzyć średnią wagę i czas posiłku po (1) wodzie, (2) soku i (3) alkoholu. Taki schemat nazywa się badaniem z powtarzanymi pomiarami.
29
Rozdział
l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
Test intuicji psychologicznej: zbiór danych "LEARN". Sposób zapisywania wyników w komputerze Podręcznik poświęcony jest
analizie danych, której dokonywać będziemy najza pomocąjakiegośprogramu statystycznego. Dlatego pierwszy krok stanowi zapisanie zbioru danych. Wyobraźmy sobie, że przeprowadziliśmy badanie, w którym chcieliśmy stwierdzić, czy poziom stresu wpływa na wyniki w sprawdzianie intuicji psychologicznej. Osoby badane zostały losowo przydzielone do 3 grup eksperymentalnych. W grupie 1. ("Strach") straszono studentów konsekwencjami niezaliczenia testu. W grupie 2. osoby były uspokajane, że będą mogły poprawiać test tak długo, aż osiągnązadowa lający je wynik. Grupę tę nazwaliśmy "Relaks". W grupie 3. ("Kontrolna") nie wprowadzono dodatkowych informacji. Oprócz testu intuicji psychologicznej badani wypełniali zmodyfikowanąskalę samooceny Rosenberga (5 pytań) i wpisywali informację o swoim wykształceniu,wieku i płci. (Przykładową ankietę z tego badania przedstawia rysunek 1.4). Badacz wprowadził (zakodował) wyniki w komputerze i otrzymał następującą tablicę danych (tabela 1.2). Patrząc na tę mnogość liczb, nawet najbardziej zagorzały przeciwnik statystyki uzna, że aby sformułować jakiekolwiek wnioski, trzeba coś policzyć. Ale jak? Niestety, czeka nas tutaj wiele pułapek, ponieważ liczby wprowadzone do komputera mają różne znaczenie. Zaczynamy od wypisania zmiennych: częściej
30
1. Nr osoby (nr). 2. GRUPA (gr) eksperymentalna różnicowała badanych ze względu na poziom stresu. Przyjmuje ona 3 wartości (1 - "Strach", 2 - "Relaks", 3 - "Kontrolna"). Mówimy, że zmienna GRUPA występowała na 3 poziomach. 3. PLEĆ (pl) - kodując dane, wpisywaliśmy 1 dla kobiet, 2 dla mężczyzn. 4. WYKSZTAŁCENIE (ed) - kodując dane, wpisywaliśmy 1- gdy osoba badana wpisała "wykształcenie średnie ogólne", 2 - gdy wpisała "średnie zawodowe", 3 - gdy wpisała "policealne", 4 - gdy wpisała "licencjat". 5. WIEK (age) - jest to zmienna, która przyjmuje wiele wartości. 6. SI do S5 - odpowiedzi na pytania w teście samooceny. Zakodowaliśmy je następująco: 1 - zdecydowanie tak, 2 - tak, 3 - nie, 4 - zdecydowanie nie, 5 trudno powiedzieć. 7. Pl do PlO - odpowiedzi w teście intuicji psychologicznej. Był to testjednokrotnego wyboru spośród 4 odpowiedzi. Zakodowaliśmy odpowiedzi na poszczególne pytania: 1- gdy została wybrana pierwsza odpowiedź, 2 - gdy druga itd. 8. Pll- pytanie to dotyczyło źródeł czerpania informacji o psychologii. Było to pytanie wielokrotnego wyboru, czyli badany mógł zakreślić więcej niż jed-
Test intuicji psychologicznej: zbiór danych "LEARN" ... ną odpowiedź spośród
czterech możliwych (a, b, c, d). Jeśli odpowiedź została zaznaczona, wpisywaliśmy 1, jeśli nie - O. 9. TIME2. Test intuicji psychologicznej został przeprowadzony powtórnie po dwóch dniach za pomocąrównoważnej wersji testu. Liczbę poprawnych odpowiedzi zakodowano w kolumnie oznaczonej TIME2. W SPSS zmienną jest kolumna w zbiorze danych, np. odpowiedzi na poszczególne pytania. W psychologii mówimy o zmiennych teoretycznych, np. o samoocenie. Odpowiedzi na pytania sąje dynie wskaźnikami zmiennej teoretycznej. Będziemy je określaliwedług terminologii SPSS,jako zmienne, dodając przymiotnik "teoretyczna", gdy będziemy mówili o "nor~~ malnych" zmiennych psychologicznych. Przykładowo, badanie wpływu strachu na zachowania afiliacyjne wprowadza dwie zmienne teoretyczne: strach i zachowania afiliacyjne. Muszą one zostać zoperacjonalizowane, czyli przedstawione w formie zmiennych obserwacyjnych (wskaźników). Te wskaźniki będą nazywane zmiennymi w czasie obliczeń, ale zarówno hipotezy, jak i wnioski zostaną sformułowane w języku zmiennych teoretycznych.
31
,
Rozdział
1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje
badań
Rysunek 1.4. Ankieta LEARN
Test intuicji psychologicznej: zbiór danych "LEARN" ...
Kodowanie
Nr osoby badanej ....... 1.......
nr = 1
GRUPA ....... 1.......
gr = 1
PŁEĆ
[jjJ
kobieta
O
pl = 1
mężczyzna
WYKSZTAŁCENIE [ji średnie
ogólne, O
średnie
zawodowe, O policealne, O licencjat lub
wyższe
ed = 1
WIEK ....... 23....... Ludzie różnie myślą o sobie. Prosimy, abyś określił, na ile poniższe zdania są zgodne z tym, co myślisz o sobie. Żałuję, że nie mogę darzyć siebie większym szacunkiem.
4 = zdecydowanie NIE
5 = trudno
powiedzieć
s1 = 1
Ogólnie rzecz biorąc, jestem z siebie zadowolony. 1 = zdecydowanie TAK 2=TAK 3 =NIE @= zdecydowanie NIE
5 = trudno
powiedzieć
s2 =
2=TAK
3 = NIE
Czasami mam silne poczucie, że jestem bezużyteczny. 4 = zdecydowanie NIE 1 = zdecydowanie TAK 2 = TAK 3 = NIE osamotniony, mimo że tego nie chcę. 4 = zdecydowanie NIE 1 = zdecydowanie TAK 2=TAK 3 = NIE
4
@= trudno powiedzieć
s3 = 5
@= trudno powiedzieć
s4 = 5
powiedzieć
s5 = 2
Czuję się
Czuję, że
z wielu rzeczy
mógłbym być
1 = zdecydowanie TAK @=TAK
dumny
3 = NIE
4 = zdecydowanie NIE
5 = trudno
Sprawdź swoją intuicję psychologiczną, wybierając najlepszą - Twoim zdaniem - z 4 możliwych odpowiedzi
1. Przypuśćmy, że osoba obdarzona dużym autorytetem prosi studentów, by w trakcie eksperymentu zaaplikowali wstrząsy elektryczne o prawie śmiertelnym natężeniu innemu studentowi, który im nic nie zrobił. Jaki procent studentów zgodzi się to uczynić? 65% b. 10% c. nikt d. wszyscy
®
2. Jeżeli dajesz tę czynność: a. nie można b. tak samo c. bardziej @ mniej
.
dzieciom nagrody za robienie
czegoś,
co
wcześniej lubiły robić, będą
one
p1 = 1
lubiły
powiedzieć
p2 = 4
3. Jeżeli zobaczysz, że ktoś, kogo podziwiasz, robi coś niezdarnego czy głupiego, na przykład rozlewa kawę z filiżanki, będziesz go później lubił: a. tak samo b. mniej bardziej d. nie można powiedzieć
®
4. Powtarzanie ekspozycji neutralnego bodźca, takiego jak osoba, piosenka czy obraz, spowoduje, że bodziec ten będzie Ci się podobał: a. mniej b. bardziej c. tak samo @ nie można powiedzieć
• Na podstawie: Aronson E., Wilson D.T., Ahert R.M. (1997). Psychologia Zysk i S-ka.
Poznań:
społeczna:
5. Przypuśćmy, że przedstawiciel organizacji kościelnej prosi o podpisanie petycji dotyczącej odmalowania krawężników na ulicy z okazji przyjazdu biskupa do miasteczka. Wiele osób podpisuje taką petycję. Parę tygodni później inna osoba z tej samej organizacji prosi o wywieszenie zdjęcia biskupa w oknie. Czy myślisz, że zgoda na pierwszą, mniejszą prośbę spowoduje, że: a. nie będzie miała wpływu na zgodę na drugą prośbę b. zgoda na drugą prośbę będzie mniej prawdopodobna @ zgoda na drugą prośbę będzie bardziej prawdopodobna d. nie można powiedzieć 6. Dla zdrowia psychicznego korzystne jest: a. realistyczne spojrzenie w przyszłość b. trafna ocena własnych zdolności i cech @ dokładne rozeznanie co do zakresu sprawowanej kontroli d. żadne z powyższych 7. Prosisz znajomego, by wyświadczył Ci przysługę - na przykład pożyczył 20 zł i on się zgadza. Po spełnieniu Twojej prośby osoba ta będzie przypuszczalnie lubiła Cię: a. tak samo b. mniej @ bardziej d. nie można powiedzieć
p5 = 3
p6 = 3
p7 = 3
8. Marysia uzyskała w jednym z testów inteligencji wynik lepszy od Jasia, mimo że nie różnią się oni poziomem uzdolnień. Która z podanych niżej interpretacji przyczyny tej różnicy wydaje Ci się najbardziej prawdopodobna:
®
dziewczynki są w szkole podstawowej zdolniejsze od chłopców b. było to wynikiem przekonania nauczycielki, że Marysia jest zdolniejsza od Jasia c. nauczycielka była przekonana, że Jaś jest zdolniejszy od Marysi, więc dziewczynka ze wszystkich sił starała dowieść, że nie ma ona racji d. testy inteligencji są stronnicze i dziewczynki rozwiązują je lepiej
9. W miejscach publicznych: a. mężczyźni częściej dotykają kobiet @ kobiety częściej dotykają mężczyzn c. nie ma różnicy d. nie wiadomo
p8 = 1
p9 = 2
10. Przypuśćmy, że zapłacono ludziom za wygłoszenie przemówienia o treści sprzecznej z ich poglądami. Zaobserwowano, że po wygłoszeniu takiego przemówienia część osób zmienia pogląd\
na zgodne z wygłoszonymi. Najwięcej takich zmian można zobaczyć, gdy a. w ogóle im nie zapłacono b. zapłacono im bardzo dużo c. zapłacono im średnio @ zapłacono im mało
p10 = 4
p3 = 3 Na zakończenie chcielibyśmy się dowiedzieć, skąd czerpiesz swoją wiedzę psychologiczną. Wiedzę psychologiczną czerpię z (można zakreślić więcej niż jedną odpowiedź):
® z obserwacji innych ludzi
z książek psychologicznych c. z zajęć na studiach lub w szkole d. z literatury pięknej
@ p4= 2
p11a = 1 p11 b = 1 p11c = O p11d =
O
serce i umysł.
33
Rozdział
l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
N
ID
o o
o o
o o
o o
o o
o o
o o
E ci cD ci tO ci cD rt5
:p
1J
~
r-:
o o o o o o o o o o o q ci r-: cD ~ .f
o o
~
~
Co oznaczają liczby w naukach społecznych? Skale pomiarowe ...
o o o o o o o o o o o o o o o o o o o o o o o o. o o o o o o o o r-: cD ci o:i r-: cD tO cD tO r-: tO
o
~
o
o
~
o
~
o
o
~
o
o
o
o
o
~
o
o
o
o
o
o
~
~
o
o
o
~
o
o
o
o
~
~
~
~
~
~
~
~
o
o
o
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
o
o
~
o
o
~
~
~
~
o
~
~
o
~
o
~
o
o
~
o
~
~
o
~
~
~
~
o
~
~
o
~
~
o
o
o
~
o
o
~
o
o
~
o
o
o
~
o
o
~
o
~
o
o
~
~
o
~
"
~
"
N
~
"
"
"
"
N
~
N
"
"
C')
"
"
"
N
"
"
"
"
~
~
"
"
C')
"
~
N
N
N
"
N
C')
C')
"
N
N
C')
N
N
N
"
N
N
"
~
N
N
C')
C')
N
C')
N
~
N
N
N
~
~
N
N
N
"
N
N
N
"
~
"
N
N
"
N
N
C')
"
N
N
~
~
N
N
N
C')
N
N
~
C')
C')
~
N
C')
~
C')
C')
C')
C')
N
C')
~
C')
"
C')
N
N
C')
C')
~
~
C')
C')
C')
~
C')
C')
"
C')
tO 0-
C')
C')
~
"
"
~
"
C')
"
"
C')
"
"
~
N
"
"
"
~
"
"
C')
"
"
C')
"
"
C')
N
"
LO
C')
~
C')
C')
C')
N
~
C')
C')
N
~
C')
C')
N
C')
C')
C')
C')
N
C')
~
~
C')
C')
C')
C')
C')
C')
~
C')
~
N
C')
N
"
N
N
N
"
C')
N
N
N
C')
N
~
N
"
"
N
N
N
C')
N
N
C')
~
N
N
N
C')
C')
C')
C')
N
C')
C')
"
N
C')
"
C')
C')
"
C')
~
C')
C')
C')
N
N
C')
"
"
C')
C')
~
C')
C')
C')
"
"
"
"
N
"
N
"
"
C')
N
C')
"
"
"
"
N
N
"
"
~
C')
C')
"
"
"
"
"
~
"
C')
~
N
~
C')
~
~
N
C')
~
~
~
~
N
C')
"
~
~
~
C')
~
~
N
N
~
~
~
~
N
"
~
'"
N
"
N
LO
LO
LO
LO
LO
LO
C')
LO
LO
LO
"
N
en
N
C')
~
"
N
C')
N
C')
~
"
N
C')
en
C')
"""
LO
C')
~
"
~
"
N
C')
~
C')
~
"
~
C')
~
"
~
"
LO
en
~
"
~
"
LO
C')
~
"
~
"
LO
LO
~
C')
~
C')
~
"
~
LO
~
C')
N
"
N
LO
~
LO
N
LO
~
LO
~
LO
N
LO
~
LO
~
LO
"
~
LO
en
LO
~
C')
~
"
~
"
N
en
~
LO
~
LO
~
C')
N
LO
~
LO
~
en
N
LO
~
LO
~
~
"
N
C')
N
en
~
"
N
"
LO
"
~
N
N
C')
LO
C')
~
C')
N
C')
LO
C')
~
C')
N
C')
l!)
C')
~ N
LO
N
N oC')
C')
C')
N
N oC')
C')
~
N
LO
tO N
C') C')
N
~
0-
Co oznaczają liczby w naukach społecznych? Skale pomiarowe. Zmienne nominalne, porządkowe i ilościowe (przedziałowe i ilorazowe) Skale pomiarowe
l) ~
o-
.o ~ ~
o-
l1l
C. o
C. en
0-
'R r--
0-
0-
C')
0-
N
o-
C. Ul
)
z
M Ul
~
L5 '" ...J )
..s:::
~
c
cel "C Lo.
'o
:o N N
10
ID Ol
l1l
en r--
N
N
N
N
N
LO
N
C')
N oC')
en r--
N
N
N
N
N
LO
N
C')
en
r--
N
N
N
1J ID
~
N
"
C')
~
N
"
C')
~
N
"
C')
~
N
"
C')
~
N
"
C')
~
N
"
C')
~
N
"
C')
~
N
Ci.
~
N
~
N
N
~
~
N
N
~
~
~
N
N
~
N
~
N
N
~
~
N
~
N
N
~
N
N
N
~
~
~
~
~
~
~
~
~
~
~
N
N
N
N
N
N
N
N
N
.., .., .., .., .., .., .., .., .., ..,
..
Ol
34
C')
E
~
N
C')
"
LO
tO
r--
co en o
~
~ ~
N
C')
~
~
;:J:
LO
tO
~
~
r--
~
N
co en o ~
~
N
N
N N
C')
N
"
LO
N
tO N
r--
N
co en oC')
N
N
Kodując dane do komputera, używamy liczb, choć równie dobrze moglibyśmy używać słów, łatwiej jednak wpisać cyfrę 1, zamiast pisać "mężczyzna". Czynność przypisywania liczb osobom czy obiektom będziemy nazywali pomiarem, a to, jakie
działania matematyczne będziemy mogli przeprowadzić na tak przypisanych liczbach określa nam typ skali pomiarowej. Pomiarem nazywamy zatem procedurę wiązania liczb z badanymi obiektami. Teraz się przekonamy, że faktycznie taka definicja pomiaru odpowiada naszej intuicji dotyczącej tego pojęcia. Każdy pomiar zaczyna się od podzielenia obiektów na kategorie. Obiekty wpadaj ą do jednej kategorii, gdy są identyczne ze względu na pewną swoj ą cechę (kształt, wiek, wzrost, szybkość, liczbę łap etc.) Wyobraźmy sobie, że dzielimy osoby ze względu na to,jakąpijąherbatę.Dzielimy je na trzy kategorie: czarna, zielona, nie piją herbaty. Możemy oczekiwać, że są to rozłączne kategorie, ale w rzeczywistości może okazać się, że są osoby, które piją zarówno zieloną, jak i czarną herbatę - wtedy nasza kategoryzacja jest zła i musi zostać zmieniona. Podobnie, może się okazać, że pośród badanych są osoby, które piją czerwonąherbatę. Wtedy nasza kategoryzacjajest niedobra, gdyż nie jest zupeł na - pewna klasa obiektów została zignorowana. Pojawia się też problem, co to znaczy "piją" - jak często trzeba pić, aby zostać zaklasyfikowanym do danej kategorii: wystarczy raz czy może trzeba pić codziennie. Warunek zupełności kategoryzacji wydaje się zupełnie oczywisty, ale zdarza się, że badacze o nim zapominają, co prowadzi do poważnych pomyłek. Na przykład [13] w Stanach Zjednoczonych podczas wyborów prezydenckich w 1992 r. oprócz tradycyjnie występujących dwóch kandydatów, demokraty Williama 1. Clintona i republikanina George'a H.W. Busha, pojawił się trzeci, niezależny - H. Ross Perot. W wielu badaniach nie brano w ogóle pod uwagę istnienia tego trzeciego kandydata. Ponieważ miał on poglądy zbliżone do Busha, to podczas badań preferencji wyborczych, w których respondenci mieli do wyboru tylko kandydata lewicy (w amerykańskim rozumieniu tego słowa) i prawicy, wygrywał Bush. Działo się tak dlatego, że Busha wskazywały również osoby głosujące później na Perota. Wyniki wyborów były następujące: Tabela 1.3. Wyniki wyborów prezydenckich 1992 r. w USA Kandydat William J. Clinton (Partia Demokratyczna)
Liczba głosów
44908233
George H.W. Bush (Partia Republikańska)
39102282
H. Ross Perot (kandydat niezależny)
19741048
35
Rozdział
l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje
badań
Co
Sumując głosy
oddane na Busha i Perota, widzimy, że głosów oddanych na kandydatów o prawicowych poglądach było znacznie więcej, a jednak wybory wygrał Clinton. Także w Polsce mieliśmy do czynienia z podobną sytuacją podczas wyborów parlamentarnych w 2001 r. Wówczas "zapomniano" o pojawieniu się dwóch nowych sił na scenie politycznej: Ligi Polskich Rodzin i Samoobrony, które odebrały głosy Akcji Wyborczej "Solidarność", powodując, że ku zaskoczeniu wielu osób nie weszła ona do nowego parlamentu. Gdy już podzielimy badane obiekty na kategorie, musimy jeszcze z każdą kategorią powiązać liczbę, wprowadzając dane do komputera. Nie można oczywiście zrobić tego w sposób dowolny, ale tak, by różnice pomiędzy przydzielonymi kategoriom liczbami odzwierciedlałyróżnice między samymi kategoriami. Ze wzglę du na to, że są to dane jakościowe, nasza swoboda w przypisywaniu obiektom liczb jest bardzo duża. Jeżeli osoba głosowała na Clintona, możemy przypisać jej wartość ,,1", na Busha - ,,2", na Perota - ,,3", jeżeli nie głosowała - ,,4", jeżeli nie udzieliła odpowiedzi - ,,9", ale każdy inny zestaw pięciu liczb jest równie dobry tak długo, jak różne liczby zostaną przypisane różnym kategoriom.
Tabela 1.4. Przypisywanie liczb poziomom zmiennej nominalnej Odpowiedzi William J. Clinton (Partia Demokratyczna) George H.W. Bush (Partia Republikańska)
Sposób 1
Sposób 2
Sposób 3
Sposób 4
1
4
20
20
2
3
15
19
3
2
10
7
głosował
4
1
5
1
Brak odpowiedzi
9
5
25
2
H. Ross Perot (kandydat Nie
niezależny)
się naj-
Wprowadzone do komputera liczby wyglądają tak samo, ale mają różne znaczenie w zależności od skali pomiarowej, na której jest operacjonalizowana nasza zmienna teoretyczna. Przeanalizujmy następujący przykład. Obserwujemy grupę 6 studentów piszą cych egzamin ze statystyki. Interesuje nas to, jak długo go piszą. Tę samą zmienną teoretyczną CZAS PISANIA EGZAMINU możemy różnie zoperacjonalizować. W tabeli 1.5 przedstawione sąwyniki 4 wskaźriików dla 6 osób badanych. 36
liczby w naukach społecznych? Skale pomiarowe ...
Tabela 1.5. Wskaźniki zmiennej CZAS PISANIA EGZAMINU CZAS1
CZAS2
CZAS3
CZAS4
Adrian
1
3,5
10:50
45
Agnieszka
2
1
10:30
25
Czarek
2
2
10:35
30
Ewa
1
3,5
10:50
45
Marcin
2
5
10:55
50
Natalia
2
6
10:58
53
Dokonując obserwacji zachowania studentów w sać następujące
czasie egzaminu, możemy zapi-
dane:
1. CZASl- możemypodzielić osoby na te, które precyzyjnie wykorzystały przewidziany czas 45 minut, oraz te, które pisały dłużej lub krócej. Tej pierwszej grupie osób przypiszemy wartość ,,1", drugiej - ,,2"; 2. CZAS2 - kolejność wychodzenia z sali. Osobie, która pierwsza opuści salę przypisujemy wartość" 1", ostatniej - wartość ,,6". Liczby 1, 2, ... 6 nazywane są rangami. Problem pojawia się, kiedy kilka osób opuszcza salę równocześnie. W tym przypadku przypisujemy im średniąrangę, nazywanąrangą wiązaną. Dwie ostatnie osoby, gdyby skończyły w różnym czasie, miałyby rangi 5 i 6. Ranga wiązana dla nich obojga wyniesie więc (5 + 6) / 2 = 5,5. Gdyby 3 pierwsze osoby skończyły równocześnie, to każdej z nich przypisalibyśmy rangę (1 + 2 + 3) / 3 = 2; 3. CZAS3 - godzinę opuszczenia sali; 4. CZAS4 - czas pisania egzaminu podany w minutach. Załóżmy, że
PYTANIE: Zastanów się, które z powyższych przyporządkowań wydaje lepsze, najbardziej naturalne. Dlaczego?
oznaczają
chcemy
porównać
wyniki Marcina i Agnieszki. Na jakie pytania możemy odpowiedzieć, używając różnych wskaźników czasu? Mając informację zakodowaną w postaci wskaźnika CZASl, możemy stwierdzić, czy Marcin i Agnieszka należą do tej samej grupy: (1) precyzyjnie wykorzystujących czas egzaminu, (2) nieprecyzyjnie wykorzystujących czas egzaminu. Nie możemyjednak powiedzieć, czy Marcin pisał dłużej niż Agnieszka, ponieważ w grupie (2) znajdują się zarówno osoby, które pisały dłużej niż 45 minut, jak i krócej. Tym bardziej nie możemy powiedzieć, o ile dłużej ani ile razy dłużej pisali egzamin. Mając dane w postaci wskaźnika CZAS2, możemy powiedzieć, czy Marcin i Agnieszka należeli do tej samej grupy, a także stwierdzić, które z nich pisało egzamin dłużej. Nadal jednak nie potrafimy ocenić o ile dłużej, a tym bardziej ile razy dłużej, ponieważ rangi 1 - dla Agnieszki i 5 - dla Marcina oznaczająjedynie kolejność, nic nie mówiąc o odległościach między poszczególnymi wartościami. Zatem różnica w czasie pisania egzaminu między dwiema kolejnymi rangami może wynosić równie dobrze 1 minutę, jak i 10 minut.
37
Rozdział
1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
Co
C1. Na podstawie wskaźnika CZA81 proszę ocenić prawdziwość poszczególnych twierdzeń, odpowiednio: prawda (P), fałsz (F), nie moźna powiedzieć (?).
zaznaczając
1. Marcin wykorzystał czas w takim samym stopniu (precyzyjnie vs nieprecyzyjnie) jak Agnieszka.
P
F
?
2. Marcin pisał egzamin nie dłuźej niź Agnieszka.
p
F
?
3. Marcin pisał egzamin o 10 minut dłuźej niź Agnieszka.
P
F
?
p
F
?
4. Marcin
pisał
egzamin 2 razy
dłużej niż
Agnieszka.
C2. Na podstawie wskaźnika CZA82 proszę ocenić prawdziwość poszczególnych twierdzeń, odpowiednio: prawda (P), fałsz (F), nie można powiedzieć (?),
zaznaczając
1. Marcin wykorzystał czas w takim samym stopniu (precyzyjnie vs nieprecyzyjnie) jak Agnieszka.
P
F
?
2. Marcin pisał egzamin nie dłużej niż Agnieszka.
P
F
?
3. Marcin pisał egzamin o 10 minut dłużej niż Agnieszka.
p
F
?
4. Marcin pisał egzamin 2 razy dłużej niż Agnieszka.
P
F
?
C3. Na po.dstawie wskaźnika CZA83 proszę ocenić prawdziwość poszczególnych twierdzeń, odpowiednio: prawda (P), fałsz (F), nie można powiedzieć (?).
zaznaczając
1. Marcin wykorzystał czas w takim samym stopniu (precyzyjnie vs nieprecyzyjnie) jak Agnieszka.
P
F
?
P
F
?
3. Marcin pisał egzamin o 10 minut dłużej niż Agnieszka.
P
F
?
4. Marcin pisał egzamin 2 razy dłużej niż Agnieszka.
p
F
?
2. Marcin
pisał
egzamin nie
dłużej niż
Agnieszka.
C4. Na po.dstawie w~kaźnika CZA84 proszę ocenić prawdziwość poszczególnych twierdzeń, zaznaczając odpowiednio: prawda (P), fałsz (F), nie można powiedzieć (?).
38
1. Marcin wykorzystał czas w takim samym stopniu (precyzyjnie vs nieprecyzyjnie) jak Agnieszka.
P
F
?
2. Marcin pisał egzamin nie dłużej niż Agnieszka.
p
F
?
3. Marcin pisał egzamin o 10 minut dłużej niż Agnieszka.
P
F
?
4. Marcin pisał egzamin 2 razy dłużej niż Agnieszka.
P
F
?
oznaczają
liczby w naukach społecznych? Skale pomiarowe ...
W przypadku wskaźnika CZAS3 nasze możliwości szacowania różnicy między Marcinem i Agnieszką rosną, mamy bowiem podstawy, by ocenić nie tylko to, czy należą oni do różnych grup i które z nich pisało dłużej, lecz także to, o ile minut Marcin pisał egzamin dłużej niż Agnieszka. Jest to możliwe, ponieważ wskaźnik w postaci godziny zakończenia egzaminu cechuje się stałymi jednostkami pomiaru, tj. minutami. Kwestia, ile razy dłużej Marcin pisał egzamin od Agnieszki pozostaje ciągle nierozwiązana, gdyż brak nam punktu odniesienia - nie wiemy, o której godzinie zaczął się egzamin. Jeżeli dane przyjmują formę wskaźnika CZAS4 (czas pisania egzaminu w minutach), zawarta w nich informacja pozwala najpełniej ocenić różnice między Marcinem i Agnieszką. Na podstawie wartości, jakie przyjmuje ten wskaźnik dla każdego z nich, możemy stwierdzić: czy należą oni do różnych grup, które z nich pisało dłu żej, o ile dłużej pisał Marcin, a także ile razy dłużej pisał. Na ostatnie z pytań może my odpowiedzieć dzięki temu, że pomiar czasu pisania egzaminu zaczynamy od zera (zero minut na początku egzaminu). Wniosek: Różne operacjonalizacje zmiennej CZAS umożliwiają odpowiadanie na różne pytania. Zmielme CZASl, CZAS2, CZAS3 i CZAS4 są przykładami czterech różnych typów skal pomiarowych. Odpowiednio CZAS 1jest przykłademnominalnej skali pomiarowej, CZAS2 - porządkowej, CZAS3 - przedziałowej, CZAS4 ilorazowej. Możliwe odpowiedzi z ćwiczeń CI-C4 zostały zestawione w tabeli 1.6. TAK wpisaliśmy, gdy dysponując danym wskaźnikiem, możemy odpowiedzieć na dane pytanie, NIE - gdy odpowiedź jest niemożliwa. Tabela 1.6. Rodzaj wskaźnika a moźliwość odpowiedzi na pytania Rodzaj wskaźnika CZA51 skala nominalna
CZA52 skala
CZA53 skala
porządkowa przedziałowa
CZA54 skala ilorazowa
Czy Marcin i Agnieszka wykorzystali czas egzaminu z tą samą/różną precyzją?
TAK
TAK
TAK
TAK
Czy Marcin pisał od Agnieszki?
NIE
TAK
TAK
TAK
O ile dłużej pisał Marcin od Agnieszki?
NIE
NIE
TAK
TAK
Ile razy dłużej od Agnieszki?
NIE
NIE
NIE
TAK
dłużej
pisał
Marcin
Przykład może się wydawać abstrakcyjny, ponieważ jako nienaturalne odbieramy ograniczanie naszych możliwości odpowiadania na pytania przez tworzenie wskaź ników CZASl, CZAS2, CZAS3, skoro łatwo możemy zanotować CZAS4. Wprowadziliśmy ten przykład po to, aby uświadomić Czytelnikowi, że rodzaj skali pomia-
39
Rozdział 1.
rowej wskaźnika ogranicza nasze możliwości wnioskowania. A wiele badanych przez nas zmiennych pozwala na budowanie wskaźnikówwyłącznie na słabej skali pomiarowej. Dlatego umiejętność określania skali pomiarowej jest podstawową sprawą zanim podejmiemy następne kroki analizy. Przyjrzyjmy się wprowadzonym w powyższym przykładzie skalom pomiarowym w sposób bardziej systematyczny.
mamy do czynienia, gdy obiektom należą cym do tej samej kategorii przypisuje się tę samą liczbę lub inny symbol. Do zmiennych nominalnych należy płeć, wyznanie, region zamieszkania, rodzaj zachowania itp. Liczba przypisana w przypadku tej skali odgrywa tylko rolę identyfikatora, informuje o przynależności do danej kategorii. Nie można tych liczb uporządkować, ani tym bardziej do siebie dodawać, choć komputer bez wahania wydrukuje nam informacje o średniej płci w naszej próbie. 2. Z porządkową skalą pomiarową mamy do czynienia, gdy możemy nasze obiekty uporządkować ze względu na pewnąwłasność, np. wykształcenie (podstawowe, średnie, policealne itd.). Przypisanie obiektom liczb pozwala uporządkować osoby badane pod względem nasilenia cechy. Na podstawie danych możemy powiedzieć,że ktoś jest bardziej wykształcony od innej osoby, ale już nie możemy stwierdzić, o ile bardziej, bo skala ta nie ma stałej jednostki pomiaru. Możemy powiedzieć, kto wcześniej wyszedł z egzaminu (CZAS2), ale nie możemy określić, o ile wcześniej. Możemy powiedzieć, że Adam Małysz był pierwszy, a Swen Hannavald drugi, ale nie wiemy, jaka była między nimi różnica w punktacji. 3. Z przedziałową (interwałową) skalą pomiarową mamy do czynienia, gdy możemy wskazać stałą jednostkę pomiaru. Jeżeli analizujemy rok urodzenia respondenta, to możemy powiedzieć nie tylko, kto urodził się wcześniej, lecz także, o ile wcześniej. Informacja, że Adam urodził się w roku 1940, a Ewa w 1980 nie pozwala (bez przekształcenia roku urodzenia na wiek respondenta) odpowiedzieć na pytanie, ile razy Adam jest starszy od Ewy.
1. Z
nominalną skalą pomiarową
W psychologii
40
Typ skali pomiarowej a rodzaj dopuszczalnych przekształceń
Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
pięciostopniowe skale
typu Likerta, gdzie badany ocenia prawdziwość różnych twierdzeń, wybierając jedną odpowiedź z następującego zakresu: zdecydowanie się zgadzam, zgadzam się, trudno powiedzieć, nie zgadzam się, zdecydowanie się nie zgadzam, przyjęto za skale przedziałowe, chociaż nie ma dowodów, że różnica między "zdecydowanie się zgadzam" a "zgadzam się" jest taka sama jak np. różnica między "nie zgadzam się" a "zdecydowanie się nie zgadzam". Puryści metodologiczni traktują skale Likerta jako skale porządkowe. Przegląd artykułów publikowanych w najlepszych czasopismach psychologicznych (np. Journal ojPersonal and Social Psychology) przekonuje, że wielopunktowe odpowiedzi są traktowane jako zmienne przedziałowe, o ile opis punktów skali nie jest sprzeczny fasadowo z zasadą równości przedziałów (stałej jednostki pomiaru).
4. Z
ilorazową (stosunkową) skalą pomiarową
mamy do czynienia, gdy i niearbitralny punkt zerowy skali. Jeżeli analizujemy wiek respondenta, to zero jest precyzyjnie określone. Jeżeli Adam ma 60 lat, a Ewa 30, to możemy powiedzieć, że jest on 2 razy starszy od Ewy. Powtórzmy: Tym, co odróżnia skalę ilorazową od przedziało wej, jest istnienie zera bezwzględnego Gednostronnego ograniczenia zakresu skali). Wskaźnik CZAS4 stanowi przykład ilorazowej skali pomiarowej. możemy wskazać stałą jednostkę miary
Wynik w sprawdzianie intuicji psychologicznej (TIME2), rozumiany jako liczba poprawnych odpowiedzi, daje nam "przyzwoitą" skalę pomiarową. Wiemy, co to znaczy, że dana osoba osiągnęła wynik 0, a to oznacza istnienie zera bezwzględnego. Wiemy, że jeżeli Jacek odpowiedział na 10 pytań, a Beata na 6, to różnica między nimi jest taka sama jak między Jagodą (5 pytań) a Bartkiem (1 pytanie). Problem pojawia się, kiedy wynik w teście ma być wskaźnikiem inteligencji badanych. Nie możemy przecież powiedzieć,że osoba, która odpowiedziała na pytań, ma zerową inteligencję- wtedy skala nie ma zera bezwzględnego. Pojawiają się też problemy dotyczące równości różnic w inteligencji pomiędzy Jackiem i Beatą a Jagodą i Bartkiem. Psychologowie jednak są skłonni traktować wyniki w teście inteligencji jako mierzone na skali przedziałowej, a więc takiej, która zapewnia równość odległości (przedziałów) między kolejnymi wartościami zmiennej. Skala ta nie ma jednak zera
°
bezwzględnego.
Typ skali pomiarowej a rodzaj dopuszczalnych przekształceń Skale pomiarowe wyznaczają to, co nam wolno robić z liczbami. Często zachodzi potrzeba transformacji surowych (bo jeszcze nieprzekształconych) wyników. Banalnym powodem może być chęć uproszczenia pracy osobom kodującym wyniki w komputerze, które nie chcą wstukiwać minusów do zbioru danych. Oczywiście mówimy tu o przekształceniach, którym są poddawane wszystkie wartości zmiennej w danym zbiorze.
Skala nominalna Na skali nominalnej możemy zastosować każde przekształcenie liczbowe, które zachowuje rozróżnialność obiektów. Możemy różne regiony Polski zakodować jako (1,2,3,4,5,6) lub (12, 4, 10, 14, 1, 78), ale nie możemy przypisać dwóm regionom tej samej liczby, chyba że jest to w pełni świadomy zabieg połączenia dwóch regionów w jeden. 41
.
Rozdział
Typ skali pomiarowej a rodzaj dopuszczalnych przekształceń
1. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
Skala porządkowa Na skali porządkowej możemy zastosować każde przekształcenie, które zachowa porządek obiektów. Możemy różne poziomy wykształcenia zakodować np. jako (1 - podstawowe, 2 - średnie, 3 - policealne, 4 - niepełne wyższe, 5 - wyższe) lub (2 - podstawowe, 4 - średnie, 6 - policealne, 8 - niepełne wyższe, 10 - wyższe), ale nie możemy np. wykształceniu podstawowemu przypisać liczby 5, średniemu 3, a wyższemu 6, ponieważ takie kodowanie zmienia pierwotny porządek.
Skala
przedziałowa (interwałowa)
Na skali przedziałowej możemy zastosować każde przekształcenie, które zachowa równość przedziałów (stałąjednostkę pomiaru). Nie tracąc podstawowych informacji (w tym warunku równości przedziałów), wartości zmiennej wyrażone na skali przedziałowej możemy mnożyć lub dzielić przez stałą, dodawać lub odejmować stałą, czyli poddawać je przekształceniomliniowym y = a + bx. Zilustrujmy to na przykładzie. Jeżeli w badaniu użyl1śmy skali odpowiedzi z trzema wartościami 1/2 , O, 1/2, to aby pozbyć się ułamków, możemy pomnożyć wartości zmiennej przez stałą równą 2. Przed rekodowaniem wartości zmiennej:
o
Po pomnożeniu przez 2:
-1
i = 1/2
o
Odległość między kolejnymi pomiarami w skali Celsjusza jest równa 10°, a w skali Fahrenheita 18°. Na obu tych skalach przyrost temperatury między 20° -7 30° (68 -7 86) jest taki sam, jak między 30° -740° (86 -7 104), czyli przekształcenie liniowe zachowuje równość przedziałów.
Skala ilorazowa (stosunkowa) Liczby z tej skali pomiarowej możemy poddawać wszystkim przekształce niom, które zachowają równość stosunków. Czas pisania egzaminu możemy, wpisując dane do komputera, pomnożyć lub podzielić (y = bx), ale nie możemy dodać do wyniku stałej. tak,ja~ mogliśu:y to ~ro bić w przypadku zmiennej przedziałowej. Dlaczego? DodanIe stałej spowodUj e zmIanę stosunku (ilorazu) liczb. Jeżeli Ewa pisała egzamin 30 minut, a Adam 60 minut, to możemy takie wyniki podzielić np. przez 60, zapisując czas w godzinach, a nie w minutach. Wtedy wynik Ewy wyniesie 0,5, a Adama 1, i nadal zostanie zachowana relacja mówiąca, że Adam pisał dwa razy dłużej. Odjęcie od wyników 20 spowodowałoby, że Ewa otrzymałaby wynik 10, a Adam 40. Ta operacja zachowuje informację o różnicy (nadal widzimy, że Adam pisał egzamin o 30 minut dłużej), ale już odpowiedź na pytanie, ile razy dłużej, prowadzi nas do mylnego wniosku, że Adam pisał egzamin 4 razy (a nie 2,jak było w rzeczywistości) dłużej. Powyższy przykład przedstawiony jest w tabeli 1.7. Wniosek: jeżeli chcemy zachować informacje dostępne na skali ilorazowej, nie możemy dodawać stałej do naszych wyników. Tabela 1.7.
Przekształcenia algebraiczne
na skali stosunkowej
i=1
Wynik Wyniki surowe
i - długość przedziałów między kolejnymi wartościami
y=XI b; b= 60 {dzielenie przez
(nieprzekształcone)
stałą)
Rysunek 1.5. Przekształcenie algebraiczne na skali przedziałowej
42
Po tej transformacji wyników odległość między kolejnymi punktami skali wzrosła, ale nadal zachowana jest równość przedziału. Możemy też dodawać stałą = 2. Przekształcenie liczb (-1, O, 1) na (1, 2, 3) też pozwala na zachowanie równości przedziałów. Używamy go, przekształcając pomiary temperatury w skali Celsjusza w skalę Fahrenheita: F = 32 + 9fsC. Jest to przekształcenie liniowe y = a + bx, gdzie y = F oznacza temperaturę w skali Fahrenheita, x = C temperaturę w skali Celsjusza, a = 32, b = 9fs, W wyniku tego przekształcenia 20°C -7 68°F 30°C -7 86°F 40°C -7 104OP.
Ewa
30 min
Adam różnica
wyników (Adam - Ewa) stosunek wyników (Adam 1 Ewa) wniosek
Wynik
przekształcenia
przekształcenia
=
y=X-a; a 20 (odejmowanie stałej)
0,5 h
10 min
60 min
1h
40 min
30 min
0,5 h
30 min
2
2
4
przekształcenie
przekształcenie
y = bX zachowuje
równość przedziałów, jak i równość stosunków
zarówno
Y = X + a zachowuje tylko równość przedziałów. Zniekształca
informacje o stosunkach między liczbami
43
Rozdział
l. Naukowy sposób poszukiwania związków między zmiennymi. Rodzaje badań
W statystyce to, czy zmienna jest jakościowa (nominalna i porządkowa skala pomiarowa), czy też ilościowa (przedziałowa i ilorazowa skala pomiarowa), pocią ga za sobą dramatycznązmianę naszych możliwości analizy. Dlatego w dalszej czę ści książki nie będziemy odróżniać zmiennych ilorazowych i przedziałowych, używając dla nich wspólnego terminu: zmienna ilościowa.
Zmienne
przedziałowe i
określamy jako
44
zmienne
ilorazowe ilościowe.
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Rozkład
zmiennej w próbie i w populacji. Miary tendencji centralnej • I• rozproszenIa
Pojęcia
kluczowe:
rozkład
zmiennej,
prawdopodobieństwo, zmienna ciągła (wartość
modalna, moda); mediana;
częstość,
proporcja, procent,
i skokowa (dyskretna), dominanta
średnia, zmienność, rozstęp,
sumy
kwadratów, wynik standaryzowany, próba losowa, populacja, estymator, parametr, statystyka Nowe symbole: L, ~, M, Mo, Me, SS,
Rozkład
S2, S, Z
zmiennej w próbie
Pierwszym krokiem w analizie jest sprawdzenie rozkładów naszych zmiennych. zmiennej pokazuje, jak często w naszej próbie występowała dana wartość. Jeżeli wśród 30 badanych było 14 mężczyzn, co stanowi 0,47 próby, to zmienna PŁEĆ, przyjmująca wartości 1 - mężczyzna i 2 - kobieta, ma następującyrozkład (1; 0,47) (2; 0,53), kobiet było bowiem 16, co stanowi 0,53 próby (zobacz w tabeli 2.1). W rozkładzie zamiast procentów podajemy proporcje, ponieważ są one odpowiednikiem prawdopodobieństwa definiowanego w podejściu empirycznym (a posteriori). Mówiąc najprościej, rozkład
Definicja
prawdopodobieństwa
W szkole poznaliśmy klasyczną definicję prawdopodobieństwa (a priori). Pomaga nam ona odpowiedzieć na pytania dotyczące prawdopodobieństwa zajścia
45
Rozdział
2.
Rozkład
Rozkład zmiennej w
zmiennej w próbie i w populacji ...
różnych zdarzeń
bez konieczności przeprowadzania doświadczeń weryfikujących wynik. Gdy staramy się dowiedzieć, jakie jest prawdopodobieństwowyrzucenia orła przy rzucie symetryczną monetą albo wyrzucenia cyfry większej od 4 przy rzucie kostką, nie musimy koniecznie rzucać monetą lub kostką· Stosując klasyczną definicję prawdopodobieństwa, definiujemy prawdopodobieństwa zajścia tych zdarzeń jako stosunek liczby zdarzeń sprzyjających do liczby zdarzeń możliwych. Oczywiście milcząco zakładamy, że orły będąwypadać tak samo często jak reszki (moneta jest "uczciwa" - nie wyróżnia ani reszki, ani orła). Podobnie kostka musi być uczciwa - żadna liczba oczek nie może być wyróżniona. W przypadku, gdybyśmy mieli do czynienia z "oszukaną" kostką lub monetą, klasyczna definicja prawdopodobieństwa nic nam nie da, chyba że wiemy, w jaki sposób moneta czy kostka jest oszukana - np. wiemy, że orzeł wypada dwa razy częściej niż reszka. W psychologii nie możemy stosować klasycznej definicji prawdopodobieństwa, gdyż w zasadzie nigdy nie znamy prawdopodobieństw a priori, dlatego wykorzystujemy definicję empiryczną(albo a posteriori) prawdopodobieństwa. Oznacza to, że aby odpowiedzieć na pytanie, jakie jest prawdopodobieństwo spotkania na ulicy Warszawy osoby rozwiedzionej, musimy przeprowadzić badania. Jeżeli zapytamy o stan cywilny sto osób spotkanych na ulicy i cztery powiedzą, że są rozwiedzione, to będzie my mogli stwierdzić, że prawdopodobieństwo spotkania osoby rozwiedzionej w Warszawie wynosi 0,04. O tym, jakie warunki muszą być spełnione, abyśmy mogli formułować sądy ogólne na podstawie zbadanej próby, trzeba przeczytaćw literaturze [5, 19]. Podsumowując:
rozklad zmiennej można przedstawić jako zbiór par (wartość, częstośc'), gdzie częstość oznacza, ile razy wystąpiła dana wartość w naszej próbie; wtedy rozkład płci wygląda następująco (1, 14) (2, 16), ale poprawniej jest przedstawićrozkład jako zbiór par (wartość,prawdopodobieństwo),gdzie prawdopodobieństwo należy rozumieć jako proporcję osób, którym przypisywano daną wartość, w stosunku do całej liczebności próby. 46
próbie
Podstawowym sposobem prezentacji zmiennej jest rozkład częstości (frekwencje). Rozkład częstości (tabele: 2.1, 2.2, 2.3, 2.4 i 2.5) przedstawia wartość danej zmiennej oraz jej częstość pojawiania się. W rozkładzie częstości mamy 5 kolumn. W pierwszej wypisane są wartości zmiennej uporządkowane od najmniejszej do największej. W drugiej liczba osób (częstość), które udzieliły takiej odpowiedzi. W trzeciej kolumnie liczba została zamieniona na procent osób, które udzieliły takiej odpowiedzi. Często, gdy mamy dużą liczbę braków odpowiedzi, takjak w pytaniu o satysfakcję z pracy, gdy nie zadano tego pytania bezrobotnym, ważniejsza jest kolumna czwarta - procent ważnych odpowiedzi. Piąta kolumna zawiera procent skumulowany mówiący o tym, jaki procent próby uzyskał wynik mniejszy lub równy danej wartości. Graficzne sposoby przedstawienia rozkładu zmiennych omówione zostaną w rozdziale 3.
Tabela 2.1. Rozkład zmiennej PŁEĆ w badaniu LEARN Częstość Ważne
Procent
Procent ważnych
Procent skumulowany
mężczyzna
14
46,7
46,7
46,7
kobieta
16
535,3
53,3
100,0
Ogółem
30
100,0
100,0
Tabela 2.2. Rozkład zmiennej WYKSZTAŁCENIE w badaniu LEARN Częstość Ważne
Procent
Procent ważnych
Procent skumulowany
1
(średnie
ogólne)
8
26,7
26,7
26,7
2
(średnie
zawodowe)
8
26,7
26,7
53,3
3 (policealne)
7
23,3
23,3
76,7
4 (licencjat)
7
23,3
23,3
100,0
30
100,0
100,0
Ogółem
47
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Rozkład zmiennej w próbie
Tabela 2.3. Rozkład zmiennej WIEK w badaniu LEARN Częstość Ważne
Procent
Tabela 2.4. Zmienna Q49 (LICZBA DZIECI) z Polskiego Generalnego Sondażu SpoProcent ważnych
Procent skumulowany
21,00
7
23,3
23,3
23,3
23,00
4
13,3
13,3
36,7
24,00
1
3,3
3,3
40,0
25,00
4
13,3
13,3
53,3
26,00
1
3,3
3,3
56,7
27,00
3
10,0
10,0
66,7
29,00
3
10,0
10,0
76,7
30,00
3
10,0
10,0
86,7
32,00
3
10,0
10,0
96,7
33,00
1
3,3
3,3
100,0
30
100,0
100,0
Ogółem
zmiennej, możemy odpowiedzieć na pytanie, jakie jest prawdozmienna przyjmie określoną wartość. Zanim to jednak zrobimy, wprowadzimy rozróżnienie na zmienne ciągłe i skokowe. Liczba wartości zmiennej skokowej (dyskretnej) jest skończona i możemy je wszystkie wypisać. Przykładem takiej zmiennej jest liczba dzieci. Można mieć 0, 1, 2,3, czy 1000 dzieci, ale nie można mieć 1,5 ani 1,25 dziecka. Wartości zmiennej są wyraźnie od siebie oddzielone. Inaczej jest w przypadku zmiennej ciągłej, takiej jak czas wykonywania zadania, który możemy podawać w godzinach, minutach, sekundach, milisekundach itd. W praktyce nasz sposób pomiaru czyni tę zmienną dyskretną - zaokrąglamy np. do minut, mimo to w rzeczywistościjest to zmienna ciągła. W przypadku zmiennej dyskretnej możemy określić, ile wynosi prawdopodobieństwo,że zmienna przyjmie określoną wartość, np. p(X = 2), w przypadku zmiennej ciągłej to prawdopodobieństwo jest równe zero.
łecznego [7]
Ważne
O
Braki danych
1 2 3 4 5 6 7 8 lub 9
Częstość
Procent
1766 1518 2846 1611 635 269 113 65 69 18 8910
19,8 17,0 31,9 18,1 7,1 3,0 1,3 0,7 99,8 0,2 100,0
więcej
Ogółem
Procent ważnych
Procent skumulowany
19,9 17,1 32,0 18,1 7,1 3,0 1,3 0,7 0,8
19,9 36,9 68,9 87,1 94,2 97,2 98,5 99,2 100,0
Znając rozkład
podobieństwo, że
Na podstawie danych zawartych w przykładzie 2.1 określ prawdopodobieństwo, że wylosowana osoba ma: Odpowiedź:
a) mniej niź 2 dzieci
p(X< 2) = p(X= O) + p(X= 1)
b) więcej niż 2 dzieci
p(X> 2)
c) więcej niż 1 i mniej niż 3 dzieci
p(1 <X<3)
d) więcej niż 1 i mniej niż 4
p(1 <X< 4)
e) nie więcej niż 2 dzieci
p(X:,> 2)
Na podstawie rozkładu zmiennej WIEK określ, jakie jest prawdopodobieństwo,źe wylosowana osoba wśród dorosłych Polaków ma: Na podstawie rozkładu zmiennej LICZBA DZIECI określ prawdopodobieństwo, że wylosowana osoba ma: 4 dzieci
48
p(X= 4)
Odp.: p = 0,071
Odpowiedź:
a) mniej niź 20 lat
p(X< 20)
b) więcej niż 50 lat
p(X> 50)
c) 20 lat lub więcej
p(X:,> 20)
d) nie mniej niź 40 lat i nie więcej niż 60 lat
p(40 < X< 60)
p
=0,026
49
h !
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia
Tabela 2.5. Rozkład zmiennej Q9AGE (WIEK RESPONDENTA) w badaniu PGSS [7] Wiek
CZ
PW
Wiek
PS
CZ
P
PW
PS
18
119
1,1
1,1
1,1
58
182
1,6
1,6
19
172
1,5
1,5
2,6
59
180
1,6
1,6
74,7
20
168
1,5
1,5
4,1
60
164
1,5
1,5
76,2
21
187
1,7
1,7
5,8
61
133
1,2
1,2
77,4
22
160
1,4
1,4
7,2
62
170
1,5
1,5
78,9
23
153
1,4
1,4
8,6
63
180
1,6
1,6
80,5
1,4
1,4
10,0
64
164
1,5
1,5
82,0
1,5
1,5
83,4
24
160
73,1
25
168
1,5
1,5
11,5
65
163
26
164
1,5
1,5
13,0
66
155
1,4
1,4
84,8
27
172
1,5
1,5
14,5
67
164
1,5
1,5
86,3
28
172
1,5
1,5
16,0
68
143
1,3
1,3
87,6
29
163
1,5
1,5
17,5
69
167
1,5
1,5
89,0
30
188
1,7
1,7
19,2
70
131
1,2
1,2
90,2
31
193
1,7
1,7
20,9
71
129
1,2
1,2
91,4
32
186
1,7
1,7
22,6
72
114
1,0
1,0
92,4
33
231
2,1
2,1
24,6
73
113
1,0
1,0
93,4
34
230
2,1
2,1
26,7
74
99
0,9
0,9
94,3
35
250
2,2
2,2
28,9
75
87
0,8
0,8
95,1
36
253
2,3
2,3
31,2
76
70
0,6
0,6
95,7
37
296
2,6
2,6
33,8
77
79
0,7
0,7
96,4
38
244
2,2
2,2
36,0
78
50
0,4
0,4
96,8
39
271
2,4
2,4
38,4
79
55
0,5
0,5
97,3
40
297
2,7
2,7
41,1
80
48
0,4
0,4
97,8
41
290
2,6
2,6
43,7
81
42
0,4
0,4
98,1
42
259
2,3
2,3
46,0
82
31
0,3
0,3
98,4
43
251
2,2
2,2
48,2
83
33
0,3
0,3
98,7
44
261
2,3
2,3
50,6
84
20
0,2
0,2
98,9
45
2:!4
2,0
2,0
52,6
85
32
0,3
0,3
99,2
46
193
1,7
1,7
54,3
86
29
0,3
0,3
99,4
47
235
2,1
2,1
56,4
87
13
0,1
0,1
99,5
48
202
1,8
1,8
58,2
88
15
0,1
0,1
99,7
49
200
1,8
1,8
60,0
89
9
0,1
0,1
99,8
50
159
1,4
1,4
61,4
90
13
0,1
0,1
99,9
51
191
1,7
1,7
63,1
91
5
0,0
0,0
99,9
52
154
1,4
1,4
64,5
92
4
0,0
0,0
100,0
53
173
1,5
1,5
66,0
93
1
0,0
0,0
100,0
.54
148
1,3
1,3
67,3
94
2
0,0
0,0
100,0
55
142
1,3
1,3
68,6
97
1
0,0
0,0
100,0
56
158
1,4
1,4
70,0
98
100,0
57
164
1,5
1,5
71,5
Całość
Oznaczenia: CZ -
50
p
częstości,
- procent skumulowany
P - procent
całej
1
0,0
0,0
11192
100,0
100,0
Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia
próby, PW - procent ważnych odpowiedzi, PS
Samo przedstawienie rozkładu zmiennej nie jest spełnieniem naszych marzeń, gdyż w praktyce często zdarza się, że chcemy porównać ze sobą dwie lub więcej zmiennych. Ponieważ porównywanie dwóch rozkładów wcale nie jest proste, warto poszukać jakiejś innej metody, która pozwoli nam się zorientować, jaka jest relacja między dwiema zmiennymi. Na przykładmożna porównać średnie tych rozkładów. Zanim to jednak zrobimy, musi się zapalić czerwone światełko ostrzegawcze! Cóż bowiem znaczyłaby średnia ze zmiennej GRUPA w badaniu LEARN? Czysty nonsens! Musimy bowiem zapamiętać, że liczby w naszej tabeli (tabela 1.2), choć pozornie wyglądają tak samo, znaczą zupełnie co innego. Liczby użyte do kodowania zmiennej GRUPA mają za zadanie jedynie odróżnić trzy warunki eksperymentalne od siebie. Zamiast 1, 2, 3 moglibyśmy wpisać 39, -7, fi . Ta zmiana nie ma żadnego znaczenia, jeżeli grupom przypiszemy różne liczby. Takie liczby, jakjuż wiemy, określane sąjako pochodzące z nominalnej skali pomiarowej i mają na celu jedynie rozróżnienie obiektów. Na pewno nie możemy tych liczb dodawać, odejmować, mnożyć ... Oczywiściemożemy oceniać "na oko" różnice pomiędzy rozkładami czy grupami wyników. Ale zdecydowanie lepszym rozwiązaniem jest posługiwanie się pewnymi wielkościami, które służą nam do opisu charakterystyki rozkładu czy grupy wyników. Do tego celu służą nam statystyki opisowe, które możemy podzielić na miary tendencji centralnej, opisujące położenie wyników oraz miary dyspersji opisujące ich rozproszenie. Podstawowe statystyki opisowe można pogrupować na miary tendencji centralnej opisujące polożenie wyników oraz miary dyspersji opisujące rozproszenie wyników. W podręczniku omówimy tylko najczęściej wykorzystywane. Więcej miar opisujących rozkłady zmiennych Czytelnik znajdzie np. w [10, 5, 11,3].
Miary tendencji centralnej Najprostszą, ale też najmniej przydatną w badaniach społecznych miarą tendencji centralnej jest wartość najczęściej występująca, nazywana wartością modalną (modą) lub dominantą. Jeżeli, na przykład, w teście 10 osób uzyskało odpowiednio 2,2, 6, 7, 8,2, 5, 11,4 i 2 punkty, to wartością modalną jest 2. Ustalenie wartości modalnej jest ważne np. dla producentów obuwia, którzy chcą wyprodukować buty w najczęściej występującym rozmiarze. W naukach społecznych wartość modalna może być przydatna przy przewidywaniu wyników wyborów, jednak nie jest często wykorzystywana.
51
Rozdział
Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia
2. Rozkład zmiennej w próbie i w populacji... Najczęściej wykorzystywanąmiarą tendencji
centralnej jest średnia arytmetycz-
Tabela 2.6. Dopuszczalne miary tendencji centralnej dla
M
LX Xl +X2 +...+X. =- =-2._--=----_ _
zmienna nominalna
Dominanta
Mediana
Średnia
TAK
NIE
TAK
TAK
NIE NIE
TAK
TAK
TAK
...!!.
n
n
zmienna
porządkowa
zmienna ilościowa •..
typów skal pomia-
rowych
na wyrażona wzorem
gdzie X\, X 2 ,
różnych
X;, to wyniki poszczególnych osób, a n - liczba osób w próbie. Np.
jeśli w teście pięć osób uzyskało odpowiednio 2, 2, 6, 7 i 8 punktów, średnia wynosi
5 punktów. Średnią wyników w próbie oznaczamy literą M od angielskiego słowa mean. W wielu podręcznikach średnia oznaczana jest także jako X. Zapamiętaj:
X=M x
Podział
zbioru wyników na dwie równe części, czyli podział medianowy może my uogólnić na podział na większąliczbę części. Analogicznie do mediany, dzieląc zbiór na 100 części, możemy zdefiniować centyle:
Y=M y
~ Procent
(X""0
Pozycyjne miary tendencji centralnej Mediana jest w
Średnia jest miarązależnąod wartości skrajnych. Wyliczanie średniego dochodu
studentów może prowadzić do dziwnych wyników, jeżeli w grupie znajduje się milioner. W takiej sytuacji możemy określić środkowy dochód, czyli taką wartość zmiennej, oznaczonąjako Me, która podzieli nasz zbiór wyników na połowy.
myśl
tej definicji 50. centylem. wieku 6 lat poinformowano naszych rodziców, że nasz wzrost odpowiada 90., a waga 79. centylowi. Oznaczało to, że w populacji 6-latków 90% dzieci ma wzrost nie większy od naszego, a 79% waży nie więcej od nas. Możemy też powiedzieć, że 10% dzieci było wyższych, a 21 % cięższych. Najczęściej używane centyle otrzymały specjalne nazwy: Możemy pamiętać z dzieciństwa, jak w
Ent(X~Me)~ 30.,40.,50.,60., 70., 80., 90. centyl to odpowiednio 1.,2.,3.,4.,5.,6., 7., 8., 9. DECYL. 25., 50. i 75. centyl to odpowiednio 1., 2., 3. KWARTYL. 50. centyl, czyli 2. kwartyl, nazywany jest MEDIANĄ.
Powyższy zapis oznacza, że procent wartości zmiennej X mniejszych od Me jest
równy 50. Taka wartość nazywana jest medianą rozkładu. Trzeba pamiętać, że im bardziej średnia arytmetyczna różni się od mediany, tym lepiej mediana wyraża tendencję centralną·
W rozkładach zmiennych ciągłych nie ma problemu ż wartościami X = Me. Nie ma też takiego problemu w rozkładach zmiennych porządkowych, gdy przyporząd kowanie osobom wyników jest różnowartościowe(różne osoby mają różne wyniki, tak jak dzieje się to przy rangowaniu bez rang wiązanych). W zbiorze wyników: 1,2,3,4,5 Me = 3 W zbiorze wyników: 1,2,3,4,5,6 Me = 3,5 (w tym przypadku mediana może być dowolną liczbą 3 < Me < 4) Jest oczywiste, że nie dla każdej zmiennej można stosować wszystkie miary tendencji centralnej. Przy wyborze odpowiedniej miary może nam pomóc znajomość skali pomiarowej, na jakiej mierzona jest konkretna zmienna (tabela 2.6). 52
Definicje teoretyczne sąjasne, ale trzeba pamiętać, że aby wszystkie centyle mogły wyznaczone sensownie, nasza zmienna musi przyjmować co najmniej 100 wartości, chociaż to też nie gwarantuje sukcesu. W tabeli 2.7 przedstawiony został hipotetyczny rozkład zmiennej, rozkład prostokątny, gdyż każda z wartości związana jest z tą samą liczebnością. Wartości centyli, decyli, kwartyli odczytujemy z kolumny zawierającej procent skumulowany. zostać
53
l'
t
\
Rozdział
2.
Rozkład
Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia
zmiennej w próbie i w populacji ...
Wyznacz medianę, kwartyle i decyle dla tej zmiennej, a następ nie wykonaj to samo zadanie dla rozkładu zmiennej WIEK respondenta przedstawionej w tab eli 2.5.
Jak już powiedzieliśmy, najczęściej wykorzystywanąmiarą tendencji centralnej dla zmiennych ilościowych (co najmniej przedziałowa skala pomiarowa) jest śred nia. Przyjrzyjmy się teraz własnościom tej miary.
Tabela 2.7. Hipotetyczny rozkład zmiennej
54
VVłasnościśredniej
w
CZ
p
PS
38,25 20,00
1,00
34,00
63,75
20,00
1,00
68,00
13,50
20,00
1,00
1,00
39,00 20,00
1,00
35,00
64,50 20,00
1,00
69,00
14,25 20,00
1,00
2,00
39,75 20,00
1,00
36,00
65,25 20,00
1,00
70,00
15,00 20,00
1,00
3,00
40,50 20,00
1,00
37,00
66,00 20,00
1,00
71,00
15,75
20,00
1,00
4,00
41,25 20,00
1,00
38,00
66,75
20,00
1,00
72,00
16,50
20,00
1,00
5,00
42,00 20,00
1,00
39,00
67,50
20,00
1,00
73,00
17,25 20,00
1,00
6,00
43,15 20,00
1,00
40,00
68,25 20,00
1,00
74,00
18,00 20,00
1,00
7,00
43,50 20,00
1,00
41,00
69,00 20,00
1,00
75,00
18,75
20,00
1,00
8,00
44,25 20,00
1,00
42,00
69,75 20,00
1,00
76,00
19,50
20,00
1,00
9,00
45,00 20,00
1,00
43,00
70,50
20,00
1,00
77,00
20,25 20,00
1,00
10,00
45,75 20,00
1,00
44,00
72,75 20,00
1,00
78,00
21,00 20,00
1,00
11,00
46,50 20,00
1,00
45,00
73,50 20,00
1,00
79,00
21,75 20,00
1,00
12,00
47,25 20,00
1,00
46,00
79,00 20,00
1,00
80,00
22,50
20,00
1,00
13,00
48,00 20,00
1,00
47,00
90,50
20,00
1,00
81,00
23,25
20,00
1,00
14,00
48,75 20,00
1,00
48,00
91,00 20,00
1,00
82,00
24,00 20,00
1,00
15,00
49,50 20,00
1,00
49,00
91,50 20,00
1,00
83,00
24,75 20,00
1,00
16,00
49,75 20,00
1,00
50,00
92,00 20,00
1,00
84,00
25,50 20,00
1,00
17,00
51,00 20,00
1,00
51,00
92,50 20,00
1,00
85,00
26,25 20,00
1,00
18,00
51,75 20,00
1,00
52,00
93,00
20,00
1,00
86,00
27,00 20,00
1,00
19,00
52,50 20,00
1,00
53,00
93,50
20,00
1,00
87,00
27,75
20,00
1,00
20,00
53,25 20,00
1,00
54,00
94,00 20,00
1,00
88,00
28,50
20,00
1,00
21,00
54,00 20,00
1,00
55,00
94,50 20,00
1,00
89,00
56,00
95,00 20,00
1,00
90,00
57,00
95,50
1,00
91,00
29,25
20,00
1,00
22,00
54,75 20,00
1,00
30,00
20,00
1,00
23,00
55,50 20,00
1,00
20,00
30,75 20,00
1,00
24,00
56,25 20,00
1,00
58,00
96,00
20,00
1,00
92,00
31,50 20,00
1,00
25,00
57,00 20,00
1,00
59,00
96,50 20,00
1,00
93,00
32,25 20,00
1,00
26,00
58,00 20,00
1,00
60,00
97,00 20,00
1,00
94,00
33,00 20,00
1,00
27,00
58,50 20,00
1,00
61,00
97,50 20,00
1,00
95,00
33,75 20,00
1,00
28,00
59,25 20,00
1,00
62,00
98,00 20,00
1,00
96,00
34,50 20,00
1,00
29,00
60,00 20,00
1,00
63,00
98,50 20,00
1,00
97,00
35,75 20,00
1,00
30,00
60,75 20,00
1,00
64,00
99,00 20,00
1,00
98,00
36,00 20,00
1,00
31,00
61,50 20,00
1,00
65,00
99,50 20,00
1,00
99,00
36,75 20,00
1,00
32,00
62,25 20,00
1,00
66,00
101,50 20,00
1,00
100,00
37,50 20,00
1,00
33,00
63,00 20,00
1,00
67,00
1. Średnia jest wrażliwa na ekstremalne wyniki, np. gdyby w grupie osób przeciętnie zarabiających znalazł się miliarder, to średnia zarobków w tej grupie zostałaby sztucznie zawyżona i źle reprezentowałaby wysokość zarobków. 2. Suma odchyleń wszystkich wyników od średniej równajest zero, co zapisujemy: L(X- M) = O. Możemy to sprawdzić, korzystając z danych z przytoczonego wyżej przykładu z testem (dla uproszczenia opuszczamy indeksy): L~-~=a-~+a-~+0-~+a-~+~-~ = -3 - 3 + 1 + 2 + 3 = O.
3. Średnia jest lepszym predyktorem niż jakakolwiek inna miara tendencji centralnej, ponieważ suma kwadratów odchyleń wszystkich wyników od śred niej jest minimalna, co możemy zapisać L(X- M)2 = minimum. Ta własność średniej zostanie wykorzystana przy omawianiu analizy regresji. 4. Średnia jest bardziej stabilna (ma mniejszy błąd standardowy) od innych miar tendencji centralnej (to zdanie stanie sięjasne dopiero po lekturze rozdziału 3.).
Średnia ważona Jeżeli chcemy policzyć średnią ogólną, znając średnie w poszczególnych grupach, to musimy uwzględnićliczebność tych grup. Im liczniejsza grupa, tym większy wpływ będzie miała jej średnia na średnią ogólną. Wzór: k
IM;xn Mw
j
=....:.j~--'-l-k,.--.--
In; ;~l
gdzie:
Mw - średnia ogólna k -liczba grup Mi - średnie w poszczególnych grupach ni -liczebności poszczególnych grup.
55
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia
Miary rozproszenia wokół średniej
.
Wyobraźmy
sobie, źe chcemy obliczyć średni wynik egzaminu testowego z trzech klas, w których zanotowano następujące średnie: M1 = 3,0; M2 = 3,5; M3 = 4,5.
Jak to zrobić, nie znając wyników poszczególnych uczniów, a tylko średnie klas? Nie może my odpowiedzieć na to pytanie, dopóki nie znamy liczebności klas. Jest bowiem oczywiste, źe bardziej liczna klasa powinna mieć większy wpływ na średnią niż mała klasa. Załóżmy, że n1 = 20, n2 = 30, n3 = 10. Liczebności te stanowią wagi, przez które musimy pomnożyć odpowiednie średnie, aby otrzymać średniąważoną. Po zsumowaniu wymnożonych (zważonych) średnich dzielimy tę sumę przez sumę wszystkich obserwacji, czyli liczebność wszystkich klas N n1 + n2 + n3.
porównajmy dwa zbiory wyników: Zbiór 1:
4, 4, 5, 6, 6
Zbiór 2:
2, 2, 5, 8, 8
Wabu przypadkach średnia równa się 5. Jeżeli przedstawimy te rozkłady wyników graficznie:
=
to zobaczymy,
że
tym, co je
W przypadku pierwszego O wiele
Policzmy Określ, jakie musiałyby być liczebności klas, aby przy tych samych średnich w klasach M 1
M2
=3,5; M3 =4,5 średnia ważona wynosiła:
różni
jest
stopień
wokół średniej.
skupienia wyników
Jest to bardzo ważna informacja o rozkładzie wyników, która wymaga wprowadzenia oprócz miar tendencji centralnej (średnia, mediana, moda), miar rozproszenia. Najprostszą miarą rozproszenia jest zakres zmienności (rozstęp), będący różnicą między wartością maksymalną i minimalną.
M, Xn , +M, Xn, +M, xn, 3x20+3,5x30+4,5xlO 220 M = . = =-"'"367 w ni +n, +n, 20+30+10 60'
=3;
rozkładu
wynosi on 6 - 4 = 2, dla drugiego równa
lepszą miarą
rozproszenia jest suma kwadratów odchyleń od definiowana wzorem: SS = L(X - M)2
tę statystykę
dla
rozkładu
1:
Policzmy ją także dla
(X- M)2
X
X-M
X
X-M
4
4-5
2
2-5
a)
M=4
4
4-5
2
2-5
b)
M=4,5
5
5-5
5
5-5
c)
M= 3,0 M= 3,2
6
6-5
8
8-5
6
6-5
8
8-5
d)
L
=25
L(X - M)2=
M
Badacz przeprowadził eksperyment z trzema grupami. Pierwsza grupa licząca 50 osób uzyskała średni wynik 75. Średni wynik w drugiej grupie liczącej 40 osób wyniósł 80. W trzeciej grupie liczącej 25 osób średnia wyniosła 70. Policz średnią ze wszystkich grup. ~=~
~=~
~=~
M1 = 75
M2 = 80
M3 = 70
l
= I.5X =5'
SS l
L
=4
się
rozkładu
2:
(X- M)2
=25 M
8 - 2 = 6.
średniej,
L(X - M)2=
2
= I.5X =5'
SS2
=36
Suma kwadratów odchyleń od średniej zazwyczaj rośnie wraz ze wzrostem liczby osób w próbie. Wyjątkiem jest sytuacja, gdy dodatkowe osoby mają wynik równy średniej, ponieważ wtedy ich odchylenia od średniej równają się zero. Aby nasza miara nie zaleźała od liczbę stopni swobody.
wielkości
próby, musimy
uśrednić
SS,
dzieląc ją
przez
W ten sposób wprowadziliśmy wzór na wariancję:
I'
s = eNSS -l)
W naszych
I
rozkładach: 2
SS! N-l -
S ----
56
!
-
57
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Statystyki opisowe rozkładu zmiennej. Miary tendencji centralnej i rozproszenia
Policzmy odpowiednie odchylenia standardowe, czyli
sl
= VS, r;z =
s-
s
~ (N - 1)
a) Sześciu studentów zapytanych o liczbę randek w ostatnim tygodniu podało następu jące wartości:
s=f"1= 2 VS2
1,2,3,4,3,5
Różnica wariancji obu rozkładów i ich odchyleń standardowych wskazuje, że drugi rozkład charakteryzuje się większym rozproszeniem wyników wokół średniej niż rozkład pierwszy.
2 Pojęcia
odchylenia standardowego i wariancji są najważniejsze ze statystyk opisowych jednej zmiennej i zawierają tę samą informację. Znając wariancję, znamy odchylenie standardowe i odwrotnie. Odgrywają również kluczową rolę w badaniu współzależności pomiędzy dwiema i więcej zmiennymi. Podnoszenie do kwadratu powoduje, że większe odchylenia od średniej mają dużo większy wpływ na SS niż odchylenia małe. Takjak w życiu, gdzie koszty popeł nienia dużych błędów rosną nieliniowo. Jak wyjaśnimy to w następnym rozdziale, wariancję w próbie liczymy po to, aby oszacować (estymować) wariancję w populacji. Aby była dobrym estymatorem, kiedy badamy małe próby, musimy dzielić SS przez N - l, a nie przez N. W przypadku dużych prób, to czy dzielimy przez 3000, czy przez 2999 nie ma większego znaczenia.
Rozstęp
4
11
Średnia Wariancja
b)
10
9
11
1
2
3
4
5
6
7
8
9
10
11
Policz średnią, wariancję i odchylenie standardowe zmiennej LICZBA RANDEK. c) Inny badacz wprowadzając dane do komputera, pomnożył każdą wartość przez stałą b = 2 i otrzymał rozkład:
2,4,6,8,6,10
2
3
4
5
6
7
8
9
10
11
Policz średnią, wariancję i odchylenie standardowe zmiennej LICZBA RANDEK. d) Inny badacz wprowadzając dane do komputera, pomnożył każdą wartość przez stałą b 2 i dodał stałą a 1, otrzymując rozkład:
=
5
20
Odchylenie standardowe
=
1
4,47
2
3
4
5
6
7
8
9
10
11
Policz średnią, wariancję i odchylenie standardowe zmiennej LICZBA RANDEK. Wpisz wyliczone wartości do tabelki:
c)
58
8
3,5,7,9,7,11
Mediana
Jakie wnioski
7
mał rozkład:
0,2,4,8,11 0,2,4,8,6 0,2,4,8,21
a)
6
3,4,5,6,5,7
Policz i wpisz do tabeli średnią, medianę, rozstęp wyników, sumę kwadratów odchyleń od i odchylenie standardowe następujących wyników, oznaczających liczbę sprzeczek w partnerem w ciągu ostatniego miesiąca:
c)
5
b) Badacz wprowadzającdane do komputera, dodał do każdej wartości stałą a = 2 i otrzy-
średniej, wariancję
b)
4
Policz średnią, wariancję i odchylenie standardowe zmiennej LICZBA RANDEK.
1
a)
3
Zmienna możesz sformułować?
a)
X
b)
X+2
c)
2X
d)
2X+ 1
M
Jakie wnioski możesz sformułować?
SS
52
5
59
Rozdział
2.
Rozkład
Standaryzacja
zmiennej w próbie i w populacji .,.
Bez obliczania wariancji uporządkuj poniższe trzy rozkłady ze względu na rozproszenie wokół od najmniejszego do największego:
średniej
A:
21,19,28,22,20
B:
11,15,38,15,11
C:
22,22,22,22,22
Załóżmy, że mamy rozkład wyników o średniej wynoszącej 100 i odchyleniu standardowym równym 15. Jaki będzie wynik standaryzowany z dla wyniku surowego 8l? z=
87 -100 =Q",O 87 15 15 '
Wiemy, że średnia wyników z testu inteligencji w populacji' wynosi 100, a odchylenie standardowe 15. Nasz podopieczny uzyskał z tego testu wynik 130. Można zadać pytanie, jak daleko od średniej leży jego wynik? Z=
130-100 = 30 =2 15 15
Oznacza to, że uzyskał on wynik leżący o dwa odchylenia standardowe powyżej średniej. Załóżmy, że średni wynik semestralnego testu na Twojej uczelni wynosi 2, a odchylenie standardowe 0,75. Natomiast na uczelni Twojego kolegi ocenia się wyniki testu na innej skali i tam średnia równa jest 5,5, a odchylenie standardowe 1,75. Ty osiągnąłeś z testu wynik 3,6, a twój znajomy 8,5. Jak myślisz, który z was otrzymał lepszy wynik z testu na tle swojej grupy?
Do zbioru liczb 1, 2, 3, 4, 5 dodaj dwie dowolne liczby tak, aby: a)
średnia się
nie
zmieniła;
b) średnia się zmieniła, ale mediana pozostała bez zmiany; c) suma kwadratów odchyleń od średniej (SS) pozostała bez zmiany; d) wariancja pozostała bez zmiany.
Ztolegi
=
8,5-5,5 =1,71 1,75
Zmoje
__ 3,6-2 --213 0,75 '
Ponieważ wyniki standaryzowane mają średnią równą zero i odchylenie standardowe równe 1, można je łatwo poddawać przekształceniom algebraicznym.
Standaryzacja Standaryzacja polega na zamianie wyników surowych w wyniki standaryzowane. Standaryzowaćmożemy wyłącznie zmienne ilościowe - bo tylko wtedy możemy policzyć średnią i odchylenie standardowe. Jak widzieliśmy w ćwiczeniu 2.6, dodanie (odjęcie) stalej od każdego wyniku zmiennej ilościowej zmienia jej śred nią, ale nie zmienia odchylenia standardowego. Mnożenie (dzielenie) przez stałą k zmienia zarówno średnią, jak i odchylenie standardowe. Używając powyż szych przekształceń dodawania (odejmowania) oraz mnożenia (dzielenia) danego zbioru wyników przez stałą k, można przekształcić rozkład każdej zmiennej ilościo wej (pod warunkiem, że jego odchylenie standardowe nie wynosi zero) w rozkład o średniej równej zero i odchyleniu standardowym wynoszącymjeden. Takie przekształcenie rozkładu nazywa się standaryzacją.
z
60
= wynik-średnia
odchylenie stand. '
czy
1.~-M 1 Z= s
Adam i Dare~ pisali egzamin u różnych osób prowadzących ten sam przedmiot. Adam otrzymał 12 punktow, Darek 18 punktów. Który z nich otrzymał lepszy wynik? Nie możemy odpowiedzieć na to pytanie, jeżeli nie znamy wartości rozkładów obu testów. Z~łóżmy, że śr~dnia pierwszego testu, który pisał Adam, wyniosła 10, drugiego zaś 20, natomiast odchylenia standardowe - odpowiednio 3 i 2. Widzimy, że rozkłady nie są takie same. Możemy teraz przekształcić wyniki surowe (nieprzekształcone) w wyniki standaryzowane. z Adama
12-10 2 = -3 - -- 3
18-20 - --2- -- - 1
ZDarta -
Ponieważ ZAdama> ZDarka, stwierdzamy, że lepszy wynik otrzymał Adam.
.
Wynik standaryzowany z pokazuje, o ile odchyleń standardowych uzyskany przez nas wynik położonyjest poniżej (gdy z < O) lub powyżej (gdy z > O) średniej. Innymi słowy, jak daleko w jednostkach odchylenia standardowego leży nasz wynik od śred niej. Dla X = M wynik standaryzowany wynosi zero.
• Informacje o średnich i odchyleniach standardowych wyników w testach zostały wprowadzone w celach dydaktycznych i nie są informacjami dotyczącymi konkretnych narzędzi.
61
Rozdział
2. Rozkład zmiennej w próbie i w populacji ...
Rozkład
Rozkład zmiennej Porównaj wyniki obu studentów, jeżeli: a)
M A =15
b)
MA
c)
MA
=20 =12
sA=4 SA SA
=1 =2
=4 So = 3
M o =15 Mo Mo
So
=10 =14
So =
Zo=· Zo=
Powtórzmy jeszcze raz: Aby porównać wyniki indywidualnych osób pochodzące z różnych rozkładów, musimy zamienić je na wyniki standaryzowane.
Za pomocą testu przystosowania do sytuacji. po rozwodzie p~zeb~dano 4 p.ary o~ób ro:wiedzionych. Wyniki ujawniły różnice w poziomie przystosowa~la między kobietami ~ męzczy znami. Średnia dla kobiet wyniosła: M Kob = 60, przy odchyleniu standardowym S~ob - 6, natomiast średnia dla rozwiedzionych mężczyzn wyniosła MMęż = 55, pr~y odchyleniu standar?Owym SMęż 4. W poniższej tabeli przedstawiono rezultaty pos~cz~golnych. badanych: Porownaj wyniki kobiet i mężczyzn w poszczególny~h parach I ?,cen, ktora z. osob .w danej ?arze kobieta czy mężczyzna, lepiej przystosowała Się do sytuaCJI po rozwodzie (wyzszy WYnik oznacza lepsze przystosowanie).
=
Wynik kobiety (K)
mężczyzny (M)
przystosował się:
wyliczane na podstawie próby nazywane są STATYSTYKAMI. Np. jeżeli wyliczymy średni wynik sprawdzianu, który uzyskała dana klasa, to jest to wyliczenie statystyki.
para 2
72
para 3
48
51
para 4
54
59
2
mężczyzna
Za pomocą testów zdolności werbalnych i zdolności matematycznych przebadano ~ uczniów. W przypadku testu zdolności werbalnych średnia wyni?sła ~Werb =. 50, a odchylenie standardowe SWerb 20. W teście zdolności matematycznych srednla wyniosła MMat 20, a odchylenie standardowe SMat= 5.
=
=
Na postawie danych zawartych w poniższej tabeli porównaj wyniki obu testów u każdego z uczniów, a także oceń, z którego uzyskał lepsze rezultaty.
62
l Wartości liczbowe
63 47
Kasia
losowanie
PRÓBA .... ~ - - - - - - - - - POPULACJA
Lepiej
66
Uczeń
Chociaż analizujemy starannie wyniki pochodzące z badanej próby, to jednak podstawowym przedmiotem naszego zainteresowania jest populacja. Populacja to zbiór wszystkich możliwych jednostek, które są przedmiotem naszego zainteresowania. Próba to zazwyczaj niewielka część interesującej nas populacji. O sposobach pobierania próby można przeczytać w literaturze [5, 19]. Bardzo rzadko mamy możliwość zbadać całą populację. Badamy zwykle tylko jej część, czyli próbę. Chcemy natomiast formułować twierdzenia o populacji, a nie o próbie. Podstawowym naszym celem jest więc estymacja (szacowanie) parametrów populacji za pomocą statystyk z próby.
Wynik
para 1
Wynik w teście
Wynik w teście
zdolności
zdolności
werbalnych
matematycznych
30
25
Paweł
50
15
Rafał
40
20
Magda
90
40
ZWerb
-1
= ZMat =
Jest lepszy w teście: matematycznym
w populacji
Próba i populacja
Zo=
6
zmiennej w populacji
Statystyki opisujące próbę będziemyoznaczać literami łacińskimi M,
s.
M - średnia w próbie,
s - odchylenie standardowe w próbie
l Wartości liczbowe wyliczane
estymacja
~
ze wszystkich elementów populacji nazywane są PARAMETRAMI. Np. jeśli obliczylibyśmy średni wzrost wszystkich poborowych w danym roku, to byłoby to otrzymanie parametru.
Parametry opisujące populację będziemyoznaczać literami greckimi
/1 (mi), O"(sigma), a (alfa), jJ(beta) /1- średnia w populacji 0"- odchylenie standardowe w populacji
Rysunek 2.1. Próba a populacja
Średnia zmiennej w próbie (wartość statystyki M) interesuje nas o tyle, o ile pozwala nam wnioskować o średniej w populacji. Średnia M jest estymatorem /1. Podobnie odchylenie standardowe.
63
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Zapamiętaj: M
Rozkład zmiennej
w populacji
jest estymatorem jl, s jest estymatorem a. Porównywanie wyników konkretnej osoby z rozkładem zmiennej w próbie i z rozkła dem zmiennej w popl,.llacji
Dla niewielkich populacji rozkład zmiennej w populacji moż~my wyliczy~ analogicznie jak rozkład zmiennej w próbie. Możemy też po~~c~yć m~ary tendenCjI ~en tralnej i miary rozproszenia rozkładu zmiennej w populacJI. Sredmą rozkł~d~ zmIennej w populacji oznaczamy symbolem jl, zaś odchylenie standardowe wymkow w populacji oznaczamy jako o:
szóstoklasista Jaś otrzymał wynik 90 w teście kompetencji szkolnych. Średnia w jego klasie wyniosła M = 70, a odchylenie standardowe s = 20. Wiemy, że średnia w populacji szóstoklasistów wynosi a = 100 z odchyleniem standardowym jJ = 10. Możemy porównać wynik Jasia z rozkładem zmiennej w próbie (jego klasie) i z rozkładem zmiennej w populacji szósto-
klasistów.
Tabela 2.8. Symbole średniej i odchylenia standardowego dla próby i populacji Rozkład
zmiennej w próbie
Średnia
M
Odchylenie standardowe
s
X-M
90-70
z =---=---=1 J s 20
Rozkład
zmiennej w populacji
względem
klasy
x -/1
z2 = -(J'- =
90-100 =-1 10
względem populacji szóstoklasistów
jJ
Wynik Jasia jest o jedno odchylenie standardowe lepszy od średniej w jego klasie i o jedno odchylenie standardowe gorszy od średniej w populacji szóstoklasistów.
Zapisz symbolem:
Szkoła językowa prowadzi testy kwalifikujące na określony poziom nauki. Z wieloletnich doświadczeń wynika, że osoby zakwalifikowane na:
Tabela 2.9. Symbole statystyk opisowych dla próby i populacji Średnia w próbie
M
- 4 poziom powinny pochodzić z populacji o jJ = 40 i a= 10,
Średnia w populacji
jJ
- 5 poziom powinny pochodzić z populacji o jJ = 50 i a= 10, - 6 poziom powinny pochodzić z populacji o jJ
z s
Wynik standaryzowany Odchylenie standardowe w próbie
- 7 poziom powinny pochodzić z populacji o jJ = 70 i a= 10. Aby zostać zakwalifikowanym na określony poziom, dana osoba musi niący się o więcej niż jedno odchylenie standardowe od średniej.
Odchylenie standardowe w populacji Kwadrat odchylenia standardowego w próbie
Na który poziom nauki zostanie zakwalifikowana Ewa,
Kwadrat odchylenia standardowego w populacji
ss
Suma kwadratów
średniej
w próbie
X-M
Odchylenie średniej w próbie od średniej w populacji
Z4
52-50 10
= - - - = 1,2 (Ewa jest zbyt dobra, aby być na 4 poziomie)
10
5
Wariancja w populacji średniej
Kwadrat odchylenia wyniku pojedynczej osoby od w populacji
średniej
podstawą sformułowania oceny bądź
z
rozkładem
'
52-60
Kwadrat odchylenia wyniku pojedynczej osoby od w próbie
nej w próbie
jeżeli uzyskała wynik X = 52?
z 52-50 = O2
Wariancja w próbie
64
otrzymać wynik nieróż
Aby odpowiedzieć na to pytanie, musimy porównać wynik Ewy z rozkładem w populacji uczniów zakwalifikowanych na różne poziomy nauki.
X
Wyniki surowe Odchylenie wyniku pojedynczej osoby od
=60 i a =10,
Z6
=-,-10-=-0,8
z)
=--= -1,2 10
(X- M)2
52-70
(X -
jJ)2
pojedynczego wyniku jest porównanie go z rozkładem zmienzmiennej w populacji.
Ewa
,
(Ewa Jest zbyt słaba, aby być na 7 poziomie)
może wybrać między piątym
a szóstym poziomem nauczania.
65
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ... Rozkład normalny (rozkład Gaussa) Zapamiętaj:
Korzystając z danych z cy uczniowie:
Uczeń
uczeń
1
69
uczeń
2
73
uczeń
3
39
uczeń
4
43
Z4=
1,2
Rozkład
określ,
na jaki poziom
mogą zostać przyjęci następują
Z5-
0,2
Z6-
normalny
-0,8
Z7-
(rozkład
-1,2
Zapis N(j.L, o) oznacza, że zmienna ilościowa ma rozkład normalny o średniej f1 i odchyleniu standardowym er.
Decyzja 51ub 6
Gaussa)
Wiele zmiennych w populacji ma rozkład normalny, który można opisać za pokrzywej Gaussa. Ma ona kształt dzwonu, któ~ jest symet~czny wzg1ęd~~ średniej równej modalnej i medianie rozkładu. Lewa l prawa gałąz rozkładu zbhza się asymptotycznie do osi poziomej (nigdy jej nie przecina). Około 68% powierzchni pod krzywą mieści się w granicach jednego o~chy łenia standardowego na prawo i na lewo od średniej. Pole obszaru w gramcach od z = -1,96 do z = +1,96 obejmuje 95% powierzchni pod krzywą, a od z = -2,5~ do z = +2,58 obejmuje 99% całkowitej powierzchni pod krzywą, przy czym odpowIednio 5% i 1% mieści się poza tymi granicami. Równanie krzywej normalnej zależy tylko od dwóch parametrów: średniej i odchylenia standardowego. Ma to podstawowe znaczenie praktyczne, ponieważ po~w~la wyznaczyć rozkład zmiennej, jeżeli znamy średnią i odchylenie standard~we l wIemy, że jest to rozkład normalny. Powierzchnia pod krzywą normalną odpowIada 100% przypadków. Bardzo ważną własnością krzywej normal?ej jest ~o, że.p?wi~rzc~ nia pod krzywą (czyli proporcja przypadków) w przedziale o? sre~n~eJ do J~kie: gokolwiek punktu zależy tylko od odległości tego punktu od sredmeJ wyrazonej w jednostkach odchylenia standardowego. Między średnią i punkte:n od1e?łym od niej o jedno odchylenie standardowe mieści się zawsze 0,3413 pO":'I~rzc~m po~ krzywą, bez względu na to, czy analizujemy rozkład wzrostu, wagI, l~tehgencJI czy jakiejkolwiek innej zmiennej. Wielkość obszaru pod krzywą, czylI proporcja przypadków, ma bardzo duże znaczenie, ponieważ wyznacza prawdopodobieństwo że zmienna przyjmie wartość z tego przedziału. Na rysunku 2.2 pokazane je~t, że w odległości ±2 odchylenia standardowe od średniej znajduje się ponad 95% przypadków. mocą
66
2.6,
Wynik Porównanie Porównanie Porównanie Porównanie z poziomem z poziomem z poziomem z poziomem w teście 4 6 5 7 52
Ewa
przykładu
/l-2a
/l-a
Rozkład X N(100, 10)
80 Jednostki Z
90
/l
t
100
/l+a
/l+2a
/l+3a
110
120
130
>-
N(O,1) -2
-1
Rysunek 2.2. Rozkład normalny
O
2
3
>-
Pamięt~jmy, ~e rozkła.d n?~a1ny jest zdefiniowany dla zmiennych ciągłych. W ~ezultacle mUSImy pamlętac, ze prawdopodobieństwo, iż badana zmienna przyjmUJ.e ko~etną wart.oś~ jes~ równe zeru: p(X = 35) = O. Przykładem zmiennej ciągłej moz~ by,c :vz~ost. Jezeh zmierzymy czyjś wzrost, otrzymując np. 173 cm, to musimy pamlętac, ze j~st to tylko wartość przybliżona, zależna od dokładności naszej miarki. ~~o~~ w gru~Ie ludzi o wzrości~ 173 c~ mogą się od siebie pod względem tej zmiennej rozmc, tyle z~ na~ze. urządzeme pomiarowe może nie być wystarczająco dokładne, aby ~o wykryc. Jez:h. nawet ~~yjemyjakiejś dokładniejszej miarki, która pozwala na pO~11lar z ?okładn~sclą do ml1u~etró,:, mikrometrów czy nanometrów, to i tak pozostaje pewIe~ margmes błędu. NIgdy me możemy także mieć pewności, że dana osoba ma dokładme.1 3 cm ~zrostu, a odzwierciedleniem tego faktu jest właśnie wynik prawd~podobIe~stwa, IZ wartość wzrostu wynosi właśnie tyle, równy zeru. Dlatego d1~ zmle~~ch CI~łych z.aw~ze ~bliczamy prawdopodobieństwa, że zmienna przyjmIe wartosc na1ezącą do jaklegos przedziału, a nie równąjakiejś liczbie.
7
67
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Rozkład normalny (rozkład Gaussa)
Ostatnie z przedstawionych równości wnika' ". . p(z = ~k) = 0, zatem wszędzie dalej będzie~y trak;oz p~wyzekiJ. omOWlOnego f~ktu: paramI równoważne. wac zna >, ~ oraz ~, < jako
Zapamiętaj:
w przypadku zmiennej ciągłej w ramce poniżej są sobie równe.
prawdopodobieństwawypisane
0.4
tyle samo przypadków mieści się między średnią a wynikiem z = 1 (O
5 lub z < -5 jest więc możliwe, ale niesłychanie mało prawdopodobne. Korzystając z tablic rozkładu normalnego (tablica 1), możemy wyznaczyć pole pod krzywąnormalnąodcięte przez dowolne dwa punkty. Aby to uczynić, musimy zamienić wartości naszej zmiennej na wyniki standaryzowane. Standaryzacja powoduje przekształcenie rozkładu zmiennej N(u, oJ w rozkład normalny standaryzowany N(O, 1). W ten sposób, niezależnie od tego, czy interesuje nas wzrost poborowych N(170, 5), czy inteligencja N(100, 15), korzystać będziemy z tych samych tablic dla wartości z.
0.3
Rozkład normalny jest symetryczny, więc
Tablice Tablice kolumny.
rozkładu
rozkładu
normalnego z
normalnego z (patrz tabela 2.10 i tablica 1)
zawierają
trzy
Tabela 2.10. Fragment tablicy rozkładu normalnego
Pl
P2
O
0,0000
0,5000
0,01
0,0040
0,4960
0,02
0,0080
0,4920
0,03
0,0120
0,4880
0,04
0,0160
0,4840
Z
0.2 0.1
0.0
-4
-2
68
O
Rysunek 2.3. Obszar Pl i pz
4
Ponieważ rozkład norma1n . t
ści dodatnie z oraz odpowiad~~~: ~~me:::~y, w ta~l~cach po~ane są tylko wartowartości z wartości PI i P2 są takie same j~ak dla Pdoddotbl~nhstwa Pl. 1.P2. Dla ujemnych
ln-6 '. . '. . o a mc wartoscl z onnacja, ze zmIenna 'llosclowa ma rozkład 1 . . ... możemy przedstawić w postaci krz .G no~a ny oznacza, lZ jej rozkład ej 100% wszystkich wyników Dla danywh aus~a: PO~lerz~hnia pod krzywą mieści '. . yc wartosCl ZmIenne1 X (1 b t d . Zx ) mozemy jednoznacznie określi' '. J U S an aryzowanej zx) należy do danego przedziału pc prokłPodrcję osob W. populacji, dla których X (lub . . rzy a owo: wymk (patrz r kł d X ku 2 .1) mIeszczący się w przedziale (100 110) k _ oz a na rysunnmożeniu przez 100 otrzymamy procent; _ 34~i~. a Pl-0,34l3 populacji. Po przeZapamiętaj:
Następujące pytania:
~» Jak~ proporcja populacji otrzyma wynik większy od 130? Jak~ p~ocent otrzyma wynik większy od 130?
3)
J~kkle ~ekst prawdopodobieństwo,że wylosowana osoba otrzyma wy
. N '. 00013 n t' d' aCję· a pytame pIerwsze odpowiemy , a pyame rugIe odpow' 130/ , 0,0013. lemy , /0, a na pytanie trzecie _ nI
Wlę
szyod 130?
są pytaniami o tę samą inform
W pierwszej kolumnie szukamy wartości Zi, w drugiej znajduje się informacja o wielkości obszaru między średnią (w rozkładzie standaryzowanym równą zero) a daną wartością: PI = p(O ~ z ~ Zk) = p(O < z < Zk)' W kolumnie trzeciej znajduje się informacja o wielkości obszaru (proporcji przypadków, prawdopodobieństwie uzyskania wyniku) od danej wartości Zk do krańca rozkładu: P2 = p(z ~ Zk) = p(z > Zk)'
z=O
°
Sprawd~, czy rozumiesz zależności między:
proporcją - procentem - prawdopodobieństwem.
Jeżeli nie, przeczytaj jeszcze raz fragment Rozkład normalny.
69
Rozdział
2. Rozkład zmiennej w próbie i w populacji ...
Sposoby wykorzystania informacji dotyczącej normalności rozkładu zmien
Pytania sprawdzające
ciej kolumnie znajdziemy wartość: O 1587 M' . . . OWI nam to, ze od wartości z = 1 do końca rozkładu pozostaje 15,87% obserwacji.'
1. Czym różnią się definicje prawdopodobieństwa w a) klasycznym podejściu (a priori), b) podejściu empirycznym (a posteriori)?
odpowiedzieć na pytanie 1 i 2, należy: a) obliczyć wynik z (zrobiliśmy to już na początku)' Zatem: aby
Sposoby wykorzystania informacji dotyczącej normalności rozkładu zmiennej w populacji Wyliczanie procentu osób, które uzyskają wynik spełniający określone kryteria w
b)
j:k~~/cach rozkładu normalnego poszukać teg~ wyniku, tj. z = 2 w kolumnie oznaczonej
c)
odczytać (w tym samym wierszu) wartość zamies Interpre~ując ~ę wartość jako procent (2,28%) o~~zoną w kolumn~e p~. Wynosi ona 0,0228.
cent osob, ktore Uzyskają wynik większy od
>0;
ymamy odpowiedz na pytanie 2 (o pro-
o. d) dok?nać przekształcenia 100% - 2 28% = wynik mniejszy od X. ' o 97,72 Yo - Jest to procent osób, które
uzyskają
Inny sposób: . - odczytać w kolumnie P1 wielkość obszaru mi dz' 0,4772 = 47,72%) i dodać 50% czyi" drugą . ~ Yksrednlą a częsc roz ładu. ,
daną wartością z (czytamy'
.
Il'
Korzystając z danych z przykład 2 7 d
. u . ,o powiedz na następujące pytania, a rozwiązania
w tabelce: Wiedząc, że następujące
wyniki w teście kompetencji matematycznych mają N(100, 10), odpowiedz na pytania:
1. Jaki procent osób uzyska wynik mniejszy 2. Jaki procent osób uzyska wynik Aby na nie odpowiedzieć, podanej wartości 80.
należy
niż
większy niż
w pierwszej
80?
80? kolejności policzyć wyniki
z = 80 -100
umieść
Jak~ procent osób uzyska wynik mniejszy niż 90? Jak~ procent osób uzyska wynik większy niż 90? 3. Jak~ procent osób uzyska wynik mniejszy niż 100? 1.
2.
Jak~ procent osób uzyska wynik większy niż 100? Jak~ procent osób uzyska wynik mniejszy niż 110? 6. Jak~ procent osób uzyska wynik większy niż 11 O? 7. Jak~ procent osób uzyska wynik mniejszy niż 120? 8. Jaki procent osób uzyska wynik większy niż 120? 4.
standardowe z dla
=-2
10 Kolejnym krokiem będzie skorzystanie z informacji zawartej w tablicach rozkładu normalnego (patrz tablica na końcu książki). Przypomnijmy, że w tablicach rozkładu normalnego znajdują się 3 kolumny: z, P1 i pz. Kolumna oznaczona jako z zawiera wartości jednostek standaryzowanych z, uszeregowane od najmniejszej (O) do największej. Jest to miejsce, w którym poszukamy otrzymanego przez nas w zadaniu wyniku. (Łatwo zauważyć, że tabela rozkładu normalnego podaje wartości bezwzględne, tj. bez minusów. Zatem zamiast z = -2, poszukamy z = 2). Kolumna oznaczona jako P1 mówi nam o wielkości obszaru, czy inaczej powierzchni (wyznaczonej przez krzywą Gaussa) pomiędzy średnią a daną wartością z. Przykładowo: dla wartości z 1 w kolumnie P1 odczytamy wielkość obszaru 0,3413. Oznacza to, że 34,13% wszystkich obserwacji mieści się w obszarze między średnią (z = O) a jednym odchyleniem standardowym (z = 1).
=
70
.. l" neJ w popu aCJz
5.
9. Jaki procent oso'b u k . " . . zys a wynik mnieJszy niż 130? 10. Jaki procent osób uzyska Wynik większy niż 130?
x
z
% osób, które Uzyskają wynik mniejszy od X
80
2
97,72
90
% osób, które Uzyskają wynik większy od X 2,28
100 110 120 130
Kolumna P2 zawiera informację mówiącą o wielkości obszaru odciętego przez daną wartość z, tj. takiego, który rozciąga się od tej wartości do końca rozkładu. Przykładowo: dla z 1 w trze-
=
71
Sposoby wykorzystania informacji dotyczącej normalności rozkładu zmiennej w populacji
Rozdział 2. Rozkład zmiennej w próbie i w populacji ...
Wyliczanie wartości zmiennej na podstawie znajomości
rozkładu normalnego, przy założonym procencie osób,=
Analogicznie
możemy wyliczyć
próg pozycyjny dla oceny bardzo słabej (dolne 10%
Szukamy pz = 0,1000, najbliższa z = 1,28. dolne 10% my z = -1,28:
Ponieważ
wartość
w tablicach to
= O
rozkładu).
rozkładu znajduje się poniżej' ~~ed nieJ .' ~ °d , ktorej odpowla?a . o wzoru na z wstawla-
które mają osiągnąć wynik z danego przedziału
03
.,
.
_1,28=X-70.
10 Po wymnożeniu obu stron równania przez 10 wyliczamy X = 57,2. Wyniki egzaminacyjne o zakresie punktacji od O do 100 musimy przekształcić na oceny informujące studentów o poziomie wykonania przez nich testu w skali: 1) bardzo słaby, 2) słaby,
~n~~~~~~:b6~:~~~:c'toOCz~enęd ~ark~zo słabą (cz~1i oblać egzamin), trzeba otrzymać mniej niż
. ,Zlę I zastosowaniu progów poz .... h . . . YCYJ~Yc egzamin zdaliby studenci z wynikiem 58 i 59 punktów kt' porażkę. ' orzy przy zastosowaniu progow absolutnych odnieśliby
3) przeciętny, 4) dobry, 5) bardzo dobry.
Możemy dokonać tego, ustalając progi bezwzględne, np.: 1) bardzo słaby - poniżej 60% 2) słaby - 60-69% 3) przeciętny - 70-79% 4) dobry - 80-89% 5) bardzo dobry - 90% i powyżej. Problem pojawia się, gdy wykładowca umieści w teście bardzo trudne pytania, na które są w stanie odpowiedzieć tylko nieliczni. W takim przypadku zamiast progów bezwzględnych lepiej wprowadzić progi pozycyjne, które odnoszą się do rozkładu wyników. Mówią one np., że wynik mieszczący się: a) w dolnych 10% rozkładu jest bardzo słaby(1) b) między 11% a 20% rozkładu - słaby (2) c) między 21% a 60 % rozkładu - przeciętny (3) d) między 61% a 70% rozkładu - dobry (4) e) powyżej 70% - bardzo dobry (5).
Sprawdźmy
teraz, jaki stopień otrzy t d t k . padku obu sposobów oceniania wied~a s. u en, tory
~zys~ał.~nik 40 punktów w przy-
k~ 1.0?-~unkto,,:,.ej. ska.1i )~st ró~nozna~~:ez N~~~~~~~::~~{~z~:e46~:uan~~; mleSCI słabą.
Się
bezwzględnego , a to z
pOnlzeJ naJnlzszego progu
p~zypa?-
w kl' ' o wy onania o el oznacza ocenę bardzo
Aby ustalić, jaką ' . rI zast ' na jednostki z: ocenę otrzyma on, Jes osuJemy progi. pozycyjne, przeliczmy jego wynik
40-70
zl=--=-3. 10
~ ~ag~~;~~, ~:~~~~c~~~~:I~e;~f~~~~nk:j;Jn:aort~ś~i
w dolnych 10% rozkładu o
.
wyznaczających ocenę
pz odpowiadającej z =.3. Znajdujemy ' 310 procent rozkładu, a WięC zawiera się bardzo słabą.
:~~~i~k: :0 ~unktów nie pozwal~ zd~ć e~zaminu (ocena bardzo słaba) zarówno prz zasto-
Aby wyznaczyć ilość punktów, którą należy uzyskać, by być ocenionym np. na poziomie bardzo dobrym (5), trzeba wiedzieć, jaki jest rozkład wyników w populacji. Jeżeli N(,u, 0",), to korzystając z tablic, możemy bez problemu wyznaczyć progi pozycyjne.
nych
(zd~eo~~~ ~~:~~~~~~t (zdają CI, ktorzy uzyskali powyżej 60% punktów), jak i ~OZYCyj-
Wyznaczmy progi bezwzględne i pozycyjne dla oceny bardzo dobrej.
Aby wyznaczyć progi bezwzględne, należy za punkt wyjścia wziąć zakres punktacji. Wynik 100 w teście stupunktowym oznacza 100% wykonania testu. Zgodnie z zasadami opisanymi wyżej trzeba uzyskać powyżej 70 punktów, aby otrzymać ocenę bardzo dobrą. Wyniki innych
studentów nie mają wpływu na naszą ocenę· Progi pozycyjne zależą od tego, jak inni napisali egzamin. Ocenę bardzo dobrą uzyska górne 30% studentów. Jaki wynik należy uzyskać, aby zakwalifikować się do tej grupy? Innymi słowy pytamy, ile wynosi z dla pz = 0,3. W tablicach rozkładu normalnego szukamy w trzeciej kolumnie pz i odpowiadające mu z, które odcina 30% powierzchni od prawego końca rozkładu. Najbliżej wartości pz = 0,3000 znajduje się pz = 0,3015, która odpowiada z = 0,52. Podstawiamy te wartości do wzoru na z, pamiętając, że wyniki mają rozkład N(70,10): 052= X -70 .
,
10
Po wymnożeniu obu stron równania przez 10 wyliczamy X = 75,2.
72
Wniosek: Aby uzyskać ocenę bardzo dobrą, wystarczy otrzymać 76 punktów lub więcej. Przy zastosowaniu progów absolutnych uzyskalibyśmy z takim wynikiem ocenę przeciętną (3).
Proszę wyznaczyć progi dla:
bezwzględ' ne I
. . PozycYJne, Wiedząc, że skala punktacji wynosi 0-100,
a) N(70,10); b) N(50,20). Określ,
jaki
stopień otrzymają następujący
Studenci
Student 1
Wynik z egzaminu
40
Student 2
50
Student 3
70
Student 4
75
Student 5
90
Wynik z 3
studenci: Progi bezwzględne
bardzo
słaby
Progi pozycyjne N(70,10)
bardzo
Progi pozycyjne N(50,20)
słaby
73
Rozdział
2.
Rozkład
zmiennej w próbie i w populacji ...
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Postanowiliśmy, że osobom, które znajdą się wśród 5% najlepszych studentów zaproponujemy stypendia naukowe, natomiast tym, którzy się znajdą w grupie 10% najsłabszych studentów - specjalne zajęcia wyrównawcze. Studenci, przed przystąpieniem do testu, chcą wiedzieć, jaki wynik muszą osiągnąć, aby otrzymać stypendium. Wiedząc, że wyniki w teście mają w populacji rozkład normalny, o znanej średniej i odchyleniu standardowym N(1 00, 1O), możemy to ustalić, korzystając z tablic rozkładu normalnego.
Poszukamy w tablicach
rozkładu
normalnego, w kolumnie oznaczonej jako P2, wartości odpo-
wiadającej 5%. Najbliższa tej wartości okazuje się liczba 0,0505 i odpowiada ona wynikowi Z = 1,64. Znając wartość
z,
punktów trzeba
uzyskać,
średnią
i odchylenie standardowe, aby dostać stypendium:
możemy odpowiedzieć
na pytanie, ile
164 = X -100 , 10
X-100=1,64x10 X= 16,4 + 100 = 116,4. Aby
otrzymać stypendium, należy zdobyć
Korzystając
z danych zawartych w
przykładzie
2.9, odpowiedz na
następujące
pytania:
1. Jaki wynik musi
osiągnąć
student, aby
się znależć wśród
2% najlepszych uczniów?
2. Jaki wynik musi
osiągnąć
student, aby
się znaleźć wśród
1%
3. Jaki wynik musi
osiągnąć
student, aby
się znaleźć wśród
0,5%
najsłabszych
uczniów?
najsłabszych
uczniów?
P2
z
X
5% najlepszych
0,05
1,64
116,4
2% najlepszych
0,02
% skrajnych
1%
najsłabszych
0,5%
74
co najmniej 116,4 punktów na egzaminie.
najsłabszych
0,01 0,005
Wizualizacja danych. Tworzenie wskaźników złożonych Pojęcia kluczowe: wskaźniki złożone, trafność i rzetelność wskaźnika;
rzetelności
skali; analiza czynnikowa
danych; histogram; wykres:
(składowych głównych);
słupkowy, kołowy,
analiza
wizualizacja
skrzynkowy
Nowe symbole: aCronbacha
Chociaż logiczne jest, aby rozdział poświęcony tworzeniu wskaźników zmiennych teoretycznych i oglądaniu (wizualizacji) rozkładów zmiennych poprzedzał rozdziały poświęcone analizie danych, to początkujący Czytelnik może mieć kłopoty ze zrozumieniem wszystkich pojęć wykorzystywanych w niniejszym rozdziale. W takim przypadku zachęcamy do przeczytania po przerobieniu następnych części podręcznika (w szczególności rozdziału 8.). W tym momencie warto zapoznać się jedynie z histogramami, zostawiając resztę tekstu do późniejszej lektury. Czytelnik z pewnym doświadczeniemw analizie danych zyska po lekturze tego rozdziału w tym momencie wiele cennych informacji.
Tworzenie
wskaźników
Budowanie wiedzy to zadawanie pytań o zależności między zmiennymi teoretycznymi (nieobserwowalnymi). Jeżeli chcielibyśmy sprawdzić, czy prawdziwa jest mądrość ludowa mówiąca, że pieniądze szczęścia nie dają, to najpierw musielibyśmy dokonać operacjonalizacji zmiennych teoretycznych: posiadanie pieniędzy, bycie szczęśliwym. Musimy określić, kiedy uznamy daną osobę za posiadającąpienią dze, kiedy za szczęśliwą... Podobnie rzecz się ma, gdy próbujemy mierzyć inne zmienne teoretyczne, np. poziom lęku. Ta zmienna faktycznie jest nieobserwowalna, gdyż opisuje pewien stan emocjonalny, którego nie daje się bezpośrednio zmierzyć. Możemy za to łatwo zmie-
75
Tworzenie
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych
rzyć towarzyszące lękowi objawy fizjologiczne: zwiększoną temperaturę ciała, pocenie
się dłoni itp. i używając ich jako zmiennych, zbudować odpowiedni wskaźnik
wiedzi, ponieważ trzy różne odpowiedzi są zakodowaneJ'ako O Zauwaz'my . . WYNIKI W SPRAW . . . ,ze zmIenna ., , DZIANIE to w IstOCIe 10 zmiennych, przedstawiając ch od 0WIedz! na poszczegolne pytania. Mamy do wyboru dwie y p
możliwości:
lęku.
SAMOOCENA jest również zmiennąteoretyczną- bez przyjęcia dodatkowych założeń nie możemy jej zaobserwować. Operacjonalizując tę zmienną, możemy założyć, że osoba o niskiej samoocenie powinna w specyficzny sposób odpowiadać na pewne pytania. Na przykład możemy poprosićją o ustosunkowanie się do zdania: "Czuję, że z niewielu rzeczy mógłbymbyć dumny". Wyrażone stanowisko może być wskaźnikiem zmiennej teoretycznej SAMOOCENA. Jednak odpowiedź na pojedyncze pytanie bywa dziełem przypadku. Mówimy, że jest zazwyczaj obarczona dużym błędem pomiaru. Taki błąd ma znaczący (i negatywny) wpływ na wyniki dalszych analiz. Jeżeli jednak osoba ustosunkowuje się w sposób konsekwentny do kilku opinii, np. wskazuje odpowiedź "tak" na pytanie "Ogólnie rzecz biorąc, jestem z siebie zadowolony" i "raczej nie" na pytanie "Żałuję, że nie mogę darzyć siebie większym szacunkiem", to możemy być pewni, że nie są to raczej odpowiedzi przypadkowe. Do pomiaru zmiennej teoretycznej (latentnej, nieobserwowalnej) wykorzystujemy łatwo obserwowalne zmienne (np. odpowiedź na pytanie, reakcję skórnogalwaniczną), które na podstawie wcześniej zgromadzonej wiedzy uznajemy za zwią-
•
~~gr~g?:~ć te l O zmi~nnych, np. licząc, ile jest prawidłowych odpowiedzi.
•
a az ej osoby będZIemy wtedy mieli jedną liczbę po~ostm:ić 10 liczb, ale oznacza to w analizach wp;owadzenie dodatkowe' ZmIennej PYTANIE, co zostanie w rozdziale 7. J
wyjaśnione
liśmDlakon.strukCji wskaź~ika.w s~rawdzianie wybraliśmy sposób pierwszy i zlicz -
":ledząc, żc w pytaniach 2, 6 i 10 prawidłowa h ~ odpowiedź 2. itd. Utworzyliśmy w ten spo~b
d Y p"';"'lIowe OdpOWledzl, o 4., w 3, 7 15 nową zmIenną o naZWIe TIME l.
pow!e~z
pyta~Iach
Tabela 3.1. Tabela
częstości
zmiennej TIME1
Częstość Ważne
Procent
Procent ważnych
Procent skumulowany
1,00
1
3,3
3,3
2,00
1
3,3
3,3
6,7
3,00
3
10,0
10,0
16,7
wany jest skalą. Jest to trzecie znaczenie terminu "skala" w statystyce. Wcześniej mówiliśmy o skali pomiarowej (np. nominalna, przedziałowa) i o skalach odpowiedzi (np. TAK,
4,00
2
6,7
6,7
23,3
5,00
3
10,0
10,0
33,3
6,00
7
23,3
23,3
56,7
NIE lub 1... 2 ... 3 .. .4 ... 5). W zbiorze danych LEARN mamy 5 zmiennych (od sI do s5) związanych z samooceną. Aby otrzymaćwskaźniksamooceny, moglibyśmy po prostu odpowiedzi na
7,00
4
13,3
13,3
70,0
8,00
6
20,0
20,0
90,0
3
10,0
10,0
100,0
30
100,0
100,0
zane z daną zmienną teoretyczną· Zestaw pytań, które służą do budowania wskaźnika zmiennej teoretycznej nazy-
te pytania do siebie dodać. Oczywiście każda z odpowiedzi na pojedyncze pytanie obarczona jest błędem pomiaru. Jednakże sumując je i zakładając, że błędy te są przypadkowe (tzn. nie ma błędu systematycznego, który by na przykładzawyżał odpowiedzi na wszystkie pytania), liczymy na to, że się one zniosą. W rezultacie błąd, jakim obarczony jest wskaź nik, będzie mniejszy niż błąd każdego z pytań osobno. Dzięki temu wykorzystywanie wskaźników zbudowanych z więcej niż jednego pomiaru prowadzi w analizach sta-
wskaźników
9,00 Ogółem
3,3
TIME1
8r-----------~
Średnia
6,0000 Mediana 6,0000 Dominanta 6,00
tystycznych do znacznie wiarygodniejszych wyników. Oczywiście musimy sprawdzić (o czym później), czy dodawanie wartości zmien4
nych ma sens. Sposoby tworzenia wskaźnikówpokażemy na przykładzie zbioru LEARN. :l;l
2
,2 Ul Gl' N
Zmienna WYNIK W SPRAWDZIANIE
76
Gdybyśmy zakodowali odpowiedzi na pytania tak, że l oznaczałoby odpowiedź prawidłową, a O- błąd, to pozbawilibyśmy się możliwości analizy błędnych odpo-
o o Rysunek 3.1. Rozkład częstości zmiennej TIME1
9,00 TIME1
77
Rozdział
3. Wizualizacja danych. Tworzenie
wskaźników złożonych
Tworzenie wskaźników
z ', .
uwagę na uzyskany rozkład wartości zmiennej ~IME 1 p~zedstawiony YI'na rysunku 3.1. t w a e na l .10 pytań, czyli teoretycznie mogllsmy ., wiedzi ~zysk' ~c wym'k~ o d O('zadneJ praWI._ dł . d wiedzi) do 10 (wszystkie odpowiedzI prawIdłowe), Jednak w nasze~ gru ani jedna osoba, która wynik skrajny. Zatem zmIenna 1 . . . . tym przypadku wartości od 1 do 9. 'ak glo"da wyników w intuicji psychologIcznej TIME przYJmuJe w Zobaczmy teraz, J wy ' t W drugim terminie (tabela 3.2):
bWl~03cml
Wskaźnik zbudowaliśmy, zliczając prawIdłow~ odp~
pi~:~~ ~n~~żła się Ta b e Ia 3.. 2
Ważne
rozkład
Rozkład częstości
otrzymała
teście
zmiennej TIME2 Procent ważnych
Procent skumulowany
13,3
13,3
13,3
2
6,7
6,7
20,0
4
13,3
13,3
33,3
Częstość
Procent
1,00
4
4,00 5,00 6,00
8
26,7
26,7
60,0
7,00
5
16,7
16,7
76,7
8,00
2
6,7
6,7
83,3
9,00
1
3,3
3,3
86,7
10,00
4
13,3
13,3
100,0
CD Zawsze trzeba sprawdzaćrozkłady braków danych (zarówno opuszczenia py_ tania, jak i uchylenia się od sformułowaniasądu przez wybór odpowiedzi "nie wiem", "trudno powiedzieć"). Może to stanowić cenną informację zarówno o pytaniu, jak i osobie badanej. Możemy zliczyć, ile takich odpowiedzi udzieliła osoba badana.
stanowić się nad wykluczeniem go z dalszych analiz, podejrzewając, że nie traktował on naszych badań poważnie. Jest to bardzo ważna heurystyka, ponieważ często badacz nie wprowadza sam wyników do komputera i nie widzi profilu odpowiedzi dla poszczególnych osób. Nie musimy podkreślać, że ta-
..
Zmienna SAMOOCENA . Przypomnijmy, że odpowiedzi n.a p~tan.ia: sI. Żałuję, że nie mogę darzyć slebl.e "'.'Iększym szacunkIem. s2. Ogólnie rzecz biorąc, jeste~ z .sl~bIe zadowo~ony. s3. Czasami mam silne pOCZUCIe, ze Jestem. bezuzyteczny. s4. Czuję się osamotniony, mimo że tego me, chcę. s5. Czuję, że Z niewielu rzeczy mógłbym byc dumny. kodowaliśmy następująco:
CD = zdecydowanie TAK; ~ = TAK; Q) = NIE; @) = zdecydowanie NIE; ~ trudno powiedzieć. Musimy podjąć decyzję, co zrobić z brakami odpowiedzi na.pos~c~~gólne pytania które zakodowaliśmy jako 9 i odpowiedziami "trudn~ po~:edzlec zako~~wt ' .. k 5 Możemy potraktować je jako braki odpOWIedzI l zadekl~rowac J~ ~ nyml o .h" Może to J'ednak spowodowac, duze . u by tk'l W naszy m zblOrze . Jezell b rak l·Jad anyc . . . ., t' . ~hcielibyśmy dodać liczby przedstawiające odpOWIedzI na pIęC py ano SAMOOCENA = sI + s2 + s3 + s4 + s5,
Możemy wyliczyć średnią z tych zmiennych, które nie mają braków danych. Niewykluczone jednak, że wówczas osoba, która odpowiedziała tylko na jedno pytanie otrzyma taki sam wynik jak osoba, która odpowiedziała na wszystkie pytania. Problem traktowania braków danych jest trudny i za każdym razem wymaga wnikliwej analizy. Omówienie wszystkich sposobów wykracza poza ramy tego podręcznika, ale warto pamiętać oparu heurystykach:
@ Jeżeli większość odpowiedzi badanego jest tego samego typu, to możemy za~
Tym razem rozkład jest nieco inny, cztery osoby uzyskały maksymalny mozhwy wynik, czyli 10 punktów.
78
to wszystkie osoby, które w choć jednym pytaniu zaznaczyły"trudno powiedzieć" lub nie odpowiedziały na pytanie nie będą miały wyliczonej zmiennej SAMOOCENA i program wpisze im brak danych. W naszym zbiorze tylko jedna osoba miałaby wtedy policzony wskaźnik samooceny.
kie dane mogą zaciemniać obraz zależności. Wielu badaczy traktuje odpowiedź "trudno powiedzieć"jako lokującąbadanego w środku skali. Rekodują oni wyniki w następujący sposób:
(1 -7 1), (2 -7 2), (3 -74), (4 -7 5), (5 -7 3), (9 -7 9). Taka decyzja wymaga uprzedniej analizy jej konsekwencji. W tym wypadku była to jedyna sensowna decy~a,jakąmogliśmypodjąć. Odpowiedzi "trudno powiedzieć" uznaliśmyjako równoważne"ani tak, ani nie". Brak odpowiedzi był traktowany jako brak danych.
Zauważmy, że pytania sIr, s3r, s4r, s5r (literą "r" oznaczyliśmynowe zmienne, w których odpowiedź "trudno powiedzieć" znajduje się w środku skali) są kodowane w tym samym kierunku. Możemy przypuszczać, że odpowiedzi"TAK" i "raczej TAK" świadczą o niskiej samoocenie. Te same odpowiedzi na pytanie s2r świadczą o wy_ sokiej samoocenie. Dlatego pierwszym krokiem jest rekodowanie zmiennych tak, aby te same odpowiedzi odpowiadały naszej zmiennej teoretycznej. W tym celu rekodujemy zmienną s2r tak, że 1 -75,2 -74,3 -7 3,4 -7 2,5 -7 1. Do dalszych obliczeń będziemyjuż wykorzystywali zmienną s2rr. Zanim przystąpimy do budowania wskaźnika samooceny, musimy sprawdzić, czy odpowiedzi na pytania od s1 do s5 mogą mierzyć tę samą zmienną teoretyczną. Wymaga to weryfikacji trafności i rzetelności pomiaru (patrz następny podrozdział). Na razie załóżmy, że odpowiedź na to pytanie wypadła pozytywnie i że na tej podstawie możemy utworzyć wskaźnik samooceny przez uśrednienie odpowiedzi na poszczególne pytania (oczywiście po uprzednim ich zrekodowaniu).
79
Rozdział 3.
Wizualizacja danych. Tworzenie
Typowe problemy występująceprzy tworzeniu
wskaźników złożonych
Średnia
Mediana Modalna
4
3,06 2,20 2,00 i 4,40
dług mediany, według średniej lub też wyodrębnić grupy skrajne, np. odcinając górne 25% i dolne 25% rozkładu. Każda z tych decyzji może zaowocować innymi wynikami, dlatego powinna być dokładnie rozważona i szczegółowo uzasadniona. Zilustrujmy to na przykładzie zmiennych WIEK i WYKSZTAŁCENIE (liczba lat nauki).
Tabela 3.3. Tabela częstości zmiennej LATA NAUKI SZKOLNEJ z badania PGSS POZIOM WYKSZTAŁCENIA Zmienna
2
porządkowa
1,60
1,75
70
1
4
660
Rysunek 3.2. Rozkład częstości wskaźnika samooceny
dk
.
kładów innych zmiennych podział bywa mniej oczywisty. ~o-
W ~~~i~na~ :~zróżne sposoby. Jeżeli znamy rozkład zmier:nej DEP~SJA l ~a
~:~ślone nor~y dla ~ada~~j ~=l~~~~~:~~~l~:~:~::ou;;::~l:o~~~~:~~
re .o~iągn~y wynikł~Oz~:J=I:i~a ni~depresyjne. W ten sposób dokonujem~ ~ycho klm~czn~J, p~zost~ DEPRESJA która przyjmuje teraz już tylko dwie warto~cl. O~~ tomlzac~ ~mIe~~~e wyniki pr;y oryginalnym pomiarze stają się dla nas mero~ro~ by uzys uJące roz . . Może si też zdarzyć, że w naszej pro-
80
~~:ktC~~s:~t:::"::~;::::~~o~presjikpl~nl~~~~~':~~a:a:;~~~~~~~ ze na ozemy duże zróżnicowanie
względu
tę zmIenną·
przedziałowa
Procent skumulowany
6
6
6
5,9
5,9
6,5
Procent
2
8
2847
25,4
25,5
32,0
10
3126
27,9
28,0
59,9
5,6
12
2778
24,8
24,8
84,8
7,8
14
751
6,7
6,7
91,5 100,0
17 całość
Missing
ważnych
Procent
3,4
9
Całość
Częstość
O
Samoocena
Typowe problemy ~s~ę~ujące przy tworzeniu wskaznlkow
LATA NAUKI Zmienna
brak 1,80
Kied dysponujemy pomiarem na skali iloś~iowej, mo~emy zrezyg??,:ać z czę~ .. y.. . 'k" Mo ą nas nie mteresowac punktowe rozmce w wy ŚCI mformacJI, agreguJąc wym~..g lem jest tylko wyodrębnienie dwóch p trząc narozkład SAMOnikach na skali samooceny, ~omewaz naszym ce lub trzech grup różniącyc? SIę pod wzgll~de~~a~oJ'~~;:~'d~modalnyi łatwo będzie OCENY (rysunek 3.2), me mamy ':ątp IWOSCI, ze d bnić dwie grupy różniące S1(( samooceną·. . wyo rę biorze LEARN dokonaliśmypodziału na dWIe grupy (dychotO~lW naszym z . . . . SAMOOCENA tworząc w ten sposob artości . 1 ~ dla osób z niską samozacji) ze względu na wymk1 w z~l11e~edJ· nową zmienną SAM2, która przYJmuJe WIe w . oceną; 2 - dla osób z samooceną wysoką.
wskaźników
950
8,5
8,5
11 182
99,9
100,0
98 - nie wiem
3
O
99 - brak danych
7
1
11 192
100,0
Respondenci PGSS mieli odpowiedzieć na pytanie o typ wykształcenia: brak, podstawowe, zawodowe, średnie, policealne, wyższe. Otrzymana w ten sposób zmiennajest zmiennąporządkową,więc nie można jej łatwo analizować. Aby móc wprowadzić tę zmienną do analiz za pomocą testów parametrycznych (wymagających skali ilościowej), badacze zamienili zmienną porządkową WYKSZTAŁCENIE na liczbę lat nauki, która teoretycznie może być traktowana jako zmienna ilościowa. Jest to wyjątkowy przypadek zmiany typu skali z gorszej na lepszą. Najczęściej dokonujemy transformacji w odwrotnym kierunku. Zmienne przedziałowe przekształ camy w porządkowe lub nominalne (kategorialne). Jeżeli chcielibyśmy LICZBĘ LAT NAUKI zamienić na zmienną kategorialną według mediany, to podział nie byłby prosty. Mediana wyznaczona przez SPSS wynosi 10. Pojawia się problem: co zrobić z wynikami równymi medianie? Najbardziej elegancką decyzją byłoby usunięcie z analizy osób, które je uzyskały. Spowodowałby to pominięcie 28% próby, co w małych badaniach może być nieakceptowalne (zostaje zbyt mało obserwacji), a w badaniach sondażowych, gdzie często interesuje nas próba reprezentatywna, oznacza postawienie pod znakiem zapytania reprezentatywności obciętej próby.
81
Rozdział
3. Wizualizacja danych. Tworzenie
wskaźników złożonych
Trafność i rzetelność wskaźnika. Współczynnik ex Cronbacha
W takiej sytuacji badacz decyduje się często na włączenie wyników równych medianie do jednej z grup. W naszym przypadku nie można odciąć 25% rozkładu, ale można wyznaczyć skrajne 32% próby. Omawiane problemy są natury bardziej ogólnej, ponieważ w przypadku zmiennych nieciągłych, a z tymi najczęściej mamy do czynienia w naukach społecznych, wiele osób może mieć tę samą wartość zmiennej, a to powoduje, że wyliczanie mediany, kwartyli i innych miar pozycyjnych jest bardzo trudne. Chcielibyśmy wierzyć, że podział według mediany dzieli badaną próbę na połowy. W praktyce tak często nie jest. SPSS za medianę uznaje pierwszą wartość zmiennej, która odcina 50% przypadków. W praktyce może to być wartość, która zawiera nawet 70% przypadków. Mediana jest najlepszym wskaźnikiem dla zmiennych z porządkowej skali pomiarowej tam, gdzie porządkujemy wyniki. W przypadku wielu rang wiązanych wyliczenie mediany może nie być proste. Rozpatrzmy teraz rozkład zmiennej WIEK. Możemy dokonać kategoryzacji, dzieląc osoby według wartości progowych, które zgodnie z naszymi hipotezami są ważne w naszym modelu, np. poniżej 25, 35, 55, 70 lat. Możemy też podzielić badaną próbę na pięć, w miarę równolicznych grup wiekowych, stosując procedurę rangowania i podział na kwantyle. Każda z tych decyzji zaowocuje nową zmienną o innym rozkładzie (patrz tabele 3.4 i 3.5 i rysunki 3.3 i 3.4).
RWIEK5
5000r-----
~
NWIEK5
30
4000
3000
2000
>-
g
1000
Q)
:J
cQ)
li:
o 3,00
4,00
5,00
RWIEK5 NTILES ol Q9AGE
R~sunek 3.3. Rozkład częstości zmienneJ RWIEK5
Rysunek 3.4. Rozkład częstości zmiennej NWIEK5
Nowo utworzone zmienne RWIEK5 NWIE . 'dni . , K5 mają te same wartości l 2 3 4 5 ale sre e wIeku dla poszczeg 'l h k ",.. ' , , , , o nyc ategom rozmą się istotnie (patrz tabela 3.6). Tabela 3.6.
Średni wiek w pięciu grupach wyznaczonych różnymi metodami RWIEK5
Tabela 3.4. Podział według kategorii zdeklarowanych przez badacza L
P
PS
Tabela 3.5. Podział na 5 "równolicznych" grup L
--,
NWIEK5
Średni wiek
N
1,00
21,58
Średni wiek
N
1287
1
24,17
2146
P
PS
2,00
30,90
1949
2
35,87
2451
44,70
2115
1,00
1287
11,5
11,5
1
2146
19,2
19,2
3,00
44,34
4443
2,00
1949
17,4
28,9
2
2451
21,9
41,1
4,00
3
62,83
2418
56,52
3,00
4443
39,7
68,6
3
2115
18,9
60,0
5,00
4
76,94
2298
1095
71,94
4,00
2418
21,6
90,2
4
2298
20,5
80,5
Całość
5
46,57
2182
11 192
Całość
46,57
5,00
1095
9,8
100,0
5
2182
19,5
100,0
11 192
11 192
100,0
11 192
100,0
Całość
Całość
L - częstość, PW - procent ważnych odpowiedzi (bez braków danych), P - procent, PS procent skumulowany
Trafność i rzetelność wskaźnika. Współczynnik a Cronbacha WSkP?~kiar.mo~nda wyobrazić sobie jako strzelanie do celu. Każdy element składowy azm ajestje nym strzałem.
Wskaźnik jest rzetelny G d
sieb'le.
Wskaźnik jest trafny,jeżelinasze strzały trafiły w punkt w o'ry ch . l" fi' t fi ' Cle lsmy tra IC jego tra~:~i~ ora pozwala na stwierdzenie, że rzetelność wskaźnika nie gwarantuj~ Już t
82
d)" l' e noro ny ,jeze l strzały sąna tarczy położone blisko kto
83
Rozdział 3.
Wizualizacja danych. Tworzenie
Trafność
wskaźników złożonych
Ogólnie mówiąc, pytanie o trafność dotyczy tego, co mierzy nasz wskaźnik, pytanie o rzetelność - tego, jak dobrze mierzy. Nie możemy określić trafności naszego wskaźnika, nie dysponując dodatkowymi danymi. Może się okazać, że odpowiedzi na pytania od sI do s5 mierzą skłonność badanego do przedstawiania się w dobrym świetle, a nie jego samoocenę·Jeżeli mamy dostęp do grupy terapeutycznej, w której terapeuta określał wysokość samooceny uczestników, to porównując średnie wartości wskaźnika SAMOOCENA w wyodrębnionych grupach, wyliczone na podstawie ankiet wypełnionych przez badanych i ocen terapeuty, będziemy mogli określić j ego trafność. Ten typ trafności nazywa się trafnościąkryterialną (diagnostyczną). Kryterium stanowi tu ocena terapeuty. Dla oszacowania trafności ocen szkolnych kryterium stanowić może wynik egzaminu wstępnego na studia. Inne rodzaje trafności omówione są wyczerpująco w literaturze [5], my skoncentrujemy się na rzetelnościwskaźnika,ponieważmożemyją ocenić bez dodatkowych danych. Trzeba jednak pamiętać, że omawiana tutaj jednorodność jest jednym z aspektów rzetelności, które szczegółowo są prezentowane w podręcznikach metodologicznych [5]. Wskaźnik jest rzetelny (jednorodny), jeżeli odpowiedzi na poszczególne pytania są ze sobą ściśle związane. Miarą związku między zmiennymi ilościowymi jest współczynnikkorelacji, który zostanie dokładnie omówiony w rozdziale 8. Korelacja dwóch zmiennych, oznaczana przez r, mówi nam o związku dwóch zmiennych ze sobą. Przyjmuje ona następującewartości: -1 ::;; r::;; 1. Gdy nie ma liniowego związku między zmiennymi, to korelacja jest bliska zeru. Gdy mamy do czynienia ze związ kiem dodatnim (tzn. wraz ze wzrostem jednej zmiennej rośnie druga zmienna), współ czynnik korelacji jest dodatni, gdy związek jest ujemny - współczynnik również
N en 0"""0
o
I
o oI oI
gdzie
T'"'
~I
o::>
I'--
00
..o .-s:::
Gl Gl
o::> I'--
I'--
N
o
o
o
o' o
o
LO
o::>
o::>
~~ Co
LO LO LO. C') ~.
ci
LO
I'--
T'"' T'"'
o::>
~.
gj
~.
I'-o::>
en
"O
o o
a.
«Z
W
o o
LO
I'--
C')
N T'"'
T'"' T'"'
NNT'"' T'"' T'"' T'"'
o::>
()
O O
~
o:::
o
o
LO
CI)
T'"'
o
o
tworzącychskalę. Inne sposoby definiowania aCronbacha znajdzie Czytelnik w pod-
84
00000
III
Gl~ '(j' Ul
r jest średnią z korelacji wszystkich zmiennych Xk, k zaś liczbą zmiennych
ręcznikach metodologicznych [por. 5]. Na dole raportu zamieszczonego w tabeli 3.7 mamy wydrukowanąaCronbacha, widzimy, że jest ona dość mała, a = 0.39. Może to świadczyć o tym, że albo nasza skala jest źle skonstruowana, albo jakiś problem kryje się w naszych danych. Pamiętajmy także, że warto zawsze spojrzeć na tę część raportu, która zawiera statystyki informujące nas o wartości a, gdyby jedna ze zmiennych zostałausunięta. W szczególności ostatnia kolumna (apo wykluczeniu pytania) pokazuje, jak zmieni się a, gdy usuniemy danązmiennąze skali. Można w ten sposób wykrywać zmienne, które "psują" skalę. Po ich usunięciu a znacznie wzrasta. W naszym przypadku usu-
o en T'"' o o en o::> en en en
er.
przyjmuje wartości ujemne. Jeżeli odpowiedzi na pytania są zmiennymi ilościowymi, to możemy policzyć korelacje między odpowiedziami na wszystkie pytania, a następnie wyliczyć średni współ czynnik korelacji (r). Miarąrzetelnościwskaźnikapowstałego z analizowanego zbioru pytań jest aCronbacha, którą wyliczamy według następującego wzoru:
kf a=---1+ f(k -1)
i rzetelność wskaźnika. Współczynnik a. Cronbacha
T'"'
o
o
T'"'
o:::
N
CI)
o o
T'"'
o::>
o::> o::>
o:::
o o
LO
CI)
en
o o
o
T'"'
C'LO)
o
o
N
en
I'--
c;3 11--t--t--jf-ł-~-+---l--1
o o T'"'
o
o
I'--
er er er """ LO
o
N
T'"' o::>
o o
T'"'
o::: oo T'"'
CI)
T'"'
N
o::>
o::> o::>
en
o
C') LO
o' o'
N
en
o
o
""" LO
N
o::>
o::>
I'--
I'--
T'"'
0000
-t---+-If--+--+----lC') ~
T'"'
CI)
~
N
CI)
~
M
CI)
~
"""
CI)
~
10
CI)
N
<..II
Rozdział 3.
Wizualizacja danych. Tworzenie wskaźników złożonych
nięcie
zmiennej s2r podniesie rzetelność skali z 0,39 do 0,89. Jest to poważny syby przyjrzeć się macierzy korelacji (tabela 3.7). Macierz korelacji pokazuje korelacje wszystkich zmiennych - każda z każdą. Ponieważ z założenia wszystkie zmienne mają być związane z jedną zmienną teoretyczną, to ich korelacje powinny być w miarę duże, no i przede wszystkim dodatnie. W naszym przypadku tak nie jest. Widzimy, że zmienna s2r koreluje ujemnie z innymi. Oczywiście wynika to z tego, że jest ona zakodowana w przeciwnym kierunku do pozostałych. Naprawmy zatem nasz błąd, odpowiednio rekodując s2r na s2rr. Kolejnym krokiem będzie ponowne policzenie aCronbacha dla skali ze wszystkimi pytaniami zakodowanymi w tym samym kierunku. Tym razem rzetelność jest bardzo dobra, a= 0,92 (tabela 3.8). Oznacza to, że skala samooceny jest rzetelna. Licząc a Cronbacha, trzeba zawsze pamiętać, żeby przyjrzeć się dokładnie macierzy korelacji, sprawdzić, czy wszystkie korelacje są duże i nieujemne. Czasem może się nawet zdarzyć, że źle zakodowane dane prowadzą do a mniej szej od zera, co jest oczywiście wynikiem absurdalnym, nawet dla bardzo złej skali (z definicji rzetelność jest dodatnia). Na koniec warto zrobić następującą uwagę dotyczącą interpretacji określonego wyniku a. Otóż należy pamiętać, że niska rzetelność skali oznacza, że nie mamy wystarczającychpodstaw do budowania wskaźnika zmiennej teoretycznej przez uśred nianie odpowiedzi na poszczególne pytania wchodzące w skład skali. Oczywiście rzetelność, jak wszystkie statystyki, jest tym wiarygodniejsza, im większąliczbę respondentów badamy. gnał,
Ograniczenia i wady a Cronbacha
Ograniczenia i wady ex Cronbacha
Je.żeli ~omyś1amy się, które zmienne są związane z danąpodskalą, możemy wówczas lIczyc a Cronbacha dla każdej skali z osobna. Dr:uga wła~ność a Cronbacha jest związana z tym, że rośnie ona wraz ze wzroste~ lIczby ~mlennych ~~tań) skali.. Możemy zatem sztucznie zwiększyć wartość wspołcz~nnlka rzetelnoscl skah, dodająC do niej kolejne zmienne. Zjawisko takie występuJe zwłaszcza dla ~~łych skal (10-20 zmiennych). Dla skal powyżej 20 zmiennych problem ten ma mll1eJsze znaczenie.
v:
Policz rzetelność dla skali, która ma średnią korelację a) k = 6 b) k= 11 c) k
= 21
d) k=31.
Zwróć ~~agę n~ ~o, jak a ro~nie w miarę dodawania zmiennych do skali, mimo że średnia kor.elaCja je,st d~sc mała. ~Ia jakich wartości k efekt ten jest największy? Sprawdż, czy obserwUjemy cos takiego dla Większych wartości k, np. 60, 80. kr 1+ rek -1)
a=---Liczba
pytań
k= 6
86
Analiza rzetelności przeprowadzona za pomocą a Cronbacha (oraz podobnych do niej miar) ma dość istotne wady, które nie pozwalają na traktowanie jej jako jedynego wskaźnika rzetelności. Pierwszy problem jest związany z tym, że licząc a Cronbacha, zakładamy milcząco, iż zmienne tworzące skale są związane z tylko jedną zmienną teoretyczną. Czasem może się nawet tak wydawać przy konstrukcji skali, ale rzeczywistość bywa często bardziej skomplikowana. Zdarza się również, że skala jest celowo tak zbudowana, by zawierać dwie lub więcej podskal - gdy chcemy mierzyć jednocześnie kilka zmiennych teoretycznych. Wtedy oczywiście stosowanie a Cronbacha na niewiele się zda, a nawet bywa bardzo mylące. Można zbudować skalę, która mierzy dwie zmienne teoretyczne, a jednocześnie ma dużą a Cronbacha. W takiej sytuacji nietrudno o fałszywy wniosek, że skala jest związana z tylko jedną zmienną nieobserwowalną. Istnieje metoda, która pozwala nam badać skale w sposób znacznie bardziej szczegółowy: analiza czynnikowa, która jest zaawansowanąmetodąstatystyczną i jej dokładne omówienie wykracza poza zakres tego podręcznika. Dzięki analizie czynnikowej, między innymi, możemy wykryć, że skala zawiera podskale. Pokażemy to dalej na przykładzie.
r = 0,2 oraz
Obliczenia (a)
6xO.2 6x02 a= 1+0,2(6-1) =-2-' =0,6
Wartość
a
0,6
k
=11
a=
llxO.2 1+ 0,2(11-1)
=
llxO,2 "" 0,73 3
0,73
k
=21
a=
21xO.2 1+ 0,2(21-1)
=
21xO,2 =0,84 5
0,84
k
=31
a=
31xO.2 1+ 0,2(31-1)
=
31 x 0,2 "" 0,89 7
0,89
87
Przykład
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych
zastosowania analizy czynnikowej do tworzenia
wskaźników
Tabela 3.9. Pytania dotyczące łatwości wprowadzenia zmiany z PGSS - panel 2003 1 Tak jak pokazano w
przykładzie
3.1 policz
rzetelność dla skali,
która ma
średnią korelację
r =0,6 oraz
=11 k =21
k
g)
i
ścisłe
trzymanie
tego planu
Planowanie godzin
Jedzenie wszystkich posiłków przy stole (niezjadanie niczego z lodówki, prosto z opakowania lub garnka)
4
Nakładanie
5
wyznaczonych porcji na talerz i
całkowita
Wolne jedzenie z przerwami z zastanowieniem, czy
bezpośrednio
rezygnacja z
naprawdę
dokładek
chce Pani
więcej
zjeść niedużych posiłków
5-6 razy dziennie
6
Jedzenie
7
Nienajadanie jeszcze zjeść
k- 6
8
Powstrzymanie się od zjedzenia reszty gdy poczuje Pani sytość
k - 11
9
Niepodjadanie
Wartość
Obliczenia (a)
Liczba pytań
a
k - 21 k - 31
Przykład zastosowania analizy czynnikowej do tworzenia wskaźników Co powinien zrobić badacz, jeżeli jego celem jest w~ios~owanien~ podsta:vie wielu zmiennych obserwowalnych (takich jak np. odpowIedzI na pytam~! o ~mIen nych ukrytych (latentnych, nieobserwowalnych)? Innymi słowy, co ~robIC, kIedy na przykład mamy pewną licz~ę pyta~ (zmiennyc~ obserwowalnych) 1 chcemy zobaczyć czy te pytania mierzą mteresuJącą nas zmIenną latentną, ukrytą· . . Rozważmy pytanie z PGSS (panel 2003) dotyczące ~atw~ści wpro~adzema zmI~y różnych zachowań w życiu codzienny~. R~spondencI ?yh prosz,e~I o ocenę stWIerdzeń (tabela 3.9) na skali od l do 8 opISanej w następuJący sposob.
Nic nie musiałabym
zmieniać. bo tak się
Łatwo
Trudno
łatwo
Raczej trudno
3
4
5
Raczej
Bardzo trudno
Wydaje mi się to prawie
Nie mogę określić
-
musiałabym
niemożliwe
spróbować
7
8
zachowuję
1
się
planu i wyznaczanie sobie porcji
3
h) k= 31.
88
posiłków
według
2
e) k= 6
f)
Planowanie posiłków (kupowanie jedzenia do zjedzenia na dany dzień)
2
6
się
do syta, przerywanie jedzenia, kiedy czuje Pani, posiłku,
że mogłaby coś
który jest na Pani talerzu, w chwili,
między posiłkami
10
Pełna
11
Przeczekiwanie pierwszego
12
Przeprowadzenie jednodniowej
13
Przeprowadzenie trzydniowej
koncentracja w czasie jedzenia na
spożywania
przeżuwaniu
produktów
głodu głodówki
głodówki
14
Ograniczenie
15
Codzienne
ćwiczenia
gimnastyczne
soli
16
Regularna
aktywność
fizyczna Gazda na rowerze, gra w
17
Rezygnacja z jazdy autobusem czy samochodem,
piłkę
itp.)
jeśli można dojść
pieszo
Pytanie, jak zbudować wskaźnik przywodzi na myśl omawiany w pierwszym rozdziale przypadek pomiaru ziemniaka. Wszystko zależy od tego, co nas w ziemniaku interesuje. Pierwszym krokiem jest sprawdzenie rozkładów, następnym zadeklarowanie braków danych, do których trzeba zaliczyć odpowiedzi "nie mogę tego określić - musiałabym spróbować". Jeżeli nas interesuj ą zachowania prozdrowotne, możemy policzyć liczbę odpowiedzi "nic nie musiałabym zmieniać, bo tak się zachowuję".
Możemy też potraktować skalę odpowiedzi jako skalę ilościową (puryści
meto-
dologiczni oczekujący normatywnego, a nie praktycznego podejścia do założeń mogą czuć się oburzeni - przecież powinniśmy wykazać, że istnieje stała jednostka pomiaru, że odległość między "nic nie musi" do "łatwo" jest taka sama jak między "łatwo" do "raczej łatwo" itd. Prawdąjest jednak, że tego typu dane porządkowe sąpowszech nie analizowane za pomocą testów zakładających istnienie stałej jednostki pomiaru (zmienne ilościowe). Prezentowane pytania mogą być traktowane jako bateria wskaźników zmiennej latentnej. Aby zbudować wskaźnik lub, myśląc metaforycznie, odkryć zmienną latentną, którą te zmienne mierzą, musimy wykorzystać współczynniki korelacji mię-
89
Rozdział
3. Wizualizacja danych. Tworzenie
wskaźników złożonych
Przykład zastosowania analizy czynnikowej do tworzenia wskaźników
. . (p ozycJaml. . ') W tym przypadku Nowak' doradza zastosowanie nastę. d zy pytamaml k' . hurystyki postępowama: p .
UJ'f,~Pi~rwtrzeba zanalizować zaleinaści (z reguły statysty~zne) mtzy wszy~tl~m . otenc 'aln mi wskaźnikami indicatum, a następnie włączyc do ska z zmzenne) 'f ej t}ko t~ które spełniają określony schemat zaleiności (na p~zykł~d są;;V~o~o ~:~lowane). 'W praktyce spora część badaczy poprzestaje na polzczenzu ws
s
aznz a
. . l ,. O dno rodności) - a Cronbacha. zete opcji korelacje i po k ażdej zmiennej (po wykluczeniu pozycji) pozwala na wy~h:;'Ycemepy~~n mes o
r
n;~cZ:nic
podającej
rzetelności wyclimi~owam~ k?le~n~
Dla 17 pozycji i 199 obserwacji awyniosła 0,875. Jest to rezultat z pozoru zadowalający. Dlaczego z pozoru? Dowiemy się za chwilę. Na razie spróbujmy przeprowadzić podobną analizę tylko dla 3 pozycji: 15, 16 i 17 (tabela 3.11). Parę ustaleń terminologicznych: Pytanie w kwestionariuszu jest określane jako pozycja, item. Pisząc "korelacja między pytaniami", mamy na myśli korelację mię dzy odpowiedziami na pytania. Tabela 3.11. Analiza
Statystyki dla 3 pytań
r elowanych ze skalą i usunięcie ich z analizy. Tak też zroblhsmy w ana Izowanym
p
Średnia skali przy wykluczeniu pytania
Wariancja skali przy wykluczeniu pytania
Korelacje pytanie - skala
CH15
6,29
7,19
CH16
0,54
6,40
0,522
7,00
0,58
7,47
0,463
9,65
0,37
0,723
rze~~~~::;~:::::~iete pytania potraktować jako jednąskalę i policzyć aCronba-
cha dla 17 pytań (tabela 3.10). Tabela 3.10. Analiza
rzetelności
skali
składającej się
z 17 pytań
CH17
Statystyki dla 17 pozycji testowych Średnia skali
CH1
przy wykluczeniu pytania
Wariancja skali przy wykluczeniu pytania
Korelacje pytanie - skala
51,98
220,62
0,50
0,869
wykluczeniu pytania
CH2
51,85
219,06
0,54
0,867
CH3
52,51
220,57
0,50
0869
CH4
52,51
219,28
0,64
0,863
CH5
52,01
216,25
0,64
0,863
CH6
51,90
224,12
0,45
0,871
CH7
52,13
219,42
0,63
0,864
CH8
52,63
224,15
0,59
0,866
CH9
52,33
224,80
0,53
0,868
CH10
51,91
222,63
0,52
0,868
CH11
51,91
225,38
0,53
0,867
CH12
51,30
222,55
0,50
0,869
CH13
50,06
224,39
0,42
0,872
CH14
51,94
228,07
0,38
0,873
CH15
51,94
226,13
0,42
0,872
CH16
51,52
227,12
0,38
0,873
CH17
52,49
225,61
0,49
0,869
N 199
90
a przy
• Nowak S. (1985). Metodologia badan, ukowe.
a h społecznyc.
0,875
rzetelności pytań 15, 16 i 17 (aktywność fizyczna)
N= 327
aprzy wykluczeniu pytania
a= 0,68
Współczynnik a dla 3 pytań wyniósł 0,68. Dla tak krótkiej skali jest to rezultat bardzo dobry, ale warto zwrócić uwagę, że trzecie pytanie "odstaje" od reszty. Gdy przypomnimy sobie jego treść, stanie sięjasne, że rezygnacja z jazdy samochodem! autobusem może wynikać z innych powodów niż dbanie o zdrowie, może być np. związana z oszczędzaniem pieniędzy. A jaki będzie rezultat, jeżeli nasz wskaźnik obejmie tylko pierwsze 10 pytań, które określimy jako styl jedzenia? Analiza rzetelności metodą a Cronbacha w tym przypadku również wypadła pomyślnie, gdyż wskaźnik ten osiągnął poziom 0,86 (N = 261). Niestety a o wysokich wartościach wcale nie musi świadczyć o jednorodności skali. Kolejny krok stanowi analiza składowych głównych, która jest odmianą analizy czynnikowej (obu nazw będziemy w podręczniku używać zamiennie). Jest to skomplikowana metoda statystyczna [21] i nie będziemy jej tutaj dokład nie omawiać, a jedynie pokażemy, jak możnaposługiwaćsię wydrukami w celu stworzenia wskaźników. Sytuacja ta przypomina uczenie kierowcy znaczenia pOszczególnych kontrolek na desce rozdzielczej, bez tłumaczenia mechanizmów ich działania. Podstawowa informacja z analizy czynnikowej dotyczy liczby czynników (składo wych głównych), do których mogąbyć zredukowane wprowadzone do analizy zmienne, i korelacji zmiennych z czynnikiem, który odpowiada naszej zmiennej ukrytej (teoretycznej, latentnej). Chociaż analiza czynnikowa jest metodą ogólną, to tutaj skoncentrujemy się na przypadku przekształcenia zbioru pytań w jeden wskaźnik zmiennej teoretycznej. Przeanalizujmy odpowiedzi na trzy ostatnie pytania.
Warszawa.. P aństwowe Wydawnictwo Na-
91
Rozdział
3. Wizualizacja danych. Tworzenie
..
wskaźników złożonych
Przykład zastosowania analizy czynnikowej do tworzenia wskaźników
. a ściślej macierz korelacji między nimi, zostaną trzy pytania, . d n czynnik wyjaśniający 61 % wariancji. Z forpoddane analizie c~ynnl~owej, to ~rt~~:~~~~wea główna) jest kombinacją liniową odpowieczynnikowych (factor loadings), wzorem: dZI na pytania es 10
Jeżeli odpowiedzI
na
.
o~tatnl~
m~lnego pU~ktkwuwldt~ennalarl'uCsZ:~~:ad~nków Fi =a1X15 + a ZX16 + akX17'
daną
gdzie: a1 - ak to
ładunki
czynnikowe,
X 1 - Xkto odpowiedzi na pytania (zmienne
Ładunki
Dla
•
czynnikowe dla kolejnych
pytanie 15
a1 = 0,821
pytanie 16
az = 0,846
pytanie 17
a3 = 0,665.
ułatwienia obliczeń załóżmy,
i 0,7. Wynik czynnikowy
X z =4 X3 = 3
Wnioski:
Wykonując analizę czynnikową, możemy zredukować liczbę informacji _ np. odpowiedzi na 3 pytania zastąpić jednym wynikiem czynnikowym (ważoną sumą odpowiedzi na 3 pytania).
2. . '. . że w naszym przykładzie wynoszą one odpowiednio. 0,8, 0,8 . dla danej osoby
według następującego
. wzoru.
d . X 15, X 16, X 17 oznaczają odpowiedzi na kolejne pytania. gZie . . 17 m Policzmy wyniki czynnikowe dla osób, które odpowiedziały na pytania 15,16 I W naszy przykładzie w następujący sposób: Jaś
Małgosia
X 15 = 6
X 15 - 2
X 16 - 2
X 16 = 5
X 17 =4
X 17 = 2
Analizując ładunki czynnikowe, możemy stwierdzić, jak dobrze dane pytanie jest związane z danym czynnikiem. Tę informację zawiera ładunek czynnikowy, który może być traktowany jako korelacja zmiennej (danego pytania) z czynnikiem (nowązmienną). Możemy więc wybrać pytania, które będą two-
rzyć wskaźnik tej samej zmiennej teoretycznej.
W powyższym przykładzie pytanie trzecie miało niższy ładunek czynnikowy niż
pozostałe, stąd możemy przypuszczać, że jest gorszym niż pozostałe wskaźnikiem zmiennej ukrytej - dlatego też odpowiedzi na te pytania w mniejszym stopniu wpły_ wały na wynik czynnikowy niż odpowiedzi na dwa pozostałe pytania. Kiedy z macierzy korelacji między pytaniami kwestionariusza (naturalnie mamy tu na myśli odpowiedzi na pytania kwestionariusza) zostanie wyodrębnionywięcej niż jeden czynnik (sytuacja nadzwyczaj powszechna), otrzymujemy informacje o licz-
bie czynników i ładunkach czynnikowych każdej zmiennej dla każdego czynnika. Te
ładunki są podstawą interpretacji czynników.
FM =1,6+4+1,4=7
Porównanie wyników czynnikowych pozwala ma większe problemy niż Małgosia.
stwierdzić, że
ze
zwiększeniem aktywności Jaś
. . kt'ora może być dalej analizowana nową ~mlenną, Czynnik (ściślej wynik czynniko,,:,y) j~st tak jak inne zmienne, np. odpowiedzI na pytanie. .. . ..
92
Xz = 5 X3 = 2
1.
pytań wynoszą:
możemy wyliczyć
=9,2
X 1 =4
••
F = 0,8 X X1 + 0,8 x Xz + 0,7 x X3 ,
F;= 4,8 + 1,6 + 2,8
Małgosia
X1=3
.
den wynik (czynnikowy) zamiast trzech Oznacza to dla nas, że dla kazdej OSOb~.otrzy~u~e~~~:ne 1 wartość czynnika F równałaby 1 odpowiedzi na p~ani.a. Gdyby wsz~st le wag~ i ~ różne od jedności, jest to suma ważona. się sumie odpowiedzI na ~rz~ pytania.. Gdy w g.ą d zostanie dobrze przeprowadzona, Jest to oczywista ~edukCJa liczby z~l.ennych, ~:~;~ą~niormacji. Czynnik wyjaśnia zaledwie ułatwia interpretację danych, ale wląze Się z .... . część wariancji odpowiedzi na pytania. Im więcej, tym oczywIscle lepiej. •
Jaś
ilościowe),
a F to wynik czynnikowy dla i-tej osoby. I
Tak jak pokazano w przykładzie 3.2, policz wyniki czynnikowe dla kolejnych dwóch osób, stosując te same ładunki czynnikowe.
z~t:~~~at~~~:{y~~~~:'n~:a~:~:~a~~e;~~~~~~~~~~~~o:~~~~~~~o:~:::~~~~~;~~.zasjest
Warto odnotować, że o ile wskaźnik oparty na średniej z poszczególnych py_ tań zakłada równe wagi poszczególnych pytań, to wyniki czynnikowe uwzględnia ją różny ich udział we wskaźniku zmiennej teoretycznej (ukrytej, latentnej). Przeanalizujmy wydruk analizy czynnikowej dla 17 pytań. W najprostszym wa-
riancie powinniśmy zapamiętać, że analiza czynnikowa przekształca informacje o korelacjach między pytaniami (tabela 3.12) w informacje o: 1. liczbie czynników (składowych głównych); 2. ładunkach czynnikowych (tabela 3.13).
93
Rozdział
3. Wizualizacja danych. Tworzenie
l'....
....
::l: O
.... ::l: '
O
.... M
::l: O
.... ::l: N
O
.... .... ::l: O
o .... ::l:
lU
Gi ...
"!. o
..-
N
..-
N
N N
C"l
'
C"l
o
o
..-
o
C"l ,....
o
o ,....
o
o,.... o l{)
,....
o
N
C"l
o
m
I'-
co
o
::l: O
l:!
I'-
o o
ex:> ,....
o N N
o (O
..-
Gl
lU
o o
o
ex:>
o
l{)
,....
o
N N
o o o ,....
ex:> N
o
o
,....
'
I'-
C"l
,....
o o
C"l C"l
o
C"l
o o
l{)
o
N N_
l{)
o
I'-
o o
I'-
Ol ,....
N
o o
o o
N
C"l
0-
N
C"l
C"l
o
o
.l<:
'(3
N
o
'
o
:::t_
<.>
.§
roc « I
Q)
:::
o
T5 ·en
'f
....-
o
l{)
N
(O
l{)
(O
..-
ex:> ,....
Ol
N
ex:>
,.... '
o C"l. o
,....
o
o
o
""
..l{)
(O
0_
ą.
M
..-
l{) l{)
o 0_ ..-
o
:I: O
:I: O N
:I: O
....
::l: O
'
o
l{)
'
o o '
I'-
o
Ol
l{)
'
l{)
o
o
C"l
o o (O
(O
o o
N_
Ol
Przykład zastosowania analizy czynnikowej do tworzenia wskaźników C"l
"!. o
C"l
'
..-
..-
N
..-
N
C"l
o
o
I'-
'
(O
C"l
N
N
C"l
(O
N
N N
'
C"l
Ol
..-
C"l C"l
o
N 0-
Ol
l{) ,....
,....
o
N
C"l
(O
N
'
l{)
N
o o o
C"l
o o
l{)
Ol
'
'
I'-
,....
,.... '
Ol C"l
Ol C"l
,.... '
Ol
'
o o
,....
~
..-
I'C"l
o
..l{)
o o
C"l C"l
Ol
..o
o
N
N
N
N_
N
o o o o
o
..'
::l: O
o
'
ex:>
l{)
l{)
o
C"l
l{)
o
C"l
o o o o o o
..-
l{)
N
~
l{)
lt)
o
'
Ol
o
N
N O·
IQ
o
o
N O·
..~ o
C"l
..-
o o
~
o
o o o o o o o
o
..o
'
o o o o o o o
o
::l: O
o
o o o o o o o
o ~ o
C"l
N.
"!. o
ro
c ~
'
~
Ol
l{)
C"l_
o
Ol
I'-
o
o o
C"l
l{)
o
::l: O
:5
~c
ex:>
o
O
::l: O
(O
N
ex:>
lt)
l{)
o
.... ::l: O
N N_
o
C"l
o
IQ
:S
o
::l: O
wskaźników złożonych
o o N
ex:>
o
l{).
I'-
o
"!. o
C"l C"l
C"l
N
o o.
o
'
C"l
o
C"l
C"l
o
C"l
o
o o
C"l C"l
o
o o_ ..-
Macierz ratowanych składowych(a)
o o.
..-
Czynnik
1
o
ą.
CH1
,....
CH2
o
ą. ,....
..... M lU
Cii
94
.o ~
lU
"ij" lU
f!o
~
....
3
4
Planowanie godzin posiłków i ścisłe trzymanie 0,846
Jedzenie wszystkich posiłków przy stole (... )
CH4
0,778
Nakładanie wyznaczonych porcji na talerz (... )
CH5
0,685
Wolne jedzenie z przerwami (... )
CH6
Jedzenie niedużych posiłków 5-6 razy dziennie
CH7
Nienajadanie się do syta, przerywanie jedzenia (... )
CH8
Powstrzymanie się od zjedzenia reszty posiłku (... )
CH9
Niepodjadanie między posiłkami
CH10
Pełna koncentracja w czasie jedzenia na przeżuwaniu (... )
CH11
Przeczekiwanie pierwszego głodu
CH12
Przeprowadzenie jednodniowej głodówki
CH13
Przeprowadzenie trzydniowej głodówki
CH14
Ograniczenie spożywania soli
0,659
O.
o
0_
,....
o
o, ,....
o
o
ą.
,....
o
ą.
o
ą.
..-
o ą. ..-
CH15
Codzienne ćwiczenia gimnastyczne
CH16
Regularna aktywność fizyczna (... )
CH17
Rezygnacja z jazdy autobusem czy samochodem (... )
% wariancji wyjaśniony przez czynnik Metoda wyodrębniania czynników - Głównych składowych .
o 0_ ..-
0,412 0,686 0,809 0,640 0,480 0,670 0,457 0,853 0,893 0,451 0,786 0,856 0,465
0,464 20,39 17,78 13,17 10,65
Metoda rotacji - Varimax z normalizacją Kaisera.
Zwykle badacz interpretuje ładunki czynnikowe po rotacji VARIMAX, która ma
gwarantować brak korelacji między czynnikami. O tym, jak standardowo ustala się liczbę czynników i jak rotuje się czynniki warto przeczytać w pracach [10, 21].
o O, ..-
o 0_ ..-
::l: O
2
0,798
CH3
o
..-
Celem analizy jest przedstawienie informacji zawartej w odpowiedziach na pytania w postaci mniejszej liczby czynników, więc gdy liczba czynników równa jest liczbie pytań, nic nie zyskujemy.
Q)
O
Planowanie posiłków (... ) się tego planu
,....
O. ,....
c ro
N
Tabela 3.13. Dane wyjściowe - Analiza czynnikowa (FACTOR)
N
::l: O
M
::l: O
'
::l: O
lt)
IQ
:I: O
::l: O
I'-
:I: O
co
:I: O
m
::l: O
o .... N .... .... .... ::l:
:I: O
O
::l: O
....M ::l:....'
:I: O
O
lt)
IQ
O
O
O
Wprowadzając nasze 17 pytań do analizy czynnikowej, otrzymaliśmy 4 składo we główne wyjaśniające łącznie prawie 62% wariancji. Ładunki czynnikowe dla poszczególnych zmiennych są opisane w tabeli 3.13. Dla ułatwienia czytelności wydruku ładunki mniejsze od 0,4 zostały pominięte. Tabela ta informuje nas, że pytania 1-6 wydająsię być związane z jednym czynnikiem, 7-11 z drugim, 12-14 z trzecim i 15-17 z czwartym. 95
Wprowadzenie do wizualizacji danych
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych Kiedy przeanalizujemy treść pytań związanyc~ z poszc~ególnymi czynnikami, możemy je przykładowozinterpretowaćw następuJący sposob: 'k J'ako OGRANICZANIE - pytania tworzące ten czynnik dotyczą boI. czynnl . h' d . wiem właśnie powstrzymywania różnych zachowań zWIąz~nyc z Je z~~lem; 2. czynnik jako PLANOWANIE - ponieważ odnośnie pytama dotyczą roznych ..,' aspektów planowania posiłków; 3. czynnikjako ODTRUWANIE, gdyż składające Slęnan pytama dotyczązachowań mających na celu oczyszczenie organiz~u;, . 4. czynnikjako ĆWICZENIE, gdyż odnoszące SIę don pytama dotyczą aktywności
fizycznej.
Tabela 3.15. Analiza czynnikowa dla 6 pytań Macierz rotowanych
składowych(a)
Składowa
1
2
CH1
0,900
CH2
0,832
CH3
0,586
0,447
CH4
0,493
0,624
CH5
0,688
CH6
0,864
Całkowita wyjaśniona wariancja Składowa
% wariancji
1
36,980
2
30,967
Analiza czynnikowa pokazała, że nasza z pozoru jednorodna ~k~la z wyso~~ a Cronbacha równą 0,875 nie jest wcale jednorodna, a nasz wskazmk rzetelnoscl okazał się mylący.
. . ..... , Trzeba pamiętać, że wyniki analizy czynnikowej mo~ą SIę Istotme zml~mac pod wpływem włączenia do analizy nawet pojedynczych zmIenn~ch, defo~mując st~ turę czynnikową. Dlatego też rozsądniej jest nie wprowadzac ~o. anal.Izy, ": sposob eksploracyjny, wszystkich pytań, ~le uprze~nio dokonać ich treSCI?WeJ analIzy. Jak~ przykład niech nam posłuży analIza czynnikowa wykonana dla pIerwszych 5 pytan z naszego przykładu. Tabela 3.14. Analiza czynnikowa dla 5 pytań Całkowita wyjaśniona wariancja
Macierz składowych(a) Składowa
Składowa Ogółem
1
1
CH1
0,745
2
CH2
0,791
3
CH3
0,759
4
CH4
0,762
5
CH5
0,679
2,799
% wariancji
% skumulowany
55,983
55,983
Na zaprezentowanym w tabeli 3.14 wydruku widzimy, że pr~eprow~dzona analiza ujawniła tylko jeden czynnik Gedną składową), co oznacza: ze p~am~ 1-5 stan~ wiąjednorodnąskalę. Co się jednak stanie ze strukturą cz~nnl~ową l zWIązaną z. mą interpretacją, jeśli do pierwszych pięciu dołożymy pytame szoste z naszego zbIOru 17 pytań?
96
Jak widzimy w tabeli 3.15, jedno mniej przemyślane posunięcie przyczyniło się do rozbicia jednorodnej skali na niejednorodną, składającą się już z dwóch czynników.
Wprowadzenie do wizualizacji danych Często badacze są tak skoncentrowani na poszukiwaniu wyników istotnych statystycznie (co to oznacza, przekonamy się w następnym rozdziale), że zapominają o podstawowym celu, jakim jest zrozumienie uzyskanych danych i rejestrowanych dzięki nim zjawisk. Testowanie istotności statystycznej otrzymanych wyników stanowi zazwyczaj ostatni etap całej analizy. Podstawowąrzecząjest dokładne obejrzenie danych, czemu służy w dużym stopniu wizualizacja danych. Przez długi czas zasadnicze metody badania polegały na oglądaniu zebranego zbioru obserwacja po obserwacji lub liczeniu różnego rodzaju statystyk ze zmiennych, które zawierał. Pierwsza metoda, jak łatwo się domyślić,jest niezwykle żmud na, nawet dla niewielkich zbiorów danych. Druga wydaje się znacznie lepsza. Na przykład, aby się dowiedzieć czegoś o dochodzie badanych osób, liczymy średnią i odchylenie standardowe odpowiedniej zmiennej. Podobnie, aby zbadać powiązanie między dochodem a wykształceniem, możemy policzyć korelację tych zmiennych. Takie postępowanie jest bardzo wygodne. Sprowadza nam informacjęzawartą w dużym zbiorze danych do jednej czy dwóch liczb. Niestety, tak się składa, że często w rzeczywistych sytuacjach tak daleko idąca "kompresja" informacji prowadzi do utraty istotnej jej części. Pamiętamy, że średnia i odchylenie standardowe są bardzo czułe na obserwacje odstające. Jeśli takie informacje znajdują się w naszych danych i zostaną włączone do statystyk, to po pierwsze, tracimy informację o tym fakcie, a po drugie, policzona średnia jest zawyżona (lub zaniżona).
97
Wizualizacja
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych Podobnie korelacja liniowa dwóch zmiennych pozwala nam wykryć wyłącznie liniowązależnośćmiędzy nimi. Gdy zależność tajest inna (krzywoliniowa), to współ czynnik korelacji może nam fałszywie wskazać na istnienie korelacji lub jej brak. Sytuacja staje się jeszcze trudniejsza, gdy nasze dane są "wielowymiarowe", czyli
Wizualizacja danych pozwala zrealizować trzy podstawowe cele: 1. Zapoznanie się z danymi. Sprawdzenie, czy nie zawierają one anomalii. Zanim rozpoczniemy liczenie jakichkolwiek statystyk, sprawdzamy, jaki rozkład mają nasze zmienne, ponadto musimy się przekonać, czy dane są poprawnie zakodowane, czy są w nich braki danych, czy dane nie zawierają
98
obserwacji odstających itp. Znajomość rozkładu zmiennej jest niezwykle użyteczna, gdy tworzymy wskaźniki _ czasem rozkład zmiennej będzie nam wręcz narzucałmetodę tworzenia wskaźnika, co widzieliśmy w podrozdziale poświęconym temu zagadnieniu. 2. Przekonanie się, czy postawione przed badaniem hipotezy mają szansę być potwierdzone za pomocą danych, którymi dysponujemy. Może się pozornie wydawać, że takie postępowanie jest nieuzasadnione, że jest wręcz herezją przecież o tym, czy hipotezy przez nas postawione mogą być przyjęte czy odrzucone decydują testy statystyczne. To rzeczywiście prawda, tyle że znacznie łatwiej jest dobrać odpowiedni test statystyczny, gdy wiemy, z jakiego rodzaju rozkładami zmiennych mamy do czynienia (normalny, skośny itd.), jakiego typu zależności (liniowe, nieliniowe itp.) są obecne w naszych danych. Często, przy odrobinie wprawy, możemy na oko ocenić, czy dane potwierdzają czy nie nasze hipotezy, dzięki czemu efektywniej i szybciej znajdujemy interesujące nas zależności. Zdarza się również tak, że przyglądając się naszym danym, a nie ograniczając się do robienia wyłącznie zaplanowanych testów statystycznych, możemy odkryć jakąś interesującą, nową i nieoczekiwanązależność. 3. Diagnostyka statystyk. Jest to nader istotne zagadnienie. Bardzo często po przeprowadzeniu testów statystycznych badacz osiada na laurach, zadowolony z uzyskanego wyniku. Trzeba jednak pamiętać, że za testami statystycznymi stoi wiele różnych założeń dotyczących danych. Poważne złamanie niektórych z nich może spowodować, że uzyskane wyniki będą nieprawdziwe. Oczywiście nie namawiamy tu do popadania w przesadę. To, że jakiś test wymaga, aby zmienna miała rozkład normalny nie oznacza, że musimy odrzucić wyniki, gdy rozkład naszej zmiennej odbiega w niewielkim stopniu od normalności. Jednak gdy zamiast rozkładu normalnego otrzymujemy rozkład, który jest bardzo skośny lub dwumodalny, to musimy się zastanowić, czy użyty test faktycznie nadaje się do naszych analiz.
zmiennej
Wid~imy zatem, że wizualizacja danych towarzyszy nam na każdym kr
k o u pracy po~wH(c~lI.smytyle czasu wstępowi, aby podkreślić wagę wizualizacji we współ czesneJ analIZIe danych. z
danY~l11: p~z~,d, w czasie i po przeprowadzeniu analiz statystycznych.
kiedy badamy kilka zmiennych jednocześnie. Dopóki nie dysponowaliśmy komputerami o dobrych możliwościach graficznych, trudno było szukać wzorów i anomalii w danych. Obecnie jednak oprogramowanie, które mamy do dyspozycji pozwala na stosowanie bardzo wyrafinowanych metod wizualizacji danych.
rozkładu
Wizualizacja
rozkładu
zmiennej
. Wybó~ sposo~u wizualiz~cji danyc~ zależy w dużej mierze od skali, na 'akie' Jest zmIenna. Gdy Jest ona mIerzona na skali nominalnej, to uzywm:ny wykresu ~łupkowego lub kołowego (tortowego). Dla zmiennej mierzone' na skalI lub oprócz wymienionych wykresów mo . . wykresu skrz nk k 1 zna uzyc . Y . 0:-v~go, wanty owego, histogramu oraz wykresu gęstości (głównie dl a zmIennych IlosCIOwych).
~Ierzona porządkowej przedziałowej
Wykre.s przekazują
najcz~ściJ ~
słupkowy.i k~łowy
(tortowy)
informac'ę
t~belaczęstości (np. tabela 3.16). Wysokość słupkówWYkr~;;słuąpkOJweengamzl':Y d lIczebno' . d .k ... o za ezyo Wykresy te
w formie graficznej
kła
'ak da'
SCI aneJ ategorn zmIennej lub od jej procentowego udziału Wykres słupk~wy jest bardzo prosty w interpretacji. Trzeba jednak pamiętać o pe~ny~ S?OS?~I~ m~nipulacji tym wykresem. Kiedy patrzymy na rysunek 3 5a wydaje d SIę, .ze rozmca d' , lIczebności osób z wykształceniem policealnym 1.,sre d' mm .za-, wo o.~mJest. os~ znaczna. Wyst~rczy je.dnak rzut oka na skalę, aby zrozumieć, że tak me !est. 'YIdac to na poprawme zrobIOnym rysunku 3.5b gdzie sk l . . sztuczme obCIęta od dołu. ' a a me Jest Trzeba zatem uważać, aby siebie samego i innych nie nym wykresem słupkowym, ze źle dobraną skalą.
zmylić
wadliwie zrobio-
Tabela 3.16. Rozkład częstości zmiennej WYKSZTAŁCENIE Wykształcenie Częstość Ważne
Procent
Procent ważnych
Procent skumulowany
Średnie ogólne
8
26,7
26,7
26,7
Średnie zawodowe
8
26,7
26,7
53,3
Policealne
7
23,3
23,3
76,7 100,0
Licencjat Ogółem
7
23,3
23,3
30
100,0
100,0
99
Wizualizacja
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych
9,0..----------------, 8,2
rozkładu
zmiennej
Warto pamiętać, że niektóre metody wizualizacji sprawdzają się dobrze jako naanalityczne, inne zaś jako metoda prezentacji danych.
rzędzie
8,0 8,0
7,0
7,8
6,0
Histogram
5,0
7,6 4,0 7,4
3,0
7,2
2,0
.o 7,0
1,0
:~
.~
..J
6,8
0,0 ŚrednIe og6lne
policealne
Średnie zawodowe
licencjat
licencjat
Wykształcenie
Wykształcenie
Rysunek 3.5a, b.
Średnie ogólne
policealne
Średnie zawodowe
Rozkład częstości
zmiennej
skali na postać rozkładu częstości tej zmiennej
Wykres
WYKSZTAŁCENIE. Wpływ obcięcia
kołowy
Wykres kołowy (rysunek 3.6) zawiera tę samą informa~ję, c~ wy~es słupk0V-:Y, tyle że w innej formie. Ma on niestet~ dwa ~oważne ogramczema, ktore powoduJą, że nie nadaje sit{ on na dobre narzędzIe analItyczne. .' ., Po pierwsze, gdy kategorii zmiennej jest.w~ele, ~kr~s .staj~ SIę ~pełme meczt te1ny. Drugi powód jest związany z percepcją I mozlIwoscIam: ludzkIego ~ka. Ot~z na wykresie kołowym liczebność w kategor~i jest 0~zwiercIed10nap0;VIer~chmą wycinka całego koła. Rzecz w tym, że .1ud~kIe oko .~Iezbyt dobrze ~orown~j~ po. hnI'e W rezultacie gdy mamy WIęcej kategom o podobnych lIczebnoscIach, WIerzc., . .' to często trudno jest powiedzieć, która kategoria jest liczniejsza. Sy~ację ~atuj~ m~~ co wydrukowanie liczebności na rysunku, ale jest to. s~rzec~n~ z Ideą wIzualIzacJI danych, zgodnie z którą to obraz ma do nas przemawIac, a me lIczby.. . . Wykres kołowy ma jednązaletę: jest efektowny, d~a~ego ~zęsto P?jaWIa SI~ w gazetach, opracowaniach robionych na potrzeby szerOkIej publIcznoscl. Trzeba jednak pamiętać o jego istotnych wadach i nie nadużywać go. Wykształcenie
II Średnie ogólne III Średnie zawodowe Ifij Policealne
II Licencjat Wycinki kola przedstawiają: liczebności
100
Rysunek 3.6. Wykres
Gdy zmienna porządkowa lub przedziałowa ma dużo kategorii, wówczas wykres albo wręcz niemożliwy do zrobienia. Możemy wtedy posłużyć się histogramem. Jak wiemy, wykres słupkowy pokazuje liczebność kategorii zmiennych. Gdy kategorii jest dużo, to zamiast próbować rysować wszystkie, można połączyć te sąsiadujące ze sobą. W efekcie otrzymujemy mniejszą liczbę kategorii do narysowania. Tworzenie histogramu zaczyna się więc od przyporządkowania kategoriom zmiennych przedziału (albo "koszyka"), do którego wpadną, następnie zliczamy liczbę przypadków w każdym koszyku i na tej podstawie tworzymy wykres. Na rysunkach 3.7a-d widzimy histogram zmiennej AGE (czyli wiek respondenta w PGSS z 1992 r.). W tym miejscu trzeba wskazać na bardzo poważną wadę histogramu. Otóż, o czym się zaraz przekonamy, jego wygląd zależy w znacznym stopniu od wyboru liczby przedziałów (koszyków), na które dzielimy naszą zmienną. Wybór ten jest całkowicie arbitralny. Popatrzmy na rysunek 3.7a, na którym mamy dane pogrupowane w 10 koszyków. Można z niego wywnioskować, że rozkład zmiennej jestjednomodalny i prawoskośny (nie jest symetryczny). Gdy zwiększymy liczbę koszyków do 25 (rysunek 3.7b), pojawia się druga modalna. Dalej, gdy koszyków jest jeszcze więcej, widzimy, że są w zasadzie 3 mody. Jaki jest zatem prawdziwy obraz zmiennej? Jaki wybór liczby koszyków jest prawidłowy? Trudno dać jednoznaczną odpowiedź na to pytanie. Nie należy przy tym ulegać złudzeniu, że im więcej koszyków, tym lepiej. Dodanie tylko jednego koszyka (rysunki 3.7c i 3.7d) może spowodować dość znaczne różnice między histogramami, mogą się więc pojawiać różnego rodzaju artefakty związane ze szczególnym doborem liczby koszyków. Histogram zrobiony tylko dla jednej liczby koszyków jest w zasadzie zupełnie bezużyteczny. Nie mamy żadnej gwarancji, że zmiana tej liczby nie zmieni zupełnie wyglądu wykresu. Histogram jest przydatny, gdy możemy sprawdzić, jak będzie wyglądał w przypadku zmiany liczby koszyków. Wtedy, eksperymentując, możemy porównać wykresy otrzymane w różnych przypadkach i wyrobić sobie zdanie na temat rozkładu zmiennej. Oczywiście oglądając zrobiony przez kogoś i już wydrukowany histogram, nie ~ożemy żadnych eksperymentów przeprowadzać. W rezultacie musimy uwierzyć, ze osoba, która przygotowała histogram, wiedziała, co robi i wybrała taki, który odpowiada faktycznemu rozkładowi zmiennej. słupkowy staje się nieczytelny
kołowy rozkładu zmiennej WYKSZTAŁCENIE
101
Rozdział
3. Wizualizacja danych. Tworzenie
wskaźników złożonych
Wizualizacja rozkładu zmiennej
200r---------~
300
o
lI)
'00
o
r0 100
o
Qdch.Sld
N
=15,98 Odch.Std = 15,98
Średnia =46,0
50,0 35,0
N = 1647,00
80,0 65,0
...o
Średnia'" 46,0
N=1647,OO
95,0
WIEK RESPONDENTA
o
WIEK RESPONDENTA
Rysunek. 3. 73. H·IStog ram (16 koszyko'w) Rysunek. 3.7b. Histogram (25 koszyków)
20
40
60
80
Rysunek 3.8. Histogram ze znacznikami przypadków 140
140
120
120
100
100
80
80
Rysunek 3.8 przedstawia taki histogram, otrzymany dla 300-osobowej podpróby zmiennej AGE z PGSS-u. W okolicach 40, 50 i 60 lat życia respondenta widzimy zagęszczenie kresek, co oznacza, że wielu respondentów jest w tym wieku.
60
Wykres gęstości
Odch.Sld = 15,98
Odch.Sld: 15,9B
$rednla=46,Q
$rednla:c46,Q
N= 1547,00
N::: 1647,00
WIEK RESPONDENTA
WIEK RESPONDENTA
Rysunek. 3.7c. Histogram (35 koszyków) Rysunek. 3.7d. Histogram (36 koszyków)
Istnieją metody pozwalające nieco uwiarygodnić wydrukowany his~~gram. Niestety nie oferują ich wszystkie komputerowe pakiety statystyczne. W pomzszym ~rzy kład~ie skorzystamy z możliwości darmowego pakietu statystycznego o naZWIe R . . ,'h' t (http://cran.r-project.org). Jeśli liczba zbadanych przypadków nie jest zbyt duza,. mozemy wzbogaclc .IS 0postać kresek umIeszczonych nadb'podzIałką gram o znaczm'k'1 przypadko'w, maJ' '"ce t " D' ki od słupkami histogramu. Każda kreska odpowiada jed~eJ b~daneJ os~ le.. ~lę . jest dla jakich ZmIennej przypadków.
~emu
102
łatwo zorientowaćsię,
wartości
Innym wykresem, który daje nam informację analogiczną do histogramu jest wykres gęstości. Wykres gęstości powstaje w następujący sposób. Wybieramy najpierw pewną symetrycznąfunkcję, którąbędziemy nazywać funkcjąbazową (często tę funkcję nazywa się jądrem, od angielskiego słowa kerner). Następnie każdej obserwacji przyporządkowujemy tę funkcję tak, żeby jej oś symetrii pokrywała się z daną obserwacją. Po czym dodajemy do siebie wszystkie funkcje bazowe, otrzymując w ten sposób krzywą, która jest właśnie wykresem gęstości. Procedura ta jest zobrazowana na rysunku 3.9 dla fikcyjnego zbioru danych zawierającego 10 obserwacji. Funkcjąbazową w naszym przypadku jest po prostu funkcja Gaussa. Gdy dodamy do siebie wszystkie funkcje, otrzymujemy żądany wykres. Nie ulega wątpliwości, że tam, gdzie jest więcej obserwacji, np. w okolicach wartości 35 lub 70, będzie i większe zagęszczenie funkcji bazowych, czyli po zsumowaniu otrzymamy większą wartość.
występuJe najWIęcej
Rysunek 3.9. Wykres
gęstości dla 10 przypadków
103
Rozdział
3. Wizualizacja danych. Tworzenie
wskaźników złożonych
Wykres gęstości, podobnie jak histogram, wymaga ustalenia pewnych parametrów. Przede wszystkim musimy wybrać funkcję bazową. Tutaj była to funkcja Gaussa, jednak możliwe jest stosowanie także innych (każdy pakiet statystyczny udostęp nia kilka do wyboru). Tak się jednak szczęśliwie składa, że wybór konkretnej funkcji nie ma zbyt wielkiego wpływu na wygląd całego wykresu. Jest to oczywiście duża zaleta wykresu gęstości. Drugi parametr, który musimy ustalić, stanowi szerokość funkcji bazowej h w przypadku funkcji Gaussajest to oczywiście odchylenie standardowe. Im szerokość ta jest większa, tym gładszy wykres otrzymujemy, im mniejsza, tym bardziej wykres jest poszarpany. Wydawać się zatem może, że wykres gęstości nie jest o wiele lepszym rozwiązaniem niż histogram - i tak musimy ustalić wartość dowolnego parametru, który znacząco wpływa na wygląd wykresu - tak nie jest z tego względu, że wykres gęsto ścijest stabilny z uwagi na zmiany parametru szerokości funkcji bazowej. Oznacza to tyle, że małe zmiany parametru powodują znikome zmiany wyglądu wykresu. Własność ta pozwala na systematyczne badanie rozkładu zmiennej: rozpoczynamy od bardzo małej szerokości funkcji bazowej, a potem stopniowo ją zwiększamy, eliminując "niepożądane" nierówności wykresu. Przykład takiej procedury przedstawiają rysunki 3.10 a-d. Wykreślone są tam cztery histogramy zmiennej AGE z PGSS-u (dla 300 losowo wybranych osób) wraz z wykresami gęstości o różnej szerokości funkcji bazowej h, mierzonej jako ułamek standardowej szerokości równej 1. Patrząc na serie rysunków 3.10, widzimy, że dla szerokości 0.1 wykres zawiera dużo nieistotnych informacji (drobne zmiany rozkładu), wykres otrzymany dla h = 0.25 i h = 0.5 wydaje się wiernie pokazywać podstawowe własności rozkładu zmiennej. Ostatni rozkład, dla h = 1, jest zbyt wygładzony. Wykres gęstości jest lepszy niż histogram, gdyż podczas przybliżania rozkładu zmiennej bierze pod uwagę nie tylko liczebności z jakiegoś określonego przedziału, lecz także te leżące w pewnej odległości od danej obserwacji - mają one mniejszą wagę, ale są uwzględnione. Dzięki temu w porównaniu z histogramem, w wykresie gęstości osiągamy większąstabilność. Oczywiście nie zmienia to faktu, że także wykres gęstości wymaga pewnej pracy przy jego tworzeniu, tak aby dobór parametru szerokości funkcji bazowej pozwolił na zbudowanie wykresu naprawdę pokazującego rozkład zmiennej. Niestety, nie wszystkie pakiety statystyczne pozwalają zrobić wykres gęstości. Jednym z tych, które się bardzo dobrze do tego nadająjest wspomniany już pakiet R (http://cran.r-project.org). Na koniec warto zaznaczyć, że zarówno histogram, jak i wykres gęstości niezbyt dobrze radzą sobie z wartościami odstającymi - mogą one łatwo zostać niezauważo ne, a dla niektórych wartości parametrów (szerokości funkcji bazowej lub liczby koszyków) - w ogóle niewidoczne. Z tego względu zajmiemy się teraz wykresem skrzynkowym. 104
Wizualizacja rozkładu zmiennej
20
30
40
50
60
70
80
Ry.s.unek ~;10a. Wykres gęstości. SZerokosc funkCJI bazowej h = 0.1
20
30
40
50
60
70
Rysu.':lek 3.1 Ob. Wykres gęstości. Szerokość funkCJI bazowej h = 0.25
80
Rys':'':lek 3.~.Oc. Wykres gęstości. Szerokosc funkCJI bazowej h = 0.5
Rysu.':I ek 3.1 Od. Wykres gęstości. Szerokość funkCJI bazowej h = 1
Wykres skrzynkowy ci Wykres skr~y.nk0':Y jes.t kompromisem pomiędzy pokazywaniem wyłącznie przeętnych wartoscI ZmIennej a koncentrowaniem się na wartościach odstających Po patrzmy na ~rzykład takiego wykresu na rysunku 3.11 a. . -
na~est n;,mm prze?stawio~ywy~es skrzynkowy (fikcyjnej) zmiennej WIEK. Dola':ę z SkrZ~I od~?wIada p~~rwszemu kwartylowi Ql, a górna trzeciemu kwart IryloWI. Q3. CzylI .długosc skr~~IJest równa odstępowi międzykwartylowemu (tzw. d~R.- mterquartlle .range). LIma przechodząca w poprzek skrzynki odpowiada met~:n.Ie. S~Zy~~daje nam zatem informację o tym, jak rozłożonesą przeciętne war,~. zmIenneJ. wykresu na rysunku 3.lla możemy wywnioskować że w naszej pro Ie mamy do czynienia z ludźmi przeciętnie w wieku około 30 lat' l' • kł d zmi " t k' ( . . ze roz a enneJ Jes s osny medIana me leży dokładnie pośrodku skrzynki).
105
Wizualizacja
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych
o o
rozkładu
zmiennej
~-------OJ---------1
20 -.-, ci.
(/)
Q)
,,
30
..... ~
Q)
~ 40
50
8
I
I
I
I
I
I
-2
-1
o
1
2
3
Rozkład
-2
o
4
2
(f--------i
~
____ -- - - - - -- -- - - -- iron mo \ r
I
"2
Rysunek 3.11a. Wykres skrzynkowy dla zmiennej WIEK
O
2
4
6
8
10
o
-1
1
2
normalny
;11l
Rysunek 3.11b. Porównanie histogramu i wykresu skrzynkowego dla fikcyjnej zmiennej
(
l
l
(
I
\
-2
O
2
4
6
B
Rozkład
Dodatkowo na wykresie mamy narysowane "wąsy" zaznaczone przerywanąlinią i zakończone krótkimi kreskami. Wąsy wyznaczają największą i najmniejszą wartość zmiennej, o ile nie jest ona większa (mniejsza) od Q3 + 1.5 IQR (Ql - 1.5 IQR). Zatem wąsy pokazują nam wartości leżące poza IQR, ale niezbyt od niego odległe (nie więcej niż o 1,5 odstępu międzykwartylowego). Obserwacje, które są większe od Q3 + 1.5 IQR lub mniejsze od Ql- 1.5 IQR nazywamy obserwacjami odstający mi; są one zaznaczone na wykresie jako odrębne punkty (kółka). Nasza zmienna ma
niż 3 IQR od dolnej lub górnej krawędzi skrzynki
-2
I
I
-4 -2
l
O 2
Aby się lepiej oswoić z wykresami skrzynkowymi, warto popatrzeć na histogramy i odpowiadające im wykresy skrzynkowe kilku często występującychrozkładów
O
2
4
6
8
~ak widzimy, wykres skrzynkowy nie pornoze nam wykryć rozkładu dwumodalnego!
dwumodalny
;1J ~ l
~------OJ----i
f-----OJ--------rm
j
l
i
4
6
B 10
m
I
-2
O 2
4
6
8 10
~mi~!scowienie mediany wskazuje
Rozkład prawoskośny
na sko-
snosc.
nazywamy obserwacjami skrajnymi. Możemy łatwo porównać ze sobą histogram pewnej fikcyjnej zmiennej oraz wykres skrzynkowy (rysunek 3.11b). Warto zwrócić uwagę, że wartości odstające są prawie niewidoczne na histogramie - wskazują na nie jedynie kreski oznaczające przypadki, natomiast bardzo dobrze pokazuje je wykres skrzynkowy. Wykres skrzynkowy został tym razem narysowany poziomo - czasem można się spotkać z taką konwencją·
-2
10
8
6
,,
~
dwie obserwacje odstające. Obserwacje, które leżą dalej
j
-3
..+--------DJ----i I
I
I
I
I
I
-10 -8
-6
-4
-2
O
2
ł
-10 -8 -6 -4 -2
O
2
Rozkład lewoskośny
(rysunek 3.12). Rysunek 3.12. Histogramy i odpowiadające im wykresy skrzynkowe
107 106
Rozdział 3.
Wizualizacja danych. Tworzenie wskaźników złożonych
Wizualizacja rozkładu zmiennej
W ~iekt~rych ~akiet~ch statystycznych (np. SPSS-ie) wykres kwantylow wgląda meco maczeJ, ~ak J~k n~ rysunku 3.l3b. Widzimy, że różni się on nie~o :d rysunku 3.l~a.. Na oSI.po:IO~eJwykreślonesą wartości zmiennej (wartość obserwowana), n~ OSI pIOnOWej zas takie wartości, jakie byśmy otrzymali, gdyby nasza zmienna
Wykres kwantylowy (kwantyl-kwantyl) , Wykres kwantylowy (lub centylowy) służy przede wszystkim do tego, aby sprawdzać, na ile rozkład badanej zmiennej odpowiada jakiemuś rozkładowi teoretycznemu, na przykładrozkładowi normalnemu. Bardzo często w statystyce taka informacja jest naprawdęistotna - wiele testów opiera się na założeniu, że pewna zmienna losowa ma rozkład normalny. Można się spotkać z różnego rodzaju wykresami kwantylowymi. Przeważnie różnią się one tym, co jest wykreślone na osiach. Niezależnie od tego, wszystkie te wykresy są sobie równoważne i ich interpretacjajest identyczna. Idea wykresu kwantylowgo bazuje na bardzo prostej obserwacji. Oznaczmy przez Xli] centyl i-tego rzędu zmiennej mającej rozkład normalny o średniej J.l i odchyleniu standardowym a. Centyl tego samego rzędu standaryzowanego rozkładu normalnego Zi wiąże się X; w następujący sposób: Z. l
pochodzIła z rozkładu normalnego (wartość oczekiwana). Ponieważ na wykr .
nku 3 13 ' . b eSIe z ry'. .a wartoscl o serwowane znajdują się na osi pionowej, to jest on lustrzasu ny~ odbICIem ~kr~su z rysunku 3.l3b względem prostej obrazującej rozkład norma n~. Oczyw~scle mterpretacja wykresu pozostaje bez zmian - oba zawieraJ'ą tl' samą mformacJę.
~
SPS~ 0.feruje także wykres zbliżonego typu - wykres prawdopodobieństwo-praw_ dopodoblenstwo (Wykres P-P) N' . h " . a Jego oSlac przedstaWIOne Jest prawdopodobieńo sm: sk~ulowa~,e rozkładu normalnego (wartość oczekiwana) oraz rozkładu naszej . zmIennej (wartosc obserwowana). Znowu J'eżeli punkty układ' . kł d . .. , aJą SIę na prostej to raz. a zmIennej ~est normalny. Wykres ten dla użytej już wcześniej zmiennej ACJE mozemy zobaczyc na rysunku 3.14.
X-ll
=~l-,-:,---
cr
(J)
~
Ponieważ
transformacja ta jest liniowa, to punkty (X;, Zi) leżą na jednej prostej. Wykres kwantylowy tworzymy zatem, wykreślając na jednej osi centyle pochodzące z rozkładu normalnego, a na drugiej centyle badanej przez nas zmiennej (która niekoniecznie musi mieć rozkład normalny). Jeżeli punkty układają się na jednej prostej, to znaczy, że nasza zmienna ma rozkład normalny. Na rysunku 3.l3a widzimy taki wykres dla zmiennej AGE z PGSS-u. Punkty nie układają się na prostej, więc zmienna AGE nie ma rozkładu normalnego.
Wykres p-p - WIEK RESP.
.2 1,0 1 - - - - - - - -
....
::J
E ::J
..><: (/)
o
~
,8
(/)
.c:: (J)
:co
"O
~
o
,5
~ ~
Q. (J)
.~
~
Wykres K-K - WIEK RESP. 120'.,.-----------....,
..><:
100
o
,3
(J)
tł
o w
,3
§ ~ o
.
,5
,8
1,0
80
Obserwowane prawdopodobieństwo skumulowane
fil
~
Ol
~
j
40
:~
20
60
c:
~
Rysunek 3.14. Wykres
prawdopodobieństwo - prawdopodobieństwo
~o
~
Jeżeli okaże się, że rozkład zmiennej nie J'est normalny to - przy odrob' .
o o
.@
O.l-_~~-~-~-~__I o
20
40
60
80
100
120
·2 cent la rOzkladu normalne o
Rysunek 3.13a. Wykres kwantylowy
Wartość obserwowana
wy " . ' I m e wpralicz~ mozemy SIę przek~na~,Jaki~ sąjego podstawowe właściwości: skośność oraz .
akr modalnych. Przyjrzyjmy
SIę następującym histogramom i odpowiadającym
Im wy esom kwantylowym (rysunek 3.15).
Rysunek 3.13b. Wykres kwantylowy
108 109
Rozdział
3. Wizualizacja danych. Tworzenie wskaźników złożonych
Wizualizacja zależności między zmiennymi
Powtórzmy:
Przekonaliśmysię, że możliwości graficznej analizy i prezentacji danych są bardzo dUże. Trzeba z nich mądrze korzystać, pamiętając, jakie są wady i zalety poszczególnych typów wykresów.
lJl I
I
I
i
I
ł
I
-3
-2
-1
o
1
2
3
o
Rozkład
. -3
i
I
I
i
l
l
-2
o
2
4
6
8
Rozkład
1
2
3
Gdy chcemy otrzymane przez nas wyniki pokazać osobom, które nie zajmują się
Wizualizacja zależności między zmiennymi -3 -2 -1
o
1
-3 -2 -1
o
1
2
3
dwumodalny
I
-4 ·2
i
I
I
I
l
o
2
4
6
8 10
l
2
3
Rozkład prawoskośny
:lnmrrł o
I
i
-10 -8
I
I
I
i
I
-6
-4
·2
o
2
lZJ 1:lZJ
800~---_~
o
40~-------,
-2
600 30
_: 0"-
-3 -2 -1
:jffiIIllilli l
I
I
i
l
·10
-5
o
5
10
o
1
2
-5
-10
400
3
wykształcenie (3 kat.) 'U '(I)
g
200
.o
.~ ..J
.średnie o
wykształcenie (3 kat.) 10
ffil]podstawowe
.średnie brak dzieci 1,00
IIIIIIwyż".
2,00 czworo lub więcej 3,00
Liczba dzieci (5 kat.) Liczba dzieci (5 kat.)
-3 -2 -1
Rysunek 3.15. Histogramy i wykresy kwantylowe
20
-podstawowe
o
o
1
2
3
Rysunek 3.16a. Zgrupowany wykres
Rozkład prostokątny
110
Sposób wizualizacji jest, podobnie jak wybór testu statystycznego, w dużej mierze zależny od skali, najakiej mierzone są porównywane zmienne. Gdy badamy dwie zmienne mierzone na skali nominalnej, to możemy zrobić zgrupowany wykres słup kowy - wizualizuje on informację zawartą w tabeli krzyżowej. Można go oczywiście użyć również wtedy, gdy jedna lub obie zmienne mierzone są na skali porządkowej. Przykład widzimy na rysunku 3.16a i 3.16b, gdzie pokazano związek liczby dzieci i wykształcenia respondenta (dane pochodzą z PGSS-u). Warto pamiętać, że podobnie tak jak w tabeli krzyżowej, liczebności kategorii mogą być mylące. Na rysunku 3.16a mamy wykreślone liczebności, a na rysunku 3.16b procenty. Drugi rysunek jest o wiele lepszy, gdyż kategorie zmiennych nie są
2
Rozkład lewoskośny
o
Najwięcej informacji przydatnych do analitycznego badania danych dostarczają wykres skrzynkowy oraz wykres kwanty10wy - najlepiej więc użyć ich obu. Dla zmiennych o małej liczbie kategorii niezawodny jest wykres słupkowy. statystyką, to nie należy oczywiście prezentować im wykresu skrzynkowego czy kwanty10wego, a np. dobrze zrobiony histogram czy wykres słupkowy.
:UL i
o
normalny
;lll o
-2 -1
rozkładów o różnych kształtach
Rysunek 3.16b. Zgrupowany wykres słup słupkowy. Wizualizacja związku wykształ kowy. Wizualizacja związku wykształcenia cenia z liczbą dzieci posiadanych przez z liczbą dzieci posiadanych przez responrespondenta. Słupki przedstawiają/iczeb Słupki przedstawiają procenty denta. ności
111
Wizualizacja zależności między zmiennymi
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych równoliczne (np. osób z wykształceniem podstawowym jest dużo więc~j niż z w~ ższym). Trzeba o tym pamiętać,zwłaszczabadając dane sondażowe, gdzIe kategone
:::J
::J 800
rzadko są równoliczne. . ' Gdy przynajmniej jedna ze zmiennych jest mierzona na, skalI porządkowej, to możemy analizować związek zmiennych za pomoc~~kresow ~~zynkowych. Jest to użyteczne zwłaszcza wtedy, gdy zmienne mają WIęcej ka~egorn. Na rysunku 3.17 widzimy wykres liczby dzieci w zależności od wykształcema.
N
N
W
W
os: o
~
;AJ
600 ou
aU) ~
~
a-
Q
l.:t
{~
(~
o n:r.;J:! m rllf~U mac
~
f" {l
~
r.l
~a-
200
N
N
6 o
6o
o D
* * *
o o
6
*
u
OJl:-I;:';
200
t)
-200+--~-~~-~~-~~
20
30
40
WIEK RESPONDENTA
50
60
70
80
o
D
-200+--~-~~-~-_~--1
10
20
30
40
50
60
70
80
WIEK RESPONDENTA
Rysunek 3.18a. Wykres rozrzutu z krzy- Rysunek 3.18b. Wykres rozrzutu z krzyregresji liniowej wą LOWESS
wą
o
o
4
1:!tl fJ aX)(l Uj ttlrJl;j
400
I
10
o
600
a-
~
t)
10
800
U)
n"
400
I
8
1000.-------------,
1000.--------------,
Badanie trendu. Krzywa regresji. Krzywa LOWESS (LOESS)
(3
w N Cl
« co
2
N
()
:J
o N=
2416
1286
330
podstawowe
średnie
wyższe
wykształcenie (3 kat.)
Rysunek 3.17. Liczba dzieci w zależności od wykształcenia
Na wykresie pojawiająsię obserwacje odstaj~ce o.raz skra~n~
(o~nac~one
gwiazd-
ką). Nad nazwami kategorii wydrukowane są Ich lIczebnoscl. Nlektor~ programy
statystyczne pokazująróżnice liczebności,różnicując s~erokość ~krzynek: 1m skrzynka . szersza, tym więcej przypadków znajduje się w dan~! kategon~. Gdy badane zmienne mają bardzo dużo kategorn lub są mIerzone na skalI przedziałowej, to warto użyć wykresu rozrzutu.
Wykres rozrzutu (korelacyjny) Wykres ten jest bardzo prosty zarówno do zrobienia, jak i do interpretacji. Jeżeli mamy dwie zmienne X i Y, to na wykres nanosimy punkty o współrzędnych (X;, YJ, 112
gdzie i jest numerem przypadku (rysunek 3.18).
Najprostszym i często stosowanym sposobem badania trendu jest dopasowanie do danych linii prostej, pochodzącej z regresji liniowej omówionej w rozdziale 8. Na rysunku 3.18a mamy wykreślonąlinię regresji. Kąt nachylenia linii wskazuje na to, że nie istnieje zależność liniowa między wiekiem respondenta a jego dochodem. Jak wiemy, linia regresji ma tę zasadnicząwadę, że robiącją, zakładamyautomatycznie liniowość związku między zmiennymi. Ponieważ często wcale nie ma ona miejsca, więc wymyślono lepszą metodę wizua1izowania trendu - krzywe LOWESS (albo LOESS, ang.: robust locally weighted regression). Sposób robienia tego wykresu jest bardzo prosty. W pobliżu każdego punktu na wykresie (czyli w pobliżu każdej obserwacji) dopasowujemy do danych pewien wielomian niskiego stopnia (zazwyczaj jest to linia prosta lub dobrze znana ze szkoły parabola). Robimy to jednak w szczególny sposób, otóż nie bierzemy przy dopasowaniu pod uwagę wszystkich obserwacji, a tylko te, które są odpowiednio blisko. Ponadto te obserwacje, które są dalej od punktu estymacji mają mniejsząwagę niżte, które są bliżej. O tym, ile obserwacji będzie wzięte pod uwagę decyduje parametr gładkości h, który dobieramy samodzielnie. Rysunek 3.18b przedstawia ten sam wykres rozrzutu co rysunek 3.18a, tym razem z dopasowaną do naszych danych krzywą LOWESS. Widzimy, że wskazuje ona na istnienie zależności między zmiennymi, tyle że krzywoliniowej. Parametrem, który ostatecznie decyduje o wyglądzie krzywej, jest wspomniany powyżej parametr gładkości h. Gdy ma on maksymalnąwartość (h = 1), to przy dopasowaniu krzywej bierzemy pod uwagę wszystkie obserwacje - otrzymujemy w ten sposób bardzo gładkąkrzywą, która zazwyczaj słabo pokazuje trend. Gdy h jest
113
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych
Wizualizacja zależności między zmiennymi
mniejsze, to do dopasowywania krzywej używany jest odpowiedni ułamek danych. Jeśli np. h = 0.3, to oznacza to, że przy dopasowaniu krzywej w danym punkcie uwzględnia się 30% wszystkich obserwacji, które leżą naj bliżej danego punktu. W praktyce okazuje się, że najtrafniejszym doborem h są wartości pomiędzy 0.25 i 0.5, ale nie jest to oczywiście żadna sztywna reguła. Zależność wyglądu krzywej od doboru tego parametru jest zobrazowana na ry-
W pewnej firmie dyrektor handlowy został . stawienie skali wzrostu sprzedaż w ost poproszony przez swojego przełożonego o przedposłużył się poniższym WYkreSe; słu atnlch latach. Dy~ektor handlowy w czasie prezentacji nych działach firmy w kolejnych lata~~owym demonstrującym wzrost średniego zysku w różCzy wzrost wyników handlowych je t d . . wykresu? s uzy czy mały? Jakle zastrzeżenia można mieć do tego
sunku 3.19.
ODPOWIEDŹ: Źle obcięty wykres niepodpisana o" 1oma " kach mierzony jest zysk. Wzrost j'~st wrze . t S,P?zb , nie Wiadomo, w jakich jednostczywIs OSCI ardzo mały.
o
120
__ o.
h= 0.9 h = 0.3 h = 0.1
61,4
100 61.2
o
o
80
61.0
o o
o
60,8
60 ~
~.,
'2
40
'O
~
o G.
! '.
o
20 ~",~,; .. s,;"
o
:.. . o
....
,,:'"
60,4
'
o
I:
-.:.:.:1' o
o o
2001
o o o
2002
o
"'0
o
o
5
10
15
20
25
Rysunek 3.19. Krzywa LOWESS dla różnych wartości parametru gładkości h (fikcyjne dane)
W pewnym badaniu mierzono dochód res ondenta' , pracy. Otrzymane wyniki zostały przedstaJone na p o~~z jego zakdo~olenle z wykonywanej , , , onlzszym wy resle rozrzutu. Okresl, jakle wady ma przedstawiony wykres.
ODPOWIEDŹ: Jeden punkt znajduje się na skra'u ' razem, przez co wydaje się fałszywie, że leżą bar~z~~I~Snkkou~i~~~z.stałe obserwaCje
Wielką zaletą tego wykresu jest to, że pozwala dopasować do danych krzywą bez czynienia żadnych założeń dotyczących danych (które przecież mamy dopiero po-
114
60,6
znać!). Nie jest więc potrzebny żaden model teoretyczny danych, aby móc je wygodnie wizua1izować. Jedyną wadę krzywej LOWESS stanowi to, że jej dopasowanie wymaga dość dużego i gęstego zbioru danych (obserwacje muszą być blisko siebie). Jest to zrozumiałe, gdyż krzywa LOWESS modeluje dane na podstawie ich lokalnej struktury. Pominęliśmy tutaj pewne szczegóły techniczne związane z dopasowywaniem krzywej LOWESS, takie jak kryterium doboru funkcji ważącej obserwacje lub postać dopasowywanych krzywych. Więcej informacji Czytelnik znajdzie w literaturze [13]. Zrozumienie roli parametru gładkości w zupełności wystarcza, aby samodzielnie tworzyć dobre krzywe LOWESS.
~
200 , - -
są zbite
_
100
"
d'
'O
," o" d' r.: aD ," "
'0 .<: ()
o
'O
o O
"O
"
20
""
""
rJł~!J l1rJ
"
~u
BO
BO
100
zadowolenie z pracy
115
Rozdział 3. Wizualizacja danych. Tworzenie wskaźników złożonych
Poniżej widzimy histogram długości czasów erupcji słynnego gejzeru "Old Faithful". Porównując histogram z zamieszczonymi tuż pod nim znacznikami przypadków, powiedz, czy wykres ten dobrze oddaje charakter danych. Jeśli nie, to spróbuj przewidzieć, jak wyglądałby prawidłowy histogram. ODPOWIEDŹ: Po pierwsze, jest za mało przedziałów (koszyków), co widać po znacznikach przypadków - prawdziwy rozkład zmiennej jest dwumodalny. Po drugie, opis osi X jest zbyt długi - nie ma sensu umieszczać tam aż tylu informacji - powinny się one znależć w opisie rysunku. o
" o
'"'
.". ."
~
'" " N
o
'"
~
czas trwania erupcji gejzera "Old Faithful" w parku Yellowstone (w minutach)
116
Wpisz definicje kluczowych pojęć, wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Testowanie hipotez statystycznych. Rozkład statystyki Pojęcia kluczowe: rozkład statystyki (M,
S2); błąd standardowy statystyki;
Centralne Twierdzenie Graniczne; hipotezy: zerowe, badawcze, kierunkowe, bezkierunkowe; obszar krytyczny i istotności
statystycznej;
Nowe symbole:
ZM, SM,
błąd
wartość
krytyczna statystyki; poziom
I i II rodzaju; moc testu
H1, Ho, a, p, CTG, b.p.d.o. Ho
Jak na podstawie próby możemy wnioskować o całej populacji? Wybierając dla siebie najlepszą szkołęjęzykową, możemy brać pod uwagę różne kryteria: renomę, położenie, brzmienie nazwy, a gdybyśmy chcieli dokonać wyboru opartego na kryteriach, nazwijmy je, naukowych, moglibyśmy rozważyć np. średni wynik jej absolwentów w standaryzowanym teście. Informacja, że średnia wynosi 39,4 jest bezużyteczna,dopóki nie możemy jej z czymś porównać. Średniej nie należy bowiem porównywać z rozkładem zmiennej w populacji, który może być używa ny wyłącznie dla porównania wyników pochodzących od pojedynczych osób. Śred nia może być porównana z rozkładem średnich, który zostanie omówiony w tej czę ści podręcznika. W psychologii najczęściej przedmiotem naszego zainteresowania nie są wyniki pojedynczych osób, ale właśnie prób. Podstawowym pojęciem dla zrozumienia wnioskowania statystycznego jest pojęcie rozkładu statystyki, które zostanie omówione w dalszej części rozdziału. Ważne jest, abyśmy analizowany na następnych stronach przykład czytali "zdanie po zdaniu" i sprawdzali wszystkie rachunki, ponieważ zrozumienie pojęcia rozkładu statystyki z próby jest podstawowe dla wnioskowania statystycznego.
117
Rozkład zmiennej
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki Populacje są na ogół bardzo duże i dlatego ich parametry pozostają niezna~e, jednak dla potrzeb naszego wywodu wyobraźmy sobie małą i określoną populacJę. Ułatwi nam to zrozumienie podstawowych twierdzeń statystycznych.
Rozkład zmiennej w populacji i w próbie oraz rozkład statystyki,
na przykładzie populacji marsjańskiej Aby zdefiniować rozkład statystyki, zapraszamy na ":)'cieczkę na Ma~sa, na którym żyje tylko trzech Marsjan, różniących się wzrostem: DUZY mierzy 3 m, SREDNI ~ ~, a MAŁY 1 m. W związku z tym, że populacja jest tylko trzyelementowa (co raczej me zdarza się na Ziemi), możemy z łatwością wyliczyć rozkład zmiennej w populacji. Zmienna WZROST przyjmuje 3 wartości, każdą z prawdopodobieństwem 1/3 . Jej rozkład możemy zobaczyć na rysunku 4.1. 0,35 . - - - - - - -
1m
1/3
2m
1/3
3m
1/3
0,33
0,33
0,33
0,3
2
Rysunek 4.1. Rozkład zmiennej WZROST w populacji
3
1/3
=0,33
Możemy policzyć średnią zmiennej WZROST w populacji:
J.l=1+2+3= 3 i wariancję zmiennej WZROST w populacji:
cr We wzorze na
sjanin żąda j ako wynagrodzenia za badanie 1/2 1szpiku kostnego), więc badacze ustalili, że będą prowadzić badania na dwuelementowych próbach. Próba zawierająca ponad 60% e/3) populacji powinna satysfakcjonowaćkażdego. Powstaje problem wyłaniania próby z populacji. Jeżeli chcemy móc uogólnić wyniki badania próby na całą populację, to próba musi być losowa'. Przyjmijmy najprostszą definicję, która mówi, że każdy element populacji ma jednakową szansę bycia wylosowanym. Znając tę definicję, przystępujemydo losowania. Zanim zaczęliśmy losowanie, każdy Marsjanin miał jednakową szansę bycia wylosowanym 1:3 (jeden do trzech). Załóż my, że wylosowaliśmy DUŻEGO. Jeżeli nie damy mu już szansy powtórnego wylosowania, to szanse wylosowania MAŁEGO przy drugim losowaniu są już dużo wyższe, bo 1:2 (zostało ich już tylko dwóch). Próba uzyskana w taki sposób nie byłaby próbą losową. Aby speł nić założenia próby losowej, musimy losować ze zwracaniem wylosowanych wcześniej elementów do powtórnego losowania. W taki.m przypadku szansa wylosowania DUZEGO jest taka sama za pierwszym i za drugim razem (1 :3). Losując dwuelementowe próby z trzyelementowej populacji, otrzymamy 9 prób. Kto nie w~erzy, może je sobie wypisać. Za pierwszym razem możemy wylosować MAŁEGO, SREDNIEGO lub DUZEGO i za drugim razem analogicznie. Obliczmy liczbę wszystkich możliwych prób dwu- i trzyelementowych w populacji o następującej liczbie elementów:
2 [(1-2)2 +(2-2)2 +(3-2)2] _
=
3
-
a 2 dzielimy przez N, a nie przez N-l ponieważ obliczamy wa-
riancję dla populacji, a nie dla próby.
Próba losowa 118
w populacji i wpróbie oraz rozkład statystyki ...
Wyobraźmy sobie, że grupa badaczy postanowiładokonać pomiaru wzrostu mieszkańców Marsa. Dokonywanie pomiaru jest bardzo kosztowne (każdy mierzony Mar-
Liczebność
populacji
Liczba wszystkich możliwych prób dwuelementowych
Liczba wszystkich możliwych prób trzyelementowych
4
4 x 4 = 16
4 x 4 x 4 = 64
10
10 x 10 =
10x10x10=
100 x 100 =
100 x 100 x 100 =
100
• Problem doboru próby do badań jest jednym z najważniejszych zagadnień metodologicznych, które zostało wyczerpująco omówione w [5, 19].
119
Rozdział
Rozkład zmiennej w populacji i w próbie oraz rozkład statystyki ...
4. Testowanie hipotez statystycznych. Rozkład statystyki
Rozkład średnich
Rozkład statystyki M przedstawia rysunek 4.2.
(statystyki M) ,
0,4
Wynik losowania w metrach
Statystyka M
Pierwsze losowanie
Drugie losowanie
MAŁY
MAŁY
1
1
1
ŚREDNI
1
2
1,5
DUŻY
1
3
MAŁY
2
1
ŚREDNI
2
2
DUŻY
2
3
MAŁY
3
1
ŚREDNI
3
2
DUŻY
3
3
ŚREDNI
DUŻY
T~------------------
0,3 0,2 0,1
o 1,5
Rysunek 4.2. Rozkład statystyki M (1/9 = 0,11,
2
2,5
3
% = 0,22 itd.)
Rozkład wariancji (statystyki S2) Jak
nauczyliśmy się wcześniej, statystyką nazywamy wartość liczbową wyli-
podstawie wyników w próbie. W każdej z tych 9 prób możemy wyliczyć 2 statystyki: M (średnią w próbie) i S2 (wariancję w próbie). Zaletą marsjańskiej populacji jest to, że możemy wyliczyć statystyki M i S2 we wszystkich możliwych próbach dwuelementowych. Statystyki wyliczone na podstawie różnych prób przyjmuj ą różne wartości, a więc są "normalnymi" zmiennymi, możemy przedstawiać ich rozkład. Rozkład statystyki M (średnia w próbie) przyjmującej 5 wartości, z odpowiednimi częstościami, został przedstawiony w tabeli 4.1. Najczęściej (3 razy na 9) M = 2, najrzadziej (raz na 9) M = 1 lub M = 3.
Każdy badacz oprócz średniej może wyliczyć wariancję w swojej próbie:
czoną na
S2
N-I
Tabe~a,4.~..Wariancje wszystkich możliwych prób dwuelementowych z populacJ'i marsJansklej
Średnia
Częstość
Procent
Procent ważnych
Procent skumulowany
Próba
M
1
1
1
MAŁY I ŚREDNI
1
2
1,5
MAŁY I DUŻY
1
3
ŚREDNI I MAŁY
2
1
I
MAŁY
1,00
1
11,1
11,1
11,1
ŚREDNI I SREDNI
2
2
1,50
2
22,2
22,2
33,3
ŚREDNI I DUŻY
2
3
2,00
3
33,3
33,3
66,7
DUŻY IMAŁY
3
1
88,9
DUŻY I ŚREDNI
3
2
100,0
DUŻY/DUŻY
3
3
2,50
2
22,2
22,2
3,00
1
11,1
11,1
Ogółem
9
100,0
100,0
Gdyby Marsjan było 5, to wszystkich możliwych prób dwuelementowych było by 25 itd. 120
• .
Opis próby MAŁY
Tabela 4.1. Średnia zmiennej WZROST Marsjan w dziewięciu próbach
= L.e x ; _M)2
52
Częstość
O
3
0,5
4
2
2
SS [(1
1)2 + (1
[(1 - 1,5)2 + (2
52 1)2]
O
1,5)2] - 0,5
O li 0,5/1
O 0,5
Proporcja
Suma
1,00
121
Miary tendencji centralnej rozkładu statystyki
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki Dzielimy przez N-l, gdyż są to wariancje w pr~bach, ~ ni~.w po~u1.acji. Pon~e waż liczebność próby wynosi 2, mianownik równanIa wananc~1 w pro?le ~~osl.l (N _ 1 = 1) i nasze wyliczenia mogą zostać uproszczon~ (m~slmy ?b,hczyc Je?yme · Ok) Jak widać w tabeli 4.3 i na rysunku 4.3, wanancJa wymkow w probach 1Iczm . , . , 3 ki h)' marsjańskich przyjmuje jedynie trzy wartoscI.: trzy proby ( /9 ws~yst ~ ~Ie ~ają w ogóle wariancji (oba wyniki w próbie są takie san:e~, c.zte.ry mają war~anc~~ row~ą 05 a reszta wariancję, wynoszącą 2. Warto zauwazyc, ze zadn~ z wanancJI w prob~;h nie jest równa wariancji wyników w populacji wynoszącej (}2 = 0,67.
Miary tendencji centralnej rozkładu statystyki Średnia rozkładu średnich (rozkładu statystyki M)
°
Tabela 4.3. Wariancja zmiennej WZROST w próbie Marsjan Procent
Procent
Procent skumulowany
Wariancja
Częstość
3
33,3
33,3
33,3
0,00
4
44,4
44,4
77,8
0,50
2
22,2
22,2
100,0
2,00 Ogółem
9
100,0
100,0
ważnych
0,5...--------------,
Skoro statystyka M może być traktowana jak zmienna, to możemy policzyć statystyki rozkładu tej zmiennej - miarę tendencji centralnej (np. średnią tego rozkładu) i miarę rozproszenia (np. wariancję). Innymi słowy, będziemy liczyć średnią rozkła du średnich i wariancję rozkładu średnich. Wyobraźmy sobie teraz, że z Marsa wróciła ekspedycja badaczy, z których każdy zbadał inną próbę. Takjak widzimy w rozkładzie średnich, otrzymali oni różne wyniki. Są tacy, którzy twierdzą, że Marsjanie są mali (średnia wzrostu wynosi 1 m) i tacy, którzy dowodzą, że Marsjanie są olbrzymi (średnia wzrostu 3 m). Co zrobić z tymi doniesieniami? Może uśrednić? II f"M
= 1+ 1,5 + 1,5 + 2 + 2 + 2 + 2,5 + 2,5 + 3 9
-
2
Średnia ze średnich, ze wszystkich możliwych prób dwuelementowych wynosi 2 i jest równa średniej w populacji - nie jest to przypadek, ale ilustracja twierdzenia, które jest prawdziwe także w przypadku bardzo dużych populacji.
0,4 lU .~
0,3 .. ~ ..
Średnia rozkładu statystyki M (średnia średnich)
e o
c.
0,2
równa
0,1
°
°
0,5
1,5
S2
Trzeba zauważyć, iż w przeciwieństwie do rozkładu statystyki M rozkład statystyki S2 jest skośny. Stało się,już jasne, że rozkład może być definiowany dla dowol-
Proszę zauważyć, że
to
rozkład średnich
gdyby na Marsie żyło trzech Marsjan o wzroście 1,2 i 6 m z dwuelementowych prób byłby następujący:
Pierwsze losowanie MAŁY
nej statystyki. ŚREDNI
DUŻY
122
w populacji.
2
wariancja wyników w próbach
Rysunek 4.3. Rozkład statystyki
się średniej rozkładu zmiennej
Drugie losowanie
Wynik losowania w metrach
Statystyka M
MAŁY
1
1
1
ŚREDNI
1
2
1,5
DUŻY
1
6
3,5
MAŁY
2
1
ŚREDNI
2
2
DUŻY
2
6
MAŁY
6
1
ŚREDNI
6
2
DUŻY
6
3
123
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki
Miały rozproszenia rozkładu statystyki
W tym przypadku średnia zmiennej WZROST w populacji wyniesie: 111""-
1+2+6 =
3
v:
ale żaden z badaczy prób dwuelementowych nie uzyska s,;ojej 'próbie ~redniej równej średniej w populacji. Natomiast średnia ze ~szystkIch sredmch z prob dwuelementowych, będzie równa... średniej w populacJI. _1+1,5+3,5+1,5+2+4+3,5+4+6 =3 9
II
"'M -
Aby obliczyć wariancję średnich z prób, należy obliczyć stopień rozproszenia średnich, w stosunku do średniej populacji, czyli określić stopień, w jakim różni badacze Marsa uzyskali odmienne średnie w swoich badaniach. Im bardziej średnie różnią się w poszczególnych próbach, tym mniej jesteśmy pewni, że średnia w pojedynczej pr.óbie jest zbliżona do średniej w populacji (mamy mniejsząpewność, że pojedyncza średnia reprezentuje populację jako całość). Policzmy sumę kwadratów odchyleń średnich ze wszystkich możliwych, dziewięciu prób, od średniej ogólnej: SSM = (1- 2)2 + 2(1,5 - 2)2 + 3(2 - 2)2 + 2(2,5 _ 2)2 + (3 _ 2)2 =
Ponieważ są to wszystkie możliwe próby, to SS dzielimy przez 9, a nie przez 8: Jaka jest średnia rozkładu z prób statystyki równania: M ,,2
S2?
Można ją obliczyć za pomocą
Porównajmy wariancję rozkładu średnich (rozkładu statystyki M) z wariancją rozkładu zmiennej WZROST w populacji marsjańskiej:
_ (0+0,5+2+0,5+0+0,5+2+0,5+0) = 9
Okazuje się, że średnia statystyki S2 jest równa wariancji w ~opul~cji a • Pokazaliśmy przed chwilą dwa ważne fakty, które są prawdzIwe me tylko w populacji marsjańskiej: 2
2 (J M-
(J
2
2
=-
3 Wariancja średnich z prób dwuelementowych jest dwa razy mniejsza od wariancji zmiennej WZROST w populacji. To nie jest przypadek, ale ilustracja twierdzenia ogólnego mówiącego, że:
• Średnia statystyki M jest równa średniej
w populacji.
Innymi słowy, średnia statystyki M jest równa /1; • Średnia statystyki 52 jest równa wariancji w populacji (d .
Oznacza to, że statystyka M jest dobrym (nieobciążonym) estymatorem statystyka S2 dobrym (nieobciążonym) estymatorem d.
Wariancja rozkładu zmiennej równa się odchyleniu standardowemu podniesionemu do kwadratu. Mając wyliczoną wariancję, możemy więc policzyć odchylenie standardowe rozkładu średnich (rozkładu statystyki M): jl, zaś (JM
=~(J~.
Ta miara rozproszenia rozkładu statystyki jest na tyle ważna, że nadano jej spe-
To właśnie
rozkład
statystyki
cjalną nazwę: błąd standardowy.
umożliwia
wnioskowanie o parametrach populacji na podstawie statystyk wyliczonych w próbie.
Odchylenie standardowe rozkładu statystyki określane jest jako jej BŁĄD STANDARDOWY.
Miary rozproszenia 124
Policzmy teraz, ile wynosi wariancja (Marsjanie o wysokości 1,2 i 3 m).
rozkładu
statystyki
rozkładu średnich dla
pierwszego przy-
Zajmiemy się jedynie błędem standardowym statystyki M (aAJ, ale pojęcie to odnosi się także i do innych statystyk.
kładu
125
Rozdział
4. Testowanie hipotez statystycznych.
Wjaki sposób praktycznie wykorzystujemy znajomość rozkładu średnich (statystyki M)?
Rozkład statystyki
W jaki sposób praktycznie wykorzystujemy znajomość rozkładu średnich (statystyki M)?
J..l M =J..l
Jeżeli znamy rozkład średnich z prób (rozkład statystyki M) i wysłaliśmy na Marsa
tylko jednego badacza, to możemy określić np.: 1.
prawdopodobieństwo, że szą od
otrzyma on średnią z dwuelementowej próby więk
2,5:
=
2. prawdopodobieństwo, że średnia w jego próbie znajdzie się w przedziale (1, 3):
p(1 <M < 3) = p(M= 1,5) + p(M= 2) + p(M= 2,5) =
=
W teście, o którym wiadomo, że m 100 s 1 6 ' . . -osobowa klasa średnią równą 116 Obli' 'k t' Jas otrzymał wynik X = 116, a jego 16. CZ wynl s andaryzowany Jasia i jego klasy.
p(M> 2,5) = p(M= 3) = 1/9 ;
7/9 ;
,'Q' ~~ w populacji rozkład normalny o srednlej 00 i odchyleniu standardowym rownym 16: N(100, 16)
!
Wynik Jasia:
3. prawdopodobieństwo, że średnia w jego próbie będzie mniejsza od 3:
p(M < 3) = 1-p(M= 3) = %' Wszystkie te prawdopodobieństwa są wyliczone przy założeniu, że próba była losowana z populacji, gdzie 11 = 2. Gdyby badacz wrócił z informacją, że średni wzrost na Marsie wynosi O,5m, to moglibyśmy uważać, że zamiast na Marsa, gdzie 11 = 2, poleciał on na inną planetę. Ten sposób myśleniajest podstawądla wnioskowania statystycznego, gdyż mamy do czynienia z pojedynczymi średnimi, które tak jak w przypadku wyników surowych musimy z czymś porównać.
Średnie (stat~stYka M) z 16-osobowych grup mają rozkład
N(100, 4).
Odchyle~ie standardowe statystyki M (śred
nich ze wszystkich możliwych 16-elementowych prób) jest błędem standardowym średniej. Wynik klasy Jasia:
z Klasy
Z czym
możemy porównać pojedynczą średnią?
Oczywiście z rozkładem średnich (rozkładem statystyki M). Średnią (statystykę M) porównujemy z rozkładem średnich, dokonując jej standaryzacji w analogiczny sposób, jak robiliśmy to w przypadku wyników surowych. Od średniej M odejmujemy średnią rozkładu statystyki M (średnią ze średnich) i dzielimy przez odchylenie standardowe tej statystyki, co zapisujemy wzorem:
116 -100 4
=
Anka otrzymała wynik 85, a jej 16-osobowa klasa średnio 91. Bartek otrzymał wynik 86, a jego 25-osobowa klasa 92. Które z nich
Anka
126
=
Wszystkie klasy czwarte pisały test kompetenc'i w b I ' , . . J er a nej, o ktorym wiadomo, ze ma w populacji rozkład N(100,10).
Uczeń
Wiemy już, że średnia ze średnich równa się średniej w populacji, a odchylenie standardowe (błąd standardowy) równy jest odchyleniu standardowemu zmiennej w populacji podzielonemu przez pierwiastek z liczebności próby:
116 -100 = 16
=
zJasia
Bartek
wypadło lepiej na tle swojej klasy? Która z klas wypadła
Porównanie Wynik Średnia wyniku Liczebność osoby klasy osoby klasy (X) (M) z wynikiem klasy (z) 85 91 16 z 0,6
86
92
25
z- 0,6
lepiej w sprawdzianie?
Błąd
Porównanie
standardowy
średniej klasy
średniej
z wynikiem
(O'M)
populacji (ZM)
2,5
z 3,6 z -4
2
• Wszystkie podawane wartości średnich i odchyleń standard h '. . owyc d~a roznych testów zostały dobrane tak, aby ułatwić obliczenia. Dlatego też testy sąw tek" . '" . SCIe meprecYZYjne określ '. SIę Illtorrnacja, że dla testu inteligencji 0'= 15, w innym zadaniu 0'= 16. one, raz pOjawia
127
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Porównanie trzech typów rozkładów
Wniosek: Chociaż
średnich Chociaż
Bartek uzyskał wynik o 1 punkt większy niż Anka, to porównanie ich wyników do z klas pokazuje. że nie ma między nimi różnic. W obu przypadkach z = -0,6. klasa Bartka uzyskała średnią o 1 punkt lepszą niż klasa Anki, to ze względu na jej wynik standaryzowany jest gorszy od wyniku klasy Anki.
większą liczebność
4
8
10
12
17
4
8
M"'B.85
Na podstawie
przykładu
4.2
uzupełnij poniższą tabelę
i odpowiedz na pytania:
Które z uczniów wypadło lepiej na tle swojej klasy? Która z klas wypadła lepiej w sprawdzianie?
H 4
8
10 12 14 17
4
8
M=9.6
Uczeń
Czarek Danka
Wynik Średnia osoby klasy (X) (M) 102 104
102 102
Liczebność
klasy
Porównanie wyniku osoby z wynikiem klasy (z)
9 25
Błąd
Porównanie
standardowy
średniej klasy
średniej
z wynikiem populacji (ZM)
(O'M)
z=
z=
z=
4
8
10
17
4
12
8
10
17
4
B
10
12
17
M=11.35
12
4
M=8.7
M=9.8
z=
12
M=9,45
10
8
12
17
M'=13.05
10
12
8
M=B.7
10
12
M=8.7
Rysunek 4.4. Rozkład zmiennej WYKSZTAŁCENIE w 9 próbach
?~żeli jednak zbadamy rozkład statystyki M (rozkład średnich ze wsz tk' h mozhwych pr'b 20 1 ys lC o -e ementowych), to będzie on miał kształt przedstawiony na rysunku 4 .5.
Porównanie trzech typów Zilustrujmy trzy podstawowe typy
rozkładów,
rozkładów
Rozkład średnich z prób
z jakimi mamy do czynienia, na
o o ~
przykładzie opisu poziomu wykształcenia dorosłych Polaków. Dziewięciu badaczy wylosowało dziewięć 20-osobowych prób
z populacji doroPolaków i poprosiło ich o podanie swojego wykształcenia w latach nauki. Na rysunku 4.4 przedstawione są otrzymane rozkłady i wartości statystyki M (średniej w próbie). Mimo że badacze losowali badanych z tej samej populacji, to otrzymali w swoich badaniach różne średnie. Jeden z nich mógłby się upierać, że średnia liczba lat nauki w Polsce wynosi 8, inny zaś, że 13. słych
g
'"
o
8
9
10
11
12
13
WYKSZTAŁCENIE
(lata nauki szkolnej respondenta)
128
MM= 10.358
Rysunek 4.5. Rozkład statystyki M zmiennej WYKSZTAŁCENIE
129
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki
Centralne Twierdzenie Graniczne
Rozkład ten otrzymaliśmy empirycznie dzięki losowaniu prób 20-elementowych z populacji pochodzącej z badań PGSS dorosłych Polaków. Próba badana w PGSS jest próbąreprezentatywną,a więc dobrze odtwarza rozkład zmiennej w całej populacji. Nic dziwnego, że średnia rozkładu statystyki M równa się średniej zmiennej
ROZKŁADwYJŚClOWY NOFlMALN"l!
~.-.ll--....-
WYKSZTAŁCENIE w populacji (rysunek 4.6).
N=l M = 50.19 S = 14.92
N=2
N;::; 4 M = 49.56 SM = 7.31
M = 50.42 SM = 10.33
N = 8 M 49.89 S'" = 5.24
=
N
M SM
= 16 = 49.93 = 3.66
ROZKŁADWYJŚClOWY SKOśNY
-l.1 l
N=l M = 49.82 5=14.81
N=2 M = 49.68 8",=10.27
N=4 M = 49.82 SM=7.17
N = 8 M = 50.09 SM 5.41
=
N M SM
= =
16 50.08
=
3.83
ROZKŁADwYJśCIOwyElMOOALNY
10 WYKSZTAŁCENIE
12
14
17
(M = 10.366)
Rysunek 4.6. Rozkład zmiennej WYKSZTAŁCENIE w populacji
uJł!
N=l
N=2
N=4
M = 51.77
M = 49.53
M = 49.35
S
= 34.16
SM
= 24.99
SM = 17.46
N = 8 M = 49.92 SM = 12.23
N = 16
M = 49.52 SM
=
8.48
ROZKŁADwYJśClOWYPROSTOł<ĄTNY
Centralne Twierdzenie Graniczne
BO
Dokonaliśmy symulacji losowania prób jedno-, dwu-, cztero-, ośmio- i szesnastoelementowych z populacji o różnych rozkładach zmiennych. Dla każdej z 1149 wylosowanych prób policzono średnią i rozkład tych średnich (statystyki M) przedstawiono na rysunku 4.7. Pod każdym rozkładem znajduje się informacja o średniej z wszystkich średnich i błędzie standardowym średniej (GM)' Losowanie prób jednoelementowych odtwarza rozkład zmiennej w populacji. Błąd standardowy średniej równa się odchyleniu standardowemu zmiennej w populacji (oznaczonemu s na rysunku 4.7) ze względu na dzielenie przez Jl. Bez względu na to, jak bardzo niezwykły kształt może mieć rozkład wyjściowy (rozkład zmiennej w populacji), wraz ze wzrostem liczebności próby rozkład statystyki M coraz bardziej upodabnia się do rozkładu normalnego. Liczebność próby nie wpływa na średniąrozkładuśrednich, wpływa natomiast najego odchylenie standardowe. Im większe N, tym mniejszy błąd standardowy średniej (GM)'
.~łl M S
=
49.60
= 29.40
M = 50.70 SM 20.32
=
M SM
= 49.45 =
14.33
M = 50.82 SM = 10.43
N = 16 M 50.03 SI( 7.13
= =
Rysunek 4.7. Wpływ liczebności próby na kształt rozkładu statystyki M
131
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Centralne Twierdzenie Graniczne
To, co pokazaliśmy za pomocą symulacji losowania prób, zostało udowodnione matematycznie i sformułowane w postaci Centralnego Twierdzenia Granicznego (CTG):
NtatOtdsktawMie przy~ładu. 4.3 i zawartych w nim informacji powiedz, jaki s a ys y a dla prob o Innych liczebnościach:
rozkład będzie miała
b) dla prób 25-elementowych? Jeżeli
pobieramy kolejno próby losowe o
liczebności
c) dla prób 16-elementowych?
N
z populacji o dowolnym rozkładzie ze średnią,u i wariancją 6
2
d) dla prób 9-elementowych?
,
Ile wyniesie błąd standardowy średniej?
to dla dostatecznie dużych prób rozkład średnich (statystyki M) będzie rozkładem normalnym o średniej
Gdy zmienna ma w populacji
,u i wariancji
rozkład
6
2
/
Z jakiego twierdzenia skorzystałeś?
N.
normalny,
to rozkład średnich jest normalny także dla małych prób.
!eżeli LĘ~ mierzony odpowiednim testem ma w populacji rozkład skośn I
Gdybyśmy chcieli wyznaczać rozkład statystyki
M empirycznie, tak jak robili-
śmy
to w przypadku populacji marsjańskiej, to proces ten przebiegałbynastępująco: losujemy z populacji (ze zwracaniem) wszystkie możliwe próby losowe o danej liczebności N i dla każdej z tych prób obliczamy średniąM. Jeżeli populacja jest 100-elementowa, a próby lO-elementowe, to wszystkich możliwych prób jest 100 10 . Nawet dla szybkiego komputera wyliczenie rozkładu 100 10 średnich jest wyzwaniem. A przecież zwykle mamy do czynienia zarówrto z większymi populacjami, jak i więk szymi próbami. Dzięki CTG nie musimy wykonywać tych obliczeń, ponieważ wiemy, że chociaż średnie w próbach będą miały różne wartości, to oscylują one wokół średniej z populacji f.1. CTG mówi, że krzywa rozkładu średnich jest krzywą normalną bez względu na to, jaki jest kształt rozkładu zmiennej w po~lacji. Co więcej, odchylenie standardowe tego rozkładu normalnego wynosi cr / oJ N . Im większa jest liczebność losowanej próby, tym mniejsze jest odchylenie standardowe rozkładu statystyki, tzn. tym mniejszy będzie rozrzut średnich wokół średniej w populacji.
Jeżeli
jaki
INTELIGENCJA mierzona odpowiednim testem ma w populacji statystyka M
rozkład
= 20, to jaki
ODPOWIEDŹ:
b)
będzie
59
dla prób 36-elementowych ?
Z jakiego twierdzenia skorzystałeś?
J~~eli ~NTR?WERSJ~ mierzona odpowiednim testem ma w populacji rozkład bimodalny o śred nieJ Jl- 36 I odchyleniu standardowym (7= 10, to jaki rozkład będzie miała statystyka M c) dla prób 100-elementowych? d) dla prób 36-elementowych? Z jakiego twierdzenia skorzystałeś?
(7=
statystyki M
.._
a) dla prób 100-elementowych?
błędu standardowego rozkładu średniej z prób:
że rozkład
.
rozkład będzie miała statystYk: ~ srednleJ Jl -
Zakładając następujące wielkości odchylenia standardowego w populacji o: określ
a) dla prób stuelementowych?
132
(7
N(1 00, 1O), to
rozkład będzie miała
Na podstawie CTG możemy powiedzieć, parametry będą równe N(100,1).
odchyleniu standardowym
'
. Ik ., wie osc
27, gdy liczebność próby wynosi N = 9.
normalny, a jego
133
Rozdział
4. Testowanie hipotez statystycznych. Rozkład statystyki
Tak jak pokazano to w przykładzie 4.4, określ wielkość błędu standardowego rozkładu śred niej z prób: a) 13= 27, gdy
liczebność
próby wynosi N = 100
b) 13= 12, gdy liczebność próby wynosi N = 100 c) 13= 12, gdy liczebność próby wynosi N = 9 d) 13= 10, gdy liczebność próby wynosi N = 25 e) 13= 10, gdy
liczebność
próby wynosi N = 16.
Jakie wnioski możesz sformułować? 1. Gdy wzrasta odchylenie standardowe zmiennej przy niezmienionej liczebności próby, to błąd standardowy średniej . 2. Gdy zmniejsza się liczebność próby przy stałym odchyleniu standardowym, to błąd standardowy średniej .
Hipotezy statystyczne Celem badań jest przetestowanie różnych hipotez. Chcemy dowiedzieć się np., czy nowa metoda nauczania prowadzi do lep~zych wyn~kó,:. w tes~~c~ k~mpet~nc~~ szkolnych lub czy osoby systematycznie ĆWIczące mają mzsze clsmeme krwI mz takie, które unikają aktywności fizycznej. Te stwierdzenia to nasze hipotezy badawcze (alternatywne, eksperymentalne, robocze). Hipotezę badawczą określamy symbolem Hl. Celem przeprowadzenia badań jest weryfikacja takich hipotez. Jeżeli chcemy pokazać, że codzienne łykanie witamin pozytywnie wpływa na witalność, to wnioskowanie dedukcyjne polega na odrzuceniu hipotezy przeciwstawnej do naszej hipotezy badawczej. Hipoteza przeciwstawna nazywana zerową (Ho) mówi, że łykanie witamin nie wpływa na poziom witalności. Odrzucenie Ho przekonuje nas o słuszności naszej hipotezy badawczej (Hl)' Jeżeli, przykładowo,
chcemy pokazać, że przebywanie na świeżym powietrzu wysokim poziomem energii, to wnioskowanie dedukcyjne polega na odrzuceniu hipotezy przeciwstawnej mówiącej, że przebywanie na świeżym powietrzu nie ma związku z wysokim poziomem energii. Zilustrujmy to przykładem. wiąże się z
Załóżmy, że
134
dysponujemy dwiema przesłankami: 1) Wszyscy przebywający na świeżym powietrzu mają wysoki poziom energii. 2) Andrzej pracuje na świeżym powietrzu.
Hipotezy statystyczne
z kt~rych na mocy wnioskowania dedukcyjnego wyprowadzamy konkluzję, że Andrzej powinien cieszyć się wysokim poziomem energii. Czy stwierdzenie faktu że Andrzej cieszy się wysokim poziomem energii skłoni nas do przyjęcia teorii,' że: ,,~rze~ywa~ie na świ~~ym powietrzu dodatnio wpływa na poziom energii"? Nie, pomewaz pOZIOm energll Andrzeja może zależeć od wielu innych czynników (np. aktywności fizycznej, uwarunkowań genetycznych itd.). Potwierdzenie teorii w przypadku ~?rze~a nie pozwala nam na stwierdzenie jej prawdziwości. Jeżeli jednak Andrzej CIerpI na kłopoty z energią, to stwierdzenie tego faktu, z logicznego punktu widzenia, powinno skłaniać nas do zakwestionowania jednej z dwóch przesła nek: "Wszys~y przebywający na świeżym powietrzu mają wysoki poziom energii" lub "Andrzej przebywa wystarczająco długo na świeżym powietrzu". Ponieważ ostatnia przesłanka jest łatwiejsza do weryfikacji, podejrzewamy, że to nasza teoria jest fałszywa.
Kierując się analogicznymi zasadami, zamiast testować hipotezę badawczą, któ~ej .prawdziwo.ść c~cielibyśmy potwierdzić, budujemy hipotezę zerową, zakładamy,
ze jest pr~wdzlwal staramy się doprowadzić do sprzeczności (uzyskać wynik należą cy. do ZblOru mało prawdopodobnych, jeżeli przyjęte przez nas przesłanki są prawdZIwe). D~prowadzenie do sprzeczności (dowód nie wprost) jest pewniejszym sposob~m wmoskowania niż wskazywanie kolejnych przykładów popierających naszą
teonę·
Wnioskowanie statystyczne Wnioskowanie statystyczne jest wzorowane na regule dowodzenia NIE WPROST
określanej też po łacinie ad absurdum [18] . Jeżeli chcemy w ten sposób udowodnić, że da~e t~ierdzenie - nazwijmy je Hl - jest prawdziwe, tworzymy jego negację _
naZWIjmy jąHo . Dla zdania Hl: "Teres nie jest człowiekiem"Ho brzmi: "Teres jest człowiekiem".Zakładamy teraz, że Ho jest prawdziwe i sprawdzamy, do jakich konsekwencji prowadzi przyjęcie tego założenia, np. skład krwi Teresa powinien mieć określone parametry. Jeżeli badanie krwi Teresa daje wyniki niezgodne z oczekiwa~iami, to jest to dowodem na to, że przyjęte założenie (Ho: "Teres jest człowiekiem") jest fałszywe. W ten sposób zgodnie z prawem wyłączonego środka, które mówi ~e. z p~ry: zda~ie i jego nega~ja tylko jedno jest prawdziwe dowiedliśmyprawdziwo~ SCI tWlerdzema Hl: "Teres me jest człowiekiem". Struktura statystycznego wnioskowania indukcyjnego jest analogiczna do struktury dowodzenia nie wprost (ad absurdum). Chcąc pokazać, że prawdziwe jest twierdzenie nazywane hipoteząbadawczą (Hl)' zakładamy dla potrzeb dowodu prawdziwość jego negacji określanej jako hipoteza zerowa (Ho). . . ~lastępnie sprawdzamy, do jakich konsekwencji prowadzi przyjęcie prawdziwoSCI hIpotezy zerowej. Jeżeli Hl brzmi, że "Teres jest nadzwyczaj inteligentny" (pochodzi z populacji o średnim IQ różnym od 100), to formułujemy hipotezę zerową 135
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Hipotezy statystyczne
w postaci: "Teres pochodzi z populacji o IQ = 100" i sprawdzamy, do jakich to prowadzi konsekwencji. Jeżeli w teście IQ Teres otrzymał wynik 180, to byłby to wynik niemożliwy, gdyby test miał 160 pytań przy założeniu, że za każdąprawidłowąodpowiedź przyznajemy jeden punkt. Jeżeli test ma 180 pytań, to jest to wynik możliwy, ale bardzo mało prawdopodobny, ponieważ oznacza on 5 odchyleń standardowych powyżej śred niej (jeżeli (7= 15). Możemy przypuszczać, że Teres pochodzi z populacji o średniej wyższej od 100. Porównanie wnioskowania dedukcyjnego z wnioskowaniem statystycznym przedstawione jest w tabeli. Wnioskowanie dedukcyjne
Ho zapisana
Ho zapisana
za pomocą parametrów
słownie
Jedynacy nie różnią Się od populacji pod względem inteligencji.
Ho:j.l
100
Formułujemy negację
H1 , które chcemy
względem
inteligencji.
H1 zapisana za pomocą parametrów
H1 zapisana słownie
H1:j.l;t100
J~dynacy różnią Się
od populacji pod względem inteligencji.
Wnioskowanie statystyczne
Formułujemy twierdzenie
Zakładamy, że
1. Chcemy spr~wdzić, czy jedynacy różnią się od populacji pod Sformułowane hipotezy znajdują się w tabeli:
udowodnić.
H1 w formie twierdzenia Ho.
Ho jest prawdziwe i sprawdzamy, do jakich konsekwencji prowadzi
przyjęcie
Jeżeli konsekwencje przyjęcia założenia prowadzą do absurdu, odrzucamy założenie o prawdziwości Ho i uznajemy prawdziwość H1 za udowodnioną.
tego
założenia.
Jeżeli konsekwencje przyjęcia założenia prowadzą do otrzymania MAŁO
PRAWDOPODOBNEGO WYNIKU, odrzucamy założenie o prawdziwości Ho.
Powtórzmy: Stosując wnioskowanie statystyczne, odrzucimy Ho, jeżeli założenie jej prawdziwości prowadzi do konsekwencji, które są mało prawdopodobne. Podejmowanie decyzji na podstawie oceny prawdopodobieństwa oznacza, że wnioskowanie statystyczne ZAWSZE wiąże się z ryzykiem błędu. Różnica między przedstawionym wyżej pewnym wnioskowaniem dedukcyjnym a niepewnym wnioskowaniem statystycznym polega na tym, że w tym drugim nie mamy do czynienia z konsekwencjami niemożliwymi, a jedynie mniej lub bardziej prawdopodobnymi.
Wzorując się
na
przykładzie
~~d~:;~~:rawdzić,
czy himalaiści
hipotezy dla
następujących zagadnień:
różnią się poziomem hemoglobiny we krwi od populacji
=
~~P~I~~~~~d~:::w~~~15~~y osoby neurotyczne różnią się poziomem magnezu we krwi od 4 Chcemy s zi'omem
d "
..
9IUk~~a:e z~~~~~ ~~~~1J~~~~i~~j= ~~~.owane w dużych ilościach różnią się po-
Ho zapisana słownie
SIę
.
sformułuj
2. Chcemy sprawdzić, czy osoby spo . . d"I" .... rolu od populacji (gdzie j.l 175). zywające uze I OSCI ryb roznIą Się poziomem choleste-
Him.alaiści nie różnią
Formułowanie hipotez
4.5,
od. populacji poziomem hemoglobiny we krwi.
Ho zapisana za pomocą parametrów
Ho:j.l
14
H1 zapisana za pomocą parametrów
H1 zapisana słownie
H1:j.l;t14
Hi.malaiści różnią Się
od.populacji poziomem hemoglobiny we krwi.
Pierwszym krokiem we wnioskowaniu statystycznym jest sformułowanie pary hipotez. Dla naszej hipotezy badawczej formułujemy hipotezę zerową, która musi spełniać dwa warunki: 1. 2.
wykluczać się
być
z hipotezą badawczą, precyzyjnie określona.
136 137
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Kierunkowe i bezkierunkowe hipotezy badawcze
sze od O,O~. Tylk~ ~kąd wi~my, jakie jest to prawdopodobieństwo? To proste _ dla otrzymanej wartoscl M wyhczamy ZM, a następnie sprawdzamy w tablicach rozkładu normalnego odpowiadającąjejwartość P2 (kolumna P2)'
Kierunkowe i bezkierunkowe hipotezy badawcze Kierunkowe
hipote~y
badawcze
Sposób sformułowania hipotezy badawczej wskazuje, jakie wyniki będą świad czyły przeciwko Ho. W zależności od naszych przewidywańmoże być ona sformuło wana trojako: przewidujemy, że badani studenci są lepsi w sprawdzianie intuicji psychologicznej niż średnia w populacji, zapiszemy to Hl: f1 > 5. 2. Jeżeli przewidujemy, że badani studenci są gorsi w sprawdzianie intuicji psychologicznej niż średnia w populacji, zapiszemy to Hl: f1 < 5. 3. Jeżeli przewidujemy, że badani studenci mają intuicję psychologicznąróżną od średniej w populacji, nie przewidując kierunku różnicy, to zapiszemy to 1.
Jeżeli
Hl: f1* 5. Dwie pierwsze hipotezy nazywamy hipotezami kierunkowymi, trzecią bezkierunkową. W pierwszym przypadku (Hl: f1 > 5) stwierdzamy, że tylko M istotnie więk sze od 5 pozwolą na odrzucenie Ho. W drugim przypadku (Hl: f1 < 5) stwierdzamy, że tylko M istotnie mniejsze od 5 pozwolą na odrzucenie Ho. Otrzymanie wyniku większego od 5 nie pozwoli na odrzucenie Ho. W trzecim przypadku (Hl: f1 5) Ho będą falsyfikowały zarówno wyniki istotnie większe, jak i mniejsze od 5. Powtórzmy: Kierunkowa hipoteza badawcza precyzuje kierunek różnicy (dodatni lub ujemny) między wartością statystyki a parametrem określonym w hipotezie zerowej Ho. Spodziewamy się na przykład, że średnia w naszej próbie będzie wyższa, a nie niższa niż średnia w populacji. Bezkierunkowa hipoteza badawcza to taka, w której kierunek nie jest określony. Eksperymentator przewiduje wynik różny od wartości określo nej w hipotezie, ale nie przewiduje, czy różnica będzie dodatnia, czy ujemna. Na przykład badacz może chcieć rozstrzygnąć, czy nowe lekarstwo wpływa na uczenie się, nie przewidując, czy wpływ ten będzie korzystny, czy szkodliwy. W tym przypadku hipoteza badawcza mogłaby być następująca: "lekarstwo oddziałuje na szybkość uczenia się", a hipoteza zerowa mówiłaby, że nie oddziałuje. Różnica między hipotezami kierunkowymi i bezkierunkowymi jest ważna, ponieważ te dwa rodzaje hipotez dają różne wartości krytyczne dla tego samego poziomu istotności statystycznej. Według umowy, wybory statystyczne są binarne; to znaczy, że jeśli obserwowane zdarzenie jest mało prawdopodobne, przy założeniu, że hipoteza zerowa jest prawdziwa, to odrzucamy hipotezę. Jeśli obserwowane zdarzenie nie jest mało prawdopodobne, hipoteza nie jest odrzucana. Co to znaczy "mało prawdopodobne"? Najczęściej w badaniach społecznych za mało prawdopodobne uznaje się wyniki, których prawdopodobieństwojest mniej-
*
138
W po,?ższych pr~ykładach. hipoteza zerowa (Ho) i badawcza (Hl) muszą się wykluczac. Odrzuceme Ho powmno wskazywać na prawdziwośćHl, gdyż Ho i kierunkowe H~ się w~k~uczają nie może równocześnie równać się 5 i być większym od 5). Anahza zaplsow f1 = l f1 > 5 mogłaby sugerować, że nie wszystkie możliwo ści zos~ały~wzg~~d?i~ne. Takjednak nie jest, ponieważ średnie ujemne bez względu na swoJą wle1kosc sWladcząna korzyść prawdziwości hipotezy zerowej. . Po,;iedzieliśmy, że według umowy za mało prawdopodobne uznajemy zdarzen.la, ktorych prawdopodobieństwozajścia jest mniejsze niż 0,05. Jak możemy to z~nterpreto.wać? Jeżeli ~ n.aszych bada~iach otrzymaliśmy mało prawdopodobny wy_ mk, to ~oz~ to oZ,n~c~a~: ze mamy wyjątkoweszczęście (otrzymanie takiego wyniku zdarza SIę me częsclej mz 5 razy na 100) albo że ... przyjęliśmy fałszywe założenia. , Przyglądamy się naszym założeniom i stwierdzamy, że tylko jedno z nich może byc fałsz~we. Któ~~? To, kt?re mówiło, że badana przez nas próba nie różni się od normalnej populaCJI studentow, dla których f1 = 5. To ostatnie założenie miało status hipotezy, którą nazywamy hipotezązerową.
°CI!
, ~auważmy, że wartość z, a wraz z nią prawdopodobieństwo, zmienia się w nOSCI od wartości parametru wyspecyfikowanego w Ho.
Średni
wyniósł: M
zależ
wynik zmiennej INTUICJA PSYCHOLOGICZNA w badaniu LEARN
= 6.
Jeżeli Ho:
f1 = 5,
6-5 0,37
ZM
=--=2,74.
6-5,5 0,37
Jeżeli
Ho: f1 = 5,5,
ZM
=--=1,35.
Jeżeli
Ho: f1 = 6,
ZM
=--=0.
Jeżeli
Ho: f1 = 6,5,
ZM
6-65 = 0,3; =-1,35.
6-6
.'
0,37
. Ta.sama otrzymana przez nas średniaMbędziemiałaróżne ZM (co jest bezpośred mo zWląz~e z prawdopodobieństwem), w zależności od tego, j aką hipotezę testujemy. ~trzymame bardzo ~ało ~rawdopodobnego wyniku (M < 4,28 lub M> 5,72) upoważ ?la n~s do odrzucema hIpotezy zerowej i stwierdzenia, że badana próba różni się IStOt?l~ statystycznie od populacji. Na tym, w skrócie, polega testowanie hipotez. Omowlmy cały proces dokładnie w następnej części.
139
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Etapy testowania hipotez
Etapy testowania hipotez W tej
części
omówimy trzy pierwsze etapy testowania hipotez. Określenie zmiennych i ich skal mułowanie założeń i hipotez:
pomiarowych, sfor~
1. te, których badacz jest pewny i nie chce ich kwestionować; wydają się wątpliwe.
które jesteśmy skłonni uznać za prawdziwe w badaniu LEARN:
1. Zmienna: TIME1 jest zmienną ilościową i ma w populacji leniu standardowym a= 2. 2. Próba losowa N
rozkład
normalny o odchy-
=30.
dwa rodzaje hipotez:
badawczą
odrzucić Ho
2. te, które nie pozwalają na odrzucenie hipotezy zerowej.
musiałby wynieść średni wynik w naszej próbie, abyśmy mogli odrzucić Ho?
M 6, M 4, a może M 3 lub M 7, a może M 4,51ub M 5,5? Jaka różnica między parametrem określonym w hipotezie a statystyką jest wystarczająca, aby odrzucić Ho?
=
=
Wszystkie
=
=
=
=
średnie z możliwych prób musimy podzielić na te, które:
2. nie pozwolą nam na odrzucenie Ho: ,u = 5. Co to znaczy, że średnia M jest istotnie większa/mniejsza/różna od 5? Znaczy to, że otrzymanie takiego wyniku jest mało prawdopodobne przy założeniu prawdziwości Ho. A to oznacza, że musimy wyliczyć prawdopodobieństwo otrzymania M należącego do określonego przedziału przy założeniu prawdziwości Ho. Nie jest to trudne, ponieważ znamy rozkład statystyki M (średniej). Jeżeli spełnione są założenia CTG, to wiemy, że ma ona rozkład N(,u, więc możemy skorzystać z tablic rozkładu normalnego, jak robiliśmy to dla wyliczenia prawdopodobieństwa, że dany uczeń otrzyma wynik należący do określonego przedziału. Tablice dotyczą standaryzowanego rozkładu normalnego, więc musimy M z naszej próby
1. zerową Ho, 2.
prawdopodobne i dla których trzeba
Dzieli
k),
Hipotezy Formułujemy
mało
odrzuceń Ho).
1. pozwolą nam na odrzucenie Ho: ,u = 5 (obszar krytyczny);
Pierwszy typ założeń tworzy przyjęty przez badacza model, drugi to hipotezy. Założenia,
1. te, których otrzymanie jest (obszar krytyczny);
Ile
Musimy przyjąć pewne założenia d.ot~czące roz~ładu zmi~n~ej w populacji, a także metod pobierania próby. Założenia te dZielimy na dWie kategone. 2. te, które
Takie wyniki grupujemy w tzw. obszarze krytycznym (obszarze on wszystkie możliwe wyniki na dwie kategorie:
wystandaryzować:
H1•
Mamy podejrzenie, że badana próba różni się pod względ~~ intui~ji ps~chologiczn~j od populacji wszystkich studentó~ i, ?hcielibYśmy to sprawdzlc. Sądzimy, ze pochodzI ona . z populacji o średniej większej n1Z 5. Hipoteza zerowa stanowi przeciwieństwo H1 , jest precyzyjnym ok~eśleniem p.ara~etrow populacji. Obie hipotezy dotyczą parametrów populacji. Mu~zą s~ę one wza!emnle wykluczać tak aby odrzucenie Ho uprawdopodobniało H1 • H1 Jest ~IP?tezą, kt~~ą badacz chciałb~ potwierdzić. Natomiast Ho badacz formułuje tak, aby moc Ją odrzuclc.
2 =--=037
eJ M
J30
'
Te przykłady obrazują, dlaczego Ho musi być precyzyjnie (punktowo) określona. Gdybyśmy określili, że 5 <,u < 5,5, to nie moglibyśmy wyliczyć rozkładu statystyki. Dla otrzymanej wartości M (ZM) komputer drukuje prawdopodobieństwo otrzymania z > ZM, czyli war-
tość pzZ tablic rozkładu normalnego.
Reguła odrzucenia Ho zależy od sposobu sformułowania H1 • Określenie rozkładu
H1
statystyki:
Jeżeli spełnione są założenia
CTG, możemy policzyć ZM, k~?ry ma rozkład normalny N(,u, aM)' Powiemy, że w celu weryfikacji hipotezy zastosowahsmy test z.
Odrzucamy Ho. gdy
,u>5
pz< 0,05
,u<5
pz < 0,05
,ui'5
2pz< 0,05,
dla Ho:,u = 5
Ustalenie reguły decyzyjnej: Schemat
140
możliwe średnie,
które
możemy uzyskać
pz < 0,025
M=6zM =2,74.
Z tablic rozkładu normalnego z kolumny pz odczytujemy, że dla z 2,74 pz 0,0031. 0,0031 < 0,05, co pozwala nam na odrzucenie Ho w przypadku dwóch pierwszych H • 1 Test hipotez kierunkowych nazywany jest testem jednostronnym.
=
postępowania można sformułować następująco:
1. Przewidujemy wszystkie
czyli
w tym badaniu.
2 Dzięki znajomości rozkładu statystyki (rozkładu średnich), z g.óry ok~eślam.y, któ~e . z nich są mało prawdopodobne (p < 0,05), czyli będą świadczyc przeciwko hipotezie i pozwolą na jej odrzucenie).
=
Przy teście dwustronnym (hipoteza bezkierunkowa) Ho falsyfikują wyniki z obu krańców rozkładu, więc obszar przedstawiający prawdopodobieństwo równe 0,05 musi zostać podzielony na dwie części po 0,025. W tym przypadku możemy odrzucić Ho, gdy pz < 0,025. Wartość odczytana z tablic 0,0031 jest mniejsza od 0,025, więc także w tym przypadku możemy odrzucić
Ho.
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Etapy testowania hipotez
W czasach, gdy nie było komputerów, które z łatwością obliczają dokładne prawdopodobieństwa zawarte w omawianej tabelce, decyzje statystyczne podejmowano na podstawie porównania wartości statystyki z wartością krytyczną. Pierwszym krokiem było zbudowanie obszaru krytycznego, czyli takiego zbioru wyników, których prawdopodobieństwo pojawienia się było mniejsze od 0,05. W tym celu w tabeli rozkładu normalnego szukano wartości z, dla której P2 0,05. Dla testu jednostronnego jest to ZK 1,64. Tę wartość nazywano wartością krytyczną statystyki. Wszystkie wartości ZM> 1,64 (lub ZM < -1 ,64 dla przeciwnego kierunku H1 ) pozwalają na odrzucenie Ho przy teście jednostronnym. Dla testu dwustronnego szukamy w odpowiedniej kolumnie P2 = 0,025. Wartość ta to ZK = 1,96. Jeżeli przy teście dwustronnym z > 1,96 lub z < -1,96, to odrzucamy Ho.
=
=
M
ZM
P1
5,1
0,27
4,9
0,27
5,5
1,35
4,5
1,35
5,72
1,96
4,28
1,96
P2
0,11
0,39
0,41
0,09
0,475
0,025
Obliczamy prawdopodobieństwa:
Wyliczenie
prawdopodobieństwa
al) p(M> 5,1) = p(z > 0,27) = 0,39
przy założeniu, że Ho jest prawdziwa
bI) p(M < 4,9)
Chcielibyśmy się przekonać,
czy studenci z badania LEARN nie różnią się pod względem intuicji psychologicznej od populacji, z której zostali wylosowani. Wiemy, że wyniki w sprawdzianie intuicji psychologicznej (IP) mają w populacji studentów rozkład normalny, o średniej 5 i odchyleniu standardowym 2. Innymi słowy, pragniemy się dowiedzieć, czy nasza próba pochodzi z populacji o średniej fi = 5 i a= 2.
= p(z < -0,27) =
cI) p(4,9 <M < 5,1) = 0,11 + 0,11
. =
a2) p(M > 5,5) =p(z > 1,35) = Formułujemy
Hl
(hipotezę badawczą)
i
przeciwstawną
do niej Ho
(hipotezę
b2) p(M < 4,5)
zerową).
Hl: Studenci z badania LEARN różnią się pod względem intuicji psychologicznej od populacji studentów. Ho: Studenci z badania LEARN nie różnią się pod względem intuicji psychologicznej od populacji studentów.
..
.
= p(z < -1,35) = 0,09
c2) p(4,5 <M < 5,5) = 0,41 + 0,41 =
..
o
CTG możemy wyznaczyćrozkład statystyki M. Znajomość rozkładu statystyki M pozwala nam na wyliczenie prawdopodobień stwa, że w naszym badaniu otrzymamy średnią spełniającą dane warunki, np. M> 6 lub 3 < M < 5 przy założeniu, że fi = 5. Obliczmy, jakie jest prawdopodobieństwootrzymania w naszym badaniu i przy takim założeniu średniej:
5,5
Dzięki
a3) p(M> 5,72) =p(z > 1,96) = 0,025 b3) p(M < 4;28) = p(z > -1,96) = .......... c3) p(4,28 <M < 5,72) = 0,475
+ 0,475 = .......... 0,025
a1) większej od 5,1 a2)
większej
od 5,5
a3) większej od 5,72
Aby 142
b1) mniejszej od 4,9
c1)
należącej
do
przedziału
(4,9; 5,1)
b2) mniejszej od 4,5
c2) należącej do przedziału (4,5; 5,5)
b3) mniejszej od 4,28
c3) należącej do przedziału (4,28; 5,72)
znaleźć odpowiednie prawdopodobieństwa, musimy zamienić wartości M
na wartości ZM. Błąd standardowy średniej wynosi
aM=
2/
J30
=
0,37.
4,28
Widzimy, że
0,025
o
5,72
otrzdymanie średniej spoza przedziału (4,9 ; 5,1) jest przy przyjętych założeniach b ar zo prawdopodobne (1- 0,22 = ..........).
średniej spoza przedziału (4,5 ; 5,5) jest przy przyjętych założeniach dotr~yma~i~ uzo mmeJ prawdopodobne (1 - 0,82 = ..........).
otrZYdmanie średniej spoza przedziału (4,28 ; 5,72) jest przy przyjętych założeniach b ar zo mało prawdopodobne (1- 0,95 = ..........).
143
Etapy testowania hipotez
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki
Podejmowanie decyzji statystycznych Jeśli rozkład IQ w populacji ma średnią 100 i odchylenie standardowe 15 (;J = 100, (J= 1~), ~o określ prawdopodobieństwo, że średnia IQ (statystyka M) w przeprowadzonym przez Ciebie badaniu (losowa próba 25-elementowa) będzie a) większa od 106
z _ M - f.1 _ M - f.1 M
(J
-
M
Jeśli
ZM
Rozważmy etapy
wnioskowania statystycznego na przykładzie. Chcemy sprawdzić, czy specjalny trening polepszy wyniki w teście IQ. Wylosowaliśmy 16-osobowąpróbę uczniów, którą poddaliśmy treningowi, a następnie zmierzyliśmy IQ. Wiemy, że inteligencja ma w populacji rozkład normalny o J.1 = 100 i a = 16. Przetestujmy hipotezę kierunkową w pięciu różnych próbach.
= 106 -100 = ~ = 2
(J
15
--
--
.JN
3
J25
Określenie zmiennych mułowaniezałożeń i
=2, to p > 0,023.
Zmienna: wynik w teście IQ (zmienna
i ich skal pomiarowych, sforhi otez:
ilościowa)
Z1. Próba losowa N = 16 Z2. Wyniki IQ w populacji mierzone są na skali przedziałowej i mają rozkład N(100, 16)
H1: ,u > 100
Z3. Ho: ,u = 100
Sformułowaliśmy kierunkową hipotezę badawczą, ponieważ
chcemy wykazać, że nasz trening podnosi, a nie obniża IQ. Otrzymanie średniej istotnie niższej od 100 nas nie interesuje.
b) mniejsza od 100 c) większa od 95 d) zawierać się w przedziale (95,105) e) zawierać się w przedziale (98, 102). Ile wyniosą prawdopodobieństwa, gdy próba będzie 9-elementowa?
Wybór testu statystycznego i stat styki: Spełnione są założenia CTG, więc
,uM =,u,
Rozkład lęku w populacji ma rozkład normalny ze średnią,u = 40 i odchylen!e~ stan~ardowym (J= 10. Dla każdej z poniższych prób podejmij decyzję, czy prawdopodoblenstwo, ze została
Statystyka
(J M
ZM
(J = .JN ' czyl'I
ma
rozkład
określenie rozkładu
wiemy, że statystyka M ma rozkład N(,u, (JM), gdzie
,uM =
,
(JM
=
..
N(O, 1)
wylosowana z tej populacji jest mniejsze od 0,05. a) próba N
=9 osób o średniej M =43 z
_ M - f.1 M-
(J M
=M
- f.1
= 43 -
40
(J
10
--
--
.JN
J9
= _3_ '" 0.90 3,33
,'o
iW" <;:~
.
f''>
,{
;\>K'"
'~:1KROK3'
;l;~ \ w~h
~;" ~
f"~
reguły decyzyjnej. Wybór poziomu istotokreślenie obszaru krytycznego i wartości
Ustalenie ności
a,
krytycznej statystyki z: Jeżeli
hipoteza zerowa jest prawdziwa, to statystyka M ma rozkład N(100,4).
Jeżeli
b) próba N = 100 osób z wynikiem M = 43, c) próba N = 81 osób o średniej M = 37,
144
d) próba N= 16 osób o średniej M= 37.
z > Zk, to odrzucamy Ho.
Jeżeli
z < Zk, to stwierdzamy brak podstaw do odrzucenia Ho.
145
Rozdział
Rozkład statystyki
4. Testowanie hipotez statystycznych.
Etapy testowania hipotez
Obliczanie wartości statystyki na podstawie otrzymanych wyników: Rozważmy różne wyniki:
Posługując się danymi zawartymi w powyższym przykładzie, dokonaj weryfikacji
M1 = 104
=
.
a) stosując test dwustronny dla a= 0,05
= ZM3 =
.. .
b) stosując test jednostronny dla a= 0,01
ZM1
=107 M3 =108 M2
ZM2
M4 = 96
ZM4
=
..
=88
ZMS
=
.
Ms
c) stosując test dwustronny dla a = 0,01. M1 Zs
Test jednostronny a= 0,05 Podjęcie
-104 =-3
Z1
-107 = 1,75
M2
M3 =
M4
Z1
Z3
108 =2
Z1
Z2 > Zk
Z3 > Zk
więc
więc
= 96 =-1
Z4
decyzji: więc
b.p.d.o.
decyzja wobec Ho: M2 =
Ho: f.l = 100:
Ho
odrzucamy odrzucamy
Ho
Ho
Ms = 88 Zs =-3
Zs
< Zk
więc
więc
b.p.d.o.
b.p.d.o.
Ho
Ho
decyzja wobec Ho:
107; Zk= 1,65; Z2 =
decyzja wobec Ho: decyzja wobec Ho:
Test dwustronny a= 0,05
decyzja wobec Ho:
Gdy sformułujemy bezkierunkową hipotezę badawczą, zmienią się tylko kroki 1 i 3. Określenie zmiennych i ich skal mułowaniezałożeń i hipotez: Określamy hipotezę badawczą bezkierunkowo
Ustalenie ności
reguły
pomiarowych, sforTest jednostronny a= 0,01
H 1 : f.l *- 100.
decyzyjnej. Wybór poziomu istot-
rx, określenie obszaru krytycznego i wartości
krytycznej statystyki z: Określamy
obszar krytyczny po dwóch stronach
Jeżeli
2,5%
to
rozkładu:
hipoteza zerowa jest prawdziwa,
prawdopodobieństwo
Izl > Zk{Z>
Test dwustronny a= 0,01
otrzyman.ia wyniku
1,96 lub
Z
< -1,96}
jest mniejsze od 0,05.
zk=1,96
146
Rysunek 4.8. Obszar krytyczny z =1,96
• b.p.d.o. Ho- brak podstaw do odrzucenia Ho
147
Rozdział
4. Testowanie hipotez statystycznych. Rozkład statystyki
Powtórzmy: Testy hipotez kierunkowych to testy jednostronne. Testy hipotez bezkierunkowych to testy dwustronne. Wartości krytyczne z, potrzebne do podjęcia decyzji o odrzuceniu lub nieodrzuceniu hipotezy zerowej sprawdzamy w tablicy rozkładu normalnego. Jeżeli Hl: J1 > 100 (kierunkowa hipoteza badawcza) przewiduje wyniki w naszej próbie większe od 100, to bierzemy pod uwagę tylko prawy (dodatni) koniec rozkładu z, a wartością krytyczną z jest wartość, powyżej której znajduje się 5% rozkładu z. W tym przypadku wartością krytyczną z jest 1,64, ponieważ 5% obszaru rozkładu z znaj duj e się powyżej 1,64. W takim przypadku zapada decyzja o odrzuceniu hipotezy zerowej, jeśli z jest większe od 1,65. Analogicznie, jeżeli Hl: J1 < 100 (kierunkowa hipoteza badawcza) przewiduje wyniki w naszej próbie mniejsze od 100, to bierzemy pod uwagę tylko lewy (ujemny) koniec rozkładu z, a wartością krytyczną z jest wartość, poniżej której znajduje się 5% rozkładuz. W tym przypadku wartościąkrytyczną Z jest-1,64, ponieważ 5% obszaru rozkładu z znajduje się poniżej -1,64. W takim przypadku zapada decyzja o odrzuceniu hipotezy zerowej, jeśli z jest mniejsze od -1,64. Porównajmy teraz tę wartość krytyczną z wartością krytyczną otrzymaną dla hipotezy bezkierunkowej przy tym samym poziomie a. Wartości krytyczne dla hipotezy bezkierunkowej uwzględniają, że wartość statystyki może być dodatnia albo ujemna - są położone tak, że połowa znajduje się powyżej wartości dodatniej, a połowa poniżej wartości ujemnej. Dla wybranej przez nas istotności a= 0,05, co oznacza, że będzie nas interesowało 2,5% (0,025) rozkładu z znajdujące się powyżej dodatniej wartości krytycznej i 2,5% (0,025) rozkładu z znajdujące się poniżej ujemnej wartości krytycznej. Rysunek 4.8 pokazuje wartości krytyczne z odczytane z tablicy rozkładu normalnego -1,96 i +1,96 dla a = 0,05. W tym przypadku zapada decyzja o odrzuceniu Ho, jeśli z jest większe niż +1,961ub mniejsze niż-1,96. Można zauważyć, że jeżeli z jest dodatnie, potrzebnajest mniejsza wartość bezwzględna z, że by odrzucić Ho, gdy jest testowana dodatnia hipoteza kierunkowa (np. Hl: J1 > 100) niż gdy jest testowana hipoteza bezkierunkowa. Z tego powodu badacz stosujący testy jednostronne może być podejrzewany o to, że przerobił swoją hipotezę badawczą na kierunkowąpo obejrzeniu wyników, widząc, że otrzymał wynik niepozwalający na odrzucenie hipotezy zerowej za pomocą testu dwustronnego. Aby uniknąć takich podejrzeń, najlepiej jest stosować testy dwustronne nawet wtedy, gdy teoria dokładnie przewiduje kierunek zależności. Jeżeli przyjmiemy a= 0,01 (chcemy się mylić nie częściej niż 1 raz na 100), to przy dodatniej hipotezie kierunkowej wartość krytyczna z wynosi 2,33. W tym przypadku hipoteza zerowa jest odrzucana tylko wtedy, jeżeli z jest większe od +2,33 w teście jednostronnym. Dla hipotezy bezkierunkowej wartości krytyczne są równe: +2,58 i -2,58. W tym przypadku Ho jest odrzucana, jeżeli z jest większe niż +2,58 lub mniejsze niż -2,58.
Etapy testowania hipotez
Określ wartość krytyczną z dla następujących poziomów istotności: a) a = 0,05 dla testu dwustronnego b) a = 0,05 dla testu jednostronnego. Szukamy w tablicach rozkładu normalnego: dla testu dwustronnego P2 = 1/2a i odczytujemy wartość z = 1,96; dla testu jednostronnego P2 = a i odczytujemy wartość z = 1,64.
Określ wartość krytyczną z dla następujących poziomów istotności: c) a = 0,02 dla testu dwustronnego d) a = 0,02 dla testu jednostronnego e) a = 0,01 dla testu dwustronnego f) a = 0,01 dla testu jednostronnego g) a = 0,001 dla testu dwustronnego h) a = 0,001 dla testu jednostronnego.
Test
a= 0,05 a= 0,02 a= 0,01 a= 0,001 jednostronny 1,64 dwustronny
'0'idzim~, ż.e przy tej samej wartości średniej otrzymanej w naszym badaniu może się zdarzyć ze podejmiemy zupełnie inne decyzje dotyczące Ho w zależności od: ' 1. sposobu sformułowania H 1: kierunkowo (test jednostronny) lub bezkierunkowo (test dwustronny); 2. wyboru poziomu ryzyka - poziomu istotności a.
Używ~jąc d~ustronnego testu na poziomie istotności a = 0,01 oraz a = O 05 przeprowad . test hlp~~ez, ze nast~pujący zbiór wyników X: 1, 2, 3, 4, 5, 6, 7, 8, 9 został W;los~wany z dan~ populaCji o rozkładzie normalnym, gdy: a) M = 5; N = 9; f1 = 6,5; (]'= 3
3 (jM= J9=1 dla a
148
1,96
5-65
z = - - ' =-15 1 '
=0,05 Zk =1,96, więc nasza decyzja to b.p.d.o Ho
dla a= 0,01 Zk = 2,33, więc nasza decyzja to b.p.d.o Ho.
149
Rozdział
4. Testowanie hipotez statystycznych.
Rozkład statystyki
Etapy testowania hipotez
Ustalenie reguły decyzyjnej: Posługując się
o
rozkładach
danymi zamieszczonymi w przykładzie 4.9, zweryfikuj hipotezy dla populacji normalnych, gdy:
Poziom istotności dla testu jednostronnego a = 0,05
b).u=6,5;
0'=1
Wartość krytyczna Zk = 1,64
c).u=4;
0'=4
Jeżeli
d) .u=4;
0'=2
e).u=3,5;
0'=2
f) .u=7;
0'=2
g) .u = 3;
O' = 4.
ZM
= 1,64, odrzucimy Ho. Jeżeli
ZM
Obliczanie wartości statystyki:
9
eJ M
Parametry
Zk dla
ZM
a)
.u =6,5
0'=3 -1,5
b)
.u =6,5
0'=2
c)
.u=4
0'=4
d)
.u=4
0'=2
e)
.u =3,5
0'=2
f)
.u=7
0'=2
g)
.u=3
0'=4
a = 0,01
2,33
Decyzja
a = 0,05
Zk dla
b.p.d.o. Ho
1,96
= J25 = 1,8
z= 46-45 =056 1,8 '
Decyzja b.p.d.o. Ho Podjęcie decyzji: Ponieważ ZM
< 1,64, to b.p.d.o. Ho.
SCHEMAT WNIOSKOWANIA Zmienne
Wynik w teście - zmienna ilościowa
Założenia
Spełnione są założenia testu z.
Ho:.u =45
Hipotezy
Wybór testu i rozkład statystyki Wyniki w
teście
< 1,64, b.p.d.o. Ho.
kompetencji szkolnych po gimnazjum
mają rozkład
normalny N(45,9).
Firma AVANTI reklamuje swoje kursy przygotowujące do tego egzaminu, jako dające pewność jego pomyślnego zdania. Spośród uczniów, którzy ukończyli ten kurs wylosowano 25osobową próbę. Średni wynik w tej grupie wyniósł 46 punktów. Czy mógłbyś na tej podstawie potwierdzić prawdziwość reklamy?
Reguła
H1:.u > 45
Statystyka Z ma rozkład normalny N(0,1).
decyzyjna
Test jednostronny a
=0,05; Zkryt =1,64;
Odrzucimy Ho, jeżeli z> 1,64 .
Obliczenia eJ M
=
9 J25 = 1,8
Decyzja
z=
46-45 =0,56 1,8
b.p.d.o. Ho
SCHEMAT WNIOSKOWANIA Określenie zmiennych i ich skal mułowaniezałożeń i hipotez::
pomiarowych, sfor-
Zmienne (skale pomiarowe): wynik w teście - zmienna ilościowa Założenia:
N(45,9), próba losowa N = 25
150
Statystyka z ma
rozkład
normalny N(0,1)
,,-(,
C:~J~~enie4.12. ..,' ,,"
Dziewię~iu uczniów szkoły artystycznej wypełniało test językowy i popełniło następującą licz-
bę błędow: 13,10,11,12,13,14,15,16,13.
M=13N=9
Hipotezy: Ho: .u = 45; H1 : .u > 45
Wybór testu i ustalenie
'j'.
rozkładu statystyki:
~rzeprowadź test hipotezy, że uczniowie szkoły artystycznej nie różnią się pod względem liczby błędów w teście językowym od a) populacji N(14,2) b) populacji N(11,2) c) populacji N(12,3) d) populacji N(15,3). Zastosuj test dwustronny i wybierz poziom istotności a = 0,05.
151
-
Etapy testowania hipotez
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki
c) N(12,3) SCHEMAT WNIOSKOWANIA
a) N(14,2) SCHEMAT WNIOSKOWANIA
Zmienne Zmienne Założenia
Spełnione są założenia testu
z.
Założenia
Spełnione są założenia
testu z.
Spełnione są założenia
testu z.
Hipotezy Hipotezy
Wybór testu i rozkład statystyki
Wybór testu i rozkład statystyki
Reguła
Reguła decyzyjna
decyzyjna
Obliczenia Obliczenia Decyzja Decyzja
d) N(15,3) SCHEMAT WNIOSKOWANIA
b) N(1l,2) SCHEMAT WNIOSKOWANIA
Zmienne Zmienne Założenia
Hipotezy
Wybór testu i rozkład statystyki Reguła
decyzyjna
Spełnione są założenia testu z.
Założenia
Hipotezy
Wybór testu i rozkład statystyki Reguła
decyzyjna
Obliczenia Obliczenia
Decyzja
Decyzja
153 152
Ryzyko
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki
Etapy wnioskowania statystycznego na podstawie wydruku komputerowego Omówiliśmy procedurę testowania hipotez na podstawie porównania otrzymanej wartości statystyki z odpowiednią wartością krytyczną· Dziś statystyki obliczane są najczęściej przez komputer, a na wydrukach zamiast wartości krytycznych podawane są prawdopodobieństwa. Przy dostępnej mocy obliczeniowej komputerów wyliczenie dokładnychprawdopodobieństwnie stanowi żadnego problemu. Drukowane prawdopodobieństwoto prawdopodobieństwo uzyskania, przy założeniuprawdziwościHo, bezwzględnej wartości statystyki równej lub większej od bezwzględnej wartości statystyki wyliczonej z naszej próby. Wartość bezwzględna
błędu
Porównanie wartości prawdopodobieństwawydmk;:>wanef/o przy '!"~rtości statystyki z wybranym poziomem IStotnoscl a.
3:~i: ;:~~~~i ~~~:f~fe~~~bieństwa wydrukuje komputer, jeżeli w badaniu otrzymaliśmy ZM = 1?
oznacza pomijanie znaku liczby.
Jeżeli średnia, którą otrzymaliśmy w naszym badaniu, po standaryzacji wynosi 2, to na wydruku otrzymamy prawdopodobieństwozwiązane z ZM= 2 lub ZM = -2, ponieważ standardowo pakiety statystyczne wykonują test dwustronny (testująhipotezę bezkierunkową). Dla ZM = 2 wydrukowana wartość p
Sz~kamy w tablicach wartości P2 dla z = 1. Wynosi ono P2 = O 1587 stWierdzamy brak podstaw do odrzucenia hipotezy zerowej. ,.
ZM
Odrzucamy Ho, gdy p (poziom istotności z wydruku)
f.1<5
ZM
P2 (wartość drukowana na wydruku komputerowym)
Decyzja
0,1587
b.p.d.o. Ho
1
wartości p na wydrukach komputerowych
ZM
dotyczą hipotez niekierunkowych
ZM
1,26
P < 0,05
ZM
2,1
ZM
1,87
f.1 7':5
0,05,
Wykonaj polecenie z przykładu dla następujących wartości średnich.
podstaw do odrzucenia Ho·
f.1>5
>
P2
będzie odpowiadała wartości P2 w tablicach
rozkładu normalnego (p = 0,0228). Jeżeli to prawdopodobieństwo jest mniejsze od założonego poziomu istotności (a= 0,05, a= 0,01 lub a= 0,001), to odrzucamy Ho· Jeżeli nie, to stwierdzamy brak
Hl
Ponieważ
2,41
Etapy testowania hipotez z wykorzystaniem wydruku komputerowego przedstawiają się następująco:
Ryzyko Określeniezmiennych i ich skal pomiarowych, sformułowaniezałożeń i hi otez.
Mó
~
.,
''im~
:,,, rpKłłO~ ~"
"""" ~
;t ~
Wybór testu i określenie rozkładu statystyki.
Ustalenie reguły decyzyjnej. Wybór poziomu istotności.
154
błędu
.J~k powiedzi~ł.Lem, "Statystyka
niczego nie dowodzi, czyni tylko wszystko mmeJ lub bardZIej prawdopodobnym". Czy ~ożliwejest otrzymanie średniej 7, przy założeniu że 30-elementow .b ale (w od a) a pochodZI z populacji o fJ = 5? prawdopodobne. DecydUjemy na odrzucenie H. . fJ = 5 M .Y bardzo ł .. bł d l O' • ozemy pope a e' prawdopodobieństwo popełnienia tego błpdu bpd . .. d ' mc ą;,k . .. . '( '( zIe mnIejSZe o p~zlOmu ryzy a, ktore zgodzIllsmy SIę przyjąć: 5 pomyłek na 100 de .. (O 05) Ta wlk' . ł' . CYZJ1 , . . le osc za ozonego ryzyka nazywa SIę poziomem istotności i oznaczanaj' est Jako a.
mało
MOŻ~IWE, zależn~ści się więc
może t~P~oć
155
Ryzyko
Rozdział 4. Testowanie hipotez statystycznych. Rozkład statystyki Decyzje statystyczne są binarne - albo odrzucamy.hipotezę ~erową, albo jej ni.e odrzucamy. Dokładnie tak jak w życiu, gdy przychodzI do nas kll~nt p~ac.ący pod~~banknotem. Możemy banknot odrzucić albo zaakceptowac. Jezell odrzucIll~:ny~SZYWY banknot, to podjęliśmy prawidłową decyzję· Jeżeli nie odrzuciliśmy ~aI;;motu prawdziwego, to nasza decyzja również była ~rawidłowa. J:~~li jednak przyjęliśmyfałszywy banknot lub.od~zuciliśmy~rawdzI~,to p~~ełmhsmybłąd. Z podobną sytuacją mamy do czymema przy podeJm?wamu decyzJI statysty~z~ych. Różnią się one jednak od życiowychtym, że dokładme znamy prawdopodobIenstwo popełnienia błędu.
.. Są cztery możliwe rezultaty naszych decyzJI: l. 2. 3. 4.
odrzucenie fałszywej Ho, nieodrzucenie prawdziwej Ho, odrzucenie prawdziwej Ho, nieodrzucenie fałszywej Ho·
Dwie pierwsze są decyzjami prawidłowymi. Odrzu~enie prawdziwej HonazY!'amy błędem pierwszego rodzaju (odrzuciliśmyprawdzIWY banknot)- ~łąd drugIego rodzaju pojawia się, kiedy fałszywa Ho nie jest odrzucana (przYJęllsmy fałszywy banknot).
Jeżeli odrzucimy prawdziwąhipotezę Ho' to popełniamy błąd pierwszego rodzaju.
Jeżeli nie odrzucimy fałszywej hipotezy Ho' to popełniamy błąd drugiego rodzaju.
Prawdopodobieństwopopełnieniabłędu I rodzaju nazywamy p~ziome",l i.stot~o
ści _ ryzykiem błędu, który skłonni jesteśmy zaakceptować. Wybor wartosc~ pOZI~ mu istotności zależy od badacza i od tego, jak "ostro" chce on weryfikowac swoJe hipotezy. W naukach społecznych przyjmujemy zazwyczaj wartość a~ 0,05. Czasem może nam zależeć na tym, aby ryzyko błędu było niższe (np. badama medyczne), wtedy możemy ustalić a= 0,01 (możemy pomylić.sięraz na.s~o) lub a= 0,001 (~o żerny pomylić się raz na tysiąc). Czasem interpretujemy ~m~, gdy I! ~ 0,1, okreslając je jako istotne na poziomie tendencji st~ty~tyczn~j.Taki~ ~m:a,są sygn~łe~: że replikacja badania ze zwróceniem szczegolneJ uwagI na mozhwe zrodła wanancJI niewyjaśnionej może dać wyniki istotne statystycznie. . . . . . Gdy odrzucamy Ho, grozi nam popełnieniebłędu I r~dzaJu. Ale .Jezell me odrzucimy Ho, to też możemy popełnić błąd, polegający na meodrzucemu FAŁSZYWEJ
156
Ho. Jest to błąd II rodzaju.
błędu
Prawdopodobieństwo
niepoprawnego odrzucenia prawdziwej Ho (błąd I rodzaju) jest równe a. Nowy symbol, p (beta), określa prawdopodobieństwobłędu II rodzaju (nieodrzucenie fałszywej Ho). Skoro regułą decyzyjną jest albo odrzucić Ho, albo nie, prawdopodobieństwo poprawnego odrzucenia fałszywej Ho wynosi l - p. Tabela 4.4. Decyzje wobec Ho i towarzyszące im rodzaje Odrzucamy Ho
Ho prawdziwa Ho
fałszywa
Błąd
Nie odrzucamy Ho
I rodzaju a
1-fJ
©
błędów
1-a Błąd
©
1/ rodzaju fJ
Tabela 4.4 przedstawia symbole używane do określenia prawdopodobieństwa z tych błędów. Błąd I rodzaju pojawia się, kiedy prawdziwa Ho jest odrzucona, a błąd II rodzaju pojawia się, gdy fałszywa Ho nie jest odrzucona. Beta (j3) oznacza więc prawdopodobieństwopopełnienia błędu II rodzaju. Warto zaznaczyć, iż dla każdego testu prawdopodobieństwa popełnienia błędów I i II rodzaju są wzajemnie przeciwstawne. Najlepsza strategia podejmowania decyzji powinna oczywiście minimalizować oba rodzaje błędów. Niestety, próba zmniejszenia prawdopodobieństwabłędu I rodzaju powoduje w rezultacie wzrost prawdopodobieństwa błędu II rodzaju. To znaczy, że jeżeli eksperymentator przyjmuje a~ 0,?1 zamiast a= 0,05, aby zmniejszyć szansęniepoprawnegoodrzucenia prawdZIweJ Ho, rezultatem będzie wzrost prawdopodobieństwa nieodrzucenia fałszy wej Ho. Im mniejsze jest ryzyko błędu I rodzaju, tym większe jest prawdopodobieństwo popełnienia błędu II rodzaju. Niemożliwe jest jednoczesne minimalizowanie ryzyka popełnienia obu błędów, dopóki nie zmieni się sposobu przeprowadzania badania i nie uwzględni dodatkowych przypadków lub nie zastosuje innego testu statystycznego. Prawdopodobieństwo błędu II rodzaju pozwala nam na określenie mocy testu statystycznego, która jest definiowana jako prawdopodobieństwopoprawnego odrzucenia fałszywej Ho.
każdego
Moc testu statystycznego jest zdefiniowana jako prawdopodobieństwo poprawnego odrzucenia fałszywej Ho: moc testu
=1 - J3
Moc testu określa jego zdolność do wykrywania różnic. Ogólnie mówiąc, im większa moc testu, tym większa jestjego zdolność do wykrycia różnic między prawdziwą wartością parametru a hipotetyczną wartością przyjętą w hipotezie zerowej.
157
Rozdział
4. Testowanie hipotez statystycznych.
Jeżeli
Rozkład statystyki
hipoteza zerowa jest fałszywa, moc testu dla pojedynczej się, gdy: • zmniejsza się a, • zmniejsza się N • i zwiększa się er.
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole średniej
zmniejsza
Test jednostronny ma większą moc niż test dwustronny, pod warunkiem że hipoteza kierunkowa ma prawidłowy kierunek. Moc testu zwiększa się także ze wzrostem różnicy między prawdziwąwartościąJ1 a hipotetyczną wartościąJ1 przyję tą w Ho. Jeżeli hipoteza zerowa jest prawdziwa, a przyjęte założenia słuszne, jedynym czynnikiem wpływającym na prawdopodobieństwobłędu I rodzaju jest wartość a ustalona przez eksperymentatora. Warto pamiętać, że niestatystyczne informacje wpływają także na decyzję dotyczącą wyniku badania. Badacz często ma możliwośćpowtórzenia eksperymentu i oszacowania jego rzetelności. Rzetelność wyników eksperymentu jest także oceniana na tle podobnych badań. Na moc testu wpływa również wariancja zmiennej, która może być kontrolowana przez badacza na przykładprzez systematycznąkontrolę wpływów zewnętrznych na pomiar. Zachęcamy Czytelnika do zaznajomienia się z problemem określania mocy testu w literaturze [3, 5, 9, 10, 11].
Podsumowanie Wyniki, które pozwalają odrzucić Ho na poziomie istotności a = 0,05 są w naukach społecznych określane jako istotne statystycznie. Wartość statystyki zwią zanej z poziomem ajest nazywana wartością krytyczną tej statystyki. Kierunkowa hipoteza badawcza określa kierunek różnic między wartością statystyki a parametrem określonym w hipotezie zerowej. Bezkierunkowa hipoteza badawcza to taka, w której kierunek różnic nie jest określony. Testy hipotez kierunkowych to testy jednostronne. Testy hipotez bezkierunkowych to testy dwustronne.
158
Test t Studenta. Pojęcia
Przedział ufności
kluczowe: test f Studenta dla jednej próby; test f Studenta dla prób
zależnych;
test f Studenta dla prób
Nowe symbole: f, D, D w, Os, dr,
niezależnych; przedziały ufności
SM, SM D
Rozkład
t Studenta
Nauczyliśmy się, jak testować hipotezęmówiącą o tym, że próba pochodzi z populacji o znanym rozkładzie N(jL, a). Możemy skorzystać z CTG i porównać otrzymaną średnią w próbie z rozkładem średnich. W takim modelu przyjmujemy, że f1 oraz asą znane w populacji. Odpowiadający temu modelowi test nazywa się testem z (od statystyki, której używamy). Co jednak zrobić, kiedy aw populacji jest nieznane, a jest to przecież bardzo częsta sytuacja? Wiemy już, że odczylenie standardowe (s) z próby stanowi dobry estymator a: Można więc do wzoru na z:
z
M-J.l. " =- - zamiast aM po d stawIC CYM
sM
=
s
r-;:;'
-vN
Ale czy tak wyliczone z będziemy mogli porównać z tablicami rozkładu normalnego? Okazuje się, że nie zawsze. Tak wyliczona statystyka ma rozkład normalny tylko dla bardzo dużych prób. Dla prób N < 30 ma ona inny rozkład. Otrzymujemy w tym przypadku rodzinę rozkładów nazwanych rozkładami t Studenta, od pseudonimu matematyka W.S. Gossetta, który je zdefiniował. Statystyka t jest używana do testowania hipotez dotyczących średniej przy założeniu, że rozkład zmiennej w populacji jest normalny.
159
Rozdział
Zastosowanie testu t Studenta do testowania hipotezy dla pojedynczej próby
5. Test t Studenta. Przedział ufności
Jeżeli zbiór Nwyników
został wylosowany z populacji o rozkładzie normalnym
ze średnią,u i nieznaną wariancją, to statystyka t ma (opisany w odpowiednich tablicach) rozkład t Studenta
M-Jl
t=--
df=N-1
s/JN
Warto zauważyć, iż t to rodzina rozkładów, które zależą od rozmiaru próby. Gdy N dąży do nieskończoności, rozkład t Studenta zbliża się do rozkładu normalnego. Aby w praktyce weryfikować hipotezę, musimy wpierw wyliczyć t, podstawiając do wzoru M - średnią z próby, s - odchylenie standardowe wyliczone z próby, N liczebność próby oraz 11- zakładanąw Ho średnią w populacji. Jeżeli Ho jest prawdziwa, to otrzymana wartość t powinna być bliska O. Im bardziej t różni się od zera, tym mniej prawdopodobne jest otrzymanie takiej wartości, przy założeniu, że Hojest
Jest jeden warunek ograniczający (proporcja soku do spirytusu) - tracimy więc jeden stopień swobody.
Są dwa warunki ograniczające nasze decyzje (stosunek soków jasnych do ciemnych, proporcja spirytusu) - tracimy więc dwa stopnie swobody.
Mamy 5 - 1 - 4 stopnie swobody, co oznacza, że możemy wlać do koktajlu dowolną ilość każdego z 4 soków. Nie mamy żadnej swobody w decydowaniu o ilości spirytusu - jest ona wyznaczona przez ilość soku.
Mamy 5 - 2 = 3 stopnie swobody, co oznacza, że możemy wlać do koktajlu dowolną ilość 3 soków. Nie mamy żadnej swobody w decydowaniu ani o ilości czwartego soku, ani o ilości spirytusu - są one wyznaczone przez podanie proporcji w przepisie.
Natomiast w kolumnach znajdująsię wartości poziomu istotności. Tablica rozt S~d~nta jest tak sko~struowana, że a związane z wartościami krytycznymi t dl~ te~to,,: jednostronnych l dwustronnych, przy tej samej liczbie stopni swobody, znaj.duj~ Sl~ w ty~h.samym wierszu w tabeli, lecz oznaczają wartości dla różnych pozlOmow lstotnoscl. Na przykład odczytujemy z tabeli, że 2,583 jest wartościąkrytyczną zarówno dla df= 16 i a= 0,01 przy teście jednostronnym, jak i dla df= 16 i a= 0,02 przy teście dwustronnym. kładu
prawdziwa.
Statystyka t =
Tablice
rozkładu
t Studenta
M-Jl
G;
s/vN następującymi warunkami:
ma
rozkład
t Studenta z N-l stopniami swobody pod
1. Wyniki pochodzą z populacji o rozkładzie normalnym. 2. Wyniki były losowane niezależnie.
Co znajduje się w tablicach rozkładu t Studenta (patrz: tablice na końcu książki)? Wiersze tabeli nazywane są stopniami swobody, inaczej df od angielskiej nazwy degrees offreedom.
Ogólnie mówiąc, stopnie swobody mogą być określone jako miara, związana ze zbiorem informacji.
Zastosowanie testu t Studenta do testowania hipotezy dla pojedynczej próby
Jest to miara stopnia, w jakim wartości w tym zbiorze mogą się zmieniać, spełniając jednocześnie warunki, które są na zbiór nałożone.
Pojęcie stopni swobody łatwo zobrazować na przykładzie przyrządzania koktajli.
160
Koktajl 1.
Koktajl 2.
4 soki owocowe (cytrynowy, pomarańczowy, wiśniowy, porzeczkowy) połączyć ze spirytusem w proporcji 10: 1.
4 soki owocowe (cytrynowy, pomarańczowy, wiśniowy, porzeczkowy) połączyć tak, aby soków jasnych było dwa razy więcej niż soków ciemnych, następnie dodać spirytus w proporcji 1: 1O.
W koktajlach mamy 5 składników - więc musimy określić 5 liczb mówiących o ilościach danego płynu - gdyby nie było warunków ograniczających (proporcje), mielibyśmy pełną swobodę (5 stopni).
Bada~? p~ziom .Ię.ku
pulaCJI o srednleJ J1 s 8.
=
Przetestuj Jak
w pew~ej próbie. Czy można uznać, że została ona wylosowana z po50? Srednia w próbie (N = 16) wynosi M = 46, odchylenie standardowe
=
hipotezę zerową. wykorzystując
zmienią się
Twoje decyzje,
jeżeli
dwustronny test
t,
gdy a = 0,05.
wybierzesz a = 0,01?
Odpowiedz na pytania, stosując SCHEMAT WNIOSKOWANIA.
161
Rozdział
5. Test t Studenta.
Zastosowanie testu t Studenta do testowania hipotezy dla pojedynczej próby
Przedział ufności
SCHEMAT WNIOSKOWANIA POZIOM LĘKU (zmienna ilościowa).
Zmienna
Spełnione są założenia
Założenia
Korzystając z
testu t.
Ho: fi = 50 Próba pochodzi z populacji o fi = 50.
Hipotezy
a) Średnia w próbie (N = 25) wynosi M = 46, odchylenie standardowe s = 8
H1: fi *- 50 Próba nie pochodzi z populacji o fi = 50. Wybór testu i rozkład statystyki Reguła
Zmienna
Statystyka t ma rozkład t Studenta dla df = N - 1 = 15.
Założenia
a= 0,05; tkryt (15) = 2,131; odrzucimy Ho,
decyzyjna
t>2,131Iubt<-2,131
Hipotezy
46 - 50
Wybór testu i rozkład statystyki
jeżeli
Obliczenia
t=
-4
=-=-2
8/1J16 2
Reguła
b.p.d.o. Ho
Decyzja
Określeniezmiennych i ich ska! pomiarowych, sfor mułowanie założeń
t.
decyzyjna
m
i hipotez:
Hipotezy:
Ho: fi = 50 Próba pochodzi z populacji o fi = 50 H 1: fi *- 50 Próba nie pochodzi z populacji o fi
Spełnione są założenia testu
Obliczenia
Zmienna POZIOM LĘKU (zmienna ilościowa) ma w populacji rozkład normalny, M = 46, s = 8, N = 16
= 50
Wybór testu i ustalenie rozkładu statystyki: Statystyka t ma rozkład t Studenta dla df
danych zawartych w przykładzie 5.1, przetestuj hipotezę zerową dla następują
cych prób:
=N - 1 =15
Decyzja b) Średnia w próbie (N = 16) wynosi M = 48, odchylenie standardowe s = 8 Zmienna Założenia
Spełnione są założenia testu
t.
Hipotezy
Wybór testu i rozkład statystyki Reguła
decyzyjna
Obliczenia
Ustalenie a= 0,05
Poziom istotności: Wartość
reguły decyzyjnej:
krytyczna:
Odrzucimy Ho, jeżeli
tkryt (15) = 2,131 t> 2,131 lub t < -2,131
Obliczanie wartości statystyki:
Decyzja c) Średnia w próbie (N = 25) wynosi M = 48, odchylenie standardowe s = 8 Zmienna Założenia
t=
46 - 50
8/J16
-4
testu t.
Hipotezy
=-=-2
2
Wybór testu i rozkład statystyki Podjęcie
decyzji:
-2> -2,131, więc brak podstaw do odrzucenia Ho (b.p.d.o. Ho). Stwierdzamy, że próba nie różni się od populacji pod względem poziomu lęku.
162
Spełnione są założenia
Test t, w którym porównujemy średnią zmiennej w jakiejś grupie ze średnią w całej populacji jest często nazywany testem t dla jednej próby.
Reguła
decyzyjna
Obliczenia
Decyzja
163
Zastosowanie testu t Studenta do testowania hipotezy dla pojedynczej próby
Rozdział 5. Test t Studenta. Przedział ufności
d) Średnia w próbie (N = 16) wynosi M = 46, odchylenie standardowe s = 4
Wybór testu i ustalenie
rozkładu statystyki:
Zmienna Spełnione są założenia testu
Założenia
t.
Statystyka t ma
rozkład
t Studenta dla dr =N -
1 =29.
Hipotezy
Ustalenie
Wybór testu i rozkład statystyki istotności:
Reguła decyzyjna
Poziom
Obliczenia
Wartość ność
reguły decyzyjnej:
a = 0,05
krytyczna: Nie musimy
znać wartości
krytycznej
t, z wydruku odczytamy istot-
p.
Odrzucimy Ho,
jeżeli
p ::;; 0,05
Decyzja
Obliczanie wartości statystyki wykonuje komputerowy pakiet statystyczny:
e) Średnia w próbie (N = 25) wynosi M = 46, odchylenie standardowe s = 4
Wyniki
przedstawiają
tabele 5.1 i 5.2.
Zmienna Spełnione są założenia testu
Założenia
t. Błąd
Odchylenie standardowe
Hipotezy
2,15
Wybór testu i rozkład statystyki Reguła decyzyjna
standardowy średniej 0,39
Tabela 5.2. Test dla jednej próby zmiennej TIME1
Obliczenia
Wartość
TIME1
Decyzja
=5
t
df
Istotność (dwustronna)
Różnica średnich
2,55
29
0,016
1,00
Podjęcie
W badaniu LEARN nie znamy odchylenia standardowego zmiennej INTUICJA w populacji. Możemy przetestować hipotezę mówiącą, że badana próba nie różni się pod względem intuicji psychologicznej od populacji ( Ho: f.l = 5) za pomocą testu t. Dla potrzeb przykładu przeanalizujemy pierwszy pomiar tej zmiennej - TIME1.
testowana
0,016 < 0,05,
decyzji:
więc możemy odrzucić
Ho
Badana grupa różni się istotnie statystycznie od populacji pod względem intuicji psychologicznej: t = 2,55 P < 0,02 dla pierwszego sprawdzianu (TIME1).
SCHEMAT WNIOSKOWANIA Określenie zmiennych i ich skal pomiarowych, sformułowaniezałożeń i
hipotez:
Intuicja psychologiczna TIME1 (zmienna ilościowa) Założenia:
Na podstawie przykładu 5.2 i zamieszczonych poniżej wydruków przeanalizuj analogicznie drugi pomiar zmiennej INTUICJA - TIME 2 ( Ho: f.l = 5)
Zmienna TIME1 ma w populacji rozkład normalny, M = 6, s = 2,15, N = 30 Hipotezy: Ho: f.l = 5 Próba pochodzi z populacji o średniej intuicji psychologicznej równej 5.
164
H 1: f.l* 5 Próba różni się od populacji pod względem średniej intuicji psychologicznej.
Odchylenie standardowe 2,61
Błąd
standardowy średniej 0,48
165
Rozdział
5. Test t Studenta.
Przedział ufności
Zastosowanie testu t do testowania hipotezy o równości średnich ...
Hipoteza badawcza może zostać sformułowana trojako:
Tabela 5.4. Test dla jednej próby zmiennej TIME2 Wartość
t TIME2 2,10
testowana = 5
df
Istotność (dwustronna)
Różnica średnich
29
0,045
1,00
SCHEMAT WNIOSKOWANIA Zmienne Założenia
Spełnione są założenia
testu
t.
Hipotezy
Wybór testu Reguła decyzyjna
Wartość statystyki
i decyzja
Zastosowanie testu t do testowania hipotezy o równości średnich na podstawie dwóch prób zależnych (schemat badawczy: Pretest-Posttest)
166
Bardzo popularnym, choć rodzącym sporo problemów metodologicznych [por. 5, 6], jest schemat badawczy: pretest-posttest. Pozwala nam on na zbadanie, czy nastąpiła zmiana w zakresie naszej zmiennej zależnej między pierwszym (pretest) a drugim (posttest) pomiarem. Przykład: badamy wpływ obecności innych na liczbę popełnianych błędów. Badani uczą się pisać bezwzrokowo na komputerze, który zapisuje wyniki. Następ nie podchodzimy do badanego i przyglądamy się, jak mu idzie (komputer zapisuje wyniki). Zmienna niezależna: obecność innych osób (jest, brak) to zmienna nominalna. Zmienna zależna: liczba popełnianych błędów to zmienna ilościowa. W zbiorze LEARN możemy policzyć różnice między wynikami w pierwszym teście i wynikami w drugim teście, przeprowadzonym po dwóch dniach. Mamy dwa zestawy pomiarów - po dwa dla każdej osoby badanej. To, że są one połączone w pary powoduje, że pomiary są od siebie zależne. Mówimy, że są to próby zależne, możemy więc dla każdej osoby utworzyć nową zmienną D, będącą różnicą między pomiarem początkowym i końcowym. Jeżeli oczekujemy wzrostu wartości zmiennej, to rozsądniej jest od wyniku końcowego odejmować wynik początkowy: Dw = Xk - Xp. Jeżeli oczekujemy spadku wartości zmiennej w drugim pomiarze, to od wyniku początkowego odejmiemy końcowy: D s = Xp - X k . Pozwoli nam to uniknąć wartości ujemnych testu t.
H 1: Jio>t=O ~ wyniki w obu pomiarach różnią się istotnie od siebie H 1: Jio> O ~ nastąpił wzrost wartości zmiennej zależnej H1 : Jio < O ~ nastąpił spadek wartości zmiennej zależnej
Hipoteza zerowa musi być sformułowana precyzyjnie Ho: JiD = O. Teoretycznie możemy sobie wyobrazić, że wiemy, jak duża powinna być różnica i możemy sformułować hipotezę, np. Ho: JiD = 10, ale w praktyce zdarza się to niezmiernie rzadko. Proszę zauważyć, że umiemy już testować hipotezę Ho: JiD = O. Jeżeli możemy założyć, że rozkład różnic w populacji jest normalny lub mamy wystarczającodużąpróbę, to możemy zastosować test t Studenta, takjak w poprzednich zadaniach. Musimy utworzyć nową zmienną D - różnicę między wynikami, policzyć jej średnią, odchylenie standardowe i błąd standardowy.
CI gdzie: M D
-
różnic, S M D
-
M_D_=_DJ_N
~_SM_n JN =
średnia różnica, N -liczba par pomiarów, SD - odchylenie standardowe błąd standardowy różnicy.
Teraz możemy przetestować hipotezę dotyczącą różnicy między wynikami pierwszego i drugiego pomiaru.
Sześć osób otrzymywało specjalny lek mający obniżyć poziom cholesterolu we krwi. Poziomy cholesterolu zmierzone u badanych przed i po kuracji przedstawiają się następująco: Przed kuracją
Po kuracji
Ds
Pacjent 1
287
255
32
Pacjent 2
350
269
81
Pacjent 3
343
340
3
Pacjent 4
309
247
62
Pacjent 5
343
323
20
Pacjent 6
309
267
42
Czy nastąpiła istotna redukcja poziomu cholesterolu? Przetestuj hipotezę, stosując SCHEMAT WNIOSKOWANIA (a= 0,05) i wykorzystując obliczenia cząstkowe.
167
Zastosowanie testu t do testowania hipotezy o równości średnich ...
Rozdział 5. Test t Studenta. Przedział ufności
Określeniezmiennych i ich ska! pomiarowych, sfor~ mułowanie założeń i hipotez: Zmienna niezależna: LEK (zmienna nominalna na dwóch poziomach: 1 - przed zaży ciem, 2 - po zażyciu) Zmienna zależna: POZIOM CHOLESTEROLU (zmienna ilościowa)
SCHEMAT WNIOSKOWANIA Zmienna niezależna: LEK (zmienna nominalna na dwóch poziomach: 1 - przed zażyciem, 2 - po zażyciu)
Zmienne Zmienna
zależna
Spełnione są założenia
próby losowe, pomiary zależne
Hipotezy: Ho: /lo = O Poziom cholesterolu po kuracji nie zmieni się·
Wybór testu i rozkład statystyki Reguła
decyzyjna
Obliczenia
Statystyka t ma rozkład t Studenta dla df = N - 1 = 5.
t> 2,571 lub t < -2,571.
Odrzucimy Ho, jeżeli
= 28,29' =11 6
s
H : /lo*- O Poziom cholesterolu po kuracji ulegnie zmianie.
M
1
Wybór testu i ustalenie rozkładu statystyki:
testu t.
Ho: /lo = O Poziom cholesterolu po kuracji nie zmieni się· H1 : /lo*- O Poziom cholesterolu po kuracji ulegnie zmianie.
Hipotezy
Założenia:
Zmienna CHOLESTEROL ma w populacji rozkład normalny, Mo = 40, So = 28,29, N = 6;
POZIOM CHOLESTEROLU (zmienna ilościowa)
Założenia
"
.J55
'
40 116 ,
t=-=345 '
3,45 > 2,571, więc możemy odrzucić Ho. Stwierdzamy, że poziom cholesterolu po kuracji obniżył się.
Decyzja
Spełnione są założenia testu t. df =N - 1 =5, gdzie N to liczba par pomiarów. Ustalenie reguły decyzyjnej: Poziom istotności: Wartość
krytyczna:
tkl}'f(5)
=2,571
Podejmując decyzję
t> 2,571 lub t < -2,571
Obliczanie wartości statystyki:
Ponieważ oczekujemy spadku wartości zmiennej w drugim pon;iarze" więc: Ds = Xp - X k ,
gdzie X to pretest (pomiar początkowy), a Xk to posttest (pomiar koncowy). p
M o =40
s
=28,29
M"
= ~ =11,6 '\iN
t_
-40
- 28,29/.J5
= -40 = -3,45 11,6
D - różnica pomiędzy parą pomiarów średnia różnica
Mo SM
D
błąd standardowy różnicy par pomiarów
N - liczba par pomiarów Podjęcie decyzji:
3,45 > 2,571, więc możemy odrzucić Ho. Stwierdzamy, że otrzyma~~ wy~ik. nale~y do obszaru odrzuceń Ho, czyli uznajemy, że poziom cholesterolu obnlzył Się Istotnie po
168
kuracji nowym lekiem.
decyzj ami statystycznymi
a wyj aśnieniami
a= 0,05
Odrzucimy Ho, jeżeli
So
Różnica między
o odrzuceniu Ho w przykładzie 5.3, stwierdziliśmy, że otrzymanie zaobserwowanej średniej M D = 40 jest mało prawdopodobne przy założeniu, że wyniki pochodzą z populacji o /lD = O(hipoteza zerowa). Co z tego wynika? Czy możemy stwierdzić,że lekarstwo powoduje obniżenie poziomu cholesterolu? Ważne jest rozróżnieniemiędzy decyzją, która może być podjęta odnośnie do Ho, a podawaniem wyjaśnień otrzymanych wyników. Możliwe jest podjęcie prawidłowej decyzji statystycznej i wyciągnięcie niewłaściwych wniosków. Rozważmyna tym przykładzie alternatywne wyjaśnienie otrzymanego wyniku. Być może w badaniu wzięli udział ochotnicy, którzy mieli bardzo wysoki poziom cholesterolu i zgłoszenie się do badań było jednym z szeregu działań, które te osoby podjęły, aby ratować się przed zagrożeniem zawałem. Nie możemy wykluczyć tego, że ich poziom cholesterolu mógłby się obniżyć, nawet gdyby nie brali udziału w tym programie, np. na skutek zmiany diety czy zwiększeniapoziomu aktywności fizycznej. Interpretacja otrzymanego wyniku byłaby dużo łatwiejsza, gdybyśmy ochotników podzielili losowo na dwie grupy. Pierwsza otrzymywałaby lek (grupa eksperymentalna), druga czekałaby na otrzymanie leku (grupa kontrolna). Od obu grup mielibyśmy dwa pomiaru poziomu cholesterolu, co pozwoliłoby porównywać M D grupy eksperymentalnej zamiast do 0, to do średniej z grupy kontrolnej. Jeżeli różnica między średnimi w dwóch grupach byłaby istotna statystycznie, to eksperymentator miałby większąpewność co do przyczyny wyników. Zawsze warto zadać sobie pytanie, czy otrzymane przez nas istotne statystycznie wyniki dadzą się inaczej wytłumaczyć. Trzeba pamiętać, że decyzja statystyczna powinna być odróżniana od konkluzji badawczych. Wynik może być statystycznie istotny, ale
169
Rozdział
5. Test t Studenta.
Przedział ufności
Zastosowanie testu t do testowania hipotezy o równości średnich ...
wątpliwy
- ze względu na inne możliwe interpretacje - i niczego nierozstrzygający. Osobnym problemem jest możliwość generalizacji otrzymanych wyników, która zależy od sposobu dobrania próby.
Polityk chce się dowiedzieć, czy złożenie wyborcom obietnicy zwiększenia wydatków na cele społeczne wpłynie na podwyższenie jego notowań. ~a on .dost~p ~o dany~h dotycz~cych popularności kilku innych kandydatów przed i po tym Jak obl~call zWlększe~le wydatkowo na
cele
społeczne.
Co może wywnioskować z danych przedstawionych w tabeli 5.5 inne czynniki nie wpływały na wskaźniki popularności)?
że żadne
Tabela 5.5. Wskaźniki
popularności
Polityk
SCHEMAT WNIOSKOWANIA
(zakładając,
Określenie zmiennych i ich skal pomiarowych, sformułowaniezałożeń i
polityków
Wskaźnik
Wskaźnik
popularności
popularności
Przed Xp
PoXk
Róźnica D w
hipotez:
Zmienna niezależna: CZAS POMIARU (zmienna nominalna, dwie wartości: [1] - zaraz po manipulacji, [2] - 2 dni później) Zmienna zależna: INTUICJA (zmienna ilościowa)
1
42
43
1
Założenia:
2
41
45
4
3
50
56
6
Zmienna INTUICJA ma w populacji rozkład normalny, próby losowe, pomiary zależne Hipotezy:
4
52
54
2
5
58
65
7
6
32
29
-3
7
39
46
7
8
42
48
6
9
48
47
-1
10
47
53
6
oczekujemy wzrostu wartości zmiennej w drugim pomiarze, więc q" =>( -x;" 35; N 10; SD 3,57.
Ponieważ
a 'LD w
Jak wspomnieliśmy, w badaniu LEARN dysponujemy pomiarami wyników w teście intuicji psychologicznej, w dwóch punktach czasowych TIME1 i TIME2, czyli dla każdej osoby badanej dysponujemy parą pomiarów, które są od siebie zależne. Możemy więc przetestować hipotezę, że dla mężczyzn (powiedzmy, że szczególnie interesują nas mężczyźni) różnica mię dzy wynikiem pierwszego i drugiego testu wynosi O (Ho: /lo = O).
=
=
Ho: /lo = O Nie ma różnicy między pierwszym a drugim pomiarem w teście intuicji psychologicznej. Wyniki pierwszego i drugiego pomiaru pochodzą z populacji o tych samych
średnich.
H1 : /lo # O. Jest różnica między pomiarem pierwszym i drugim. W teście intuicji psychologicznej wyniki pierwszego i drugiego pomiaru pochodzą z populacji o tych samych
średnich.
Wybór testu i ustalenie rozkładu statystyki: Statystyka t ma rozkład
t Studenta dla df = N - 1 = 13
=
Ustalenie reguły decyzyjnej:
SCHEMAT WNIOSKOWANIA
Poziom istotności: a = 0,05
Zmienne Załoźenia
Hipotezy
Spełnione są założenia testu
t.
Wartość krytyczna: Nie musimy znać wartości krytycznej t, z wydruku odczytamy istotność
p.
Odrzucimy Ho. jeżeli p = 0,05 ,
Wybór testu i rozkład statystyki Reguła decyzyjna
Obliczenia
'" " K~OK I
,
' '\ Obliczanie wartości statystyki: "
Tabela 5.6. Statystyki dla prób zależnych Średnia
170
Decyzja
N
Odchylenie standardowe
Błąd standardowy średniej
Para
TIME1
6,00
14
1,96
0,52
1
TIME2
6,00
14
2,24
0,60
171
Zastosowanie testu t do porównania średnich na podstawie prób
Rozdział 5. Test t Studenta. Przedział ufności
niezależnych
Tabela 5.7. Test dla prób zależnych Różnice w próbach zależnych
Istotność
Błąd
Średnia
Para 1 TIME1 - TIME2
-0,50
t
Odchylenie standardowy standardowe średniej
-0,69 13
0,72
2,71
df
(dwustronna) 0,502
Biolog uważa, że temper~tura otoczenia ma wpływ na kumkanie żab. Grupa żab laboratoryjnych została losowo podzielona na 2 podgrupy i umieszczona w identycznych terrariach. Grupa kontrolna żab jest trzymana w stałej temperaturze 22°C. Grupa eksperymentalna jest trzymana w temperaturze 30°C. Zliczano liczbę odgłosów wydanych przez żaby w ciągu 10-minutowego pomiaru. Ilustrują to następujące dane: Grupa kontrolna (1) 22° C
30° C
Liczba odgłosów
Liczba odgłosów
13,10,11,12,16,14,15,13
52,40,44,48,56,60,64,52
Podjęcie decyzji:
0,502> 0,05, więc nie możemy odrzucić Ho (b.p.d.o. Ho). Stwierdzamy, że nie ma istotnej różnicy w poziomie intuicji psychologicznej między pomiarami.
Czy temperatura wpływa na kumkanie żab? Przetestuj hipotezę, stosując SCHEMAT WNIOSKOWANIA i wiedząc, że:
M1 =13 gdzie n -
Zastosowanie testu t do porówll,ania średnich na podstawie prób niezależnych Gdy chcemy przetestować hipotezę o równości średnich na podstawie badania dwóch niezależnych prób, możemy skorzystać z kolejnego twierdzenia dowiedzionego przez Gosseta. Test t dla prób niezależnych:
Grupa eksperymentalna (2)
M2 =52
s1=2
s2=8
liczebność każdej
df=2(n-1),
z grup.
SCHEMAT WNIOSKOWANIA Określeniezmiennych
i ich skal pomiarowych sfor'
mułowaniezałożeń i hipotez:
Zmienna niezależna: TEMPERATURA (zmienna ilościowa, tu przyjmuje dwie wartości: 22°C i 30°C; traktowana jak zmienna nominalna) Zmienna zależna: LICZBA ODGŁOSÓW (zmienna ilościowa) Założenia:
Zmienna LICZBA ODGŁOSÓW ma w populacji rozkład normalny, próby losowe, wariancje w odpowiednich podpopulacjach są równe, pomiary niezależne. Hipotezy:
Ho: Jeżeli:
Dwie niezależne, równoliczne próby zostały wylosowane z populacji o rozkładzie normalnym i zakładając, że:
Ho: /11 = /12
oraz
2 (J' l
f.J1
H1: f.J1
= f.J2 Temperatura nie wpływa na
liczbę odgłosów
wydawanych przez żaby.
*' f.J2 Temperatura wpływa na liczbę odgłosów wydawanych przez żaby.
= (J'22 '
Wybór testu i ustalenie
rozkładu statystyki:
to statystyka Statystyka t ma rozkład
M 1 -M2
t Studenta dla df = 2(n -
1) = 14.
t =---,~=,,~ s,':s,' ma rozkład t Studenta dla df= 2(n - 1)
=N -
gdzie n - liczebność każdej z prób
i N=2n.
Ustalenie
2, Poziom Wartość
istotności:
krytyczna:
reguły decyzyjnej:
a = 0,05
tkryt (14) = 2,145
Odrzucimy Ho, jeżeli t> 2,145 lub t < -2,145.
172
173
Zastosowanie testu t do porównania średnich na podstawie prób
Rozdział 5. Test t Studenta. Przedział ufności
Metoda wzmocnień
Metoda tradycyjna
Obliczanie wartości statystyki:
t = MI -M2 = 13-52 = -39 = -39 = -13,36 s'+s' J4+64 ~8 5 292 _'_2 8 "'\lo,J ,
(minuty)
(minuty)
10,14,16,13,11,12,15,13
13,17,23,19,15,21,19,25
Przetestuj odpowiednią hipotezę, stosując SCHEMAT WNIOSKOWANIA i wiedząc, że:
II
S22
Podjęcie
SCHEMAT WNIOSKOWANIA
Zmienna niezależna: TEMPERATURA (zmienna ilościowa, przyjmuje dwie wartości: 22°C i 30°C; traktowana jak zmienna nominalna) Zmienna zależna: LICZBA ODGŁOSÓW (zmienna ilościowa) Spełnione są założenia
Założenia
Hipotezy
Zmienne
Założenia
SCHEMAT WNIOSKOWANIA
Ho:
= 16
decyzji:
-13,36 < -2,145 więc możemy odrzucić Ho. Stwierdzamy, że temperatura wpływa na liczbę odgłosów wydawanych przez żaby.
Zmienne
niezależnych
f11
Spełnione są założenia testu
t.
Hipotezy Wybór testu i rozkład statystyki Reguła decyzyjna
testu t.
Obliczenia
=f12 Temperatura nie wpływa na liczbę
odgłosów
wydawanych przez żaby.
H1 : f11 "* f12 Temperatura wpływa
na liczbę odgłosów wydawanych przez żaby.
Decyzja
Wybór testu i rozkład statystyki
Statystyka t ma rozkład t Studenta dla df Odrzucimy Ho, jeżeli
Reguła decyzyjna
Obliczenia
t-
-
M 1 -M2 fĘI SI :8 2
-
-
=N - 2 =14.
t> 2,145 lub t < -2,145
13-52 = -39 = -39 =-1336 J 4+ 64 2,92 ' 8
J83
-13,36 < -2,145, więc możemy odrzucić Ho.
Decyzja
Czy możesz zaproponować inny sposób przeprowadzenia tego eksperymentu, dający biologowi więcej infonnacji?
;;, Y'Ówiczenie 5.~. 1 ',J
ThF
174
'"
;
j,
..,
'"
'"
'.E~...'
,<;<,
Pedagog zamierza przetestować efekt wzmocnień pozytywnych w porównaniu do tradycyjnych metod, jako różnych sposobów utrzymania dyscypliny w klasie. 16 nauczycieli zostało poinstruowanych odnośnie do technik, które mają być użyte w tym badaniu: 8 nauczycieli o metodzie tradycyjnej, 8 o metodzie wzmocnień. Dane stanowią informacje o czasie koncentrowania się uczniów na temacie zajęć (minuty w czasie jednej godziny), zebrane od każdego' z nauczycieli przerabiających identyczny materiał. Klasy zostały wybrane tak, aby nie różniły się istotnie pod względem statusu społeczno-ekonomicznego oraz przeszłych doświadczeń szkolnych uczniów. Dane są następujące:
ł. i< x
"~ x
Ówi~zenie 5.5.
,
Psycholog społeczny badający problematykę masowej komunikacji przydzielił losowo 72 ochotników do dwóch grup eksperymentalnych. 36 osób otrzymało instrukcję, aby przez miesiąc czerpać informacje wyłącznie z telewizji, natomiast 36 innych osób miało czerpać informacje wyłącznie z radia. Po miesiącu sprawdzono wiedzę wszystkich badanych na temat wydarzeń politycznych w minionym okresie. Badacz nie robił żadnych założeń odnośnie do tego, które 4; grupa Radio: ze ~ódeł i~f~rmacji jest lepsze. Oto wyniki badania: grupa TV: M1 24, M2 - 26, S2 - 5.
=
Przetestuj
hipotezę, stosując
SCHEMAT WNIOSKOWANIA, na poziomie
Jakie wnioski mógłby wyciągnąć badacz, gdyby uzyskane wyniki wych, a nie 36-osobowych?
Grupa TV (1)
M
24
s: =
istotności
pochodziły
a = 0,05.
z prób 9-osobo-
Grupa RADIO (2) 26
s2
4
5
N
36
36
175
Rozdział
5. Test t Studenta. Przedział ufności
Zastosowanie testu t do porównania średnich na podstawie prób niezależnych
SCHEMAT WNIOSKOWANIA Zmienne
Spełnione są założenia testu
Założenia
W badani~ LE~RN m~że~~ przetestować hipotezę o różnicach między poziomem intuicji psychologicznej w zaleznoscl od samooceny badanych. Zmienna niezależna: zdychotomizowana SAMOOCENA (zmienna nominalna). Zmienna zależna: wyniki w sprawdzianie TIME1 (zmienna ilościowa).
t.
Hipotezy Wybór testu i rozkład statystyki
SCHEMAT WNIOSKOWANIA
Reguła decyzyjna
Określenie zmiennych i ich skal pomiarowych sfor-
Obliczenia
mułowaniezałożeń i hipotez:
'
Zmienna niezależna: zdychotomizowana SAMOOCENA (zmienna nominalna na dwóch poziomach: 1 - niska samoocena, 2 - wysoka samoocena) Zmienna zależna: wyniki w sprawdzianie TIME1 (zmienna ilościowa)
Decyzja
Założenia:
Z.mienna TIME1 ~a w populacji rozkład normalny, próby losowe, wariancje w odpowiednich pod populaCjach są równe, pomiary niezależne
Hipotezy:
Założenie
o jednorodności
(homogeniczności)
wariancji
Ho: 111 = 112 Wyniki w sprawdzianie TIME1 nie zależą od samooceny. H 1:111 ;r. 112 Wyniki w sprawdzianie TIME1 zależą od samooceny.
W analizowanych dotąd przykładach zakładaliśmyjednorodność wariancji w porównywanych podpopulacjach. Często jednak to założenie nie jest spełnione i może się okazać, że wariancja np. w grupie mężczyzn jest istotnie większa od wariancji w grupie kobiet. Co wtedy? Gdy wariancje nie są jednorodne, zmienia się wzór do obliczania wartości t i liczby stopni swobody. Zgodnie z zasadą przyjętą przez nas, takie przypadki pozostawiamy do liczenia komputerowi. Musimy sięjednaknauczyć odczytywać wydruk komputerowy. Podane są na nim dwie wartości t, wyliczone przy założeniu:
1. jednorodnych (równych, homogenicznych) wariancji; 2. niejednorodnych (nierównych, niehomogenicznych) wariancji.
Wybór testu i ustalenie rozkładu statystyki: Statystyka t ma rozkład
t Studenta dla df = N -
2 = 28.
Ustalenie reguły decyzyjnej: Poziom istotności: a
=0,05
Wartość krytyczna: z wydruku odczytujemy istotność p.
Odrzucimy Ho, jeżeli p:s; 0,05.
o tym, którą wybrać, informuje nas statystyka F (test Levene'a), która pozwala podjąć decyzję dotyczącą
Jeżeli p związane
z daną wartością F jest większe od 0,05, to stwierdzamy brak podstaw do odrzucenia Ho tego testu, a dla testowanej hipotezy zerowej testu t (Ho : /11 = /12) odczytujemy wartość t wyliczoną przy założeniu jednorodnych wariancji w porównywanych próbach. Jeżeli zaś p ~ 0,05, to odrzucamy Ho : (j~ = (j~ , a dla testowanej Ho : /11 = /12 odczytujemy wartość t dla wariancji niejednorodnych. 176
Obliczanie wartości statystyki: Tabela 5.8. Statystyki zmiennej TIME1 dla grup wyznaczonych przez wartości zmiennej niezależnej SAMOOCENA Średnia Odchylenie standardowe
Błąd
standardowy
Samoocena
N
1
15
6,20
2,08
0,54
2
15
5,80
2,27
0,59
średniej
177
Zastosowanie testu t do porównania średnich na podstawie prób
Rozdział 5. Test t Studenta. Przedział ufności
niezależnych
Tabela 5.9. Test t (wpływ samooceny na wynik w teście TIME1) Wz?ru!ąc się ~a przykł~dzie 5.?, n.a.podstawie ~any~h z tabel 5.10 i 5.11 przetestuj hipotezę
Test t równości średnich
df Założono równośĆ
0,50
wariancji
Błąd
Istotność
Różnica
(dwustronna)
średnich
0,62
0,40
0,80
0,40
0,80
28
o roznlcach między poziomem IntuIcJI psychologicznej w zależności od samooceny badanych w przypadku gdy zmienną zależną będzie TIME 2. '
standardowy różnicy
Tabela 5.10. Statystyki zmiennej TIME2 dla grup wyznaczonych przez wartości zmiennej niezależnej SAMOOCENA
wariancji
0,50 27,77
0,62
Estymator błędu standardowego średniej różnicy zależy od spełnienia lub nie założenia o jednorodności wariancji. Pakiet statystyczny sprawdza to założenie testem F (Levene'a). W przypadku zmiennej TIME1 prawdopodobieństwo otrzymania F = 0,31 jest znacznie większe od 0,05, co nie pozwala na odrzucenie Ho: a~ = a: ' mówiącej, że wariancje w obu próbach sąjednakowe.
wartości
t dla 2. wariantu.
15
6,87
2,67
0,69
2
15
5,13
2,33
0,60
Test t
t
Hipotezy
Zmienna niezależna: zdychotomizowana SAMOOCENA (zmienna nominalna) Zmienna zależna: wyniki w sprawdzianie TIME1 (zmienna ilościowa) Spełnione są założenia testu
Wybór testu Reguła
decyzyjna
Wartość statystyki
i decyzja
178
t.
=
fl1 fl2 Grupy różniące się samooceną nie będą różnić się wynikami w teście. H1: fl1"* fl2 Grupy różniące się samooceną będą różnić się wynikami w teście.
Ho:
Istotność
Różnica
Błąd
(dwustronna) średnich standardowy różnicy
Założono równość
1,90
28
0,068
1,73
0,91
0,068
1,73
0,91
założono równości
SCHEMAT WNIOSKOWANIA
Założenia
df
równości średnich
Nie
0,62> 0,05, więc nie możemy odrzucić Ho (b.p.d.o. Ho). Stwierdzamy, że grupy różniące się samooceną nie uzyskały różnych wyników w teście.
Zmienne
średniej
Tabela 5.11. Test t (wpływ samooceny na wynik w teście TIME2)
wariancji Podjęcie decyzji:
standardowy
1
Program komputerowy liczy wartość t w dwóch wariantach: 1. przy założeniu równości wariancji w pod populacjach; 2. bez założenia równości wariancji w podpopulacjach.
Ponieważ test Levene'a nie pozwolił nam odrzucić Ho: al' = a: ' bierzemy pod uwagę wartości dla 1. wariantu. Gdyby Ho: a~ = a: została odrzucona, bralibyśmy pod uwagę
Błąd
N
Nie założono równości
Średnia Odchylenie standardowe
Samoocena
Statystyka t ma rozkład t Studenta dla df
=N - 2 =28.
Odrzucimy Ho, jeżeli p::; 0,05.
=
wariancji
1,9027,49
SCHEMAT WNIOSKOWANIA Zmienne
Założenia
Spełnione są założenia testu
t.
Hipotezy
Wybór testu i rozkład statystyki Reguła
decyzyjna
Obliczenia
=
t(28) 0,50; P 0,62 0,62 > 0,05, więc nie możemy odrzucić Ho (b.p.d.o. Ho). Stwierdzamy, że grupy różniące się samooceną nie uzyskały różnych wyników w teście.
Decyzja
179
Rozdział
5. Test t Studenta.
Przedział ufności
Przedział ufności
dla średnich
W badaniu PGSS (panel 2003) respondenci oceniali przedziałowość' swojego stylu funkcjonowania. Większa wartość wskaźnika MET oznacza większą przedziałowość. Na podstawie wyników przedstawionych w tabeli 5.12 oceń, które z poniższych zdań jest fałszywe. Możemy:
Oceniano przedziałowość stylu jedzenia kobiet i mężczyzn. Im wyższa wartość wskaźnika FOOD, tym większa przedziałowość. Na podstawie wyników z tabel 5.14 i 5.15 oceń które z poniższych zdań jest fałszywe (F), a które prawdziwe (P). '
1. odrzucić Ho : /11 = /12;
Możemy:
.. Ho: <J'l2
2. od rzuclc
= <J'22 ;
a) odrzucić Ho : /11 = /12;
3. stwierdzić, że kobiety są bardziej "przedziałowe" niź mężczyźni; 4.
stwierdzić, że zróżnicowanie
w grupie
mężczyzn
b) odrzucić Ho: <J'12
jest większe niż w grupie kobiet.
Test F Levene'a okazał się istotny statystycznie, co oznacza, że wariancje w porównywanych próbach nie sąjednorodne. W konsekwencji dla Ho : fi1 = fi2, odczytujemy wartość t z drugiego wiersza, tj. wiersza opisanego jako wariancje NIEjednorodne. Jednak istotność na poziomie p = 0,714 sprawia, że podejmujemy decyzję o nieodrzuceniu Ho testu t. Wartości odchyleń
standardowych są wyższe w przypadku mężczyzn, co w połączeniu z istotnością testu F prowadzi nas do konkluzji, że zróżnicowanie w grupie mężczyzn jest większe niż w grupie kobiet.
2. możemy stwierdzić, że zróżnicowanie w grupie mężczyzn jest większe niż w grupie kobiet;
=
3. nie możemy odrzucić Ho : /11 /12, stwierdzamy, że kobiety nie różnią się istotnie statystycznie od mężczyzn pod względem przedziałowości stylu funkcjonowania; możemy stwierdzić, że
średnich
kobiety są bardziej nie jest istotna statystycznie.
"przedziałowe" niż mężczyźni, gdyż różnica
p
ITJ ITJ
p
d) stwierdzić, że zróżnicowanie w grupie mężczyzn jest większe niż w grupie kobiet.
CI]
p
f=:D
Tabela 5.14. Statystyki zmiennej PRZEDZIAŁOWOŚĆ JEDZENIA N
M
s
1 MĘŻCZYZNA
169
2,97
0,811
2 KOBIETA
226
2,78
0,712
= <J'~;
1. możemy odrzucić Ho : <J'12
4. nie
= <J'~;
c) stwierdzić, że kobiety są bardziej "przedziałowe" niż mężczyźni;
FOOD
Zatem:
p
Tabela 5.15. Test t dla prób niezależnych - związek przedziałowości jedzenia z płcią wariancje FOOD jednorodne wariancje NIEjednorodne
t
df
Istotność
2,50
393
0,013
2,45
334,49
0,015
Tabela 5.12. Statystyki zmiennej PRZEDZIAŁOWOŚĆ dla kobiet i mężczyzn
MET
s
N
M
1 MĘŻCZYZNA
170
2,39
1,04
2 KOBIETA
228
2,43
0,89
Przedział ufności
Tabela 5.13. Test tdla prób niezależnych (wpływ płci na PRZEDZIAŁOWOŚĆ) t wariancje MET jednorodne wariancje NIEjednorodne
180
df
Istotność
-0,38
396
0,707
-0,37
330,43
0,714
• Por, G. Wieczorkowska-Nejtardt (1998). Inteligencja motywacyjna: mądre sposoby wyboru celu i sposobu działania. Warszawa: WISS (Wydawnictwa Instytutu Studiów Społecznych).
dla średnich
Chociaż analizujemy starannie wyniki pochodzące z badanej próby, to jednak podstawowym przedmiotem naszego zainteresowania jest populacja. Średnia zmiennej w próbie (wartość statystyki M) interesuje nas o tyle, o ile pozwala nam wnioskować o średniej w populacji. Średnia M jest estymatorem /l. Statystyka M z pojedynczego badania może być lepszym lub gorszym estymatorem /l w zależności od jej błędu standardowego. Jeżeli na podstawie pojedynczej średniej chcemy przewidywać średnią w populacji, to możemy dokonać estymacji (szacowania):
1. punktowo, 2. przedziałowo.
181
Rozdział
5. Test t Studenta. Przedział ufności
Przedział ufności
Estymacja punktowa polegałaby na wskazaniu konkretnej wartości średniej w populacji, np. przez stwierdzenie, że średnia samoocena w populacji wynosi 3,5 (J1 = 3,5). Estymacja przedziałowapolega na określeniuprzedziału, w którym z danym prawdopodobieństwemzawiera się średnia w populacji. Mówimy wtedy, że z prawdopodobieństwem 0,99 średnia samoocena w populacji zawiera się w przedziale (3; 4) - od 3 do 4. Przedział ten nazywamy 99% przedziałem ufności dla
a= a=
0,05 0,01
dla średnich
ta = ta =
Zarówno bł~d standardowy średniej, jak i wartość krytyczna zależą od stopni swobody dl, wylIczanych na podstawie liczebności próby. Sprawdzamy ta dla df= N-l, gdzie Nto liczebność próby.
średniej.
Prawdopodobieństwo,że
bo wynosi zaledwie 0,01. Jeżeli chcemy podjąć
f..l nie znajduje
większe
ryzyko
się
w tym przedziale jest bardzo
błędu
(np. 0,05), to
małe,
możemy zbudować
węższy przedział ufuości.
Załóżmy, że w próbie średnia M = 50 i odchylenie standardowe s = 7. Jeśli N =25, to jaki jest 95% przedział ufności dla średniej w populacji? Jakie wnioski możesz wyciągnąć?
dla średniej z populacji oznacza, 5 razy na 100 przedział ufności nie będzie zawierał prawdziwej średniej f1 (a= 0,05 .
95%
przedział ufności
Średnia M 50, wartość krytyczna t przy N - 1 25 - 1 2,064; błąd standardowy średniej wynosi SM = 71s = 1,4.
=
że
=
=24 stopniach swobody t(24, 0,05) =
Margines błędu wynosi więc 2,064 x 1,4 = 2,8896 '" 2,89. Dolna granica przedziału ufności wynosi: 50 - 2,89 = 47,11.
Ogólny wzór na obliczanie 95% przedziałuufności dla średniej, gdy znane jest a w populacji ma postać: M ± 1,96 x
błąd
Górna granica przedziału ufności wynosi 50 + 2,89 = 52,89.
Przedział [(47,11 );(52,89)] z prawdopodobieństwem 0,95 zawiera średnią M = 50.
standardowy M
i
Wartość odczytana
z tablic rozkładu normalnego dla a= 0,05 Przedział ufności jest symetryczny, więc sprawdzamy wartości krytyczne tak jak dla testu dwustronnego. Gdy znane jest a w populacji, sprawdzamy wartości krytyczne w tablicach rozkładu normalnego: a= 0,05 Za= 1,96 a= 0,01 Za= 2,58.
Gdy nieznane jest aw populacji, dokonujemy jego estymacji za pomocąs.
s Granice przedziału ufuości są symetryczne względem średniej z próby (M ± ta JN)
s s Powiemy, że przedział (M - ta JN;M + ta JN)
182
N
Przedział ufności dla średniej w populacji
95% 25
99%
[(47,11 );(52,89)]
16
i
zawiera średnią w populacji z prawdopodobieństwem 1 - a, gdzie ta jest wartością krytyczną testu dla odpowiedniego poziomu liczbie stopni swobody dl = N-l.
Korzystając z danych zawartych w przykładzie 5.8, odpowiedz na następujące pytania: a) Jeśli N = 25, to jaki jest 95% przedział ufności dla średniej w populacji? b) Jeśli N = 25, to jaki jest 99% przedział ufności dla średniej w populacji? c) Jeśli N = 16, to jaki jest 95% przedział ufności dla średniej w populacji? d) Jeśli N =16, to jaki jest 99% przedział ufności dla średniej w populacji?
istotności przy
~ PGSS a~alizowano związek wykształcenia z kolejnością urodzenia respondenta w rodzinie. W tabeli 5.16 przedstawione są średnie, odchylenia standardowe i przedziały ufności dla średniej (95% i 99%).
183
Rozdział
5. Test t Studenta.
Tabela 5.16. grupach
Przedział ufności
Przedział ufności
Przedziały ufności wokół średnich
WYKSZTAŁCENIE
urodzeń
N
M
s
przedział
99%
ufności
SM
przedział
ufności
dolna
górna
dolna
górna
1.00
1137 11,08 3,02
0,09
10,91
11,26
10,85
11,32
2.00
1039 10,92 2,93
0,09
10,73
11,10
10,68
11,15
3.00
568 10,38 2,68
0,11
10,15
10,60
10,09
10,67
4.00
309
9,88 3,20
0,18
9,52
10,24
9,41
10,36
5.00
175
9,41
2,94
0,22
8,97
9,85
8,83
9,99
3228 10,70 2,99
0,05
10,59
10,80
Total
Na podstawie powyższej tabeli określ prawdziwość następujących stwierdzeń (P - prawda, F - fałsz): 1. Im
większa liczebność
próby, tym mniejszy
błąd
UTIJ
3. Im szerszy przedział ufności, tym większe prawdopodobieństwo, że średnia w populacji znajdzie się w tym przedziale.
[iJ}]
4. 99% przedział ufności oznacza prawdopodobieństwo p = 0,01, że średnia w populacji znajdzie się poza przedziałem.
UTIJ UTIJ
5. 95% przedział ufności oznacza prawdopodobieństwo p = 0,05, że średnia w populacji znajdzie się poza przedziałem.
przedział ufności jest szerszy niż 95% przedział ufności.
[iJ}]
Graficzną postacią przedziałów ufności jest
wykres określany jako "słupki błędu". Jako przykład niech posłużą nam dane zebrane w PGSS. Na rysunku 5.1 przedstawione są przedziały ufności dla średnich zmiennej WYKSZTAŁCENIE (lata nauki) dla grup respondentów wydzielonych na podstawie kolejności urodzenia. Najwyższą średnią zanotowano u respondentów urodzonych jako pierwsi, najstarszych z rodzeństwa lub jedynaków. Najszerszy przedział ufności zbudowano wokół średniej dla grupy 5 (N = 175). Widzimy, że szerokość przedziału ufności zależy od liczebności próby. 11.5.,...---------------,
11.0
I
10.0
-'-
9.5
184
9.0
"C
§
a.
ZM
=M
-
J.1
z tablica-
(JM
mi rozkładu normalnego. 2 . Gd' y meznane b y ło
(7,
, M-J.1 wy l'lczal'lsmy t =-
. 1 porównywaliśmy
z tab1ica-
SM
mi rozkładu t Studenta. Stosowaliśmy ten wzór także wtedy, gdy chcieliśmy przetestować hipotezę dotyczącą różnicy między średnimi z dwóch prób zależnych (np. pretest _ posttest).
Ho: PD = c, gdzie c -
Wyliczaliśmy t = M D -
J.1D
SM D
najczęściej równe O
i porównywaliśmy z tablicami rozkładu t Studenta.
3. Gdy chcieliśmy ocenić różnice między średnimi z dwóch grup niezależnych (np. eksperymentalna - kontrolna):
Ho : PI
=
P2,
M1-M · 1" wy1lcza lsmy t = 2 i porównywaliśmy z tablicami rozkładu t Studenta. SM,_M,
Umiemy już dużo, ale nie wyczerpuje to naszych potrzeb. Jedno jest pewne, we wszystkich trzech przypadkach schemat wnioskowania jest identyczny: wypisujemy założenia i hipotezy, szukamy testu statystycznego, który pozwala przetestować hipotezę przy danych założeniach, wyliczamy statystykę, porównujemy z jej rozkła dem i podejmujemy decyzję.
!
.E :::J
rn 'N
waliśmy test Z i porównywaliśmy wyliczoną wartość
--,---
~
'0
Rysunek 5.1. Przedziały ufności dla średnich zmiennej WYKSZTAŁ CENIE w zależności od kolejności urodzenia
1. Gdy znane były odchylenia standardowe w populacji o znanej średniej, stoso-
II
10.5
.~
Podsumowanie
[iJ}]
standardowy.
2. Im większy błąd standardowy, tym szerszy przedział ufności.
6. 99%
średnich
Nauczyliśmysię dotąd testować trzy typy hipotez dotyczących średnich:
(liczba lat nauki) 95%
Kolejność
zmiennej WYKSZTAŁCENIE w pięciu
dla
I
B.5ol--_~--~-~-~--~---' N' "6
1.00
2.00
kolejność urodzenia
3.00
4.00
5.00
185
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji Pojęcia kluczowe: czynnik; poziom czynnika; zróżnicowanie całkowite; zróżnicowanie międzygrupowe; zróżnicowanie wewnątrzgrupowe; wariancja
międzygrupowa; wariancja wewnątrzgrupowa; suma kwadratów odchyleń od średniej; średni
kwadrat
Nowe symbole: F, s~ , s~, dfa• dfw. SSa. SSw, SST. dfT, df1• df2
Niekoniecznie. Jeżeli średnia w grupie bez żadnej manipulacji (grupa kontrolna) wyniosłaby M 3 = 7, to jedyny wniosek, jaki możemy wyciągnąć byłby taki, że RELAKS pogarsza wyniki. Analogicznie, jeżeli M 3 = 2, to możemy powiedzieć, że STRACH polepsza wyniki. Hipotetyczne układy wyników przedstawia wykres na rysunku 6.1. Chociaż dwa pierwsze słupki reprezentujące średnie z dwóch pierwszych grup są identyczne we wszystkich trzech, to ich interpretacja zależy od trzeciego słupka reprezentującego średnią z grupy kontrolnej. Wniosek: aby móc sformułować rozsądne wnioski o wpływie manipulacji, konieczne jest wprowadzenie grupy kontrolnej w celu określenia poziomu wyjściowe go zmiennej zależnej, bez manipulacji (base line). Czy mając trzy grupy, możemy używać testu t Studenta dla porównania par śred nich? NIE. Dlaczego? Bo cechą wnioskowania statystycznego jest ścisłe określenie ryzyka błędu. Wiemy, że każdy test t, który przeprowadzimy, jest obarczony pewnym błędem I rodzaju (przypomnijmy: błąd ten polega na tym, że odrzucimy hipotezę zerową, mimo że jest ona prawdziwa). Wielkość tego błędu szacuje nam istotność statystyczna p. Jeżeli przeprowadzimy wiele testów, z których każdy jest obarczony błędem (np. p = 0,05), to skumulowany błąd I rodzaju może być bardzo duży, a na pewno większy od akceptowalnego poziomu 0,05. Można dokładnie wyliczyć, ile ten błąd będzie wynosił, używając prostego wzoru: PE =1-(0,95)",
Ograniczenia stosowalności testu t Studenta. Dlaczego 3 jest lepsze niż 2? Wyobraźmy sobie badanie, w którym testujemy wpływ poziomu stresu na wyniki w teście. Rozważmy możliwe wyniki eksperymentu, w którym zmienna niezależna przyjmuje 2 lub 3 wartości. W grupie 1 (STRACH) informujemy student~w, że je~t to test ostatniej szansy, w grupie 2 (RELAKS) mówimy, że mogą poprawIać wymk wielokrotnie. Jeżeli otrzymalibyśmy średnie MI = 7 dla STRACHU i M 2 = 2 dla RELAKSU, i ta różnica między średnimi okazałaby się istotna statystycznie, to czy moglibyśmy powiedzieć, że STRACH polepsza, a RELAKS pogarsza wyniki?
gdzie PE jest skumulowanym błędem I rodzaju, a c - liczbą wykonanych testów. Jeżeli, na przykład, porównujemy 4 grupy, to musielibyśmy zrobić 6 testów t, z których każdy niesie ze sobą błąd p = 0,05, wówczas skumulowany błąd PE = 0,265, a takiej wartości błędu nie możemy zaakceptować. Tłumacząc problem wielokrotnych testów obrazowo - wyobraźmy sobie, że ukrywamy nasz romans przed otoczeniem i bardzo się pilnujemy, aby nikt nie zobaczył nas razem, gdy np. trzymamy się za ręce. Jest druga nad ranem. Wyludnione ulice. Czy możemy iść pod rękę? Ryzyko wpadki jest minimalne. Ale jeżeli będziemy to powtarzać, ryzyko, że ktoś nas zobaczy jest już duże, więc lepiej nie ryzykować. Aby przetestować hipotezę o równości więcej niż dwóch średnich, musimy nauczyć się podstawowego testu w bildaniach eksperymentalnych - analizy wariancji.
STRACH
III
RELAKS
•
KONTROLNA
o~2lI-
186
Rysunek 6.1. Hipotetyczne średnie wyniki w teście w zależności od poziomu stresu
Jednoczynnikowa analiza wariancji
Chcemy sprawdzić, czy pewne warunki eksperymentalne wpływają na wyniki otrzymywane przez studentów w teście. W tym celu studentów przydzielamy losowo do trzech równolicznych grup, gdzie: -
187
Rozdział 6.
Jednoczynnikowa analiza wariancji
Jednoczynnikowa analiza wariancji
1. w grupie E1 - studenci relaksują się przed testem, który jest przedstawiany jako nieważny sprawdzian; 2. w grupie E2 - studenci są zachęcani, aby dać z siebie wszystko; 3. w grupie E3 - studenci są straszeni, że test jest warunkiem koniecznym zaliczenia przedmiotu. Chcemy zbadać związek między zmienną STRES (zmienna nominaln~) a WYNI~IEM w teście (zmienna ilościowa). STRES jest zmienną niezależną, WYNIK zmienną zalezną.
Zmienne niezależne w analizie wariancji
podniesione do kwadratu różnice (X - M) będą składać się na ogólną zmienność wyników SSr(od angielskiego słowa total), podniesione do kwadratu różnice (X - M 1 ), określać będą zmienność wyników w ramach danej grupy SSw (od angielskiego słowa within - zmienność wewnątrzgrupowa). Podniesione do kwadratu różnice między średnimi w poszczególnych warunkach eksperymentu a średnią ogólną (M1 - M) wyznaczają zmienność międzygrupową SSB (od angielskiego słowa between). Podstawą analizy wariancji jest podział zróżnicowania całkowitego na zróżnicowanie śred nich wokół średniej ogólnej (międzygrupowe ) i zróżnicowaniewyników w poszczególnych grupach, wokół średnich grupowych (wewnątrzgrupowe). Miarą zróżnicowania są sumy kwadratów odchyleń od odpowiedniej średniej.
Aby policzyć zróżnicowanie międzygrupowe, od każdej średniej w grupie odejmujemy śred nią ogólną, różnice podnosimy do kwadratu, sumujemy i mnożymy przez liczbę osób w grupie:
nazywane są CZY~NIKAMI. Wartości zmiennych niezależnych
SSB=
nazywamy POZIOMAMI czynnika.
W naszym
przykładzie:
n =4 Możemy powiedzieć, że czynnik STRES występuje na 3 poziomach: E1, E2, E3. W tabeli 6.1 przedstawiono wyniki 3 równolicznych grup (liczbę grup oznaczamy symbolem k, zatem k = 3) i 4 osób w każdej z nich (liczbę osób w grupach oznaczamy symbolem n, zatem
n = 4).
Zmienna niezależna STRES Grupa E2 "motywowani"
Grupa E3 "straszeni"
1,2,3,2'
4,5,6,5
7,3,5,5
M1 =2
M2= 5
M3 =5
Grupa E1 "relaksowani"
Średnie
w grupach
M1 =2
M2 =5
M3 =5
Aby policzyć zróżnicowanie wewnątrzgrupowe, musimy od każdego wyniku odjąć średnią z odpowiedniej grupy. Łatwiej będzie nam to zrobić, jeżeli przedstawimy dane z tabeli 6.2 w formie, w jakiej wpisywaliśmy je do komputera.
Numerosoby w grupie
(wynik Grupa
Wynik
-
średnia
grupy)2
n x (średnia grupowa - średnia ogólna)2
(wynikśrednia
ogólna)2
1
1
1
(1. - 2)2
(1 - 4)2
2
1
2
(2 - 2)2
(2 - 4)2
3
1
3
(3 - 2)2
4
1
2
(2 - 2)2
(3 - 4)2 4 x (2 - 4)2
(2 - 4)2
1
2
4
(4 - 5)2
(4 - 4)2
2
2
5
(5 - 5)2
(5 - 4)2
M,.- średnia ogólna
3
2
6
(6 - 5)2
(6 -.4)2
M1, M2 ,· M3 - średnie grupowe k - liczba grup (poziomów zmiennej niezależnej)
4
2
5
(5 - 5)2
1
3
7
(7 _5)2
(7 - 4)2
N = n x k - ogólna liczba osób
2
3
3
(3 - 5)2
(3 - 4)2
3
3
5
(5 - 5)2
Jedną z osób badanych był Jan, który znalazł się w grupie E1. Wynik Jana (X ~ 1) .moż~a porównywać ze średnią ogólną (M= 4) lub średnią z jego grupy (M1 = 2), natomiast srednlą jego grupy można porównywać ze średnią ogólną.
4
3
5
(5 - 5)2
4x(5-4)2
(5 - 4)2
12
24
36
Średnia
ogólna: M= 4
n - liczba osób w grupie
Możliwe porównania możemy zapisać w postaci równania:
X-M=X-M 1 +M1 -M
=
(wynik Jana - średnia ogólna) (wynik Jana - średnia grupowa) + (średnia z grupy Jana - średnia ogólna)
188
M =4
SSB= 4[(2 - 4)2+ (5 - 4)2+ (5 - 4)2] = 24.
Tabela 6.2. Dane eksperymentalne
Tabela 6.1. Dane eksperymentalne
Zmienna zależna Wynik w teście (w punktach)
n [(M1 - M)2+ (M2- M)2+ (M3 - M)Z].
Suma
4x(5-4)2
,
(5 - 4)2
(5 - 4)2
SSw=12 Możemyteż policzyćzróżnicowaniecałkowite (SSr), sumując kwadraty odchyleń
nych wyników od Zauważmy, że
średniej
poszczegól-
ogólnej (szósta kolumna tabeli 6.2) - SSr= 36.
36 = 12 + 24, co w postaci symboli zapisujemy
SST = SSs + SSw i stwierdzamy,
następująco:
że SS są addytywne.
189
Rozdział
Rozkład
6. Jednoczynnikowa analiza wariancji
Jest to podstawowe równanie analizy wariancji, któ~e mówi~ że zróżnicowanie całkowite (S~:) można podzielić na część wyjaśnioną naszym oddziaływaniem eksperymentalnym (SSB- roznice między grupami) i część niewyjaśnioną (SSw- różnice w wynik.ach o~.ób będących w ty~~ samych grupach). Naszym celem jest oszacowanie wpływu manipulaCJI stresem na Wyniki
2
Sw
S~
w teście. Chcąc odpowiedzieć na to pytanie, laik patrzy na wielkość różnic między średnimi w grupach poddanych różnym oddziaływaniom, czyli wi?lko~ć SSB' My wiemy~ że d? sf.ormu~o. wania jakiegokolwiek sądu niezbędne jest okresleme standardu porownan. Nie mozemy nic powiedzieć o SSB, dopóki nie będziemy wiedzieli, z c~ym to p?równ~ć. N?~ur.alnym, choć w codziennym życiu często ignorowanym standardem jest porownanle zrozmcowa· nia międzygrupowego (SSB) do wewnątrzgrupowe~o(SSw). Cz.ę~to jed.nak for~~łuj~c sądy o zróżnicowaniu międzygrupowym typu: "koble~y są.bar?zlej. em~cj.on.~ln~ n1~ m~z czyźni", nie bierzemy pod uwagę tego, że zarówno kobiety, jak I męzczyznl ro.Znl,,!- Się mię dzy sobą wewnątrz swoich grup (zróżnicowanie wewnątrzgrup~we). W m~slenlu na~ko wym nie popełniamy tego typu błędów i oceniamy wp~ czynnika n~ zm.l.en~ą zalezną, porównując SSB do SSw. Jak to robimy? Udowodniono, ze stosunek warlan~jl ml~dzygrupo wej do wewnątrzgrupowej ma rozkład F Fishera; rozkład ten pozwala na wyliczenia prawdopodobieństw przy założeniu, że f11 f12 f13·
=
Sw
/l2
= ... =
/l
Zapis symbolami hipotezy badawczej nie jest prosty. Zaprzeczeniem Ho: /lI = /l2
=/l3 jest np. zarówno sytuacja, gdy /lI *- /l2 = /l3 jak i gdy /lI = /l2 *- /l3. Poprawnie sformułowana hipoteza badawcza mówi, że co najmniej jedna grupa pochodzi z populacji o średniej różnej od średniej populacji, z której pochodzą pozostałe grupy. Jeżeli średnie w
grupach różnią się między sobą, to będziemy oczekiwali,
2
2
~
~
S
~ będzie większy od jedności. Jeżeli się okaże, że S ~
że
ilo-
jest w sposób istotny
większy
od jedności, odrzucamy Ho i wnioskujemy, że co najmniej jedna średnia grupowa różni się istotnie statystycznie od co najmniej jednej z pozostałych.
Istotność ilorazu Folrz
2
=!JL. 2
i s~ są niezależnymi oszacowaniami wariancji w populacji ((]"2). 2
Statystyka F Fishera
F
kwadrat wewnątrzgrupowy.
SB
raz
F Fishera
- średni
Iloraz 2"" pozwala nam zbadać hipotezę zerową Ho: /lI
= =
Rozkład
SSw
= d/w
F Fishera
S2
= -f Sw
można ocenić na podstawie tablic rozkładu F przy
= k - 1 stopniach swobody związanych z licznikiem i dJ2 = N - k = k(n - 1) stopniach swobody związanych z mianownikiem, gdzie: N - ogólna liczba osób biorąca udział w badaniu, k - liczba grup wyznaczona przez liczbę wartości zmiennej niezależnej (liczbę poziomów czynnika), n - liczba osób w grupach.
dfi
Sw
jest ilorazem dwóch niezależnych estymatorów wariancji w populacji, ma znany rozkład.
Aby policzyć F, musimy policzyć wariancje, dzieląc SS przez odpowiednie stopAbyśmy
nie swobody:
dfi = d/B
=
k- 1
dJ2 = d/w = k(n - 1). Ogólnie stopnie swobody związane z licznikiem ilorazu F określane sąjako df1 , z mianownikiem jako df2 •
Dzieląc między grupowe i wewnątrzgrupowe sumy kwadratów przez związane
z nimi stopnie swobody, otrzymujemy: 2
SB
190
SSB
= d/B
. - średni kwadrat mIędzygrupowy;
mogli
skorzystać z
testu F,
muszą być spełnione następujące założenia:
1. Zmienna zależna powinna mieć w populacji rozkład normalny, chociaż test F jest dosyć odporny na niespełnienie założenia o normalności rozkładu. 2. Próby pochodząz populacji o równych wariancjach. Zakładamy homogeniczność Uednorodność) wariancji (j~ = (j~ = ... = (j2 , niespełnienie tego założe nia może prowadzić do zawyżania wartości statystyki F i do zbyt częstych odrzuceń hipotezy zerowej. 3. Pomiary w
obrębie
grupy powinny być statystycznie
niezależne.
Wszystkie założenia analizy wariancji omówione są wyczerpująco przez Brzezińskiego [5,6]. Tam też można znaleźć sposoby radzenia sobie z nienormalnością rozkładu zmiennej zależnej czy niejednorodnościąwariancji. Trzeba jednak pamiętać, że dokonywanie transformacji np. logarytmicznej danych może poprawić kształt rozkładu, jednocześnie zwiększając heterogeniczność wariancji. Dlatego trzeba do-
191
Rozdział
Zastosowanie analizy wariancji do testowania hipotez o
6. Jednoczynnikowa analiza wariancji
równości średnich
kładnie analizować efekty transformacji, które w większości wypadków nie zachowująrównościprzedziałów, a więc zmieniają charakter naszych danych.
Podejmowanie decyzji na podstawie wydruku komputerowego
Rozkład z prób statystyki F jest rodziną krzywych dla każdego możliwego układu stopni swobod .
Na wydruku podane jest dokładne prawdopodobieństwo otrzymania danej wartości statystyki (np. F) przy założeniu prawdziwości hipotezy zerowej.
Rysunek 6.2 przedstawia przykładowy wykres rozkładu statystyki F dla dft = k stopni swobody dla licznika id dh = N - k stopni swobody dla mianownika, co zapisujemy jako F(k,N - k).
Jeżeli
jeżeli
p:::;; 0,05, to odrzucamy Ho,
p > 0,05, to brak podstaw do odrzucenia Ho,
(0,1 > p > 0,05 - to tendencja statystyczna).
<Xl
ci
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
obszar krytyczny 0,05 o
ci
Przeanalizujmy przykład przytoczony na początkurozdziału,stosując SCHEMAT WNIOSKOWANIA.
4
Rysunek 6.2. Rozkład statystyki F dla df2
W naszym przykładziedft = fi = 4,26.
=2, df2 =9
= 2 dh = 9; z tablic rozkładu F odczytujemy, że F(2,9)
Określeniezmiennych i ich skal mułowaniezałożeń i hipotez:
Zmienna niezależna: POZIOM STRESU (zmienna nominalna) przyjmuje 3 wartości: stres, relaks, kontrolna.
Tablice rozkładu F
Zmienna zależna: WYNIKI W TEŚCIE (zmienna ilościowa).
Tablice rozkładu F (patrz tablice na końcu podręcznika) zawierają rozmieszczone w kplumnach wartości krytyczne dla poziomu istotności 0,05 (napisane zwykłą czcionką) oraz dla poziomu 0,01 (czcionką półgrubą), przy czym kolumny przedstawiają wartości stopni swobody dla licznika testu F (wariancja międzygrupowa), a wiersze - wartości stopni swobody dla mianownika testu F (wariancja wewnątrz grupowa). Interesującąnas wartość krytyczną odczytujemy "na przecięciu" kolumny odpowiadającej danej liczbie stopni swobody dla licznika (dft) oraz wiersza odpowiadającego danej liczbie stopni swobody dla mianownika (dh)· Statystyka F przyjmuje tylko nieujemne wartości, więc reguła decyzyjna jest prosta:
Założenia:
Zmienna zależna (zmienna ilościowa) ma w podpopulacjach wyznaczonych przez zmienną niezależną rozkład normalny. Grupy
niezależne zostały
(O"~
wylosowane z populacji o tych samych wariancjach
= 0"; = 0"; = 0"2
- założenie o homogeniczności wariancji).
Hipotezy:
Ho:
f11
=f1z =f13 =f1
Stres nie wpływa na wyniki w teście.
H 1 : Stres wpływa istotnie na wyniki w teście. Przynajmniej jedna średnia f11, f1z lub f13 różni się istotnie od przynajmniej jednej z pozostałych.
Wybór testu i ustalenie Jeżeli
Fotrz ~ Fkryt , odrzucamy Ho'
Jeżeli F otrz < F kryt , to brak podstaw do odrzucenia
192
pomiarowych, sfor-
Ho'
rozkładu statystyki:
Statystyka, którą wykorzystamy przy podejmowaniu decyzji względem hipotezy zerowej ma rozkład F Fishera z (k - 1) stopniami swobody związanymi z licznikiem oraz (N - k)
193
Rozdział 6.
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
Jednoczynnikowa analiza wariancji
stopniami swobody związanymi z mianownikiem, gdzie N - to liczebność całej próby, k - liczba grup (liczba wartości zmiennej niezależnej).
Wyliczając międzygrupową sumę
kwadratów (ang. sum af squares between groups-
SSB), k
Ustalenie reguły decyzyjnej:
• zapis
SSB = nLCM j - M/ j=1
że
oznacza,
sumujemy kwadraty
odchyleń średnich
W tablicach rozkładu F (na końcu podręcznika) możemy odczytać, że:
od średniej ogólnej, po wszystkich grupach:j = 1 ,j = 2,j = 3, i mnożymy sumę przez n.
dla a = 0,05 przy df1 = 2 i df2 = 9, wartość krytyczna testu wynosi Fkryt = 4,26.
Wyliczając wewnątrzgrupową sumę
kwadratów (ang. sum of squares within gro-
ups - SSw),
Wyliczenie statystyki Patrz:
k
• zapis We wszystkich wzorach zakładamy, że grupy są równ,oliczne. ~ada,na próba. składa się z N = n x k osób, gdzie n - liczba osób w grupie, k - liczba pozlomow czynnika. Wzór na SS
Zmienność
Wzór na df Wzór na
k
Międzygrupowa
SSB =n"'2)M j -M)2 j=1
df1 = k-1
52
Wzór na F
/I
= LLCXij -
SSw
j=1 ;=1
oznacza,
że wyliczamy kwadraty odchyleń od śred-
=
=
niej w grupie Mj dla każdej osoby w grupie od i 1 do i n, potem sumujemy dla każdej grupy od j = 1 do j = 3, a następnie sumujemy otrzymane w ten sposób wyniki z wszystkich grup.
s 2 =SSB -B diB
S2B =12 SSB = 24 k 2 SSw -SSw =LLCX-MY df2 = k(n -1) Sw=dj, 1) } w j=\ ;=1 S2w = -4 df2 = 9 SSw= 12 3
Mj)2
Podjęcie
decyzji:
df1 = 2
2
/I
Wewnątrzgrupowa
k
Fotrz
SB =2 Sw
SSr= 36
oznacza,
;=1
F otrz = 9
dfr = kn-1
"!
że powinniśmy zsumować wszystkie wyniki w pierwszej grupie,
podstawiając pod "i' kolejno 1,2, 3... aż do n, które w naszym ,prz~kładzie .rów,na się 4. Grupa, do której dana osoba należy, jest identyfikowana przez ,J , ktore przYJmuJe wartości od 1 do k, czyli w analizowanym przez nas przykładzie: 1, 2, 3. k
· Lj=\ X\j oznacza, że należy zsumować wyniki wszystkich pierwszych osób we wszystkich grupach. k
194
Ho na poziomie a = 0,05.
Fkryt , zatem
Wniosek:
. . . Wzory wyglądają na skomplikowane, ale takie ~ie są.. K~żda osoba a.nalJzl~ m~ swoJ~ identyfikację informującą o jej numerze w dan~J g:uple I o tym, W. k.toreJ gru~~e Się zn~t duje. Indeks wskazujący numer w grupie przYJmuJe cztery wartoscJ. NazwalJsmy go ,,/ .
Psycholog pracujący w klinice psychiatrycznej chce sprawdzić, czy są istotne różnice w dh!hospitalizacji pomiędzy pacjentami z różnym rozpoznaniem choroby. Sprawdzając po czterech pacjentów z różnymi rozpoznaniami, uzyskano następujące wyniki (w tygodniach): gości
Typ rozpoznania Zaburzenia afektywne
Zaburzenia poznawcze
oznacza,
wszystkich grupach.
że należy wykonać sumowanie
Uzależnienia
od narkotyków
6
11
8
3
7
10
5
9
12
6
9
10
M1
/I
• LLXij j=1 ;=1
Mamy Fotrz
krytyczna testu Fkryt = 4,26 przy df1 = 2 i df2 = 9
/I
Wyjaśnienie wzorów:
!X,
wartość
SST = LLCXij-M)2 dfr = kn-1 j=\ ;=1
Całkowita
• Zapis
Dla a = 0,05
=
M2
=
M3 =
wyników wszystkich osób, we Czy różnica w długości pobytu w szpitalu między poszczególnymi kategoriami chorych jest istotna statystycznie? Przetestuj hipotezę, stosując SCHEMAT WNIOSKOWANIA (a= 0,05).
195
Rozdział
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
6. Jednoczynnikowa analiza wariancji
nx
(wynik
Numer osoby w grupie
Grupa
1
1
6
2
1
3
Wynik
- średnia grupy)2
(średnia
grupowa - średnia .ogólna)2
Chcemy, na podstawie zbioru danych LEARN, wykazać, że wyniki w sprawdzianie intuicji psychologicznej zależą od zastosowanej manipulacji. Trzy badane grupy różniły się poziomem stresu. Ze względu na dwukrotny pomiar zmiennej zależnej (TIME1, TIME2) przeprowadzono dwie jednoczynnikowe analizy wariancji.
3
1
4
1
1
2
mułowaniezałożeń i
Określenie zmiennych i ich skal pomiarowych, sfor-
hipotez:
2
2
Zmienna niezależna: POZIOM STRESU (skala nominalna) - badane grupy.
3
2
Zmienna zależna: wynik w sprawdzianie intuicji psychologicznej TIME1 (zmienna ilo-
4
2
ściowa).
1
3
Założenia:
2
3
3
3
4
3
Ilościowa zmienna zależna ma w podpopulacjach wyznaczonych przez zmienną nieza-
leżną rozkład normalny.
Grupy niezależne zostały wylosowane z populacji o takich samych wariancjach (eJ ~
Suma
= eJ ~ = eJ~ = eJ
2 -
założenie o homogeniczności wariancji).
Hipotezy: Ho : f.Ll = f.L2 = f.L3 = f.L Stres nie wpływa na wyniki w sprawdzianie.
Hl : Przynajmniej jedna średnia f.Ll, f.L2 lub f.L3 różni się od przynajmniej jednej z pozo-
stałych.
SCHEMAT WNIOSKOWANIA
Wybór testu i ustalenie rozkładu statystyki:
Zmienne Założenia
Spełnione są założenia
testu F.
Hipotezy
Ze względu na to, że zmienna niezależna ma więcej niż 2 wartości, nie możemy zastosować testu t.
Wybór testu i rozkład statystyki
Przeprowadzamy jednoczynnikową analizę wariancji.
Reguła
Statystyka F ma:
decyzyjna
Obliczenia:
SS
df
52
F
dfl = k - 1 = 2
df2 = N - k = 30 - 3 = 27
dfl = dfa
df2 = dfw.
międzygrupowe
Ustalenie reguły decyzyjnej: wewnątrzgrupowe
Odrzucimy Ho. jeżeli prawdopodobieństwo związane z otrzymanym F odczytane z wydruku będzie mniejsze od a = 0,05.
ogółem
Decyzja
Obliczenia: Odczytanie wartości prawdopodobieństwa z wydruku komputerowego.
196
197
Zastosowanie analizy wariancji do testowania hipotez o
Rozdział 6. Jednoczynnikowa analiza wariancji
równości średnich
Tabela 6.3. Jednoczynnikowa analiza wariancji (ONEWAY). Statystyki opisowe N
TIME1
Błąd standardowy Średnia Odchylenie standardowe
1,00
10
6,00
2,11
0,67
2,00
10
5,90
2,42
0,77
3,00
10
6,10
2,13
0,67
30
6,00
2,15
0,39
Ogółem
Korzyst,ając z inf~rmacji za~artych w przykładzie 6.2 i poniższego wydruku, przeprowadź schemat wnioskowania dla zmiennej TIME2.
Tabela 6,5. Statystyki opisowe
1,00
10
7,90
1,97
0,62
2,00
10
4,00
2,26
0,71
3,00
10
6,10
2,13
0,67
Ogółem
30
6,00
2,61
0,48
Tabela 6.4. Analiza wariancji Suma kwadratów
kwadrat
0,20
2
1,000E-01'
grup
133,80
27
4,96
Ogółem
134,00
29
Między
grupami TIME1
Średni
df
Wewnątrz
F
Istotność
0,02
0,980
TIME2
Tabela 6.6. Analiza wariancji
, Symbol E _ 01. Jest to sposób oznaczenia iloczynu stojącej przed nim liczby x 10- (co 2 oznacza mnożenie przez 0,1). Analogicznie E - 02 oznaczałoby mnożenie przez 10- , czyli mnożenie przez 0,01. W praktyce oznacza to przesunięcie przecinka odpowiednio 2 o jedno lub więcej miejsc w lewo lub w prawo (E + 02 oznacza mnożenie przez 10 ).
Suma kwadratów
df
Średni kwadrat
F
Istotność
76,20
2
38,10
8,45
0,001
grup
121,80
27
4,51
Ogółem
198,00
29
1
Z wydruku odczytujemy, że otrzymaliśmy wynik nienależący do obszaru odrzuceń Ho F
Średnia Odchylenie standardowe Błąd standardowy
N
SS Między
grupami IME2
Wewnątrz
=0,020; P =0,98, co oznacza p > 0,05.
Podjęcie decyzji:
SCHEMAT WNIOSKOWANIA Dla TIME1 stwierdzamy brak podstaw do odrzucenia Ho i uznajemy, że manipulacja nie miała istotnego wpływu na wyniki uzyskane w sprawdzianie przeprowadzonym bezpośrednio po manipulacji.
Założenia
SCHEMAT WNIOSKOWANIA Zmienne
Założenia
Hipotezy
Zmienna niezależna: STRES - zmienna nominalna na 3 poziomach. Zmienna zależna: wynik w sprawdzianie intuicji TIME1 - zmienna ilościowa. Spełnione są założenia testu F
Ho = manipulacja stresem nie wpływa na wyniki w sprawdzianie. Hi : Przynajmniej jedna średnia /11, /12 lub /13 różni się od przynajmniej jednej z pozostałych. Manipulacja stresem wpływa na wyniki w sprawdzianie.
Wybór testu i rozkład statystyki Reguła decyzyjna Wartość statystyki
Decyzja
198
Zmienne Spełnione są założenia testu
F.
Hipotezy Wybór testu i rozkład statystyki Reguła
decyzyjna
Wartość statystyki
Decyzja
Statystyka F ma df1 = k - 1 = 2 df2 = N - k = 30 - 3 = 27. Jeśli p ~ 0,05, odrzucimy
Ho·
F = 0,020; P = 0,98 p> 0,05 więc stwierdzamy b.p.d.o. Ho. Manipulacja stresem nie miała istotnego wpływu na wyniki w TIME1.
Jeśli
SST
=106 i SSw =24, to jaka jest wartość SSB?
SST = SSB + SSw, to SSB = SSt- SSw, zatem SSB = 106 - 24 = 82.
199
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
Rozdział 6. Jednoczynnikowa analiza wariancji
Numer osoby
w grupie Jeśli SSa
Wynik
Grupa
-
1
1
10
(10-12)2
2
1
12
(12-12)2
3
1
14
(14 - 12)2
1
2
6
(6 - 6)2
2
2
5
(5 - 6)2
3
2
7
(7 - 6)2
3
7
(7 - 7)2
=9; 82 =8; 83 =7.
1 2
3
7
(7 - 7)2
Jaka jest wartość s~ ?
3
3
7
(7 - 7)2
81
2
Dla równolicznych podgrup
Sw
=
=3, mamy następujące dane:
222 SI +S2 +S3
k
Ponieważ grupy są równoliczne:
grupowa - średnia ogólna)2
średnia
grupy)2
=124 i SSw =46, to jaka jest wartość SST?
Zakładając jednakowe wielkości grup n = 12 i liczbę grup k
nx (średnia
(wynik
1
4
14
(14-15)2
2
4
16
(16-15)2
3
4
15
(15-15)2
4x(12-10)2
4 x (7 - 10)2
4x(15-10)2
12
Suma
177
SCHEMAT WNIOSKOWANIA Zmienne
Zmienna niezależna: DZIAŁ zatrudnienia - zmienna nominalna Zmienna zależna: OCENA przedsiębiorstwa - zmienna ilościowa Spełnione są założenia
Założenia
Hipotezy
Zakładając jednakowe wielkości grup n = 10 i liczbę grup k = 4, mamy następujące dane: 81
=6; 82 =7; 83 =5.
i rozkład statystyki Reguła
Psycholog interesujący się zagadnieniami zarządzania chce ~pr~wdzić, czy osoby zatrud~io ne w różnych działach różnią się w swoich ocenach prze.dslębl~rstwa. Trz~ osoby z dZiału technicznego (GRUPA 1) oceniły firmę na: 10, 12 i 14;.troje z dZI.ału ma:ketmg~ (GRUPA 2,~ na: 6, 5, i 7; troje z kSięgowości (GRUPA 3) na: 7, 7 17, natomiast troje z dZiału produkCJI (GRUPA 4) na: 14, 16 i 15. Wyższe wartości oznaczały bardzi~j ~ozytywne oce.ny. Czy osoby pracujące w różnych działach różnie oceniają firmę? PrzetestuJ hipotezę, stoSUjąc SCHEMAT WNIOSKOWANIA (ex 0,05). Narysuj wykres średnich porównywanych grup.
=
200
Ho : Pracownicy różnych działów oceniają swoją firmę jednakowo. H1 : Pracownicy różnych działów różnie oceniają swoją firmę (co najmniej jedna z grup pochodzi z populacji o różnej średniej niż grupy pozostałe).
Wybór testu
Jaka jest wartość s~ ?
decyzyjna
Statystyka F ma df1
=k - 1 =3; df2 =N - k =12 - 4 =8. =
SS
df
międzygrupowe
177
3
12
8
s2
177 3
Decyzja
F
= 59
12 =15 8
ogółem
I
Gdy a= 0,05 Fkryt (3;8) 4, 07 ~ odrzucimy Ho. jeśli Fotrz (3;8) ~ 4,07.
Obliczenia:
wewnątrzgrupowe
testu F.
59 "" 3933 15 ' ,
'
189
Fotrz ~
=Fkryt ~ odrzucamy Ho
Wykres średnich ocen przedsiębiorstwa dokonanych przez pracowników zatrudnionych w nych działach przedstawia rysunek 6.3.
róż
201
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
Rozdział 6. Jednoczynnikowa analiza wariancji
5 r-------------,
16.,......---·-----------......., 14
-l--------------
4 +------------~
12
3 +------------~
10
8
o ..L1
2
3
.
'"
~~~
'/ ~
~
W badaniu porównywano odczuwaną intensywność nieodwzajemnionej miłości w trzech grupach: (1) 50 osób, które były w chwili badania nieszczęśliwie zakochane, uzyskało średnią intensywność M 1 3,5 z wariancją s; 5,2; (2) 50 osób, wcześniej nieszczęśliwie zakochanych, opisujących swoje wcześniejsze doznania w retrospektywie, uzyskało M2 = 3,2 z wariancją s~ 5,8 oraz (3) 50 osób, które nie doświadczyły nieszczęśliwej miłości, opisując jak przypuszczalnie by się czuły, gdyby jej doświadczyły, uzyskało M3 3,8 z wariancją s~ 4,8. Czy grupy różniły się pod względem intensywności doznań? Przetestuj hipotezę, stosując SCHEMAT WNIOSKOWANIA (a 0,05). Narysuj wykres średnich.
=
=
=
~
"""
Jlli~~~g~~)nie 6.5b. . ;'~ił!~7
"
. Ówicl:el:lie 6.5a. . ..
"~if'{
~
4
Rysunek 6.3. Wykres średnich ocen pracowników różnych działów
~)
t------------....j
2
6 4 2 O
=
=
Czy studenci z różny~h uczelni r~żnią się poz~om~m towarzyskości? Z trzech uczelni wylosowano po 25 ~tu?entow. Następnie zapytano Ich, Ile czasu dziennie (w godzinach) spędzają w towarz.ystwle I~nych ~t~dentów. W.uczelni X śr~dnia wyniosła M1 5 z wariancją 2, w ucze!nI Y.- M2 - 4 Z S2 - 1,5, natomiast w uczelni Z - M3 6 z wariancją s~ 2,5. Jaki można ~snucwnl~sek? Przetestuj hipotezę, stosując SCHEMAT WNIOSKOWANIA (a= O 05). NarysUJ wykres srednlch. '
=
=
=
s; =
SCHEMAT WNIOSKOWANIA Zmienne
=
Założenia
Statystyki
Grupa 1
Grupa 2
Grupa 3
M
3,5
3,2
3,8
52
5,5
5,8
4,8
N
50
50
Spełnione są założenia testu
F.
Hipotezy
Wybór testu i
50
rozkład
Reguła
statystyki
decyzyjna
Obliczenia:
SCHEMAT WNIOSKOWANIA
df
S2
F
międzygrupowe wewnątrzgrupowe
Zmienne
ogółem
Spełnione są założenia testu F.
Założenia
Decyzja
Hipotezy
7r----------------. Wybór testu i rozkład statystyki
6t--------------J 5t-------------~
Reguła decyzyjna
Obliczenia:
df
S2
F
4
t--------------
międzygrupowe
3t---------------
wewnątrzgrupowe
2r-------------~
ogółem
202
Decyzja
0+----------------.:
203
Zastosowanie analizy wariancji do testowania hipotez o
Rozdział 6. Jednoczynnikowa analiza wariancji
równości średnich
grupa 1 - była grupą kontrolną, nie poddaną żadnej terapii; otrzymała
grupa 2 -
Źródło Między
120
grupami
a) ..........
grup
209
Ogółem
po
spożyciu
alkoholu;
grupa 4 - została poddana jednocześnie terapii i leczeniu farmakologicznemu.
df
Średni
kwadrat (52)
zanotował liczbę
Badacz wyniki:
F
b) ..........
ciągu
12 kolejnych
Grupa 3 (terapia)
Grupa 4 (leki + terapia)
1
11
4
6
3
2
13
7
4
4
3
10
6
4
O
4
7
7
2
2
19
=SSr + SSa =209 - 120 =89 b) dfw =dfr- dfa = 19 - 3 =16
a) SSw
5
9
4
1
2
6
10
2
1
1
M
M1= 10
M 2 =5
M 3 =3
M 4 =2
n
n1= 6
n2= 6
n3= 6
n4= 6
s
S1= 2
S2= 2
S3= 2
Ogółem
M=5
N=24
SS B _ 120 - 40 c) SB = d/B --3-2
Wykorzystującwydruk
wrotów
40 e) F=-1L=--=7,19 s~
5,56
zależy
komputerowy (tabela 6.7), zweryfikuj od rodzaju leczenia (a= 0,05).
Między
Uzupełnij tabelę analizy wariancji:
Suma kwadratów (SS)
df
kwadrat (52)
a) ..........
3
c) ..........
grup
100
b) ..........
Ogółem
160
23
Między
grupami Wewnątrz
Średni
F
df
grupami
d) ..........
228,00
76,00
Wewnątrz grup
20
70,00
3,50
Ogółem
23
298,00
tów do 4 grup:
=1,41
hipotezę mówiącą, że
liczba na-
F
Istotność F
21,70
0,000'
SCHEMAT WNIOSKOWANIA Zmienna niezależna: RODZAJ LECZENIA - zmienna nominalna Zmienna zależna: LICZBA NAWROTÓW - zmienna ilościowa
Założenia
Spełnione są założenia
Reguła
decyzyjna
Wartość
Decyzja
statystyki
testu F.
Ho : Rodzaj leczenia nie wpływa na liczbę nawrotów. H1 : Rodzaj leczenia wpływa na liczbę nawrotów
Hipotezy
Wybór testu i rozkład statystyki Badacz zainteresowany wpływem różnych rodzajów terapii na liczbę nawrotów cho;o?y u pacjentów ze zdiagnozowanym zespołem alkoholowym wybrał losowo 24 oso~y ~posrod o~ze kujących na wizytę w poradni. Następnie, również w sposób losowy, przydzielił po 6 paCjen-
Średni
kwadrat
3
Zmienne e) ..........
Suma kwadratów
o
204
S4
Tabela 6.7. Analiza wariancji Źródło
Źródło
następujące
to
Grupa 2 (leki)
d) ..........
S2
miesięcy. Ilustrują
Grupa 1 (kontrolna)
c) ..........
3
nawrotów w
Numer osoby e) ..........
Wewnątrz
powodujący mdłości
grupa 3 - została poddana terapii behawioralnej;
Uzupełnij tabelę analizy wariancji:
Suma kwadratów (SS)
lek
(co najmniej jedna z grup pochodzi z populacji liczbie nawrotów niż grupy pozostałe).
różnej średniej
Statystyka F ma df1 = k - 1
=3; df2 =N - k =24 - 4 =20.
Odrzucimy Ho, Forrz(3;20)
jeśli
p ~ 0,05.
=21,70; P < 0,001
Odrzucamy Ho.
205
Rozdział
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
6. Jednoczynnikowa analiza wariancji
Smak pasty do
Badano wpływ stresu na pracę serca. Badanych przydzielono losowo do trzech grup. Osoby, które znalazły się w grupie 1 wprowadzono w stan zdenerwowania, w grupie 2 - w stan relaksu, a w grupie 3 nie wpływano na nastrój badanych. Następnie zmierzono i zanotowano liczbę uderzeń serca na minutę u każdego z nich. Czy wpływ STRESU na pracę serca (uderzenia na minutę) jest istotny statystycznie? Odpowiedz na to pytanie, stosując SCHEMAT WNIOSKOWANIA i wykorzystując wydruk komputerowy.
zębów
Wiśnia
Guma
Mięta
7,2,8,5,3,3,0
5,8,3,4,2,8,5
9,10,7,4,10,6,3
M1 =4
Mz= 5
M3 = 7
M=4 ~zy ~mak
pasty wp~wa na liczbę ubytków? Narysuj wykres średnich i przetestuj odpowiedSCHEMAT WNIOSKOWANIA i wykorzystując wydruk komputerowy z tabeli 6.9. nią hIP.otezę, stosuJąc
Poziom zmiennej STRES Grupa 1 (stres)
Grupa 2 (relaks)
Grupa 3 (kontrolna)
84,82,82,85,87
79, 86, 72, 73, 70
90,80,71,65,79
Mz= 76
M1=77
M1=84
Tabela 6.9. Analiza wariancji zmiennej UBYTKI
Między
M= 79
Średni
df
Suma kwadratów
kwadrat
Między grupami
2
190,00
95,00
12
550,00
45,83
14
740,00
Wewnątrz
grup
Ogółem
F 2,07
kwadrat
2
32,67
16,33
18
128,00
7,11
20
160,67
grup
Ogółem
Tabela 6.8. Analiza wariancji Źródło
Suma kwadratów
grupami
Wewnątrz
Istotność
Średni
df
Źródło
Istotność
F 2,30
F
0,129
F
0,17
SCHEMAT WNIOSKOWANIA Zmienne Założenia
Spełnione są założenia testu
F.
Hipotezy
SCHEMAT WNIOSKOWANIA Wybór testu i rozkład statystyki
Zmienne Spełnione są założenia testu F.
Założenia
Hipotezy
Decyzja
Wybór testu i rozkład statystyki
7r---------------,
Reguła decyzyjna
6+---------------1
Wartość statystyki
5+----------------i
Decyzja
4+-----------------.j ,
%&
"
206
Reguła decyzyjna Wartość statystyki
:~ ~
_Cwiczeoie 6.7b. ' ,;'
3+----------------i 2+-----------------i
.
Dentysta był zainteresowany wpływem smaku pasty do zębów na częstotliwość mycia zębów przez dzieci i, co za tym idzie, liczbę ubytków w ich zębach po określonym czasie. Dentysta wybrał do badania 21 dzieci i podzielił je losowo na 3 grupy. Każda z grup przez 6 miesięcy myła zęby pastą o innym smaku: wiśniowym, gumy do żucia lub miętowym. Po 6 miesiącach dentysta zaobserwował następującą liczbę ubytków w grupach:
o+----------------i
207
Rozdział
Zastosowanie analizy wariancji do testowania hipotez o równości średnich
6. Jednoczynnikowa analiza wariancji
Tabela 6.10. Analiza wariancji
Jeżeli
wariancje we wszystkich grupach są równe, to:
kwadrat
.... ....
224,00
....
182,00
....
....
406,00
M 1= 19 M2 = 12 M3 = 20 M= 17
M 1 = 19 M2 = 19 M3 = 13 M= 17
B 1)
= 16
S2
w
SSB=
s' = 380 =190
S2
2
B
B
=
16
F=
'
M 1= 19 M2 = 12 M 3 = 20 M= 17
A 2) s~
= 100
S2
w
S2
B
=
S2
B
Błąd
Odchylenie standardowe
standardowy
Grupa kontrolna
7
52,00
3,65
1,38
Grupa eksperymentalna
7
44,00
4,12
1,55
średniej
=8,00
Test Levene'a jednorodności wariancji wynosi: F = 0,404; p = 0,537.
=
SSB=
SSB=
0,002
M1 = 19 M2 = 19 M3 = 13 M= 17
B2)
51 = 52 = 53= 10
51 = 52 = 53= 10
14,77
F
Średnia
Różnica średnich
F = 190 = 11 88
Istotność
N
=
SSB = 10 X (2 2 + 52 + 32) = 380
F
Tabela 6.11. Statystyki opisowe dla grup
51 = 52 = 53 = 4
51 = 52 = 53 = 4 s~
grup
Ogółem
Porównajmy 4 hipotetyczne rozkłady (n = 10):
A 1)
df
Między grupami Wewnątrz
Średni
Suma kwadratów
Źródło
=
Tabela 6.12. Test t dla prób Wariancje
t
df
niezależnych Istotność
Błąd standardowy różnicy
równe
3,84
12
0,002
2,08
nierówne
3,84
11,83
0,002
2,08
F=
F=
SCHEMAT WNIOSKOWANIA Zmienne Założenia
Spełnione są założenia testu
F.
Hipotezy Zbadano różnice wyników w testach wiadomości uczniów piszących test w ciszy i hałasie (otwarte okno z odgłosami dobiegającymi z budowy). Odpowiedz na pytanie, czy hałas wpły wa na rezultaty testów, stosując SCHEMAT WNIOSKOWANIA i wykorzystując wydruki z SPSS następujących analiz:
Reguła decyzyjna
Wartość statystyki
a) jednoczynnikowej analizy wariancji,
Decyzja
b) testu t Studenta. Zanim przystąpisz do weryfikacji hipotezy, uzupełnij luki w tabeli 6.10 zawierającej analizę wariancji.
208
Wybór testu i rozkład statystyki
Grupa kontrolna
Grupa eksperymentalna
51,60,51,52,51,49,50
45,38,42,48,50,41,44
M 1 =52
M 1 =44 M=48
Zauważmy, że
Niewielkie
różnice wynikają z zaokrągleń.
209
Rozdział
Testy porównań poszczególnych średnich w analizie wariancji
6. Jednoczynnikowa analiza wariancji
Stosując test t, stwierdzono, że średnie w dwóch grupach różnią się istotnie statystycznie. Czy możliwe jest otrzymanie nieistotnego wyniku za pomocą testu F, na tych samych grupach pomiarów? (Zakładamy, że poziom a jest jednakowy i nie popełniono błędów w obliczeniach.)
Testy
porównań
poszczególnych średnich w analizie wariancji Analiza wariancji pozwala nam zweryfikować hipotezę zerową, mówiącą, że wszystkie średnie w porównywanych podpopulacjach są równe. Jeżeli okaże się, że możemy tę hipotezę odrzucić, to wiemy, iż co najmniej jedna średnia różni się istotnie statystycznie od co najmniej jednej z pozostałych - niestety nie wiemy (chyba że mamy do czynienia z banalnym przypadkiem dwóch średnich), które różnice są istotne. Jak pokazaliśmy na początku rozdziału, nie możemy użyć testu t do porównywania par różnic ze względu na kumulowanie się błędu I rodzaju. Przeanalizujmy następujący przykład. Chcemy na podstawie danych PGSS sprawdzić, czy istnieje różnica w ważności przypisywanej sąsiadom (JAK WAŻNI SĄSIE DZI) przez respondentów mieszkających w ośmiu regionach Polski: Centralnym, Wielkopolskim, Śląskim, Zachodnim, Pomorskim, Północno-Wschodnim, Wschodnim i Małopolskim (REGION8). Chcemy sprawdzić, w którym regionie mieszkańcy są najbardziej zainteresowani swoimi stosunkami z sąsiadami, co może być dobrą prognozą dla rozwoju demokracji lokalnej. Ponad stuletni okres rozbiorów spowodował powstanie sporych różnic w kulturze i mentalności mieszkańców różnych regionów. Test ogólny analizy wariancji pozwoli nam jedynie sprawdzić, czy któryś z regionów różni się od przynajmniej jednego z pozostałych pod względem ważności przypisywanej sąsiadom. Co jednak zrobić, gdy chcemy sprawdzić, czy sąsiedzi są ważniejsi np. dla mieszkańców regionu Śląskiego niż dla mieszkańców regionu Pół nocno-Wschodniego? Albo gdybyśmy chcieli przetestować hipotezę dotyczącą tego, czy mieszkańcy Małopolski różnią się od reszty kraju, którą możemy zapisać przy użyciu symboli w następujący sposób:
210
Możemy tego dokonać za pomocą planowanych (a priori) lub nieplanowanych (post hoc) porównań średnich. Porównania nieplanowane (post hoc) są elementem eksploracyjnej analizy danych. Dokonujemy ich, gdy nie mamy sprecyzowanych hipotez dotyczących różnic między poszczególnymi średnimi - więc porównuj emy każdą średnią z każdą.
Tabela 6.13.
Najczęściej używane testy porównań
Porównania planowane (a priori)
Porównania nieplanowane (a posteriori) testy porównań wielokrotnych (post hoc)
Kontrasty (liniowe)
Test LSD Fishera
Poprawka Bonferroniego (Test Dunna)
Test TSD Tukeya
Test Dunna-Sidaka
Test Newmana-Keulsa Test Duncana Test Scheffego
W niniejszym podręczniku ograniczymy się do omówienia kontrastów planowanych, ponieważ są one jako elementy analizy konfirmacyjnej dużo cenniejsze od testów post hoc, choć niestety rzadziej stosowane.
Kontrasty Kontrasty pozwalają nam testować hipotezy zerowe będące dowclnie skomplikowanymi kombinacjami liniowymi średnich. Oczywiście nic nie stoi na przeszkodzie, aby użyć ich do porównania ze sobą dwóch średnich, ale zazwyczaj będziemy się nimi posługiwać przy bardziej skomplikowanych hipotezach szczegółowych. Wróćmy do naszego przykładu, w którym porównywaliśmy ze sobą ważność są siadów deklarowaną przez mieszkańców różnych regionów Polski: Centralnego (,ul), Wielkopolskiego (,u2), Śląskiego (,u3), Zachodniego (,u4), Pomorskiego (,us), Północno-Wschodniego (,u6), Wschodniego (,u7) i Małopolskiego (,us).
211
Testy porównań poszczególnych średnich w analizie wariancji
Rozdział 6. Jednoczynnikowa analiza wariancji
Hipoteza l. Chcemy sprawdzić, czy mieszkańcy regionu Wschodniego bardziej cenią sobie sąsiadów niż mieszkańcy regionu Północno-Wschodniego.Regiony te sąsiadują ze sobą, ale historycznie jeden z nich związany jest z Prusami (Północno-Wschodni), drugi zaś z kresami wschodnimi Rzeczypospolitej. Konstrukcję kontrastów rozpoczynamy od postawienia hipotezy zerowej:
Ho:
Aby otrzymać prostsząpostać kontrastu, pomnożymy obie strony powyższej równości przez 4 (nie jest to konieczne, ale bardzo wygodne) i przenosimy wszystko na lewą stronę:
Ho : /11 + /16 + /17 + /18 - /12 - /13 - /14 - /15 Otrzymujemy wówczas następujące wagi:
f16 = f17
Kontrasty zgodnie z konwencją zapisuje się w postaci wag. Wagi są współczyn nikami, przez które mnoży się odpowiadające im średnie w równaniu Ho przekształ conym w taki sposób, aby wartości średnie znajdowały się z jednej strony równości:
Ho:
f16
"
~'b' 0<:'
~~
~~~
~'b' 0<:'
V
f.11
O
RO
~o
.~
~
~'tj:;
~o '\;'b-{j
~"
f.12
"
.~
~
o'
~
o~
~
~cf .~ o{j ~f ~<:' ~o t:tJ{j
~
.~
b<:'
~o
~eP
"
o~~
~o-q ~'b'
f.13
f.14
f.15
/l6
f.17
f.1a
O
O
O
1
-1
O
O
"
.~
~
~'l):;
~o '\;'b-{j
o' .
~
~o
o{j b<:'
,~<:' ~o
~o t:tJ{j
"
.~
~cf .~
~
b<:'
"
~,0
V
'* f17 = O.
b<:'
"
o~~ ~o-q
~~~
Wypisujemy wagi dla kolejnych średnich:
"
=O.
o~~
b<:'
~o
~t;,p
~
~o-q
~1f
f.11
f.12
f.13
f.14
f.15
f.16
f.17
f.1a
1
-1
-1
-1
-1
1
1
1
czyli Cz = (1, -1, -1, -1, -1,1,1, 1). Zauważmy, że wagi faktycznie sumują się do zera. Zanim dowiemy się, jak w praktyce wykonuje się testy kontrastów, wprowadzimy jeszcze kilka użytecznych pojęć. Wyróżnia się często następujące typy kontrastów: 1. Kontrasty par. Jak sama nazwa wskazuje, porównują one ze sobą dwie śred nie. Przykładem takiego kontrastu był ten, który wypisaliśmy dla Hipotezy 1. Jeżeli w naszej analizie jest k porównywanych grup, to wszystkich kontrastów par jest k(k - 1) / 2. . 2. Kontrasty złożone. Są to takie kontrasty, w których występują więcej niż dwie średnie, tak jak w kontraście Cz. 3. Kontrasty niezależne (ortogonalne). Dwa kontrasty są niezależne,jeżeli znajomość jednego z nich nie daje nam żadnej informacji o drugim. Matematyczne kryterium, jakie musi być spełnione jest następujące:jeżeli mamy k śred nich i dwa kontrasty W = (wJ, Wz, ... , Wk) oraz C = (cJ, Cz, ... , Ck), to są one niezależne, jeżeli spełniony jest warunek:
lub skrótowo: CI = (O, 0, 0, 0, 0, 1, -1, O) - ważne jest, żeby nie pomylić kolejności wag! Aby poprawnie wypisać wagi, trzeba się trzymać kilku prostych reguł: 1. wag musi być tyle, ile jest wszystkich średnich; 2. średnie, które nie występują w hipotezie zerowej mają wagę równą zeru; 3. średnie, które ze sobą porównujemy (albo kontrastujemy) mają przeciwne znaki; 4. suma wszystkich wag musi się równać zeru.
WICI
+ WzCz + ... + WkCk = 0,
czyli suma iloczynów wszystkich wag musi być równa zeru.
Tak wypisane wagi można wprowadzić do programu statystycznego, który wykona resztę obliczeń. Przeanalizujmy nieco bardziej złożoną hipotezę· ,
Hipoteza 2. Sprawdzamy, czy mieszkańcy terenów byłego zaboru pruskiego różnią się pod względem stosunku do sąsiadów od mieszkańcówpozostałych terenów Polski. Zapisujemy to w postaci hipotezy: H'~+~+~+~=~+~+~+~ O'
212
4
4
~4'
'"
o
~łJZ~Rład 6.9. o ~ "
Sprawdźmy, czy
? ,,,
kontrasty W1 = (0,0,0,0,0, -1, 1, O) i G2 = (1, -1, -1, -1, -1, -1, 1, 1, 1) są
niezależne:
Ox1 +Ox(-l) +Ox(-l) +Ox(-1) +Ox(-l) + (-1) xl + lxI +Oxl =O, co oznacza,
że
kontrasty te
są niezależne.
Dla k porównywanych grup możemy wypisać (k - 1) niezależnych kontrastów. Pozwalają one na podział całego zróżnicowania zmiennej zależnej na osobne części.
213
Rozdział
Testy porównań poszczególnych średnich w analizie wariancji
6. Jednoczynnikowa analiza wariancji
Na podstawie danych PGSS sprawdźmy istotność kontrastu skonstruowanego do pierwszej z naszych hipotez.
Sprawdź niezależność następujących kontrastów:
.,
~~
';:o..~~
~'lf 0~ C;
#~
.,
oq.'1~ j:;
~,0
.,
.~
~ o~
~~ ~o
u
1,-'lt
~
o~
~o# .~ Ou ~~
'~~ ~o
~o
e.;,u
.,
.~
~e.;,u
~
.,
';:o..~
~~ ~o
o
~o~
~'lf 0~ C;
~'lf
f.l1
f.l2
f.l3
f.l4
f.ls
f.l6
f.l7
f.l8
1
1
1
O
O
-1
-1
-1
7
-1
-1
-1
-1
-1
-1
-1
f.l1
.,
';:o..~
';:o..~~
oq.'1~ f;
o
~o~
~,0
= 4,10
f.l2
O
= 4,16
O
f.l3
= 4,07
.,
.~
lf o~
~~ ~o
,""u f.l4
O
~
= 4,17
O
f.ls
o~
~o# .~ Ou ~~
,~~ ~o ~o e.;,u
~e.;,u
f.l6
O
= 4,48
';:o..lf o
f.l7
1
~o~
~'lf
~
= 3,91
.,
.~
~~ ~o
= 4,66
f.l8
= 4,31
-1
O
1x7=7 1x(-1)= Suma
Tabela 6.14. Analiza wariancji zmiennej JAK WAŻNI SĄSIEDZI
Wniosek: kontrasty są zależne / niezależne. Warto zwrócić uwagę na dwie kwestie: •
=
Pomnożenie kontrastu przez stałą nie zmienia jego wartości, tzn. kontrasty G1 (O, 1, -3, 1, 1) i G2 = (O, 2, -6, 2, 2) są równoważne. Ta własność wynika oczywiście bezpośrednio z faktu, że możemy pomnożyć obie strony równania przedstawiającego hipotezę zerową
przez stałą.
Między
grupami
Wewnątrz
grup
Ogółem
Suma kwadratów
df
Średni kwadrat
F
Istotność
63,02
7
9,00
2,632
0,010
6060,66
1772
3,42
6123,67
1779
• Kontrasty pozwalają nam testować hipotezy będące kombinacjami średnich, nie możemy jednak za ich pomocą testować hipotez, w których do jakieś średniej dodalibyśmy stałą. Na przykład hipotezy postaci:
H o'. )12+)13+)14+)15 4
= )11 + 10 .
Test istotności hipotezy zerowej określonej przez kontrast polega na wyliczeniu statystyki według następującego wzoru:
t
-1 x4,48 + 1x4,66
-4,48+4,66
2 342x -12+ 1- ) , ( 122 125
.J3,42xO,016
0,18 .JO,055
=
0,18 "" 0766 0,235
W tym badaniu mieliśmy 1780 osób badanych i 8 porównywanych grup, mamy k = 1772 stopnie swobody. Odczytana z tablic wartość krytyczna testu t przy założonym poziomie istotności a = 0,05 wynosi tk = 1,96. Ponieważ nasze t < tk, nie możemy odrzucić Ho i musimy stwierdzić, że kontrast jest nieistotny. Mieszkańcy regionu Wschodniego i Północno-Wschodniego nie różnią się istotnie pod wzglę dem ważności przypisywanej sąsiadom. więc df = N -
t=-i=~== k
2~
C2 i
SwL-.;=1
'
ni
gdzie k - liczba porównywanych średnich, ni - liczebność i-tej grupy. Statystyka ta ma rozkład t Studenta dla df = N - k stopni swobody.
Wyrażenie w liczniku
I. C;M; = C,M + C M
Założenie
k
1
2
2
+ ... + C KMKjest sumą iloczynów wag
;::1
214
przez odpowiadające im średnie. Wyrażenie to nazywa się wartością kontrastu. W mianowniku znajduje się suma kwadratów wag podzielonych przez liczebności poszczególnych porównywanych grup. Suma ta jest pomnożona przez wyznaczony w analizie wariancji estymator wariancji wewnątrzgrupowej S2w •
o równości wariancji
Przedstawiony wzór na wyliczenie statystyki t dla kontrastów wymaga spełnienia założenia równości wariancji w odpowiednich podpopulacjach. Gdy założenie to nie jest spełnione, zamiast wykorzystywania S2 do szacowania wariancji niewyjaśnionej hipotezą (błąd) musimy oszacować błąd porównania dla każdego kontrastu
215
Rozdział
6. Jednoczynnikowa analiza wariancji
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
oddzielnie. Dodatkowo należy skorygować liczbę stopni swobody. Wzory używane do tych obliczeń są dosyć złożone, zazwyczaj więc powierzamy to zadanie komputerowym pakietom statystycznym. Mimo że pokazywaliśmydziałanie testów kontrastów na przykładziejednoczynnikowej analizy wariancji, to nic nie stoi na przeszkodzie, aby ich używać w przypadku analizy dwuczynnikowej, z którą zapoznamy się w następnym rozdziale.
Podsumowanie Analiza wariancji jest metodą pozwalającąna podział zmienności zmiennej zana oddzielne części, z których każdą możemy przypisać znanemu źródłu. Zmienność wyrażona jest w postaci sumy kwadratów odchyleń od odpowiedniej
leżnej
średniej.
Sumy kwadratów i związane z nimi stopnie swobody są addytywne: SST = SSw dfr
+ SSB
= dJB + d/w => N-l = (k -
Odpowiednio stopnie swobody: d/B = dfi
1) + (N - k)
d/w = dh
Estymator wariancji ~
międzygrupowej
Międzygrupowa
(SSB)
/'
(s~)
i......
Stosunek F Całkowita
suma kwadratów (SSr)
>
1< •
Wewnątrzgrupowa
(SSw)
~
2
F=~2 otrz
Sw
Estymator wariancji wewnątrzgrupowej
(s~ )
SSw- suma kwadratów odchyleń wyników średnich w poszczególnych grupach SSB - suma kwadratów odchyleń średnich w grupach od średniej ogólnej SST- suma kwadratów odchyleń wyników od średniej ogólnej
216
Dwuczynnikowa analiza wariancji Pojęcia
kluczowe: dwuczynnikowa analiza wariancji; efekt
główny;
efekt
interakcyjny; powtarzane pomiary Nowe symbole: SSc, SSR. SSRC. SSreszta. s~. s~. s~c. Fc• FR. FRc
Dwuczynnikowa analiza wariancji pozwala nam w jednym eksperymencie oceefekt (wpływ) dwóch niezależnychzmiennych nominalnych oraz interakcji mię dzy tymi czynnikami na ilościowązmiennązależną. Jeżeli wpływ zmiennej nominalnej na zmienną ilościowąjest istotny, to mówimy, że istotny jest efekt główny czynnika. nić
Efekt interakcji o interakcji dwóch czynników mówimy wtedy, gdy ich łączny efekt nie da się przewidzieć na
podstawie efektów czynników działających osobno. Jeżeli pijemy alkohol, to możemy się upić i usnąć. Jeżeli bierzemy środki nasenne, to szybko uśnie my. Jeżeli jednak zrobimy te dwie rzeczy równocześnie, to... możemy umrzeć. Gdyby wpływ obu czynników był addytywny, to po ich łącznym zastosowaniu powinniśmy szybciej zasypiać niż po działaniu jednego z nich. Śmierć świadczy o tym, że wpływ nie jest addytywny, lecz interakcyjny - nie da się przewidzieć na podstawie znajomości efektów głównych obu czynników. Efekt interakcji może mieć różną postać. Prześledzimy to na przykładzie. Chcemy sprawdzić wpływ psychoterapii (czynnik R) i przyjmowania leków (czynnik C) na długość snu (liczbę godzin). Symbole R, C pochodzą od angielskich słów oznaczających wiersz (row) i kolumnę (column), ponieważ tego typu dane przedstawiane są w formie tabeli (por. tabela 7.1). Jeżeli efekt jednego czynnika zależy od poziomu drugiego czynnika, np. wpływ leku na długość snu jest różny dla osób poddawanych psychoterapii i niepoddawanych psychoterapii, to mówimy, że wystąpił istotny efekt interakcji.
217
Rozdział
7. Dwuczynnikowa analiza wariancji
Efekt interakcji
c1, bez leków
C2 , leki MR1C2
MR1C1
Rh średni
Bez terapii
czas snu osób nie poddanych terapii i zażywających leki
MR2C1
MR2C2 średni czas snu osób poddanych terapii i zażywających leki
R2 , średni
czas snu osób poddanych terapii i niezażywających leków
Terapia
średni
czas snu osób nie poddanych terapii i niezażywających leków
Rysunek 7.1. Schemat badawczy
wyniki średnich połączono osobnymi liniami w ramach grup: zażywających leki lub niezaży wających. Równoległość tych prostych pozwala przewidywać brak interakcji między czynnikami. Warto zauważyć, że jeżeli średnie w 4 grupach byłyby równe i wynosiły np. 7h, to otrzymalibyśmy dwie pokrywające się linie równoległe do osi OX, co świadczy o braku związku długo ści snu z analizowanymi zmiennymi. 9.,-----------~
bez leku leki
8 ..J-----~-~---ł
7 ..J-..---~--~~=---~----.j 6
..J--~~=---::7""'~----ł
s-l----.c::....-------l 4-+-------------.j 3-1-----------~
2-1-----------~
1-+-----------1 Wyobraźmy
sobie możliwe wyniki tego badania. Dla ułatwienia średnie pochodzące od 20 osób w każdej celi (komórce, kratce) tabeli danych są liczbami całkowi tymi, choć otrzymanie takich średnich w rzeczywistości jest mało prawdopodobne.
Bez leków
Leki
Efekt leków
Bez terapii
5h
6h
6h - 5h = 1h
Terapia
7h
8h
8h -7h = 1h
O-l-------.------~
bez terapii
terapia
Bez leków
Leki
Efekt leków
Bez terapii
8h
6h
6h - 8h= -2h
Terapia
6h
8h
8h - 6h = 2h
Efekt terapii 6h - 8h = -2h 8h - 6h = 2h
Efekt terapii 7h - 5h = 2h 8h - 6h = 2h
Efekt prosty terapii bez leków
-2h
Efekt prosty terapii na lekach
+2h
Efekt główny (uśredniony) terapii Efekt prosty terapii bez leków
+2h
Efekt prosty terapii na lekach
+2h
Efekt prosty leków bez terapii
Efekt główny (uśredniony) leków
główny (uśredniony)
W badaniu nie wykryto żadnego efektu głównego (uśrednionego). Nie możemy powiedzieć, że przyjmowanie leków wydłuża sen ani że taki wpływ wywiera uczestnictwo w terapii. Nie oznacza to jednak, że na tym kończy się nasza interpretacja wyników.
leków
2h
/2 = 1h
Porównanie efektów prostych pozwala nam stwierdzić, czy zaobserwowaliśmy interakcję czynników czy też nie. W tym przykładzie oba efekty proste terapii są takie same bez względu na to, czy osoby zażywały leki, czy nie. Także
218
efekty proste leków nie
Oh /2= Oh
+1 h
Efekt prosty leków w czasie terapii +1 h Efekt
-2h
Efekt prosty leków w czasie terapii +2h
Efekt główny (uśredniony) terapii 4h /2 = 2h Efekt prosty leków bez terapii
Oh /2 = Oh
zależą
od tego, czy osoby
uczestniczyły w
terapii, czy nie.
Otrzymane średnie możemy schematycznie przedstawić na rysunku. Na osi poziomej zaznaczono wartości zmiennej TERAPIA (zupełnie umownie, bo to przecież zmienna nominalna). Na osi pionowej umieszczone są średnie w poszczególnych grupach. Punkty przedstawiające
Porównanie efektów prostych pozwala nam stwierdzić, czy zaobserwowaliśmy interakcję czynników, czy też nie. W tym przykładzie efekty proste terapii różnią się w zależności od tego, czy osoby zażywały leki, czy nie. Poddanie się terapii bez zażywania leków skraca sen (-2h), przy zażywaniu leków sen wydłu (+2h).
ża
Także efekty proste leków zależą od tego, czy osoby uczestniczyły w terapii, czy nie. Zażywanie leków sen wydłuża lub skraca w zależności od tego, czy osoby uczestniczą (+2h) w terapii, czy też nie (-2h).
219
Rozdział
Testowanie efektów głównych i interakcyjnych
7. Dwuczynnikowa analiza wariancji
Otrzymane średnie możemy schematycznie przedstawić na rysunku. Przecinanie się prostych pozwala przewidywać efekt interakcyjny zmiennych.
-- --
9 8 7
~
6 5 4 3
bez leku leki
~
2
10
9 8 7 6 5 4 3 2 1 O
1
o
bez terapii
/
bez leku leki
/
/
--
bez terapii
terapia
terapia
Testowanie efektów głównych i interakcyjnych Bez leków
Leki
Efekt leków
Bez terapii
4h
5h
5h -4h
Terapia
6h
9h
9h - 6h
Efekt terapii 6h -4h
=2h
9h - 5h
2h
Efekt prosty terapii na lekach
4h
główny (uśredniony)
terapii
=1h =3h
1. w grupie CI studenci relaksują się przed testem, który jest przedstawiany jako nieważny sprawdzian; 2. w grupie C2 studenci są zachęcani, aby dać z siebie wszystko; 3. w grupie C3 studenci są straszeni, że test jest warunkiem zaliczenia przedmiotu.
=4h
Efekt prosty terapii bez leków
Efekt
Chcemy sprawdzić, czy zmienne: STRES (jak w zadaniu przykładowym z rozdziału 6.) i REAKTYWNOŚĆ wpływają na wyniki otrzymywane przez studentów w teście. W tym celu 12 niskoreaktywnych i 12 wysokoreaktywnych studentów przydzielamy losowo do trzech równolicznych grup, przy czym:
6h 12 = 3h
Jaki wyciągniesz wniosek na poziomie Efekt prosty leków bez terapii
1h
Efekt prosty leków w czasie terapii 3h Efekt główny
(uśredniony)
leków
4h 12 = 2h
W badaniu wykryto dwa efekty główne (uśrednione). Możemy podejrzewać (aby to stwierdzić, musimy sprawdzić istotność statystyczną), że zarówno przyjmowanie leków wydłuża sen (+2h), jak też podobny wpływ ma uczestnictwo w terapii (+3h). Nie oznacza to jednak, że na tym kończy się nasza interpretacja wyników. Porównanie efektów prostych pozwala nam stwierdzić, czy zaobserwowaliśmy interakcję czynników, czy też nie. W tym przykładzie efekty proste terapii różnią się w zależności od tego, czy osoby zażywały leki, czy nie. Pozytywny wpływ terapii jest silniejszy w grupie zażywających leki (+4h) niż w grupie niezaży wającej leków (+2h). Także efekty proste leków zależą od tego, czy osoby uczestniczyły w terapii, czy nie. Leki działają silniej na osoby poddane terapii (+3h) niż na te, które w terapii nie uczestniczą (+1). Otrzymane średnie możemy schematycznie przedstawić na rysunku. pozwala przewidywać efekt interakcyjny zmiennych.
a= 0.05, na podstawie nastę
Tabela 7.1. Dwuczynnikowa analiza wariancji REAKTYWNOŚĆ
220
istotności
pujących danych?
Nierównoległość
linii
Średnie
STRES C1
C2
C3
brzegowe
R1 Niskoreaktywni
1 122 MR1C1 =
4455 MR1C2 =
5577 MR1C3 =
MR1 =4
R2 Wysokoreaktywni
2233 MR2C1 =
5566 MR2C2 =
3355 MR2C3 =
MR2 =4
Średnie brzegowe
MC1 =2
MC2
=5
MC3
=5
M=4
W dwuczynnikowym schemacie analizy wariancji możemy: porównać średnią uzyskaną przez wysokoreaktywnych (MRl ) ze średnią ogólną (M) - prosty efekt główny wysokiej reaktywności; • porównać średnią uzyskaną przez niskoreaktywnych (MR2 ) ze średnią ogólną (M) - prosty efekt główny niskiej reaktywności.
•
221
Rozdział
7. Dwuczynnikowa analiza wariancji
Efekt interakcji
Te dwa proste efekty składają się na efekt główny czynnika R (uśrednionego na wszystkich poziomach czynnika C). • porównać średnią uzyskaną przez relaksowanych (MC1 ) ze średnią ogólną (M) - prosty efekt główny relaksu; • porównać średnią uzyskaną przez motywowanych (MC2 ) ze średnią ogólną (M) - prosty efekt główny motywowania; • porównać średnią uzyskaną przez straszonych (MC3 ) ze średnią ogólną (M)prosty efekt główny straszenia. Te trzy efekty proste składają się na efekt na wszystkich poziomach czynnika R). •
główny
czynnika C
(uśrednionego
Określenie zmiennych i ich skal mułowaniezałożeń i hipotez:
Zmienne niezależne: czynnik C - POZIOM STRESU (3 wartości - zmienna nominalna) czynnik R - REAKTYWNOŚĆ (2 wartości - zmienna nominalna) Zmienna zależna: WYNIKI W TEŚCIE (zmienna ilościowa) Założenia:
Zmienna zależna ma rozkład normalny w podpopulacjach wyznaczonych przez poziomy zmiennych niezależnych. Wariancje zmiennej zależnej w podpopulacjach wyznaczonych przez poziomy zmiennych niezależnych nie różnią się istotnie (homogeniczność wariancji). Losowy
porównać średnie
uzyskane w grupie relaksowanych przez wysokoreaktywnych (MR1C1 ) i niskoreaktywnych (MR2C1 ) - prosty efekt interakcji; • porównać średnie uzyskane w grupie motywowanych przez wysokoreaktywnych (MR1C2 ) i niskoreaktywnych (MR2C2 ) - prosty efekt interakcji; • porównać średnie uzyskane w grupie straszonych przez wysokoreaktywnych (MRlC3 ) i niskoreaktywnych (MR2C3 ) - prosty efekt interakcji. • Porównywać można też między sobą średnie uzyskane przez wysokoreaktywnych w grupie relaksowanej (MR1C3 ), motywowanej (MR1C3 ), straszonej (MR1C3 ) i analogicznie średnie uzyskane przez niskoreaktywnych w grupie relaksowanej (MR2C3 ), motywowanej (MR2C3 ), straszonej (MR2C3 )'
pomiarowych, sfor-
przydział do
grup eksperymentalnych.
Hipotezy: W dwuczynnikowej analizie wariancji mamy trzy hipotezy zerowe: 1a. Poziom stresu nie wpływa na wyniki w teście, co oznacza brak efektu głównego czynnika C.
Ho : JlC1 1b.
Reaktywność
=JlC2 =JlC3 =Jl
nie wpływa na wyniki w teście, co oznacza brak efektu głównego czyn-
nika R.
Ho : JlR1 =JlR2 =Jl 1c. Brak efektu interakcji czynników R (reaktywności) i C (poziomu stresu) na wyniki w teście.
Ho : JlR1C1
=JlR1C2 =JlR1C3 =JlR2C1 =JlR2C2 =JlR2C3 =Jl.
Oznaczenia:
Te proste efekty interakcyjne składają się na efekt interakcji R x C, który występuje wtedy, gdy efekty proste jednego czynnika nie są takie same na wszystkich poziomach drugiego czynnika.
c - liczba poziomów zmiennej C (liczba kolumn) r-liczba poziomów zmiennej R (liczba wierszy) n - liczebność osób w jednej kratce danych N n x r x c - liczebność próby
=
Hipotezy zerowe formułujemy jako zaprzeczenie hipotez badawczych. Pamiętajmy, że zaprzeczeniem równości wielu średnich jest stwierdzenie, że przynajmniej jedna śred nia różni się od pozostałych.
Średnie możemy przedstawić na rysunku:
Hipotezy badawcze możemy sformułować następująco:
7-,------------, 6 + - - -__-...,.---1
7 ,-----------"-""-
6+------
5+---~~----I
5+----
4+--....,t-~-4III!----1
4
3+--+-/-------1 2+--+-------1 1+---------1 O+---,----.---r--I C1
C2
C3
ad. 1b. Efekt główny czynnika R jest istotny statystycznie. Wyniki w teście istotnie zależą od poziomu reaktywności badanego.
+------'
3+---
ad. 1c. Efekt interakcji czynników R i C jest istotny statystycznie. Wpływ manipulacji poziomem stresu na wyniki w teście zależy od reaktywności badanych.
2
1
o C1
C2
C3
Rysunek 7.2. Średnie w teście dla różnych poziomów czynników
222
ad. 1a. Efekt główny czynnika C jest istotny statystycznie. Poziom stresu istotnie wpły wa na wyniki w teście.
Wybór testu i ustalenie
rozkładu statystyki:
Chcemy badać jednoczesny wpływ dwóch zmiennych niezależnych (czynników, zmiennych nominalnych) na zmiennązależną (zmienną ilościową), więc wybieramy dwuczynnikową analizę wariancji.
223
Rozdział
Efekt interakcji
7. Dwuczynnikowa analiza wariancji
Statystyka, którą wykorzystamy przy podejmowaniu decyzji względem każdej z hipotez zerowych ma rozkład F(df1 , df2 ).
3. Wyliczenie interakcyjnej sumy kwadratów:
SSRC
=n!
:!CM RiCj - M R1 - MCj + M)2 = j=!
i=!
Sumujemy po wszystkich r x c kratkach.
Ustalenie reguły decyzyjnej:
wewnątrzkratkowej (cel/s)
4. Wyliczenie
sumy kwadratów:
3a) Dla testu efektu głównego czynnika C jest: df1
=[c -
1] stopni swobody związanych z licznikiem oraz
df2 = [rc(n - 1)] stopni swobody związanych z mianownikiem.
Dla a =0,05 wartość krytyczna testu F kryt =3,55 przy df1 Jeżeli
Falrz ;e: Fkryt , odrzucamy Ho o braku
wpływu
Jeżeli
Falrz < Fkryt , to brak podstaw do odrzucenia Ho.
Sumujemy po wszystkich osobach w danej kratce, a
=2 i df2 =18.
poziomu stresu na wyniki testu.
3b) Dla testu efektu głównego czynnika R jest: df1 = [r-1] stopni swobody związanych z licznikiem oraz
5.
Wykorzystując addytywność
następnie
sum kwadratów, wyliczamy
po kratkach.
całkowitąsumę
kwa-
dratów: SSr = SSR + SSc + SSRC + SSw = Uproszczony wzór do sprawdzenia
poprawność wyniku
= [rc(n - 1)] stopni swobody związanych z mianownikiem. Dla a =0,05 wartość krytyczna testu Fkryt =4,41 przy df1 = 1 i df2 = 18. Jeżeli F alrz ;e: F kryt , odrzucamy Ho o braku wpływu poziomu reaktywności na wyniki
Sumujemy po wszystkich osobach badanych.
testu.
Tym razem
ma
postać:
df2
Jeżeli F alrz
<
Fkryt.
to brak podstaw do odrzucenia Ho.
3c) Dla testu efektu interakcji jest: df1 = [(r - 1)(c - 1)] stopni swobody związanych z licznikiem oraz
=0,05 wartość krytyczna testu Fkryt =3,55 przy df1 =2 i df2 =18.
Jeżeli F alrz
;e: Fkryt , odrzucamy Ho o braku interakcji poziomu stresu i poziomu reak-
tywności.
Jeżeli F alrz
oznaczający jej numer poziomu czynnika kolumnowego, przyjmuje wartości od 1 do c (liczba poziomów czynnika kolumnowego);
• ,j",
• "I", oznaczający jej numer w grupie (kratce), przyjmuje osób w grupie). 6. Wyliczenie liczby stopni swobody dla
< F kryt , to brak podstaw do odrzucenia Ho.
dfR
=r-1
dfc =
Wyliczenie wartości statystyki Fatn dla efektów głów nych i efektu interakcji: 1. Wyliczenie sumy kwadratów dla C:
SSc =nr2:CMCj-M)2 = j~l
2. Wyliczenie sumy kwadratów dla R:
n (liczba
estymatora:
c -1 =
dfRC = (r-1)(c-1) =
=rc(n -
1)
dfr = N -1
=
dfw
=
7. Wyliczenie odpowiednich estymatorów wariancji - dzielimy przez odpowiadającą im liczbę stopni swobody: S
2
SSR
----
R -
d/
-
R
M)2 =
;=1
Sumujemy po wszystkich poziomach czynnika R.
224
od 1 do
=
Sumujemy po wszystkich poziomach czynnika C.
= ncI,.(M R1 -
każdego
wartości
dfr = dfR + dfc + dfRC + dfw =
c
SSR
osoba jest wyznaczana przez trzy indeksy:
• .,i", oznaczający jej numer poziomu czynnika wierszowego, przyjmuje wartości od 1 do r (liczba poziomów czynnika wierszowego);
df2 = [rc(n - 1)] stopni swobody związanych z mianownikiem.
Dla a
każda
SSc s2 --c - d/c -
sumę
kwadratów
Efekt interakcji
Rozdział 7. Dwuczynnikowa analiza wariancji
S
Tabela 7.2. Dwuczynnikowa analiza wariancji
SSRC _ =--RC d+ ':J RC 2
Suma kwadratów (SS)
Źródło wariancji
SSw_ Sw = dfw 2
Efekty
8. Wyliczenie odpowiedniej statystyki Fatrz: Dla efektu głównego czynnika R:
głównego
Istotność
F
kwadrat (52)
F
główne
STRES [C]
48,00
2
24,00
36,00
0,000
REAKT[R]
0,00
1
0,00
0,00
1,000
12,00
2
6,00
9,00
0,002
Interakcja STRES REAKT[Cx R]
Dla efektu
Średni
df
czynnika C:
Reszta
12,00
18
0,67
Ogółem
72,00
23
3,13
Prześledźmy jeszcze
raz
dwuczynnikową analizę
wariancji na wzorach
Sumy kwadratów i związane z nimi stopnie swobody są addytywne:
Dla efektu interakcji R x C:
SSr = SSR + SSc + SSRC + SSw dfr = dfR + dfc + dfRC + dfw dfR =r-1 Podjęcie
dfc =c-1
dfRC =(r-1)(c-1)
dfx =rc(n-1)
dfr =N-1
SSw to zróżnicowanie w ramach osób znajdujących się w tej samej celi (kratce, klatce) tabeli danych. SSw oznaczane jest też jako RESZTA lub BŁĄD. SSw jest tym zróżnico waniem, którego nie potrafimy w danym schemacie analizy danych wyjaśnić.
decyzji:
Efekt główny reaktywności (czynnik R) Dla a
=0,05 wartość krytyczna testu F =4,41 przy df =1 i df =18. kryt
Fkryt , więc
FR
1
Ho o braku wpływu poziomu
reaktywności na wyni-
ki testu.
Fc
kryt
Fkryt , więc
1
2
Ho o braku wpływu poziomu stresu na wyniki testu.
~
Efekt interakcji reaktywności ze stresem (interakcja C x R) Dla a FR c
ziom
f--_~Fom =S~ sir
Kolumny
suma kwadratów
=0,05 wartość krytyczna testu F =3,55 przy df =2 i df =18.
Estymator wariancji
Wiersze Całkowita
Efekt główny stresu (czynnik C) Dla a
Suma kwadratów
2
f---.-! F otrz
=
Efek czynnika R
S~ sir
Efekt czynnika C
Interakcje Efekt interakcji CR Wewnątrz
=0,05 wartość krytyczna testu F =3,55 przy df =2 i df =18. kryt
F kryt , więc reaktywności,
Rozwiązanie
1
2
Ho o braku wpływu interakcji: poziom stresu x po-
na wyniki testu.
Rysunek 7.3.
Podział zmienności
w dwuczynnikowej analizie wariancji
zadania przykładowegoza pomocą pakietu statystycznego: zmiennej R
F = s~ = er + efekt zmiennej R R 2 2 Sw er
zmiennej C
F = S~ = er + efekt zmiennej C c S~ er 2
2
Test efektu
głównego
2
Test efektu
głównego
= S~c = er + efekt interakcji RxC 2
F Test efektu interakcji R x C
226
Re
2
Sw
er
2
227
Rozdział
Efekt interakcji
7. Dwuczynnikowa analiza wariancji
Jeżeli
Jeżeli
Fotrz ? Fkryt , to odrzucamy Ho'
Fotrz < Fk ryt ' to brak podstaw do odrzucenia Ho'
Hipotezy badawcze formujemy przez zaprzeczenie hipotez zerowych. Pamiętajmy, że zaprzeczeniem równości wielu średnich jest stwierdzenie, że przynajmniej jedna śred nia różni się od pozostałych, a nie że wszystkie różnią się między sobą. Hipotezy badawcze możemy sformułować następująco: 1a) Efekt główny czynnika C jest istotny statystycznie. Poziom stresu istotnie wpływa na wyniki w teście. 1b) Efekt główny czynnika R jest istotny statystycznie. Wyniki w od samooceny badanego.
Przeprowadzona wcześniej jednoczynnikowa analiza wariancji w badaniu LEARN nie pozwoliła sprawdzić, czy osoby o niskiej samoocenie zareagowały inaczej na manipulację strachem niż osoby o wysokiej samoocenie. Aby to uczynić, musimy zastosować dwuczynnikową analizę wariancji. Możemy teraz jednocześnie sprawdzić wpływ zdychotomizowanej zmiennej samoocena SAM2 i GRUPA na wyniki w teście.
Określenie zmiennych i ich skal mułowanie:założeń i hipotez:
czynnik R - SAMOOCENA (zmienna nominalna - 2 wartości) Zmienna zależna: WYNIKI w sprawdzianie intuicji psychologicznej (zmienna ilościowa) Założenia:
istotnie
zależą
1c) Efekt interakcji czynników R i C jest istotny statystycznie. Wpływ manipulacji poziomem stresu na wyniki w teście zależy od samooceny badanego. Hipotezy badawcze w analizie wariancji trudno jest zapisać za pomocą symboli, ponieHo : /11 '" /12 = /13 nie jest zarówno stwierdzenie, że /11 = /12 '" /13, jak i /11 = /12 '" /13. Hipoteza badawcza mówi, że co najmniej jedna grupa wyników pochodzi z populacji o średniej różnej od pozostałych.
waż zaprzeczeniem
Wybór testu i ustaienie
pomiarowych, sfor-
Zmienne niezależne: czynnik C - POZIOM STRESU (zmienna nominalna - 3 wartości)
teście
rozkładu
statystyki:
Chcemy badać jednoczesny wpływ dwóch zmiennych niezależnych (czynników - zmienna nominalna) na zmienną zależną (zmienna ilościowa), więc wybieramy dwuczynnikową analizę wariancji. Statystyka, którą wykorzystamy przy podejmowaniu decyzji zerowych ma rozkład F.
względem każdej
z hipotez
Zmienna zależna ma rozkład normalny w podpopulacjach wyznaczonych przez poziomy zmiennych zależnych. Wariancje zmiennej zależnej w podpopulacjach wyznaczonych przez poziomy zmiennych niezależnych nie różnią się istotnie (homogeniczność wariancji). Losowy przydział do grup.
Hipotezy: W dwuczynnikowej analizie wariancji mamy trzy hipotezy zerowe.
Ustawienie reguły decyzyjnej: Odrzucimy odpowiednie hipotezy zerowe, jeżeli otrzymana wartość statystyki F znajdzie się w obszarze krytycznym, czyli p(F? Fotrz ) = 0,05.
1a. Poziom stresu nie wpływa na wyniki w sprawdzianie, co oznacza brak efektu głów nego czynnika C.
Ho : /1C1
=
=
=
/1C2 /1C3 /1 1b. Samoocena nie wpływa na wyniki w sprawdzianie, co oznacza brak efektu główne go czynnika R.
df
GRUPA
0,20
2
0,10
0,03
0,97
SAM2
1,20
1
1,20
0,41
0,53
62,60
2
31,30
10,73
0,00
1c. Brak efektu interakcji czynników R (reaktywności) i C (poziomu stresu) na wyniki w teście.
Oznaczenia:
c-
liczba poziomów zmiennej C (liczba kolumn) (-liczba poziomów zmiennej R (liczba wierszy) n - liczebność osób w jednej kratce danych N = n x (X c - liczebność próby
....w
:!:
i=
Średni
Suma kwadratów
Źródło wariancji
=/1R1 C2 =/1R1 C3 =/1R2C1 =/1R2c2 =/1R2C3 =/1
statystyk i odpowiednich
Tabela 7.3. Analiza wariancji
Ho : /1R1 = /1R2 = /1
Ho : /1R1 C1
228
wartości prawdopodobieństw:
Sprawdzenie
kwadrat
F
Istotność
F
Interakcja
GRUPAxSAM2 Reszta SSw Ogółem
70,00
24
2,92
134,00
29
4,62
229
Rozdział
Efekt interakcji
7. Dwuczynnikowa analiza wariancji
Przy pierwszym pomiarze (TIME1)
10
• dla efektu głównego czynnika GRUPA (poziom stresu) - F(2,24) = 0,03; P > 0,05;
8
• dla efektu głównego czynnika SAMOOCENA (wysoka/niska) - F(1 ,24) = 0,41; P > 0,05;
6
• dla efektu interakcji czynników GRUPA i SAMOOCENA - F(2,24) = 10,731; P < 0,001.
4
10 8
o 9 r1
Analizując wyniki pierwszego pomiaru, możemy odrzucić jedynie Ho zakładającą brak interakcji. Powiemy, że wpływ manipulacji stresem na wyniki w sprawdzianie istotnie zależał od samooceny badanego.
I
2
o
decyzji:
, Imwsaml IIIINsam
4
2
Podjęcie
I
6
I-:-wsaml -lll-Nsam 9 r2
gr1
9 r3
Rysunek 7.4. Wykres liniowy i słupkowy
średnich
gr2
gr3
zmiennej TIME1 w grupach
SCHEMAT WNIOSKOWANIA Zmienne
Zmienne niezależne: czynnik C - POZIOM STRESU (3 wartości - zmienna nominalna); czynnik R - SAMOOCENA (2 wartości - zmienna nominalna) Zmienna zależna - WYNIKI w sprawdzianie intuicji psychologicznej (zmienna ilościowa) Spełnione są założenia
Założenia
Hipotezy
testu F
Ho : fiC1 =fiC2 =fiC3 =fi Poziom stresu nie wpływa na wyniki w sprawdzianie, co oznacza brak efektu głównego czynnika C. Ho : fiR1
=fiR2 =fi Samoocena nie wpływa na
SCHEMAT WNIOSKOWANIA Zmienne
wyniki
w sprawdzianie, co oznacza brak efektu głównego czynnika R.
Ho : fiR1C1
Na podsta~ie an~lizy przeprowadzonej dla zmiennej zależnej TIME1 zweryfikuj hipotezy dotycz':!-ce z~lenneJ TIME2. Sprawdż, czy osoby o niskiej samoocenie zareagowały inaczej na manipulację strachem niż osoby o wysokiej samoocenie. Wykonaj wykres średnich.
=fiR1C2 =fiR1C3 =fiR2C1 =fiR2C2 =fiR2C3 =fi·
Założenia
Spełnione są założenia testu
F.
Hipotezy
Brak efektu interakcji czynników R (reaktywności) i C (poziomu stresu) na wyniki w teście. Wybór testu i rozkład statystyki Reguła
decyzyjna
Wartość statystyki
Statystyka, którą wykorzystamy przy podejmowaniu decyzji względem każdej z hipotez zerowych ma rozkład F. Odrzucimy odpowiednie hipotezy zerowe, jeżeli otrzymana wartość statystyki F znajdzie się w obszarze krytycznym, czyli p(F > Fatrz ) =0,05. • dla efektu głównego czynnika GRUPA (poziom stresu): F(2,24) =0,03; P > 0,05;
Wybór testu i rozkład statystyki Reguła
decyzyjna
Wartość statystyki
Decyzja
• dla efektu głównego czynnika SAMOOCENA (poziom stresu): F(1,24) =0,41; P > 0,05; • dla efektu interakcji czynnika GRUPA (poziom stresu) i SAMOOCENA F(2,24) = 10,73; P < 0,001. Decyzja
istotnie zależał od samooceny badanego.
230
Wykres
średnich:
Możemy odrzucić jedynie Ho zakładającą brak interakcji. Wpływ manipulacji stresem na wyniki w sprawdzianie
10
GRUPA
8
SAMOOCENA
1 2 3 (STRACH) (RELAKS) (KONTROLNA)
Stwierdziliśmy istotny wpływ interakcji czynników GRUPA x SAM2 na wyniki pierwszego
NISKA
9,6
4,2
6,8
sprawdzianu (TIME1). Pierwszym (ale nie ostatnim) krokiem do interpretacji tej interakcji byłoby sporządzenie wykresów średnich.
WYSOKA
6,2
3,8
5,4
6
I-:-wsaml __ Nsam
4
2
Zmienna zależna: TIME2
o 9,.1
9 r2
9 r3
231
Rozdział
Porównanie wyników jednoczynnikowej analizy wariancji z
7. Dwuczynnikowa analiza wariancji
analizą dwuczynnikową
Tabela 7.4. Dwuczynnikowa analiza wariancji Źródło wariancji
N
Suma kwadratów
Średni
df
Istotność
GRUPA
76,20
2
38,10
10,44
0,001
SAM2
22,53
1
22,53
6,17
0,02
F Oblicz wartości estymatorów F dla poniższych rozkładów, tak jak pokazano w przykła dzieA. Równe wariancje we wszystkich grupach
w
Interakcja
i=
GRUPAxSAM2
11,67
2
5,83
Reszta
87,60
24
3,65
198,00
29
6,83
:E
F
kwadrat
SSw
Ogółem
2 8 ~~
0,22
1,60
2 2 2 2 2 = 8 ~~ = 8 ~~ = 8 ~~ = 8 ~~ = 8 ~~ = 8 w2
Rozkład
Rozkład A 1
R1 Rz
Porównanie wyników Jednoczynnikowej analizy wariancji z analizą dwuczynnikową
C1
Cz
C3
19
12
20
17
19
18
14
17
15
17
M= 17
19 s~
Porównajmy teraz wynik dwuczynnikowej analizy zmiennej TIME2 z analizą jednoczynnikogdy nie wprowadziliśmy do analizy zmiennej SAM2. Porównujemy SS. Wabu analizach SST = 198. Wabu analizach czynnik GRUPA odpowiadał za wyjaśnienie tego samego procentu zmienności zmiennej zależnej (SS grupa = 76,2, co stanowi 38%). Przy jednoczynnikowej analizie 62% zmienności pozostawało niewyjaśnione (SSRESZTA = 121,8). Wprowadzenie dodatkowego czynnika do analizy spowodowało zmniejszenie niewyjaśnionej zmienności zmiennej zależnej z 62% do 45%. Procentowy udział poszczególnych czynników w wyjaśnia niu zmienności zmiennej zależnej przedstawiony jest na diagramach kołowych.
s~c
2
Suma kwadratów TIME2
Efekty
główne
GRUPA
df
Średni
kwadrat 38,10
2
76,20
Reszta
121,80
27
4,51
Ogółem
198,00
29
6,83
F 8,45
Istotność
FRC =
S2
Z
8% 45%
mgrupa .5am2
D reszta
Ogr*5am2
D reszta 6%
232
Rysunek 7.5. Analizajednoczynnikowa
C1
Cz
C3
19
12
20
17
=
=
s;c =
12
17
18
14
17
19 13 = 10
M= 17
19
18
14
17
19
13
M= 17
Bz
R1 Rz
C1
Cz
C3
19
20
12
17
19
18
14
17
19
13
M= 17
19 s~
s,: = 14
Sc
III grupa
Rozkład
Az
19
20
19
=
F RC = 18
R
~8%
, SRC
Fn= Fc =
0,001
19
Rz
=
Fc = 4
R1 Rz
R1
sc =
FR = O
F
C3
,
= 5 X (3 + 3' + 3' + 3') = 5x 35 = 180
Tabela 7.5. Jednoczynnikowa analiza wariancji zmiennej TIME2
Cz
19
8R
2
Rozkład
Cj
s~
5x2(2' +2') =5x8=40 2
s~.
B1
= 10
s>O
wą,
n=5
S2
R
, Sc
, SRC
= 14
= = =
FR =
FR =
Fc =
Fc =
FRC =
FRC =
11%
Rysunek 7.6. Analiza dwuczynnikowa
233
Rozdział
Porównanie wyników jednoczynnikowej analizy wariancji z
7. Dwuczynnikowa analiza wariancji
Uzupełnij następującą tabelkę (w każdej komórce znajduje się 5 osób):
Źródło wariancji
Efekty
Średni
Uzupełnij następującą tabelkę
Suma kwadratów (SS)
df
SSR= 20
dfR= 5
s~ = 4
SSc= 40
dfc = 2
s~. = 20
Fc = 6
SSRC= 180
dfRC = 10
s~e = 18
FRC = 5,4
kwadrat (52)
F
główne
R
C
10
SSw= 240
Reszta
s~e =3
dfw = 72
każdej
komórce znajduje
się
10 osób):
Średni
Suma kwadratów (SS)
df
SSR= 20
dfR= 5
Sił
:::::
F R=
SSc= 40
dfc =
s~
=
Fc =
SSRC=
dfRC =
:::::
FRC =
SSw= 240
dfw =
F
kwadrat (52)
główne
Efekty FR= 1,2
Interakcja RxC
Źródło wariancji
(w
analizą dwuczynnikową
R
C
2
,
Interakcja RxC
Reszta
s~c
Całość
Całość
r=6
c=3
n=5
dfR=(R-1)=5 dfc =(C-1)=2
F =4x3=12 R 10 '
= 10 dfw =R x C (n - 1) =6 x 3 x 4 =72
F
Poniżej zaprezentowano wyniki pewnych badań w dwuczynnikowym schemacie analizy wariancji. A i B są zmiennymi niezależnymi, opisanymi na trzech poziomach. Zmienną zależną był poziom samokontroli mierzony odpowiednim kwestionariuszem.
dfRC = (R-1)(C-1)
SSRC= 240 - 20 - 40 = 180
Zmienna B
= 20 x3 = 6 e
F Re
S2 R
S2 e
= 20 = 4
Poziom 1 (bulimia)
Poziom 2 (depresja)
Poziom 3 (anoreksja)
Poziom 1 (leczenie farmakologiczne)
2547
3567
10867
Poziom 2 (terapia behawioralna)
3246
2654
8896
Poziom 3 (psychoanaliza)
4797
58107
69710
10
= 18x3 =54 10 '
Zmienna A
F(2,72) = 6
5
F(5,72) = 1,2 F(10,72) = 5,4
= 40 = 20
2
Wykorzystując SCHEMAT
WNIOSKOWANIA i wydruk komputerowy, przetestuj 3 hipotezy
zerowe:
,
s-
IV
S2 Re
234
240 30 10 =--=-=-
72
9
= 180 = 18 10
3
Tabela 7.6. Dwuczynnikowa analiza wariancji Źródło wariancji
Suma kwadratów
df
Średni kwadrat
F
Istotność
A
52,67
2
26,33
8,03
0,002
B
30,17
2
15,08
4,60
0,019
Interakcja A x B
11,67
4
2,92
0,89
0,483
Reszta
88,50
27
3,28
183,00
35
5,23
Ogółem
F
235
Rozdział
Analiza wariancji z powtarzanymi pomiarami
7. Dwuczynnikowa analiza wariancji
Tabela 7.7. Wydruk komputerowy (GODZINY SNU by LICZBA KAW by PORA DNIA)
SCHEMAT WNIOSKOWANIA Zmienne
Zmienne
Źródło wariancji
niezależne:
czynnik C - RODZAJ ZABURZENIA (3 wartości - zmienna nominalna)
Efekty
df
Średni kwadrat
F
Istotność
6,20
2
3,10
3,00
0,069
PORADNIA
22,53
1
22,53
21,81
0,000
x PORA DNIA
14,47
2
7,23
7,00
0,004
na wyniki w teście, co oznacza brak efektu głównego czynnika C.
Reszta
24,80
24
1,03
Ho : JfR1 = JfR2 = JfR3 = Jf Terapia nie wpływa na wyniki w teście,
Całość
68,00
29
2,35
Zmienna zależna - WYNIK W TEŚCIE (zmienna ilościowa) Spełnione są założenia
Założenia
F
główne
LICZBA KAW
czynnik R - ZASTOSOWANE LECZENIE (3 wartości - zmienna nominalna)
Interakcja LICZBA KAW
testu F.
Ho : JfC1 = JfC2 = JfC3 = Jf Rodzaj zaburzenia nie wpływa
Hipotezy
Suma kwadratów
co oznacza brak efektu głównego czynnika R.
Ho : JfR1C1 = JfR1C2 = JfR1C3 = JfR2C1 = JfR2C2 = JfR2C3 = Jf. Brak efektu interakcji czynników R i C na wyniki w teście. Statystyka, którą wykorzystamy przy podejmowaniu decyzji względem każdej z hipotez zerowych ma rozkład F.
Wybór testu i rozkład statystyki Reguła
decyzyjna
Wartość
Odrzucimy odpowiednie hipotezy zerowe, jeżeli otrzymana wartość statystyki F znajdzie się w obszarze krytycznym, czyli p(F > F otrz ) ~ 0,05.
SCHEMAT WNIOSKOWANIA Zmienne Założenia
Spełnione są założenia testu
F.
Hipotezy
dla efektu głównego czynnika A: F(2,27) = 8,0; P = 0,002;
statystyki
dla efektu głównego czynnika B: F(2,27) = 4,60; P = 0,019; dla efektu interakcji czynników A x B: F(4,27) = 0,89; P = 0,483. Możemy odrzucić obie hipotezy zerowe zakładające brak wpływu czynników głównych,
Decyzja
natomiast stwierdzamy brak interakcji.
Wybór testu i rozkład statystyki Reguła
decyzyjna
Wartość
statystyki
Decyzja
Analiza wariancji z powtarzanymi pomiarami Badacz jest zainteresowany wpływem ilości wypitej kawy oraz czasu, kiedy była pita na liczbę godzin snu. 30 osób zostało losowo przydzielonych do grup eksperymentalnych. Badacz uzyskał następujące dane: Liczba wypitych Czas wypicia kawy Rano Dwie godziny przed snem
filiżanek
kawy
1
2
3
87869
98967
79898
67889
56667
54645
Przeprowadż testy 3 hipotez (a= 0,05) według SCHEMATU WNIOSKOWANIA, wykorzystując
236
wydruk komputerowy.
Planując schemat badania, uzmysławiamy sobie, że mamy zazwyczaj do czynienia z dwoma typami zmiennych: (l) zmiennymi niemanipulowalnymi, których wartości są na stałe związane z daną osobą, np. jej PŁEĆ, WIEK, nazywanymi czasem zmiennymi naturalnymi [19] i (2) zmiennymi manipulowalnymi, których wartości dla danej osoby mogą być zmieniane - np. możemy za pomocą specjalnych oddziaływań usiłować zmienić poZIOM MOTYWACJI badanego, a na pewno możemy ustalić, jakie zadanie będzie wykonywał, jeżeli TYP ZADANIA jest naszą zmiennąniezależną. Niezależne zmienne niemanipulowalne bardzo ograniczają nasze możliwości wnioskowania. Ich "wpływ" możemy badać, porównując rozkłady zmiennej zależnej w grupach osób różniących się poziomami zmiennej niezależnej. W przypadku zmiennej niezależnej PŁEĆ porównujemy po prostu wyniki kobiet i mężczyzn, w przy-
237
Analiza wariancji z powtarzanymi pomiarami Rozdział
7. Dwuczynnikowa analiza wariancji
padku zmiennej WIEK możemyporównywaćwyniki dwudziestolatków i szes'c'd . rabela 7.8. podział zróżnicowania w analizie wariancji B - zmienna niezależna ZIe · . 1 k' B - zmienna niezależna SIęClO at owo wewnątrzosobowa międzyosobowa Uży~ani~ określenia w opi~ie b~dań "wpływ wieku na postawy" jest życzenio, SSr= SSmiędzyosobami+ SSr= SSB + SSw we, p~mewaz teg~ typu b~da~Ie, mll~o porównywania wyników dwóch grup, jeslpodział zróżnicowania SSwewnątrz osób b~dam~m ko.relacYJnym. NIe WIemy WIęC, czy stwierdzone różnice są związane z wie 1 SSB = SSmiędzygrupami klem blOloglczny~, cz~ też. np. z różnymi warunkami socjalizacji. Aby to ocenić SSwewnątrz osób = SSB + SSreszta SSw = SSwewnątrz grup trze~a byłoby porownac zmIany postawy dwudziestolatków w ostatnich dziesięcio \ 1 2 2 le~Iach. Bez względu na to, czy nam się to podoba, czy nie musimy badać zmienne , F=...!..L. 2 Test F F =!.JL2 ktorych.modyfikować się nie da - także ze względów etycznych. Sr(!szta Sw · Zmienne manipulowalne stawiają nas przed dylematem wyboru, czy uczynic Je wewnątrz-, czy międzyosobowymi. Rozważmy przykład badania wpływu typu motywacji na odchudzanie. . . Na T.YP za specjalnego treningu wizualiProblem jednak tkwi w osób która pow?duJe, ze zana sobie pozytywnych inny, oso?a gdyby (POdZIW dla naszej nowej figury na straszenie _ na b" to pierwsze Moze to przepwlac w uwrazlIwlemu badanych b' ' wyo razamu .' , . ' . na Ie zaniechania komentarze na pla- problem wagi, lub we zy). ZmIenna mezalezna ma WIęC dwie wartości. ności tworzenia obrazów mentalnych Itp. NIezbędne w takIm przypadku Jest rotowa· pomiar spadku wagi w dwóch tygodni od tre- nie treningów, czyli losowy .próby na dwie grupy. Grupa mngu a po.dwóch straszona, druga odwrotme.. W tanych z Jedzemem. kim schemacIe mamy dWIe zmIenne mezalezne: TYP MOTYWACJI (czynnIk we-
MOTYWA~JI będ~iemy wpływać pomocą pamięci ba~anych, wpływ zacYJn~go: Zachęc.ame będZIe ~olega~o wyobrażaniu skutkówchęcaniamożeby~ ~dy ~oprzedm~by~a,straszona.~Iz.wt~dy, było schudmęcla plaży) oddzIaływame. SIę ~o ne~atywn~ch k~nsekwen~ji działania(złośliwe zmęczeniu wizualizacj.ą .wręcz przecIw~le, wzros~le umIeJętZmi~nną ~ależ~ą może być ciągu kolejności podział ~ierwsza ":Izuah~acYJnego, choć należałoby także mierzyć zmianę zachowań związa- byłabynajpie~zachęcan~, ~god~Iach ,M~~imy po~ją~ decyzję,
podzielić nasząpróbę
połowy
wnątrzosobowy) KOLEJNOŚĆ
międzyosobowy).
że
czy losowo na i zastosoi (czynnik powien:y, przeprowac rozne trenmgI w obu grupach (zmienna nie zależna będzie wtedy cz 'ki wadziliśmydwuczynnikowąanalizę wariancji z powtarzanym pomIarem na czyn. d b ynm em . ., . mię zyoso, owym) cz~ też ws~ystkie osoby poddać kolejno obu treningom (czyniąc niku TYP MOTYWACJI. Wtedy możemy odpowIedzlec na trzy pytama: w ten spos~b naszą zmlenn~ me~ależną. czynnikiem wewnątrzosobowym). Rozwazmy konsekwenCje tej deCYZJi.
po?ział.na grup~ zapewnia n~m to, że powinny być one wyrównane pod
względem sredmego pOZIomu nadwagI, kłopotów z wprowadzeniem rez'l'
Losowy
. d _ · .d ... mUJe ze mowego It . Moze sIęjednakokazać, że zróżnicowanie w ramach grupy jest tak duże (oso.by ze z sobie podziwu Ich ze grupami za typu treningu
znacz~ąna~,:a.gąmog.ąmi~ć duże kłopoty wyobrażeniem d~a figur~), zro~mcowame ~Iędzy sprawą będzie m~wystarczaJące. PamIętamy bOWIem, że test F polega na porównaniu wariancji
. . . . .. . . , l) Czy motywowame Jest bardZIej skuteczne mz straszeme? (pytame o efekt głow-
ny cz~nnika TYP ~OT:W~CJI).. . . ..' 2) Czy pIerwszy tremng wlzualIzacYJny Jest bardZIej skuteczny mz drugI? (pyta' nie o efekt główny KOLEJNOSCI) . ' . 3) Która z .straszenie, potem czy potem Jest (pytame o efekt mterakcJI czynm-
~olejności: "najpie~ zachęcame, strasze~Ie
leps~~?
~achęcam~"
,:~aJPler,:",
ków TYP MOTYWACJI l KOLEJNOSC)
międzygrupowej
do wariancji wewnątrzgrupowej. powtórzmy: wydaje .się.pomysł porównywania wpływu typu motywacji dla każdej Czynniki w analizie wariancji z powtarzanymi pomiarami (ang. repeated measuo~oby. Wtedy chudmęcle pod wpływem zachęcania jest porównywane z chudnię res) dzielimy na: CIem pod wpływem straszenia dla każdej osoby oddzielnie. ?gólne zró~ni~~w~niew~ników (SStotal) dzielimy na zróżnicowaniemiędzy oso1) międzyosobowe (between subjects) bamI (SSmię~ZY) l zro~mco~~n~: wewnątrz. osób (SSwewnątrz), które z kolei jest dzielo2) wewnątrzosobowe (within subjects) n~ n~ to, ktore ~a SIę ';~Jasmc naszą zmIenną niezależnąi resztę, której wyjaśnić SIę me da. Test .Istotnos~I polega na porównaniu oszacowań tych dwóch wariancji. Te pierwsze oznaczająpodział osób badanych na osobne grupy, te drugi~ dotyczą W s.chemac~e ze zmI~nną wewnątrzosobowąróżnice indywidualne nie wpływają zazwyczaj pomiarów dokonywanych na tych samych osobach. Jest to podZIał analona wymk testu IstotnośCI czynnika, czyli jest to dla nas wymarzona sytuacja. giczny do podziału na grupy (dane) niezależne i zależne, z którym zetknęliśmy się Kuszący
238
przy omawianiu testu t Studenta.
239
Rozdział
7. Dwuczynnikowa analiza wariancji
padku zmiennej WIEK możemy porównywaćwyniki dwudziestolatków i sześćdzie
Analiza wariancji z powtarzanymi pomiarami
Tabela 7.S. Podział zróżnicowania w analizie wariancji
sięciolatków.
w opisie badań "wpływ wieku na postawy" jest życzenio we, ponieważ tego typu badanie, mimo porównywania wyników dwóch grup, jest badaniem korelacyjnym. Nie wiemy więc, czy stwierdzone różnice są związane z wiekiem biologicznym, czy też np. z różnymi warunkami socjalizacji. Aby to ocenić, trzeba byłoby porównać zmiany postawy dwudziestolatków w ostatnich dziesięcio leciach. Bez względu na to, czy nam się to podoba, czy nie musimy badać zmienne, których modyfikować się nie da - także ze względów etycznych. Zmienne manipulowalne stawiają nas przed dylematem wyboru, czy uczynić je wewnątrz-, czy międzyosobowymi. Rozważmy przykład badania wpływu typu motywacji na odchudzanie. Na TYP MOTYWACJI będziemy wpływać za pomocą specjalnego treningu wizualizacyjnego. Zachęcanie będzie polegało na wyobrażaniusobie pozytywnych skutków schudnięcia (podziw dla naszej nowej figury na plaży), straszenie - na wyobrażaniu sobie negatywnych konsekwencji zaniechania działania (złośliwe komentarze na plaży). Zmienna niezależna ma więc dwie wartości. Zmienną zależną może być pomiar spadku wagi w ciągu dwóch tygodni od treningu wizualizacyjnego, choć należałoby także mierzyć zmianę zachowań związa nych z jedzeniem. Musimy podjąć decyzję, czy podzielić naszą próbę losowo na połowy i zastosować różne treningi w obu grupach (zmienna niezależna będzie wtedy czynnikiem międzyosobowym)czy też wszystkie osoby poddać kolejno obu treningom (czyniąc w ten sposób naszą zmienną niezależną czynnikiem wewnątrzosobowym). Rozważmy konsekwencje tej decyzji. Losowy podział na grupy zapewnia nam to, że powinny być one wyrównane pod względem średniego poziomu nadwagi, kłopotów z wprowadzeniem reżimu jedzeniowego itd. Może sięjednak okazać, że zróżnicowanie w ramach grupy jest tak duże (osoby ze znacznąnadwagą mogą mieć duże kłopoty z wyobrażeniem sobie podziwu dla ich figury), że zróżnicowanie między grupami za sprawą typu treningu będzie niewystarczające. Pamiętamy bowiem, że test F polega na porównaniu wariancji międzygrupowej do wariancji wewnątrzgrupowej. Kuszący wydaje się pomysł porównywania wpływu typu motywacji dla każdej osoby. Wtedy chudnięcie pod wpływem zachęcania jest porównywane z chudnię ciem pod wpływem straszenia dla każdej osoby oddzielnie. Ogólne zróżnicowanie wyników (SStotal) dzielimy na zróżnicowaniemiędzy osobami (SSmiędzy) i zróżnicowanie wewnątrz osób (SSwewnątrz), które z kolei jest dzielone na to, które da się wyjaśnić naszą zmienną nie zależną i resztę, której wyjaśnić się nie da. Test istotności polega na porównaniu oszacowań tych dwóch wariancji. W schemacie ze zmienną wewnątrzosobowąróżniceindywidualne nie wpływają na wynik testu istotności czynnika, czyli jest to dla nas wymarzona sytuacja.
B - zmienna niezależna międzyosobowa
Używanie określenia
238
Podział zróżnicowania
SSr - SSB + SSw SSB SSw
Test F
=SSmiędzygrupami =SSwewnątrz grup 2
F
=!..!.. s,~
B - zmienna niezależna wewnątrzosobowa
SSr= SSmiędzyoSObami+ SSwewnątrzosób
SSwewnątrzosób
= SSB + SSreszta
2
F=~ 2 S reszta
Pr~blem !edn~~ tkwi w pamięci osób badanych, która powoduje, że wpływ zachę~ama moze by.c Inny, gdy osoba poprzednio była straszona niż wtedy, gdyby było
to pIerwsze ~ddzIaływanie. Może się to przejawiać w uwrażliwieniu badanych na
pr~b~em wagl~ zmęczeniuwizualizacjąlub wręcz przeciwnie, we wzroście umiejęt
n?SCI t~orz~~la ob.raz?w men~alnych itp. Niezbędne w takim przypadku jest rotowame kolejn.o~cl trenmgow, czyh losowy podział próby na dwie grupy. Grupa pierwsza byłaby najpierw zachęcana, a po dwóch tygodniach straszona, druga odwrotnie. W takIm schemacie m.amy dwie z~i~nne niezależne: TYP MOTYWACJI (czynnik wewnąt~z~sobowy) l KOLEJNOSC (czynnik międzyosobowy). Powiemy, że przepro~adzlhsmy dwuczynnikowąanalizę wariancji z powtarzanym pomiarem na czynmku TYP MOTYWACJI. Wtedy możemy odpowiedzieć na trzy pytania: l) Czy motywowanie jest bardziej skuteczne niż straszenie? (pytanie o efekt głów ny czynnika TYP MOTYWACJI) 2) C.zy pierwszy,trening wizualiza,cyjny jest bardziej skuteczny niż drugi? (pytame o efekt głowny KOLEJNOSCI) 3) Która z ~olejności: "najpierw straszenie, potem zachęcanie" czy "najpierw zachęcame, potem straszenie" jest lepsza? (pytanie o efekt interakcji czynników TYP MOTYWACJI i KOLEJNOŚĆ) Powtórzmy: Czynniki w analizie wariancji z powtarzanymi pomiarami (ang. repeated measures) dzielimy na: l) międzyosobowe(between subjects) 2) wewnątrzosobowe (within subjects)
Te pie~sze. oz?aczaj ą podział osób badanych na osobne grupy, te drugie dotyczą
z~zwyczaj pom~arow dokonywanych na tych samych osobach. Jest to podział analo-
gIczny do ~od~lału na grupy (dane) niezależne i zależne, z którym zetknęliśmy się przy omaWlamu testu t Studenta.
239
Rozdział
7. Dwuczynnikowa analiza wariancji
Analiza wariancji z powtarzanymi pomiarami
W badaniu LEARN możemy zadać pytanie o wpływ zmiennych niezależnych na wyniki w teście intuicji psychologicznej zaraz po przeprowadzeniu manipulacji (zmienna zależna TIMEl) i po dwóch dniach (zmienna zależna TIME2). W tym przypadku możemy uznać, że mamy dwa pomiary jednej zmiennej zależnej INTUICJA PSYCHOLOGICZNA. Do analizy wprowadzamy czynnik wewnątrzosobowy: TIME, który ma dwie wartości (pomiar!, pomiar2). Każda osoba ma dwa wyniki zmiennej zależnej INTUICJA PSYCHOLOGICZNA. Mamy dwa czynniki mit(dzyosobowe (SAM2 i GRUPA) oraz jeden czynnik wewnątrzosobowy (TIME) i 7 hipotez do przetestowania. To, co do tej pory testowaliśmy w dwóch osobnych analizach zostanie zawarte w jednej. Porównajmy wyniki. Osobne analizy zmiennych TIMEl i TIME2 pokazały istotny efekt interakcji czynników w przypadku TIMEl i dwa efekty główne w przypadku TIME2. Jednoczesna analiza obu zmiennych dała dużo wit(cej istotnych wyników przedstawionych w tabelach 7.9 i 7.10, których nie odkrylibyśmy, gdybyśmy analizowali wyniki obu pomiarów osobno. Sposoby testowania założeń analizy wariancji z powtarzanymi pomiarami są opisane w [6].
df
Średni
kwadrat (S2)
F
Istotność
SAM2
17,07
1
17,07
3,47
0,082
GRUPA
40;30
2
20,15
4,10
0,029
SAM2xGRUPA
62,63
2
31,32
6,37
0,006
118,00
24
4,92
Reszta
12
F
..,---------.--------~
10 + - - - - - - - - - - - - - - - - 1
8
Tabela 7.9. Testy efektów międzyosobowych Sumy Źródło zmienności kwadratów (SS)
"W badaniu stwierdzono istotny wpływ manipulacji w zależności od czasu pomiaru i samooceny badanych (F = 3,53; P = 0,045). Interakcja czasu pomiaru i samooceny (F = 4,04; P = 0,06) była istotna na poziomie tendencji statystycznej. Stwierdzono także istotny efekt główny manipulacji (czynnik GR UPA: F = 4, l; P = 0,029) i interakcji samooceny z manipulacją (F = 6,37; P = 0,006)." Jest to doskonały przykład ilustrujący fakt, że test analizy wariancji jest testem ogólnym i wymaga dalszych dociekań. Z jednoczynnikowych analiz wariancji wiemy, że manipulacja nie miała istotnego wpływu przy pierwszym pomiarze. Dlatego po wykonaniu testu ogólnego konieczna jest analiza średnich i przeprowadzenie dodatkowych porównań w postaci testów post hoc lub wcześniej zaplanowanych kontrastów.
-ł-----
6
• Wysoka
III Niska 4 2
o
Tabela 7.10. Testy kontrastów wewnątrzosobowych Sumy Źródło zmienności kwadratów (SS)
df
TIME
1
TIME x SAM2
0,00 6,6
Średni
kwadrat (S2) 0,00
F 0,00
Istotność
F
1,000
1
6,67
4,04
0,060
TIME x GRUPA
36,100
2
18,05
10,94
0,000
TIME x SAM2 x GRUPA
11,63
2
5,82
3,53
0,045
Reszta (TIME)
39,60
24
1,65
Interpretacjt( wyników zaczynamy zawsze od interakcji. Nie ma sensu twierdzić, czas pomiaru nie miał wpływu na wyniki (stwierdziliśmy brak istotnego efektu głównego TIME), skoro wykryliśmy 3 istotne interakcje z czasem pomiaru, w tym istotną interakcjt( wszystkich trzech czynników. Wydruk opisalibyśmy nastt(pująco:
Rysunek 7.7. Wpływ samooceny (wysoka vs niska) i czasu pomiaru (T1, T2) na
poziom INTUICJI PSYCHOLOGICZNEJ
że
240
241
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Związek liniowy między zmiennymi ilościowymi. TfYkres korelacyjny (rozrzutu)
s~onde~tów i !ch zarobki i chcemy określić siłę tego związku, a mówiąc inaczej _ ~Iłę :v~a~emnej ws~ółzmienności. Chcemy odpowiedzieć na pytanie o to, czy w ogóle Istmeje Istotny ZWIązek pomiędzy motywacją a zarobkami oraz jaki ma on charakt~r (dodatni / ujemny) i jaka jest jego siła. Nie będziemy jednak mogli rozstrzygnąć kIerunku wpływu (tego, czy motywacja wpływa na zarobki, czy też zarobki na
motywację)·
Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej i analiza regresji
Rozkład łączny d,:óch zmiennych przedstawiamy w postaci wykresu korelacyjne~o (na~ywanego tez wykresem rozrzutu), w którym na osi X są podane wartości ZmIennej X; na osi Y wartości zmiennej Y.
Narysuj wykresy korelacyjne (rozrzutu) następujących danych: X - liczba randek w ostatnim tygodniu
'! -
Pojęcia
kluczowe: korelacja liniowa; regresja liniowa; współczynniki regresji
satysfakcj~ z życia na skali 1..2..3..4.. 5. Każda para wyników -liczba randek i satysfakcja Jest przedstaWiona jako punkt na płaszczyżnie. Do każdego rysunku spróbuj dopasować prostą i określ charakter związku:
i standaryzowane współczynniki regresji; współczynnik determinacji; regresja
• liniowy vs krzywoliniowy;
wielokrotna; zmienne kontrastowe (instrumentalne); reszty regresji; korelacja
• dodatni vs ujemny.
cząstkowa
Nowe symbole:
r, /3,
a) Przebadano grupę nastoletnich chłopców i uzyskano narezultaty:
a, b.
stępujące
Związek
liniowy
między
zmiennymi ilościowymi. Wykres korelacyjny (rozrzutu)
X: 1 2 3 4 5 6
7
Y: 1 2
5.
3
4 4
5
Z~iąz~k można określić jako dodatni i liniowy. Punkty ukła daJ~ Się wzdłuż linii prostej, która wznosi się w miarę oddalania od punktu początkowego układu współrzędnych.
Dokonując w
242
badaniu LEARN dychotomizacji zmiennej SAMOOCENA, straciliśmy dużo informacji. Osoby, które otrzymały średni wynik 1,3 i 2,8 były w naszych analizach nierozróżnialne, ponieważ należały do tej samej grupy z niską samooceną. W jaki sposób możemy policzyć związek między samooceną (niezdychotomizowaną) a wynikami w teście? Wszyscy wiedzą, że najbardziej popularną miarą opisującą związek dwóch zmiennych ciągłych jest współczynnik korelacji. Mierzy on (po podniesieniu do kwadratu) stopień dopasowania rozrzutu wartości dwóch zmiennych do linii prostej (linii regresji). Współczynnik korelacji liniowej pozwala na określenie wielkości i kierunku zależności między zmiennymi. Z sytuacją badania związku pomiędzy zmiennymi ilościowymi mamy do czynienia wtedy, gdy np. mierzymy motywację do pracy re-
.,5r--------~
2,0
"S ,,O
>-
,5
O
\ 243
Rozdział 8. Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ... c) W grupie osób trzydziestoletnich wyniki były następujące:
,.,;>.,------------,
X: 1 2 3 3 3 4 4 4 5 5 6 Y: 4 3 2 3 4 1 2 3 2 1 1.
'.'
Związek można określić jako ujemny. i .I,iniowy: ~unkty bardziej rozproszone, ale nadal wzdłuż linII prostej, jednak tym
'.'
'.0
'.0 '.0
razem widzimy, że linia "opada". - .sol----~---,--:-----:-~
Bazując na informacjach zawartych w przykładzie 8.1, wykon~j ~odobne rys~nki dla 'pomi~ rów dokonanych na innych grupach. Do każdego ~sunk~ sprobuJ dopasowac prostą I okresl charakter związku: liniowy vskrzywoliniowy/dodatnl vs ujemny.
6 ...-r---r--r-,-,-,-'-'
7
5
1
4
~--+-+---II---t-+--j---r--T--:-t--:-
3
l--+---+----1-+--+----r-j-----j
I--I--.j-+-+--+--+---r-----j I--I--.j-+-+--+--+---r-----j
21---.J--i---l--+-+--+---Ir---J 1
Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej niezależnej...
Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej niezależnej. Błąd predykcji Zastanówmy się, czy istnieje związek między wynikami w teście 1 i teście 2 (TIME1, TIME2 w badaniu LEARN). Wykres korelacyjny (rozrzutu) przedstawia się następująco. Każda osoba biorąca udział w badaniu została oznaczona przez mały kwadracik o współrzędnych X = TIME1 Y = TIME2. Widzimy, że tym samym wartościom X odpowiadają różne wartości Y. Związek między X a Y, o ile istnieje, ma charakter statystyczny, jak wszystkie związki w badaniach społecznych. Ze związkiem funkcyjnym (funkcją) mamy do czynienia, gdy jednej wartościX odpowiada dokładnie jedna wartość Y (np. wielkość dywanu do kwadratowego pokoju jest jednoznacznie wyznaczona przez jego szerokość). W badaniach społecznych osoby, które otrzymują te same wyniki w teście 1 mogą otrzymywać różne wyniki w teście 2, co oznacza, że związek ma charakter statystyczny. Nie oznacza to, że rezygnujemy z próby opisania tej zależności przez zwią zek funkcyjny i przewidywania jednej (takiej samej) wartości wyniku w teście 2 dla wszystkich, którzy osiągnęli dany wynik w teście 1. Możemy sprawdzać różne predykcje wyniku w teście 2, np. zgadując, że wynik ten powinien być lepszy od wyniku w teście 1: o 5 punktów: Y = TIME1 + 5 lub o 1 punkt: Y = TIME1 + 1 Dla każdej osoby wyliczamy wartość Y. Wartości przewidywane zostały na wykresie rozrzutu oznaczone przez czarne kółka, o pierwszej współrzędnej równej TIME1 i drugiej współrzędnej równej Y. Zauważmy, że dla każdej wartości X jest dokładnie jedna wartość Y i że układają się one wzdłuż linii prostej. TIME2
12
10
D
\--\--+-+-+--+---+---t----i
D
D
0L-.L-..L-....L--'--'---'---'---'
o
1 2 3 4
5 6 7 8 D
6
5
,-,.--r---r-,----,-r-,-,
I--I-.j-+-+--+--+---r-----j
•
41---l-+--t--+-+-+---jr---J 3
2
I--.j-+-+--+---+---+---t----i \--\--+-+-+--+---+---t----i
1
O L-L-.L.-L.-..L--'--'---'--'
244
O 1 234 567 8
D
•
•
•
D
D
D.
D
D
•
D
D
D
D
D
D
• D
O-l---~-_-_~
O
•
D D
•
•
D
wartości
przewidywane
D wartości
D ---l
otrzymane w badaniach
10
TIME1
Rysunek 8.1. Wykres rozrzutu wraz z punktami wartości przewidywanych
Równanie linii prostej można zapisać w postaci ogólnej Y = bX + a. W naszym równaniu Y' = TIME1 + 1 (h = 1, a = 1).
245
Rozdział
8. Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
liniowej ...
Równanie prostej Y' = bX + a zawiera dwa parametry, gdzie a wskazuje na miejsce przecięcia z osią OY, natomiast b informuje nas o kącie nachylenia prostej wzglę dem osi OX. • Jeżeli b = 0, to prosta jest równoległa do OX (oznacza to, że dla każdej osoby przewidujemy tę samą wartość równą a niezależnie odjej wyniku w TIMEl). • Jeżeli b < 0, to wiemy, że wraz ze wzrostem X maleje Y (związek jest ujemny). • Jeżeli b > 0, to wiemy, że wraz ze wzrostem X rośnie Y (związek j estdodatni).
Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej n iezależn ej ...
Dla każdej z predykcji został wyliczony jej błąd, podniesiony do kwadratu, a nawszystkich osobach. błąd1 = L(Y - Y')2 = L(TIME2 - t2-.p 1)2 = 97 błąd2 = L(Y - y'? = L(TIME2 - t2-'p2? = 9 błąd3 = L(Y - y'? = L(TIME2 - t2-'p3? = 20,50 Widzimy, że predykcja Y' = TIME1 + 1 wiąże się z najmniejszym błędem. Dzięki pakietom statystycznym to komputer szuka takich wartości a i b,.aby błąd był najmniejszy. Nie musimy więc zgadywać, jakie wartości należy podstawić pod a i b, aby stępnie zsumowany po
znaleźć najlepszą predykcję. Znając
b, możemy mówić o kierunku zależności między zmiennymi. Prostą Y' = bX + a nazywamy prostąregresji, zaś a i b - współczynnikami regresji.
Jak mówiliśmy wcześniej, możemy rozważać różne proste, różne predykcje dla TIME2. Jak wybrać najlepszą? Dobrą miarą dobroci predykcji może być błąd predykcji, mówiący nam, ile się pomyliliśmy, czyli jak bardzo rzeczywiste wartości Y (TIME2) różnią się od wartości przewidywanych. BŁĄD
= TIME2 -
Zostało udowodnione, że dla każdego wykresu korelacyjnego możemy jednoznacznie wyznaczyć linię prostą, która daje minimalny błąd. W badaniu LEARN ta najlepsza prosta ma równanie y' = 0,54 x TIME1 + 2,78. Metoda najmniejszych kwadratów oznacza wyznaczanie w równaniu regresji Y'
y'.
=bX + a takich współczynników a i b,
dla których L(Y' - Y)2 jest najmniejsza.
Dla pewnych osób błąd będzie dodatni (gdy otrzymały wynik wyższy od przewidywanego), dla innych - ujemny (gdy otrzymały wynik niższy od przewidywanego). Ponieważ nie interesuje nas znak błędu, dobrym pomysłem jest podniesienie różnic do kwadratu i zsumowanie ich po osobach. W tabeli 8.1 przedstawione są wyniki osób z grupy STRACH z badania LEARN i trzy przewidywane wartości: t2-'p1 = TIME1 + 5 (b = 1, a = 5) t2-'p2 = TIME1 + 1 (b = 1, a = 1) t2-'p3 = TIME1 + 0,5 (b = 1, a = 0,5).
Załóżmy, że równanie regresji służące do przewidywania wyniku egzaminu z psychometrii, na podstawie wyniku egzaminu ze statystyki, można zapisać w postaci Y' = 0,8X - 4,6. Oblicz przewidywane wyniki egzaminu z psychometrii dla osób, które uzyskały następujące wyniki na egzaminie ze statystyki: a) Rafał - 70, b) Zenek - 80, c) Stefan - 60.
Tabela 8.1. Wyniki otrzymane i wartości przewidywane dla grupy STRACH IME2
t2_p1
6
9
4,5
10
13
8,5 3,5
5 10
246
9,5
10
13
8,5
6
9
4,5
8
11
6,5
7
5,5
10
8,5
7
10
Odp. a)
YRafal=
0,8 x 70 - 4,6 = 57
t2_p3
5,5 suma = 20,50
Na podstawie danych z przykładu oblicz przewidywane oceny Zenka i Stefana. Określ, który z nich prawdopodobnie zda egzamin z psychometrii, jeżeli wiadomo, że aby zdać, należy uzyskać 45 punktów. b)
YZenek=
c)
YSfefan =
Standaryzowane współczynniki regresji W badaniu LEARN obie zmienne (TIME1 i TIME2) były mierzone na tej samej skali. Jeżeli jednak chcemy przewidywaćmotywację respondentów do pracy na pod-
247
Rozdział
8. Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej niezależnej...
liniowej ...
stawie ich zarobków, to możemy mieć kłopot, gdyż obie zmienne mają różne jednostki. Dlatego dobrym pomysłem jest wystandaryzowanie ich. Przykład zawiera wyniki surowe: cena [zł] i waga [kg] sześciu porcji jabłek oraz te same wyniki po wystandaryzowaniu: Tabela 8.2. Porównanie związku Porcja
Waga [kg] X
między wynikami
Koszt
Y
Zx
Zy
A
1,02
0,75
-1,34 -1,34
B
1,36
1,00
-0,80 -0,80
C
1,70
1,25
-0,27 -0,27
D
2,04
1,50
0,27
0,27
E
2,38
1,75
0,80
0,80
F
2,72
2,00
1,34
1,34
Współzmienność zmiennych 'P
[zł]
surowymi iwystandaryzowanymi
W badaniu LEARN a= 0,442, co oznacza, że równanie Y' = 0,54 x TIMEl + 2,78 możemy zapisać w postaci z'y = , 442 z x· dla X = TIME1. Znajomość równania regresji pozwala na przewidywanie wyników. Czy jednak "najlepsza prosta" jest dobra? Stwierdzenie, że najlepsza prosta nie musi być wcale dobra, ilustruje znany dowcip, w którym synek wręcza tatusiowi świadectwo, mówiąc: "Biorąc pod uwagę obciążenia genetyczne, jest to NAJLEPSZE świadectwo, jakie mogłem otrzymać". Podobnie jest z prostą regresji, która zostanie wyliczona dla każdych danych nawet takich, które w żadnym stopniu nie wskazują na związek liniowy. Potrzebna jest miara, która określi, jak dobrze linia prosta opisuje nasz zbiór danych. Tą miarą jest współczynnikkorelacji.
°
Przewidywanie wyników egzaminu
Co powinniśmy zrobić, jeżeli musimy przewidywać wyniki studentów na egzaminie wstępnym, nie mając żadnych dodatkowych informacji, a do tego jesteśmy karani finansowo za nietrafne predykcje? Jeżeli nie chcemy stracić, to najbezpieczniej byłoby dla każdego studenta przewidzieć ... wynik średni z poprzedniego roku, ponieważ, jak pamiętamy, z własności średniej wynika, że
Zy
WAGA
""
'P
CENA
:L(Y - My)2 = minimum.
Zx
.,'----------ar - - - ' OJ
(Y)
na podstawie wyników w teście kompetencji
przedstawiamy na wykresie korelacyjnym. dr
wstępnego
031
12J
Jeżeli
nie ma związku między wynikami w teście kompetencji a wynikami na egzaminie wstępnym, to najlepszym predyktorem pojedynczego wyniku z egzaminu będzie wynik średni z egzaminu, czyli My = 50.
Rysunek 8.2. Wykres korelacyjny wyników surowych i standaryzowanych
Jest to przykład zależności linowej. Gdy zmienne są wystandaryzowane (rysunek 8.2 po prawej) linia prosta przechodzi przez początek układu współrzędnych, czyli punkt (0,0), więc a = O. Równanie regresji dla zmiennych wystandaryzowanych ma postać Z;
= ~Z x
.
fJnazywana jest standaryzowanym współczynnikiem regresji.
W analizie wariancji zmienne
niezależne
nazywane są czynnikami. W analizie regresji zmienne nazywane
są
niezależne
predyktorami.
Standaryzowane współczynniki (wagi) regresji
f3(beta)
s = b-L Sy
fJ= 0,2 oznacza, że wzrost wartości X o jedno odchylenie standardowe jest równo248
znaczny ze wzrostem wartości Yo 0,2 odchylenia standardowego. fJ= -0,5 oznacza, że wzrost wartości X o jedno odchylenie standardowe jest równoznaczny ze spadkiem wartości Yo 0,5 odchylenia standardowego.
Jeżeli Jan otrzymał YJ = 90 punktów z egzaminu wstępnego, to nasz błąd predykcji wyniesie: Błądl = [(Wynik Jana) - (średnia My)] = 90 - 50 = YJ-My= 40. Jeżeli jednak coś wiemy o studentach, których wyniki przewidujemy, np. znamy ich wyniki w teście kompetencji i mamy wyniki obu zmiennych dużej grupy studentów, np. z poprzedniego roku, to możemy sporządzić wykres korelacyjny (rozrzutu) i spróbować dopasować do tych wyników linię prostą, która pozwoli nam wyliczyć równanie regresji. Na jego podstawie z kolei będziemy mogli przewidzieć wynik,
249
Rozdział 8. Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ...
Przewidywanie wyników zmiennej zależnej na podstawie wartości zmiennej niezależnej...
jaki na egzaminie wstępnym (Y') osiągnie student, który otrzymał X punktów w teście kompetencji. Możemy szukać najlepszej prostej, która pasuje do tych punktów. Taka prosta nazywa się prostą regresji.
(Y -My) = (Y -YI)+(YI~My) Błąd
~--~-------------,
predykcji
Różnica między
przewidywaniem zmiennymi (Y), a przewidywaniem zakładającym brak związku między zmiennymi.
zakładającym związek między
Wyniki:
X
Wykres rozrzutu (X,Y) Linia regresji: Y' O.72X + 14.70
20 30 45 60
=
100
Dane: wynik Jana
-
('Xl
90 80 Przewidywania: wynik Jana (Y' )
70 60 50
•
T
w
..L-_ _..L--
•
40
20 50 35 60
N
--:"L.=-_ _.,--
~
Y.
Średnia
My
Zmienność
Zmienność błędów
całkowita
predykcji. Jest podstawą do określenia wariancji niewyjaśnionej (błędu)
30 20
Rysunek 8.4.
10 oo
10
20
30
40
50
60
70
80
90
100
110
120
130
Rysunek 8.3. Linia regresji
=
stawie testu kompetencji X - wynik testu kompetencji
Jako miarę siły związku między X i Y możemy wykorzystać stosunek zmienności wyjaśnionej do zmienności całkowitej nazywany współczynnikiem determinacji. Informuje nas on o proporcji zmienności Y wyjaśnianej przez zmienność X:
=
egzaminie wstępnym:
= 0,72X + 14,70 (X= 88).
Nasz błąd predykcji wyniesie wtedy: Błąd2 = [(Wynik Jana) - (przewidywany wynik Jana na podstawieX)] = (Y - Y) = 90 -78,06 = 11,94. Porównanie błędu predykcji na podstawie średniej (błąd! = 40) i na podstawie linii regresji (błąd2 = 11,94) pokazuje, że wykorzystanie wyniku w teście kompetencji zmniejszyło nasz błąd predykcji. To porównanie jest podstawą oceny jakości dopasowania linii regresji do danych. Oczywiście potrzebujemy danych zsumowanych po wszystkich studentach.
250
Podział zmienności
a = 0,72 - współczynnik kierunkowy (nachylenia) linii regresji [stope] b 14,70-wyrazwolny (punkt przecięcia z osią wyników egzaminu wstępnego) [stała]
Jeżeli równanie prostej miało postać Y' = O,72X + 14,70, to znając wynik w teście kompetencji Jana (X = 88), możemy wyliczyć przewidywany wynik Jana na
Y'
Y wyjaśniona przez związek z X Jest podstawą do określenia wariancji wyjaśnionej
140
wynik testu kompetencji (X)
Y' 0,72X + 14,70 - równanie linii regresji Y' - wyniki egzaminu przewidywane na pod-
Zmienność
Na przykładj eżeli zmienna A koreluje z B na poziomie 0,3, to znaczy, że r = (0,3)2 0,09, a to oznacza, że 9% zmienności zmiennej A możemy wyjaśnić przez zmienność zmiennej B pod warunkiem, że możemy założyć związek przyczynowo-skutkowy. W innym przypadku powiemy, że zmienne A i B mają 9% wspólnej zmienności. Pierwiastek z powyższego wyrażenia z odpowiednim znakiem to współczynnik korelacji liniowej obu zmiennych:
=
r=+
251
Rozdział 8.
Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ...
Testowanie
Istnieje także zależność między współczynnikiem korelacji r a współczynnikiem nachylenia linii regresji b:
Wartość współczynnika
korelacji r zawiera
gdzie 1 lub -1 oznacza
się
istotności współczynnika
korelacji
w granicach <-1; 1>,
maksymalną siłę
liniowego
związku pomiędzy zmiennymi,
Ooznacza brak liniowego związku pomiędzy badanymi zmiennymi.
Wyraz wolny linii regresji wynosi:
ay = M y- byMx . Warto zauważyć, że fJ = r, ale tylko w przypadku zależności między dwiema zmiennymi. W spółczynnik korelacji można zdefiniować także, odwołując się do miary współzmienności dwóch zmiennych.
Testowanie
istotności współczynnika
korelacji
Współczynnik
Najprostszym sposobem pomiaru związku pomiędzy zmiennymi ilościowymi jest określenie ich współzmienności wyrażonej wzorem:
gdzie X; y
są wartościami
korelacji jest statystyką opisującą siłę i kierunek liniowej zależ dwóch zmiennych w próbie. Ale my chcemy wnioskować na temat całej populacji, a nie próby. Zaczynamy od założenia hipotezy zerowej, że wartość współczynnika korelacji jest równa zero: ności
zmiennych, a Mx i My odpowiednio ich średnimi.
Kiedy podzielimy współzmienność przez odpowiadającą im liczbę stopni swobody, co w naszym przypadku oznacza liczebność próby minus jeden (oczywiste jest, że oba pomiary X i Y dotyczą tej samej próby), otrzymamy wzór na kowariancję:
Hl: p* O(p- czytaj [ro]).
Ho: p= O Test wzoru:
istotności współczynnika
korelacji wymaga policzenia statystyki t
według
t=r ~N-2 -2'
l -r
ss
cov
=-R..
N-l
XY
Powyższa miara nie nadaje się do porównywania siły dwóch różnych związ ków, ponieważ uzależniona jest od jednostek skali, na których opisane są zmienne. Użycie tej miary np. do porównywania siły związku motywacji i zarobków oraz zarobków i samooceny pozycji społecznej jest nieuprawnione ze względu na różne jednostki skali tych zmiennych. Możemy uniknąć uzależnienia od jednostek skali, jeżeli będziemy stosować zmienne w postaci standaryzowanej, przekształcone w z. W ten sposób wprowadzamy wzór na współczynnik korelacji liniowej r Pearsona. Jest on miarą współzmiennościdwóch zmiennych X i Y wyrażonych w postaci standaryzowanej.
Gdy: z x-
X-M x
Zy
=
X-M
y
,
wtedy współczynnik korelacji ma
252
=
=
=
Jeżeli taką samą korelację
czy w takim przypadku różnicy współczynnika
r
=0,493 otrzymalibyśmy dla N =160 par pomiarów (df =158), to
łatwiej
czy trudniej byłoby odrzucić korelacji w populacji od zera?
hipotezę zerową
o braku istotnej
Określenie zmiennych
Lzxzy
x - LICZBA RANDEK (zmienna ilościowa)
N-l
y - SATYSFAKCJA Z tYCIA (zmienna
=--' XY
korelacji między liczbą randek w ostatnim tygodniu a satysfakcją z życia wynosi r 0,493 (N 16 par pomiarów). Podejmij decyzję wobec Ho: p O, stosując SCHEMAT WNIOSKOWANIA.
mułowanie założeń
postać:
r
Współczynnik
SCHEMAT WNIOSKOWANIA
Sy
Sx
która ma rozkład t Studenta dla df = N - 2, gdzie N - liczba par pomiarów.
i ich skal pomiarowych, sfori hipotez:
ilościowa)
253
Rozdział 8.
Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
liniowej ...
Testowanie
istotności współczynnika
korelacji
Założenia:
Wyliczanie linii regresji wymagało jedynie założenia o skali pomiarowej zmiennych (ilościowe). Testowanie istotności wyliczonych statystyk (b, r) nakłada konieczność speł nienia większej liczby założeń [por. 9], z których najważniejsze dotyczą liniowości związ ku, normalności rozkładu reszt regresji i jednorodności wariancji w pod populacjach wyznaczonych przez wartości zmiennej niezależnej. Hipotezy:
Ho: p= O
na danych z przykładu 8.3, podejmij decyzję wobec Ho: P = O; zastosuj SCHEMAT WNIOSKOWANIA dla N = 10 par pomiarów.
Opierając się
SCHEMAT WNIOSKOWANIA
Hl: pi' O
Zmienne
Wybór testu i ustalenie
rozkładu statystyki: Założenia
j§ -2
Statystyka t = r - - , ma rozkład
1-r
t Studenta dla dr = N -
2 = 14 stopni swobody.
Spełnione są założenia testu
t.
Hipotezy Wybór testu
Ustalenie reguły decyzyjnej: Poziom Wartość
istotności:
krytyczna:
a =0,05
tkryt (14)
Reguła decyzyjna
Obliczenia
= 2,145
Odrzucimy Ho, jeżeli t> 2,145 lub t < -2,145
Decyzja
Obliczanie wartości statystyki: W naszym przypadku wartość r podana jest w treści zadania i wynosi r = 0,493.
~ = 0,493 x4,29 = 4,12 t = r ~N-2 - - = 0,493 ~4 = 0,493,,18,42 1- r'
1-0,24
Podjęcie
decyzji:
4,12> 2,145, więc możemy odrzucić Ho. Stwierdzamy, że istnieje istotny statystycznie liniowy między liczbą randek a satysfakcją z życia.
związek
Przyjmij,
że
elipsy przedstawione na
poniższych
reprezentują
wykresy korelacyjne.
Twoim zadaniem jest uporządkowanie rysunków ze względu na wartość współczynnika korelacji od najmniejszego do największego.
o (E)
Rysunek 8.5. Siła
254
rysunkach
związku między
o zmiennymi
255
Rozdział 8. Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ...
Problemy w interpretacji
współczynnika
korelacji
Tabela 8.3. Korelacje parami dla próby N =30 (poprawki) Jeżeli mierzymy korelację inteligencji z ocenami szkolnymi i mamy dane tylko od dwóch osób, to jakie wartości może przyjąć współczynnik korelacji?
TIME1
Korelacja Pearsona Istotność
TIME2
Na podstawie analizy współczynnika korelacji możemy określić siłę związku (procent wspólnej wariancji). Sprawdź istotność oraz procent wspólnej wariancji liczonych dla prób o różnej liczebności N na podstawie współczynników korelacji.
0,4
0,6
r=
N= 27 N= 102
Istotność
Wspólna wariancja
Istotność
statystyczna
t = 3,75 Wynik istotny b) t = 7,5 Wynik istotny
a)
statystyczna
0,36
c)
0,36
d)
SAMOOCENA
Korelacja Pearsona
,
2
'
,
6~ 100
0,64
Korelacja Pearsona
-,11
-,30
(dwustronna)
,566
WIEK
Korelacja Pearsona Istotność (dwustronna)
,392
PŁEĆ
Korelacja Pearsona
,00
Istotność
(dwustronna)
, ,19
,038 -0,18
1,000
-,38
1
-,38
-,16
,392
,11
,105
,336
PŁEĆ
-,16
,566 -,30
1
,
Istotność
-,11
,014
,44
WIEK
-,18
,038
,336
,19
,12
,318
,516
1
-,03
,318
,
,12
-,03
,516
,00 1,000
,866
,866
1
,
Problemy w interpretacji współczynnika korelacji =062-=375 ' O8 ,
'
Na rysunku 8.6 przedstawiono wykresy korelacyjne czterech różnych grup wyników, dla których współczynnik korelacji wyników jest taki sam i wynosi r = 0,816. We wszystkich przypadkach zmienne mają takie same średnie Mx = 9 My = 7,5, równanie regresji jest dokładnie takie samo. Y' = 3 + 0,5 x X.
= O6..!.Q.. = 75 ' 0,8 ' [a] Tylko dla tego zestawu danych wyniki są wiarygodne
c)
d)
e:>
,... ""
co
co
'O
'O
..::r
4
Na podstawie wydruku macierzy korelacji wypisz pary zmiennych, które są ze sobą istotnie związane.
[c] Przypadek skrajny (outlier)
6
8
10 12 14
..::r ,...
4
6
8
10 12 14
[d] Związek pozorny, przypadek wpływowy (leverage)
,... "" e:> ,...
e:> ,...
co
'O
....
..::r
..::r
4
Rysunek 8.G.
""
[b] Związek krzywoliniowy
..::r ,...
C\I ,...
co
Uwaga: PŁEĆ jest zmienną nominalną, ale ze względu na to, że przyjmuje tylko dwie wartości, założenie o równości przedziałów jest zawsze spełnione i dlatego możemy ją traktować jak zmiennąilościową.
..
,...
"",...
..::r
256
, 0,14
Wspólna wariancja
b)
t = 0,6 102 - 2 = O 1- 0,6 2 '
,44
1
Istotność (dwustronna)
a)
t=06~7-2 =06~ O64 25 , 1- O6
(dwustronna)
Samoocena
TIME2
TIME1
Przykład
6
8
10 12 14
danych Anscombe'a.
5
10
15
20
257
Rozdział 8.
Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
Zastosowanie analizy regresji w badaniu LEARN.
liniowej ...
Pierwszy i podstawowy wniosek: należy oglądać dane. W spółczynnik korelacji liniowej służy do badania siły i kierunku związku liniowego między pomiarami, reprezentowanego przez linię prostą. Zatem adekwatny jest tylko do danych typu [a] (rysunek 8.6). Gdy związek nie jest liniowy, możemy zastosować regresję krzywoliniową, czyli zamiast linii prostej dopasowywać krzywą· Powszechnym błędem popełnianym przez badaczy jest stwierdzanie braku związku między zmiennymi, gdy współczynnik korelacji jest nieistotny. W takim wypadku możemy stwierdzić jedynie brak związku linowego. Innym problememjest wrażliwośćwspółczynnikakorelacji na przypadki skrajne i ograniczenie zakresu zmienności zmiennej niezależnej [9].
Tabela 8.4. Model- podsumowanie Model
R
R-kwadrat
Skorygowany R-kwadrat
1
,44
,20
,17
1
Suma kwadratów
Regresja
i=
•
o
•
• •
10
TIME1
Rysunek 8.7. Wykres korelacyjny (rozrzutu) wyników obu sprawdzianów w badaniu LEARN z linią regresji dla wszystkich badanych łącznie
kwadrat
38,69
1
38,69
28
5,69
Ogółem
198,00
29
F
Istotność
6,80
,014
Współczynniki Współczynniki
Współczynniki
niestandaryzowane
standaryzowane
b
O-l--_~-_--_-_----ł
Średni
df
159,31
Model
1
[li
2,39
Reszta
Tabela 8.G.
• •
::;
Błąd
standardowy oszacowania
Tabela 8.5. Analiza wariancji
12...---------------, 10
trzeciej zmiennej ...
a Predyktory: (Stała), TIMEl b Zmienna zależna: TIME2
Model
Zastosowanie analizy regresji w badaniu LEARN. Modyfikujący wpływ trzeciej zmiennej (grupa eksperymentalna) na otrzymane zależności
Modyfikujący wpływ
Błąd
(Stała)
2,78
1,31
,54
,21
Istotność
2,12
0,43
2,61
,014
Beta
standardowy
TIME1
t
,44
Wniosek: wyniki sprawdzianu pierwszego są istotnym (p < 0,05) predyktorem dla przewidywania wyników sprawdzianu drugiego. Współczynnik korelacji równy standaryzowanej wadze regresji (fi) wynosi 0,44 i jest istotnie różny od zera. Współczynnik determinacji (R2) wyniósł 0,20, co świad czy o tym, że wyniki ze sprawdzianu TIMEl pozwalają wyjaśnić 20% zmienności wyników sprawdzianu TIME2. 12r-------------,
258
Przeanalizujmy wydruk analizy regresji wyników drugiego sprawdzianu (TIME2) z jednym predyktorem (TIME1). Współczynnik korelacji zmiennych wynosi 0,44, współczynnik determinacji (R2) 0,20 (tabela 8.4). Test F porównuje wariancję zmiennej TIME2 wyjaśnioną przez TIMEl do wariancji niewyjaśnionej. Istotność F(p < 0,014) pozwala nam stwierdzić zasadność modelu (tabela 8.5). Z tabeli 8.6 możemy odczytać współczynnik regresji b = 0,54 i standaryzowany współczynnikregresji fJ= 0,44. Takjak stwierdziliśmywcześniej,fJ= r. Zależność ta nie jest jednak prawdziwa, gdy w równaniu jest więcej niż jeden predyktor. Dwie ostatnie kolumny tabeli 8.6 zawierają wartości testu t, który pozwala nam ocenić istotność danej wagi regresji.
10
o i---r'~,..L-:::--~7----1
~
i=
o
o o
GRUPA
02
O;!--_-,--_----,-_ _.,--_--,----_---1.
O TIME1
W
1
Rysunek 8.8. Wykres korelacyjny (rozrzutu) wyników obu sprawdzianów w badaniu LEARN z liniami regresji dla 3 grup
259
Rozdział 8.
Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
liniowej ...
Na wykresie korelacyjnym (rysunek 8.7) linia prosta wydaje się być dość dobrze dopasowana do danych, choć niepokoją punkty leżące blisko osi OX wskazujące na 4 osoby, które źle wypadły w sprawdzianie 2., choć uzyskały bardzo różne wyniki w czasie sprawdzianu l. Naniesienie na korelacyjny wykres rozrzutu na rysunku 8.8, identyfikatorów grup eksperymentalnych pokazuje, że wyniki osób z grupy STRACH (Grupa l) są doskonale dopasowane do linii prostej, zaś wyniki grupy RELAKS (Grupa 2) nie wykazują żadnej zależności, co potwierdza prosta regresji równoległa do osi Ox.
Dwóch studentów, niezależnie od siebie, badało związek między częstością uśmiechania a pozycją socjometryczną w grupie. Obaj przeprowadzili badanie na grupach o takich samych liczebnościach. Jeden otrzymał r 0,5, drugi r 0,6. Jaka jest różnica w zdolności przewidywania pozycji socjometrycznej na podstawie częstości uśmiechania się między tymi badaniami? się
=
=
Regresja wielokrotna.
Określanie związku
zmiennej zależnej z więcej niżjednym predyktorem
Możemy także policzyć współczynnik korelacji
wielokrotnej R między wara wartościami przewidywanymi na podstawie równania regresji (kombinacją liniową predyktorów). Podniesiony do kwadratu, pozwala on ocenić procent zmienności zmiennej zależnej, wyjaśniony łącznie przez dany zestaw predyktorów. Ze względu na brak miejsca nie będziemy tutaj wprowadzać wzorów, a skoncentrujemy się wyłącznie na analizie przykładów. tościami
zmiennej
zależnej
Współczynniki
Liczba Predyktory predyktorów
1
X1 -
staż
regresji wyznaczane są przez minimum sumy kwadratów (Y 81 -
Y)2
=(b 1X 1 +
Y)2
Wyliczone równanie regresji Y =$ 520X1 + $ 20411
Porównaj siłę związku między zmiennymi, gdy współczynniki korelacji wynoszą odpowiednio 0,70 i 0,80, 0,2 i 0,3.
Interpretacja współczynników
regresji
każdy dodatkowy rok pracy po doktoracie związany jest z przyrostem wynagrodzenia o $ 520
(średnio)
1
X 2 -liczba publikacji
(Y 82 -
Y)2
=(b 2X2 +
Y)2
Y =$ 566X2 +$21106
każda dodatkowa publikacja związana jest z przyrostem wynagrodzenia o $ 566
(średnio)
Jaka powinna być korelacja między X i Y, aby można było twierdzić, że 64% zmienności X jest wyjaśnione przez zmienność Y?
Regresja wielokrotna. Określanie związku zmiennej zależnej z więcej niż jednym predyktorem Analiza regresji Uedna zmienna zależna, jeden predyktor) daje się łatwo uogólna przypadek regresji wielokrotnej Uedna zmienna zależna, wiele predyktorów). Dopasowujemy wtedy nie prostą, ale hiperpłaszczyznę regresji. Regresja wielokrotna ma olbrzymie znaczenie, ponieważ pozwala ocenić ważność każdego z predyktorówprzy kontrolowaniu wpływu pozostalych. Wagi P(standaryzowane współ czynniki regresji) pokazują, o ile zmienia się zmienna zależna wskutek standaryzowanej zmiany predyktora przy zachowanej kontroli pozostałych zmiennych i dzięki testom istotności pozwalają ocenić, który z predyktorów jest istotny.
2
X 1 - staż X 2 -liczba publikacji
=
(Y - Y)2 (b 1X 1 + b2X 2 + 812 - Y)2
Y =$ 479X1 + $ 88X 2 +$20138
każda
dodatkowa publikacja związana jest z przyrostem wynagrodzenia jedynie 0$ 88 (średnio), jeżeli uwzględnimy
w przewidywaniu zarobków także staż (X1 )
* na podstawie [9]
nić
260
261
Rozdział
8. Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
Regresja wielokrotna.
liniowej ...
Określanie związku
zmiennej zależnej z więcej n iż jednym predyktorem
Tabela 8.8. Analiza wariancji Suma kwadratów
Model Wzorując się
na
przykładzie
8.4,
uzupełnij następującą tabelę:
Liczba Wyliczone Predyktory predyktorow równanie regresji X1 -
1
Y =$ 800X1 + $ 20000 b1 =
staż
a1
X 2 -liczba publikacji
1
Y =$ 1000X2 + $ 19000 b2 = a2
X 1 - staż X 2 -liczba publikacji
2
=
=
Y =$ 500X1 + $ 100X2 + $ 1950
Interpretacja równania regresji
1 Przewidywania
każdy dodatkowy rok pracy po doktoracie związany jest z przyrostem wynagrodzenia o $
Osoby 3 lata po doktoracie powinny zarabiać średnio y =
każda
dodatkowa publikacja związana jest z przyrostem wynagrodzenia o $ (średnio)
Osoby z 5 publikacjami powinny zarabiać średnio y =
każda
Osoby 3 lata po doktoracie i 5 publikacjami powinny zarabiać średnio Y=
dodatkowa publikacja związana jest z przyrostem wynagrodzenia jedynie $ (średnio) jeżeli o uwzględnimy
w przewidywaniu zarobków także staż (X1 )
W badaniu LEARN chcemy znajomości 3 zmiennych:
wyjaśnić
Regresja
56,09
18,70 5,46
Reszta
141,91
26
198,00
29
F
Istotność
3,43
0,032
Współczynniki
Model
Współczynniki
Współczynniki
niestandaryzowane
standaryzowane
Błąd
b 1
kwadrat
3
Ogółem
Tabela 8.9.
Średni
df
standardowy
(Stała)
5,73
2,13
TIME1
,51
,20
Płeć
Samoocena
t
Istotność
2,69
,012
2,49
,019
Beta
,42
,79
,86
,15
,91
,370
-,51
,36
-,24
-1,41
,171
Tylko wynik sprawdzianu pierwszego (TIME1) był istotnym predyktorem dla przewidywania wyników sprawdzianu drugiego (TIME2). Wprowadzenie dodatkowych zmiennych (choć nieistotnych) polepszyło procent wariancji wyjaśnianej przez model z 20% (tabela 8.4) do 28,3%, jednak nie jest to zmiana istotna statystycznie. Trzeba podkreślić, że wagi regresji zależą od innych predyktorów uwzględnionych w równaniu. Jeżeli pominęlibyśmy SAMOOCENĘ w analizie regresji, współczynniki ftzwiązane z TIME1 i PŁEĆ byłyby różne od tych przedstawionych na wydruku.
wyniki w drugim sprawdzianie (TIME2) na podstawie
1. wyniku pierwszego sprawdzianu (TIME1), 2.
W badaniu PGSS (panel 2003) przeprowadzono analizę zależności wagi respondenta - zmienna 8MI (Body Mass Index) od:
płci,
3. samooceny.
• umiejętności kontroli jedzenia - zmienna DYSC (wysokie wyniki świadczą o braku takiej
a. Predyktory: (Stała), PŁEĆ, TIME1, SAMOOCENA b. Zmienna
zależna:
zdolności),
TIME2
• wieku - zmienna AGE, • płci respondenta - zmier-tna SEX (1 - mężczyzna, 2 - kobieta).
Tabela 8.7. Model- podsumowanie
262
Na podstawie
Model
R
R-kwadrat
Skorygowany R-kwadrat
1
,53
,28
,20
poniższego
wydruku
sformułuj
wnioski.
Błąd
standardowy oszacowania 2,34
Tabela 8.10. Model - podsumowanie Model
R
R-kwadrat
Skorygowany R-kwadrat
1
,401 (a)
,160
,154
Błąd
standardowy oszacowania 3,806
263
Rozdział 8.
Pomiar związku między zmiennymi ilościowymi: współczynnik korelacji liniowej ...
Tabela 8.11. Analiza wariancji Model Regresja Reszta Ogółem
Korelacje
to korelacj a
Suma kwadratów
df
1027,619 5375,161 6402,780
3 371 374
Średni kwadrat
342,540 14,488
F
Istotność
23,642
0,000'
cząstkowa między
dwiema zmiennymi przy kontroli zmiennej WYdo zapoznania się z alternatywnymi definicjami korelacji cząstkowych w [5, 6, 9]. Zostało to schematycznie przedstawione w tabelce: KSZTAŁCENIE.Zachęcamy Czytelnika
Zróżnicowanie Zróżnicowanie zmiennej
Model
p - waga pracy
Współczynniki
Współczynniki
niestandaryzowane
standaryzowane
b
DYSC SEX AGE * wartość
21,544 0,375 -1,577 0,119
Błąd
standardowy
1,162 0,182 0,401 0,016
R - waga religii
t
Istotność
Beta
0,098 -0,189 0,352
18,540 2,055 -3,938 7,377
0,000* 0,041 0,000* 0,000*
zaokrąglona
Korelacj e cząstkowe
264
Błąd
(reszta regresji)
wykształcenie
Tabela 8.12. Współczynniki
(Stała)
zmiennej
wyjaśnione przez
• wartość zaokrąglona
1
cząstkowe
Jednym z najważniejszych problemów procesu badawczego jest kontrola zmiennych, które mogą wpływać na kształt związku między zmienną nie zależną i zależną. Wpływ ten może mieć charakter mediatora lub moderatora. Zależność między masą ciała mierzoną za pomocąBMI a samooceną może być istotna tylko dla kobiet, a nieistotna dla mężczyzn. Powiemy wtedy, że płeć jest zmienną modyfikującązwiązek między BMI a samooceną. Zależność między wagąprzypisywanąpracy a wagą przypisywaną religii może zależeć od wykształcenia respondenta. Wykształcenie może być mediatorem relacji między wagą, którą respondenci przypisują pracy i religii. Jeżeli obie zmienne (niezależna i zależna) są skorelowane z trzecią, należy policzyć korelacje cząstkowe. Jest to współczynnik korelacji uwzględniający związek obu zmiennych z wykształceniem. Jeżeli przeprowadzilibyśmy analizę regresji wagi pracy z jednym predyktorem: wykształceniem, to zróżnicowanie wagi pracy zostałoby podzielone na część wyjaśnioną przez zmienną niezależną: wykształcenie i część niewyjaśnioną, nazywaną przez nas błędem regresji, a którą określa się także jako resztę regresji. Jeżeli przeprowadzilibyśmy analizę regresji wagi religii z jednym predyktorem: wykształce niem, to zróżnicowanie wagi pracy zostałoby podzielone na część wyj aśnioną zmienną niezależną: wykształcenie i część niewyjaśnioną (resztę regresji). Te dwie reszty regresji określają zróżnicowanie zmiennych z wyłączeniem zróż nicowania wyjaśnionego przez wykształcenie. Korelacja tych dwóch reszt regresji
Pw - zróżnicowanie wagi pracy wyjaśnione przez
Pb - zróżnicowanie wagi pracy niewyjaśnione przez
wykształcenie
wykształcenie
Rw - zróżnicowanie wagi religii wyjaśnione przez
Rb - zróżnicowanie wagi religii niewyjaśnione przez
wykształcenie
wykształcenie
dotyczy związku P i R. Współczynnik korelacji (przy kontroli wykształcenia) to współczynnik korelacji między Pb i Rb. Stosując regresję wielokrotną, możemy liczyć reszty regresji przy większej liczbie predyktorów, np. wiek, wykształcenie, wielkość zarobków itd., co oznacza możli wość analizy współczynników korelacji cząstkowej przy większej liczbie zmiennych kontrolowanych. Nie podajemy wzorów, bo obliczenia te dokonywane są za pomocą programu komputerowego. Reszty regresji mogą być zapisywane jako nowe zmienne i poddawane dalszym analizom. Prosty
współczynnik korelacji
cząstkowej
W badaniu PGSS (panel 2003) analizowano związek między 8MI (Body Mass Index) i problemami z nadwagą (zmienna NADWAGA) ze spostrzeganą trudnością w zmianie zachowań sprzyjających zdrowiu (przykład analizowany w rozdziale 3.). Wysokie wartości 8MI i NADWAGA świadczą odpowiednio o dużej nadwadze rzeczywistej i spostrzeganej. Na podstawie wydruków korelacji prostych i cząstkowych ustosunkuj się do 13 przedstawionych poniżej twierdzeń, odpowiadając: 1 P - kiedy dane twierdzenie jest prawdziwe, F - kiedy jest fałszywe lub? - kiedy nie można udzielić odpowiedzi.
Tabela 8.13. Korelacje proste 8MI oraz NADWAGĄ
między
odpowiedziami na pytania 1-17 i wskaźnikiem Korelacje
CHi
CH2
CH3
CH4
CH5
CH6
CH7
CH8
CH9
CH10
BMI
0,03
-0,04
0,15
0,13
0,10
0,065
0,01
0,12
-0,01
0,05
p=
0,62
0,46
0,00
0,01
0,07
0,224
0,83
0,02
0,84
0,39
NAD
0,02
-0,07
0,09
0,05
0,04
0,014
0,04
0,17
0,06
0,13
p=
0,53
0,17
0,09
0,30
0,41
0,796
0,49
0,00
0,27
0,01
265
Rozdział
8. Pomiar związku między zmiennymi
ilościowymi: współczynnik korelacji
liniowej. ..
Korelacje
CH11 CH12 CH13 CH14 CH15 CH16 CH17
4 5 6 7
8 9 10
0,04 -0,03 -O,OS -0,06
O,OS
0,10
0,09
p=
0,49
0,57
0,24
0,15
0,07
0,08
NAD
0,10
0,03 -0,04 -0,09
0,11
0,14
0,10
p=
0,05
0,62
0,04
0,01
0,05
0,16 0,43
0,09
w planowaniu posiłków (CH1), tym większe BMI. planowanie godzin posiłków i ścisłe trzymanie się tego planu (CH2), tym mniejsze kłopoty z nadwagą. Im trudniejsze jest niezjadanie niczego bezpośrednio z lodówki, prosto z opakowania lub garnka (CH3), tym większe BMI. Im trudniejsza całkowita rezygnacja z dokładek (CH4), tym większe problemy z nadwagą. Im szybsze jedzenie (CH5), tym większe BM!. Im trudniejsze przerywanie jedzenia, kiedy czujemy, że moglibyśmy coś jeszcze zjeść (CH7), tym mniejsze BMI. Im łatwiejsze powstrzymanie się od zjedzenia reszty już nałożonego na talerz posiłku w chwili, gdy poczujemy sytość (CH8), tym większe problemy z nadwagą. Im trudniejsze niepodjadanie między posiłkami (CH9), tym większe problemy z nadwagą. Im łatwiejsza pełna koncentracja w czasie jedzenia na przeżuwaniu produktów (CH10), tym mniejsze BMI. Im trudniejsze przeczekiwanie pierwszego głodu (CH11), tym mniejsze problemy z nad-
1 Im 2 Im 3
BMI
większa trudność łatwiejsze
Wprowadzenie zmiennych nominalnych do równania regresji Oceń ponownie poprawność zdań, posługując się macierzą korelacji cząstkowych (po wyłą czeniu wpływu płci i wieku respondentów).
Tabela 8.14. Korelacje cząstkowe między odpowiedziami na pytania 1-17 oraz wskaź nikiem 8MI i NADWAGĄ przy kontroli zmiennej PŁEĆ i WIEK Korelacje cząstkowe (płeć - wiek)
CH1
CH2
CH3
CH4
CH5
CH6
CH7
CHS
CH9
CH10
8MI
O,OS
0,06
0,15
,022
0,09
0,05
0,11
0,22
0,14
0,17
0,04
0,00
0,23
0,49
0,15
0,00
0,06
0,02
p=
0,26
0,40
NAD
0,14
0,09
0,21
0,21
O,OS
0,04
0,15
0,31
0,22
0,24
p=
0,06
0,23
0,00
0,00
0,26
0,58
0,04
0,00
0,00
0,00
Korelacje cząstkowe (płeć - wiek)
NAD
CH11 CH12 CH13 CH14 CH15 CH16 CH17 0,11 -0,01 -0,05 -0,06 0,11 0,05 0,14 0,15 0,87 0,48 0,44 0,13 0,49 0,05 0,17 0,07 -0,03 -O,OS 0,13 0,09 0,15
p=
0,02
8MI p=
0,36
0,64
0,26
0,07
0,24
0,04
wagą.
łatwiejsze jest wykonywanie codziennych ćwiczeń gimnastycznych (CH12), tym więk sze problemy z nadwagą. 12 Im łatwiejsza jest dla nas regularna aktywność fizyczna (CH16), tym niższe BMI. 13 Im łatwiejsza rezygnacja z jazdy autobusem czy samochodem, jeśli można dojść pieszo (CH17), tym mniejsze problemy z nadwagą.
11 Im
Twierdzenia
266
1 2 3 4 5 6 7 8 9 10 11 12 13
Korelacje proste p - prawda, F F
Korelacje fałsz,
cząstkowe
? - nie wiadomo F
Wprowadzenie zmiennych nominalnych do równania regresji Z przeprowadzonych wcześniej analiz wariancji w badaniu LEARN'wiemy, że manipulacja miała istotny wpływ na wyniki w 2. sprawdzianie. Zmienna niezależna GRUPA jest zmienną nominalną i przyjmuje 3 wartości. W żadnym przypadku nie możemy jej traktować jako zmiennej ilościowej. Ten przywilej mają tylko zmienne dychotomiczne, takie jak płeć. Czy to znaczy, że nie możemy jej uwzględnić w równaniu regresji? Możemy, jeśli przekształcimyjąna dwie zmienne, nazywane kontrastowymi (instrumentalnymi, w języku angielskim dummy). Zmienną nominalną maj ącą k wartości możemy zamienić na k - 1 zmiennych kontrastowych. Sposób tworzenia kontrastów zależy od tego, co nas interesuje. My wybraliśmynastępujące porównania: 1. kontrast między grupą STRACH i RELAKS; 2. kontrast między obiema grupami a grupą kontrolną.
Sposób nadania wartości nowym zmiennym w zależności od wartości zmiennej nominalnej przedstawiony jest w tabeli poniżej:
267
Rozdział
8. Pomiar związku między zmiennymi
k1grupa
liniowej ...
1
-1
RELAKS
-1
-1 2
O
Wprowadzenie zmiennych nominalnych do równania regresji
Budowanie równań regresji jest sztuką i przedstawione wyżej przykłady w ża den sposób nie wyczerpują zagadnienia. Do równania regresji predyktory mogą być wprowadzane w różnej kolejności, w grupach, możemy wprowadzać też interakcje predyktorów. Ten rozdział stanowi jedynie wprowadzenie do tego sposobu analizy danych.
k2grupa
STRACH KONTROLNA
ilościowymi: współczynnik korelacji
Istotność zmiennej klgrupa w analizie regresji oznacza, że różnica między gruSTRACH i RELAKS istotnie wpływa na wyniki w 2. sprawdzianie. Istotność zmiennej k2grupa oznaczałaby, że grupa kontrolna różniła się istotnie od reszty. pą
Tabela 8.15. Model - podsumowanie
a
Model
R
R-kwadrat
Skorygowany R-kwadrat
1
,82 a
,67
,60
Błąd
standardowy oszacowania 1,66
Predyktory: (Stała), K2GRUPA, K1GRUPA, TIME1, PŁEĆ, SAMOOCENA
Tabela 8.16. Analiza wariancji
1
Suma kwadratów
Regresja
131,90
5
26,38
66,10
24
2,75
198,00
29
Reszta Ogółem
df
kwadrat
F
Istotność
9,58
,oooa*
a
Predyktory: (Stała), K2GRUPA, K1 GRUPA, TIME1, PŁEĆ, SAMOOCENA;
*
wartość zaokrąglona
Tabela 8.17.
Współczynniki
Model
Współczynniki
Współczynniki
niestandaryzowane
standaryzowane
b 1
a
268
Średni
Model
(Stała)
Błąd
standardowy
t
Istotność
3,93
,001
Beta
5,96
1,52
TIME1
0,49
,14
,40
3,38
,002
Płeć
-,79
,61
-,15
-1,29
,209
Samoocena
-,55
,26
-,25
-2,13
,044
K1GRUPA
1,94
,37
,62
5,24
,000
K2GRUPA
,07
,22
,04
,31
,760
Zmienna
zależna:
TIME2
Analiza regresji wykazała istotny wpływ trzech predyktorów: wynik sprawdzianu TIME1, samooceny i zmiennej kontrastowej (porównującej grupę STRACH z grupą RELAKS). Procent wyjaśnianej wariancji wzrósł do 67%.
269
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Test hipotezy zgodności rozkładu empirycznego z teoretycznym (oczekiwany!.!!2
40% kobiet, 60% mężczyzn, połowa kobiet i mężczyzn powinna nie mieć więcej niż 40 lat.
Test 1'2 dla zmiennych nominalnych Pojęcia
test
kluczowe: test
niezależności
zgodności rozkładu
empirycznego z teoretycznym'
dwóch zmiennych nominalnych; miary
siły związku
Chcemy sprawdzić, czy lista 100 losowo wybranych kandydatów spełnia te warunki? Wśród 100 kandydatów powinno być 20 młodszych i 20 starszych kobiet oraz 30 młodszych i 30 starszych mężczyzn. Są to liczebności teoretyczne oznaczane literą T. Okazało się, że lista losowo wybranych kandydatów zawiera nazwiska 30 młod szych i 5 starszych kobiet oraz 20 młodszych i 45 starszych mężczyzn. Są to liczebności obserwowane oznaczane literą O. Aby ocenić zgodność rozkładu teoretycznego (tak jak być powinno) z empirycznym (tak jak jest), musimy policzyć jakąś statystykę o znanym rozkładzie.
zmiennych nominalnych
Nowe symbole:.i, rp, C Udowodniono, że statystyka X
Zdarza się, że nasze zmienne nie pozwalają na liczenie średnich i odchyleń standardowych. Co wtedy? Czy możemy orzekać o istnieniu i sile związku między zmiennymi nominalnymi? Odpowiedź na to pytanie jest pozytywna, pod warunkiem że dysponujemy dużymi próbami. W podręczniku przedstawimy dwa typy analiz zmiennych nominalnych. Tak jak pisaliśmy w rozdziale 1., decyzja dotycząca zakupu nowego, cudownego środka na pamięć, porost włosów, dobre samopoczucie itp. powinna być poprzedzona analizą związku dwóch zmiennych nominalnych. Aby wykazać skuteczność cudownego środka, powinniśmy móc odrzucić hipotezę zerową zakładającą brak związku między zażywaniem cudownego środka a wystąpieniem jego efektów. Obie zmienne to zmienne nominalne: Zmienna 1: TERAPIA (zażywał vs nie
zażywał)
Zmienna 2: SKUTECZNOŚĆ (sukces vs porażka). tów
Zanim nauczymy się to robić, pokażemy jak można sprawdzić, czy lista kandydaspełnia ustalone parytety.
Test hipotezy zgodności rozkładu empirycznego z teoretycznym (oczekiwanym)
Z
=L
(O-T)z T
ma znany rozkład dla k - 1 stopni swobody, gdzie:
k - liczba wartości zmiennej nominalnej, O - to liczebności obserwowane, T -liczebności teoretyczne (oczekiwane). Zapamiętaj:
• Liczebności zaobserwowane to liczebności (frekwencje) otrzymane z wyników badania. • Liczebności teoretyczne otrzymujemy na podstawie hipotezy lub rozumowania teoretycznego. Hipoteza badawcza w naszym przykładzie dotyczy poprawności listy wyborczej kandydatów. Pytamy o stopień zgodności liczebności teoretycznych i obserwowanych. Jeśli liczebności obserwowane i teoretyczne różnią się istotnie, to mamy podstawy do odrzucenia hipotezy zerowej mówiącej, że rozkład cech demograficznych kandydatów jest zgodny z przyjętymi postulatami (rozkładem teoretycznym).
Hipoteza zerowa, jaką testujemy przy użyciu.t dotyczy zgodności liczebności obserwowanych i teoretycznych.
Rozważmy następujący przykład:
270
Partia Równościowego Ucisku postanowiła, że listy wyborcze powinny być skomponowane według następującego klucza:
271
Test hipotezy zgodności rozkładu empirycznego z teoretycznym (oczekiwanym)
Rozdział 9. Test X2 dla zmiennych nominalnych
SCHEMAT WNIOSKOWANIA
Tabela 9.1. Sposób wyliczenia wartości.t dla wyników z przykładu
Cechy demograficzne kandydata (płeć, wiek) - 4 kategorie (zmienna nominalna)
Zmienne
~ młode
kobiety
starsze kobiety młodzi mężczyźni
starsi mężczyźni
T
20 20 30 30
O
30 5 20 45
T-O
(T - 0)2
-10 15 10
100 225 100
-15
225
(T-O)' T
Założenia
100/20 225/20
Hipotezy
Ho:
100/30 225/30
Rozkład zmiennej z rozkładem
H1:
Rozkład
nie jest zgodny z
;f '" 27,08
r
Na wartość składa się suma różnic pomiędzyliczebnościamiobserwowanymi i teoretycznymi, podniesionych do kwadratu i podzielonych przez liczebności teoretyczne. Im większa rozbieżność pomiędzy liczebnościami obserwowanymi i teoretycznymi, tym większawartość testu Interpretacja otrzymanej wartości wymaga znajomościrozkładu statystyki (patrz tablice.r na końcu podręcznika). Aby odczytać wartość krytyczną z tablic rozkła du musimy znać liczbę stopni swobody.
r.
Próba losowa 100 kandydatów partii PRU. ;f badania zgodności rozkładu empirycznego z teoretycznym.
Spełnione są załoźenia testu
X:,yt (3) = 7,82
Reguła decyzyjna Wartość
zmiennej nominalnej rozkładem teoretycznym.
=3 stopni swobody ma rozkład ;f.
Statystyka ;f dla k - 1
Wybór testu i rozkład statystyki
nominalnej jest zgodny teoretycznym.
Odrzucimy Ho. jeśli
X:"z
~ 7,82 .
X:'n "" 27,08
statystyki
X:"' "" 27,08 > X:ryt (3) = 7,82
Decyzja
,więc odrzucamy Ho.
r
r,
Tablice rozkładu X
2
r
W tablicach w wierszach podane są stopnie swobody df= k - 1 (gdzie k to liczba wartości zmiennej nominalnej), a w kolumnach poziomy istotności. W tablicach najczęściej podane są wartości krytyczne tego testu dla df ~ 30, z dwóch powodów:
Przetestuj hipotezę dotyczącą poprawności listy wyborczej, na której znalazło się po 25 młod szych i starszych kobiet oraz po 25 młodszych i starszych mężczyzn.
~ młode
kobiety
starsze kobiety młodzi mężczyźni
starsi
mężczyźni
r
1) bardzo rzadko liczony jest dla df = 30, ponieważ przy takiej liczbie wartości zmienna jest zwykle traktowana jako porządkowa lub ilościowa i dostęp nych jest wiele innych, bardziej czułych i precyzyjnych testów; 2) dla df> 30 rozkład z próby dąży do rozkładu normalnego.
r
T
O
T-O
(T - 0)2
(T _0)2 T
20
25 25 25 25
20 30 30
;f= ..............
SCHEMAT WNIOSKOWANIA Zmienne Założenia
Spełnione są założenia testu zgodności rozkładu
;f badania empirycznego z teoretycznym.
Hipotezy Stosując SCHEMAT WNIOSKOWANIA, zweryfikujemy hipotezę dotyczącą zgodności rozkła du empirycznego z teoretycznym na przykładzie kandydatów z listy wyborczej Partii Równościowego
Ucisku.
Wybór testu i rozkład statystyki Reguła decyzyjna
Wartość statystyki
Decyzja
272
273
Rozdział
9. Test Xl dla zmiennych nominalnych
Test hipotezy o niezależności dwóch zmiennych nominalnych
Studenci oczekują, że w teście jednokrotnego wyboru będzie tyle samo poprawnych odpowiedzi a), b), c), d). Sprawdź, czy następujący rozkład odpowiedzi: po 25 poprawnych odpowiedzi a) i b) oraz po 15 poprawnych odpowiedzi c) i d) różni się istotnie od oczekiwań studentów.
~ młode
O 25
starsze kobiety
20
25
młodzi mężczyźni
20
15
20
15
mężczyźni
T-O
(T - 0)2
(T -O)'
Gdy chcemy zbadać związek między zmiennymi nominalnymi, takimi jak płeć, wybór kandydata w głosowaniu, region zamieszkania, możemy analizować jedynie liczebności.
T 20
starsi
kobiety
T
Test hipotezy o niezależności dwóch zmiennych nominalnych
Możemy sprawdzać hipotezę mówiącą, że ćwiczenia fizyczne są bardziej skuteczne w odchudzaniu niż dieta. Dysponujemy danymi pochodzącymi od 100 osób, z których 30 stosowało dietę, a 70 intensywnie uprawiało ćwiczenia fizyczne. Po 6 miesiącach można było ustalić, czy dana osoba osiągnęła zamierzony cel (sukces), czy nie (porażka).
fl= ....·.·....···
SCHEMAT WNIOSKOWANIA
Dieta
Zmienne Założenia
Spełnione są założenia testu zgodności rozkładu
fl badania ,
Porażka
10
20
Ćwiczenia
50
20
RAZEM"
60
40
empirycznego z teoretycznym.
Hipotezy
Sukces
liczebności
RAZEM'
30 70 100
brzegowe
Wybór testu i rozkład statystyki Reguła decyzyjna
Wartość statystyki
Decyzja
Hipoteza zerowa przewiduje, że wybór diety bądź ćwiczeń nie ma wpływu na odniesienie sukcesu. Pierwszym krokiem jest wyliczenie liczebności teoretycznych, przy założeniu prawdziwości Ho. Jeżeli w naszej próbie sukces odniosło 60 osób na 100 (czyli 60%), a 30 stosowało dietę, to jeśli odniesienie sukcesu nie jest związane z typem oddziaływania (dieta vs ćwiczenia), to sukces powinno też odnieść
60
Stosując
analogiczny sposób myślenia, możemy za pomocą testu.t sprawdzać zgodność rozkładu naszej zmiennej z rozkładem normalnym, ponieważ w rozdziale 2. dowiedzieliśmy się, że rozkład normalny charakteryzuje się ściśle określonymi proporcjami przypadków wyznaczonymi przez krzywą Gaussa.
60% wśród stosujących dietę, czyli -x30 = 18 osób
100
i 60% intensywnie ćwiczących, czyli -
60
100
x 70 = 42 osoby.
Analogicznie wyliczamy liczebności teoretycznie dla liczby porażek wśród ćwiczących i osób na diecie. Te liczebności możemy też wyliczyć, odejmując liczebności teoretyczne dla sukcesu (18,42) odpowiednio od liczebności brzegowych dla obu grup (30 osób na diecie, 70 osób ćwiczących).
Liczebności teoretyczne zostały zestawione w tabeli 9.2. Kiedy znamy już liczebności teoretyczne, dalsze postępowanie jest analogiczne jak przy teście badania zgodności z rozkładem empirycznym.
274
275
Test hipotezy o niezależności dwóch zmiennych nominalnych
Rozdział 9. Test X2 dla zmiennych nominalnych
Tabela 9.2.
Liczebności
teoretyczne
Ustalenie Sukces
Porażka
Dieta
30 60x-=18 100
30 40x-=12 100
30
Ćwiczenia
70 60x-=42 100
70 40x-=28 100
70
60
40
100
Dieta Ćwiczenia
Sukces
Porażka
18 42 60
12 28 40
Poziom
30 70 100
Wartość
istotności:
krytyczna
Odrzucimy Ho.
reguły decyzyjnej:
a = 0,05
X~ryt (1) = 3,84
jeżeli X~trz (1) ~ 3,84. Obliczanie wartości statystyki:
schudł
nie
na diecie
schudł
na diecie
(O-T)'
T
O
18 12
10 20
-8 8
64 64
64/12 =
42
50
8
64
64/42 =
28 12,7
20
8
64
64/28 =
O-T
(O - T)2
T 64/18 =
schudł, ćwicząc
intensywnie
Liczbę stopni swobody dla testu:r, testującego
nie schudł, ćwicząc intensywnie
r",
niezależnośćdwóch zmiennych nominalnych, wyliczamy ze wzoru:
df= (r-1) x (c-1), gdzie: r-Iiczba poziomów pierwszej zmiennej, c -liczba poziomów drugiej zmiennej.
Podjęcie decyzji:
xL, (1) "'" 12,7 > X:"./ (1) = 3,84, zatem odrzucimy Ho mówiącą, że efekt nie zależy Stosujemy SCHEMAT WNIOSKOWANIA, tak jak przy poznanych wcześniej testach.
od rodzaju
oddziaływań.
SCHEMAT WNIOSKOWANIA Określeniezmiennych
i ich skal pomiarowych, sformułowaniezałożeń i hipotez:
Korzystając z informacji zawartych w przykładzie 9.2, zweryfikuj hipotezę, że efekt nie zależy od rodzaju oddziaływań, w przypadku gdy zaobserwowane wyniki mają inny rozkład Uak pokazano w poniższej tabeli).
TYP ODDZIAŁYWANIA (dieta vs ćwiczenia) - zmienna nominalna EFEKT (sukces vs porażka) - zmienna nominalna
T
O
18 12
5 25
42
30
28 ;:( '" 12,7
40
Hipotezy:
Ho: Efekt nie zależy od typu
schudł
oddziaływania.
nie
H1: Efekt zależy od typu oddziaływania.
na diecie
schudł
na diecie
O-T
(O - T)2
(O-T)'
T
schudł, ćwicząc
Wybór testu i ustalenie Statystyka
276
r ma rozkład r dla df= 1.
rozkładu statystyki:
intensywnie nie schudł, ćwicząc intensywnie
277
Rozdział 9.
Test X2 dla zmiennych nominalnych
Test hipotezy o niezależności dwóch zmiennych nominalnych
SCHEMAT WNIOSKOWANIA
Tabela 9.3. Zależność sądów o przeszłości (R) jedzenie od stanu faktycznego (P)
Zmienne Spełnione są założenia testu .t badania
Założenia
zgodności rozkładu
Tabela
empirycznego z teoretycznym.
krzyżowa
dotyczących
pieniędzy
na
PxR R (6 lat temu)
Hipotezy R=O
Wybór testu i rozkład statystyki Reguła
braku
NIE P=O
decyzyjna
Wartość statystyki
p 1997
NIE
brakowało
TAK
brakowało
P =1
Decyzja
.
Ogółem
N
OJozp N
OJozp N
OJozp
brakowało
R= 1 TAK
brakowało
Ogółem
.
178
39
217
82,0%
18,0%
100,0%
87
64
151
57,6%
42,4%
100,0%
265
103
368
72,0%
28,0%
100,0%
O - oznacza brak problemów finansowych, 1 - oznacza występowanie takich problemów • liczebności brzegowe W badaniu PGSS (panel 2003) pytaliśmy respondentów, czy brakowało im w ostatnim roku pieniędzy na: a) jedzenie, b) kształcenie, c) leczenie. Każda
ze zmiennych
przyjmowała dwie wartości:
O- nie
brakowało;
1-
brakowało.
Prosiliśmy także o odtworzenie roku 1997 i stwierdzenie, czy wtedy brakowało pieniędzy na wymienione cele. Połączyliśmy te dane z informacjami o rzeczywistych odpowiedziach udzielonych w 1997 roku przez te same osoby. Mamy więc 9 zmiennych, z których każda przyjmuje 2 wartości (po 3 zmienne w każdej z 3 dziedzin). Możemy analizować łączne rozkłady liczebności.
P - oznacza odpowiedzi udzielone przez respondenta w 1997 roku. R - oznacza
retrospekcję,
Możliwe są więc
czyli to, co w 2003 roku osoba
a) P = O i R = O - osobie nie odtwarza tę sytuację; b) P
sądzi, że odpowiedziała w
1997.
4 konfiguracje odpowiedzi:
= O i R = 1 - osobie nie
brakowało pieniędzy
brakowało pieniędzy
na jedzenie w 1997 roku i poprawnie
w 1997, ale 6 lat
póżniej źle
odtwarza
tę
sytuację;
c) P
=1 i R = O-
osobie
brakowało pieniędzy
na jedzenie, ale 6 lat
później uważa, że
nie
brakowało;
d) P
= 1 i R =1 -
osobie
brakowało pieniędzy w
1997 i poprawnie odtwarza
tę sytuację
6 lat
później.
W tabeli krzyżowej P x R przedstawione są liczebności w poszczególnych grupach i procenty dobrze i źle odtwarzających własną sytuację sprzed 6 lat, osobno wśród tych, którym brakowało na jedzenie i tych, którzy byli "zaspokojeni".
278
Na podstawie tabeli krzyżowych odpowiedz, czy respondenci dobrze odtwarzają problemy finansowe w różnych dziedzinach życia sprzed 6 lat.
Z tabeli 9.3 możemy odczytać, że w 1997 roku 217 osób nie miało problemów finansowych w płaceniu rachunków za żywność, 151 osób je miało. Odtwarzając6 lat później - 265 osób twierdziło, że w 1997 roku nie miało problemów, 103 - że miało. Tyle możemy dowiedzieć się z liczebności brzegowych. Analiza tabeli krzyżowej ujawnia, że: a) 82% (178 osób) z tych, którzy nie mieli w 1997 roku problemów finansowych, odtwarza tę sytuację poprawnie 6 lat póź niej; b) 18% (39 osób) twierdzi, że miało problemy, choć w 1997 roku twierdziło co innego; c) 42,4% (64 osoby) z tych, którzy mieli problemy finansowe w 1997 roku, odtwarza tę sytuację poprawnie 6 lat później; d) 57,6% (87 osób) z tych, którzy mieli problemy finansowe w 1997 roku, twierdzi, że ich nie mieli. Wartość testu.t = 26,03;
P < 0,001 pozwala nam na odrzucenie Ho, mówiącej o braku związku między posiadaniem problemów finansowych w roku 1997 a poprawnością odtwarzania przeszłości. Więcej błędów popełniają ci, którzy w 1997 roku mieli problemy finansowe.
279
Rozdział
Test hipotezy o niezależności dwóch zmiennych nominalnych
9. Test X2 dla zmiennych nominalnych
Tabela 9.5. Zależność sądów o przeszłości (R) leczenie od stanu faktycznego (P) Na podstawie danych z tabeli 9.4, zawierającej informacje o problemach finansowych w ceniu za edukację, uzupełnij poniższy tekst.
Tabela
pła
krzyżowa
dotyczących
kształcenie
Zależność sądów
o przeszłości (R) od stanu faktycznego (P)
dotyczących
braku
R (6 lat temu)
pieniędzy
NIE
na
p=o
Tabela krzyżowa P x R
NIE
p 1997
NIE
p=o NIE
P 1997
brakowało
P TAK
.
=1
brakowało
N %zP N %zP N
Ogółem
%zP
R=1
brakowało
TAK brakowało
TAK
.
Ogółem
Ogółem
268
34
302
88,7%
11,3%
100,0%
40
21
61
65,6%
34,4%
100,0%
308
55
363
84,8%
15,2%
100,0%
osób nie miało problemów finansowych Z tabeli 9.4 możemy odczytać, że w 1997 roku w płaceniu za edukację, osób je miało. Odtwarzając 6 lat później osób twierdziło, że w 1997 roku nie miało problemów, ......... że miało. Tyle możemy dowiedzieć się z liczebności brzegowych. Analiza tabeli krzyżowej ujawnia, że:
b)
rza b) c)
tę sytuację
%(
brakowało
%zP N %zP N %zP
na
R=1 TAK
brakowało
.
Ogółem
221
30
251
88,0%
12,0%
100,0%
75
40
115
65,2%
34,8%
100,0%
296
70
366
80,9%
19,1%
100,0%
występowanie
takich problemów
Z tabeli 9.5 możemy odczytać, że w 1997 roku osób nie miało problemów finansowych w płaceniu za leczenie, osób je miało. Odtwarzając 6 lat później osób twierdziło, że w 1997 roku nie miało problemów, ......... że miało. Tyle możemy dowiedzieć się z liczebności brzegowych. Analiza tabeli krzyżowej ujawnia, że: a)
%(
.
=1
N
brakowało
o - oznacza brak problemów finansowych, 1 - oznacza • liczebności brzegowe
o - oznacza brak problemów finansowych, 1 - oznacza występowanie takich problemów • liczebności brzegowe
a)
brakowało
P
R (6 lat temu) R=O
pieniędzy
PxR
R=O Tabela 9.4.
braku
osób) z tych, którzy nie mieli w 1997 roku problemów finansowych, odtwapoprawnie 6 lat później;
c)
%( osób) z tych, którzy nie mieli w 1997 roku problemów finansowych odtwarza tę sytuację poprawnie 6 lat później; %(
osób) twierdzi, że miało problemy, choć w 1997 roku twierdziło co innego;
%( osoby) z tych, którzy mieli problemy finansowe w 1997 roku, odtwarza sytuację poprawnie 6 lat później;
d)
%(
tę
osób) z tych, którzy mieli problemy finansowe w 1997 roku, twierdzi, że nie
mieli.
osób) twierdzi, że miało problemy, choć w 1997 roku twierdziło co innego;
Wartość testu j1 = 28,55; P < 0,001 (tego wyniku nie zamieszczono w wydruku), pozwala I nie pozwala nam na odrzucenie Ho, mówiącej o braku związku między posiadaniem problemów
tę
finansowych w roku 1997 a poprawnością odtwarzania przeszłości. Więcej błędów popełniają
%( osoby) z tych, którzy mieli problemy finansowe w 1997 roku, odtwarza poprawnie 6 lat później;
sytuację
d)
%( nie mieli.
osób) z tych, którzy mieli problemy finansowe w 1997 roku twierdzi,
że
ich
Wartość testu j1 = 18,77; P < 0,001 (tego wyniku nie zamieszczono w wydruku), pozwala I nie pozwala nam na odrzucenie Ho, mówiącej o braku związku między posiadaniem problemów finansowych w roku 1997 a
280
poprawnością
odtwarzania
przeszłości. Więcej błędów popełniają
Na podstawie danych z tabeli 9.5, zawierającej informacje o problemach finansowych w ceniu za leczenie, uzupełnij poniższy tekst.
pła
Analogicznie można analizować rozkłady więcej niż 2 zmiennych. Odtwarzanie przeszłości jest modyfikowane przez aktualną sytuację. W badaniach sprawdzaliśmy, czy odtwarzanie przeszłości (R) zależy od rzeczywistej sytuacji w 1997 roku (P) i aktualnej sytuacji w 2003 roku (A).
281
Rozdział
Test hipotezy o niezależności dwóch zmiennych nominalnych
9. Test X2 dla zmiennych nominalnych
Tabela 9.6. Zależność sądów o przeszłości (R) dotyczących braku jedzenie od stanu faktycznego w 1993 r. (P) i aktualnej sytuacji (A) Tabela
krzyżowa
pieniędzy
na Na podstawie tabeli 9.7, poniższy tekst.
PxR R (6 lat temu)
R=O NIE p=o A=O NIE
P
NIE
1997
P=1 TAK
2003
brakowało
brakowało
A= 1 TAK
1997
2003
brakowało
P=1 TAK
%zP
brakowało
Ogółem
88,7%
11,3%
100,0%
40
21
61
65,6%
34,4%
100,0%
308
55
363
84,8%
15,2%
100,0%
37
28
65
56,9%
43,1%
100,0%
45
47
92
48,9%
51,1%
100,0%
82
75
157
52,2%
47,8%
100,0%
N %zP
o- oznacza brak problemów finansowych,
Tabela 9.7. Ogółem
302
N %zP
brakowało
34
N %zP
TAK
268
N
%zP p=o
NIE
%zP
N
Ogółem
P
N
R= 1
brakowało
1 - oznacza
występowanie
takich problemów
Wśród
tych, którzy w 2003 roku mają problemy finansowe z płaceniem za żywność 56,9% odtwarza prawidłowo brak problemów tego typu w 1997, zaś 51,1 % odtwarza prawidłowo istnienie tego typu problemów w roku 1997. Oznacza to, że liczba błędów zależy od oceny aktualnej i przeszłej wynosi:
• 7,2% dla zaspokojonych teraz i
kiedyś; kiedyś;
• 43,1% dla niezaspokojonych teraz i zaspokojonych
kiedyś;
• 48,9% dla niezaspokojonych teraz i niezaspokojonych
r=
kiedyś.
=
14,65; P < 0,001 liczonego osobno dla zaspokojonych teraz (A O) pozwala na odrzucenie hipotezy o niezależności ocen sformułowanych w przeszłości (P) i tego, co teraz na ten temat sądzą respondenci (R). Tak jak należałoby oczekiwać, to co respondenci sądzą na temat zaspokojenia potrzeb w przeszłości zależy od rzeczywistego stanu w roku 1997. Nie można tego powiedzieć w sytuacji, gdy potrzeby nie są aktualnie zaspokojone. Dla tej grupy respondentów (A = 1) nie można odrzucić hipotezy o niezależności ich sądów o przeszłości od tego, co miało miejsce w przeszłości = 1,31; P > 0,05.
r
282
opłacaniu
edukacji,
uzupełnij
o przeszłości (R) dotyczących braku pieniędzy na stanu faktycznego w 1993 r. (P) i aktualnej sytuacji (A) Tabela
krzyżowa
Px R R (6 lat temu) R= 1
R=O NIE P=O
2003 NIE
p
NIE
1997
N %zP
P=1 TAK
A=O
brakowało
brakowało
N %zP N
Ogółem
%zP p=o
2003 TAK
p
NIE
brakowało
TAK
brakowało
1997
%zP
P=1
Ogółem
o-
N N %zP N %zP
brakowało
TAK
brakowało
Ogółem
219
14
233
94,0%
6,0%
100,0%
21
6
27
77,8%
22,2%
100,0%
240
20
260
92,3%
7,7%
100,0%
49
20
69
71,0%
29,0%
100,0%
19
15
34
55,9%
44,4%
100,0%
68
35
103
66,0%
34,0%
100,0%
oznacza brak problemów finansowych, 1 - oznacza
występowanie
takich problemów
Z tabeli krzyżowej (tabela 9.7) możemy odczytać, że wśród tych, którzy w 2003 nie mieli problemów finansowych % twierdziło, że w 1997 nie miało problemów finansowych, mimo że faktycznie było inaczej. Wśród
• 71,2% dla zaspokojonych teraz i niezaspokojonych
Wartość testu
problemów finansowych w
Zależność sądów
kształcenie od
A= 1 Z tabeli krzyżowej (tabela 9.6) możemy odczytać, że wśród tych, którzy w 2003 roku nie mieli problemów finansowych - 71,2% twierdziło, że w 1997 nie miało problemów finansowych, mimo że faktycznie było inaczej.
dotyczącej
tych, którzy w 2003 roku mają problemy finansowe z płaceniem za edukację % odtwarza prawidłowo brak problemów tego typu w 1997, zaś % odtwarza prawidłowo istnienie tego typu problemów w roku 1997. Oznacza to, że liczba błędów zależy od oceny aktualnej i przeszłej 1997 i wynosi: • % dla zaspokojonych teraz i kiedyś; • % dla zaspokojonych teraz i niezaspokojonych kiedyś; • % dla niezaspokojonych teraz i zaspokojonych kiedyś; • % dla niezaspokojonych teraz i niezaspokojonych kiedyś.
r
Wartość testu = 6,58; P < 0,01 liczonego osobno dla zaspokojonych teraz (A = O) pozwala / nie pozwala na odrzucenie hipotezy o niezależności ocen sformułowanych w przeszłości (P) i tego, co teraz na ten temat sądzą respondenci (R). To, co respondenci sądzą na temat zaspokojenia potrzeb w przeszłości, zależy / nie zależy od rzeczywistego stanu w roku 1997. W sytuacji, gdy potrzeby nie są aktualnie zaspokojone: dla tej grupy respondentów (A = 1) można / nie można odrzucić hipotezy o niezależności ich sądów o przeszłości od tego, co miało miejsce w przeszłości - r 2,33; P > 0,05.
=
283
Rozdział
9. Test Xl dla zmiennych nominalnych
WYliczanie
Wyliczanie Na podstawie tabeli 9.8, dotyczącej problemów finansowych w płaceniu za leczenie, uzupełnij poniższy tekst.
Tabela 9.8. Zależność sądów o przeszłości (R) dotyczących braku leczenie od stanu faktycznego w 1997 r. (P) i aktualnej sytuacji (A) Tabela
krzyżowa
pieniędzy
na
PxR
R= 1
R=O P=O A=O NIE
P
NIE
1997
P=1 TAK
2003
brakowało
brakowało
TAK
2003
NIE
brakowało
P=1
1997 TAK Ogółem
%zP %zP
P=O P
N N
Ogółem
A= 1
N %zP
brakowało
N %zP N %zP N %zP
brakowało
TAK
brakowało
176
16
192
8,3%
100,0%
40
5
45
88,9%
11,1%
100,0%
216
21
237
91,1%
8,9%
100,0%
45
14
59
76,3%
23,7%
100,0%
35
35
70
50,0%
50,0%
100,0%
80
49
129
62,0%
38,0%
100,0%
O-oznacza brak problemów finansowych, 1 - oznacza
występowanie
x2 = L (2xO-2xT)2 =2 x L(O-T)2
Ogółem
91,7%
2xT
.
T
Analogicznie, jeżeli zwiększymy liczebność próby ośmiokrotnie,zachowującproporcje, to ośmiokrotnie zwiększy się wartość x'. W praktyce, w próbie powyżej 1000 osób bardzo trudno jest uzyskać wartość testu x', która pozwoliłaby na nieodrzucenie hipotezy zerowej - z wyżej wymienionych powodów. Trzeba pamiętać, że poziom istotności statystyki zależy od natężenia istniejącego związku i wielkości badanej próby. Im mniejsza jest próba, tym silniejszy musi być związek, aby jego istnienie okazało się istotne. Istniej ą różne miary związku między zmiennymi nominalnymi [por. 3, 16]. Pokażemy przykładowe dwie: Na podstawier możnawyliczyć tzw. współczynnik zbieżności, który jest analogiem do współczynnika korelacji r, choć nie uwzględnia znaku związku:
takich problemów
Z tabeli krzyżowej (tabela 9.8) możemy odczytać, że wśród tych, którzy w 2003 nie mieli problemów finansowych % twierdziło, że w 1997 nie miało problemów finansowych, mimo że faktycznie było inaczej. Wśród
tych, którzy w 2003 roku mają problemy finansowe z płaceniem za leczenie .......... % odtwarza prawidłowo brak problemów tego typu w 1997, zaś .........% odtwarza prawidłowo istnienie tego typu problemów w roku 1997. Oznacza to, że liczba błędów zależy od oceny aktualnej i przeszłej 1997 i wynosi: • % dla zaspokojonych teraz i kiedyś; • % dla zaspokojonych teraz i niezaspokojonych kiedyś; • % dla niezaspokojonych teraz i zaspokojonych kiedyś; • % dla niezaspokojonych teraz i niezaspokojonych kiedyś.
Wartość testu.r= 0,702; p = 0,402 liczonego osobno dla zaspokojonych teraz (A = O) pozwala I nie pozwala na odrzucenie hipotezy o niezależności ocen sformułowanych w przeszłości
Współczynnik C
przyjmuje wartość zero, gdy zmienne są niezależne. Jego warmaksymalna zależy jednak od liczby wartości zmiennych (liczby wierszy i kolumn w tabeli krzyżowej). Dla tabeli 2 x 2 maksymalna wartość wynosi 0,707. Przy porównywaniu współczynników warto więc przeprowadzić ich standaryzację, dzieląc przez wartość maksymalną- znacznie ułatwia to interpretację. tość
Dla danych oceniających skuteczność diety (przykład 9.2) w próbie 100-elementowej .r wyniósł więc 12,7.
(P) i tego, co teraz na ten temat sądzą respondenci (R). To, co respondenci sądzą na temat zaspokojenia potrzeb w przeszłości zależy I nie zależy od rzeczywistego stanu w roku 1997.
284
współczynników siły związku
Poziom istotności testu r informuje jedynie o prawdopodobieństwie istnienia związku, a nie o jego natężeniu. Bardzo ważne jest, aby przy stosowaniu testu r pamiętać, że przy niezmiennych proporcjach wartość r jest wprost proporcjonalna do wielkości próby. Wynika to bezpośrednio z wzoru na Z2. Jeżeli zwiększamy liczebność próby dwukrotnie, zachowując proporcje, to dwukrotnie zwiększy się każda z liczebności teoretycznych i oczekiwanych:
R (6 lat temu) NIE
współczynników siły związku
W sytuacji, gdy potrzeby nie są aktualnie zaspokojone: dla tej grupy respondentów (A = 1) można I nie można odrzucić hil?otezy o niezależności ich sądów o przeszłości od tego, co miało miejsce w przeszłości - X' = 12,821; P < 0,001.
c= Wiedząc, że maksymalna zowane równe jest 0,48.
12,7 100 + 12,7
wartość może wynieść
= 0,34 .
0,707, potrafimy
stwierdzić, że
C standary-
285
Rozdział
Wyliczanie
9. Test X2 dla zmiennych nominalnych
Oblicz współczynnik C dla danych z analizowanych Ćwiczenie
N
.i
368
26,03
Ćwiczenie 9.4
363
18,77
Ćwiczenie 9.5
366
28,55
Ćwiczenie 9.6
366
18,58
Przykład
157
14,65
Przykład
9.3
9.4
Policz współczynnik rp dla oceny skuteczności stosowania metody B i C dla cesu egzaminacyjnego. Jakie wnioski możesz sformułować?
przykładów:
zdał
metoda B
Zdał
TAK
NIE
TAK
a
NIE
c
b d a+d
liczymy według
suk-
następującego
TAK
NIE
TAK
10
40
50
NIE
40
40
50
50
50
100
zdał
metoda C
rp=
egzamin
rp=
egzamin
TAK
NIE
TAK
40
10
NIE
40
10
50
80
20
100
50
egzamin
a+c Współczynnik rp
osiągnięcia
C
Dla zmiennych dwuwartościowych możemy policzyć współczynnik rp, ponieważ pozwoli nam on na określenie znaku związku. Przykładowo, jeżeli chcemy policzyć skuteczność nowej metody przygotowania się do egzaminu, w tabeli krzyżowej mamy liczebności par zgodności (stosował metodę i zdał lub nie stosował metody i nie zdał) oznaczone odpowiednio a i d oraz liczebności par niezgodności (stosował metodę i nie zdał lub nie stosował metody i zdał) oznaczone odpowiednio b i c.
metoda A
współczynników siły związku
a+b c+d a+b+c+d
Testowanie związku zmiennych nominalnych ma sens tylko dla dużych prób. Konieczność kontroli dodatkowych zmiennych powoduje, że liczebności teoretyczne mogą być zbyt małe, aby zastosowanie testu.i było uzasadnione. Rozwiązaniem może być w przypadku tabel 2 x 2 zastosowanie testu dokładnego Fishera [por. 10].
wzoru:
axd-bxc
qJ = - - ; = = = = = = = = = J(a + b)(b + c)(c + d)(a + d)
Policzmy wartość rpdla skuteczności zastosowania metody A w przygotowaniu się do egzaminu, jeżeli wiemy, że 40 osób ją stosujących zdało egzamin, a 10 nie, zaś wśród 50 osób jej niestosujących egzamin oblało 40. zdał
, metoda A
286
TAK
NIE
egzamin
qJ=
TAK
NIE
40
10
10
40
50
50
50
100
50
40 x 40 - 10 x 10
=0,6
.JSOxSOXSOXSO
287
Wpisz definicje kluczowych pojęć wprowadzonych w tym rozdziale oraz zapisz nowe symbole
Rozdział 10.
Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
288
W podręczniku przedstawiliśmy pięć etapów podejmowania decyzji we wnioskowaniu statystycznym. Pierwszy krok to przyjęcie założeń, że uzyskane dane są obserwacjami wzięty mi z jakiejś populacji, z której dobór próby był losowy, a także sformułowanie (lub nie) założenia na temat skali pomiarowej i kształtu rozkładu zmiennej w populacji. Na tym etapie też formułujemy precyzyjnie określoną hipotezę zerową w opozycji do hipotezy badawczej. Założenia na temat doboru próby oraz hipoteza zerowa pozwalają razem na podjęcie drugiego kroku - wybór testu statystycznego i ustalenie rozkładu odpowiedniej statystyki oraz kroku trzeciego: sprecyzowanie reguły decyzyjnej (odrzucę Ho, jeżeli - w tym miejscu umieszczamy albo wartości krytyczne statystyki, albo wartości prawdopodobieństwa,w zależności od tego, czy sami wykonujemy obliczenia, czy też posługujemy się komputerowym pakietem statystycznym) przy założonympoziomie istotności. Krok czwarty polega na wyliczeniu (lub znalezieniu na wydruku komputerowym) odpowiednich statystyk. W kroku piątym podejmujemy decyzję, porównując wartość otrzymanej statystyki z wartościąkrytycznąlubprawdopodobieństwoz wydruku komputerowego z założonym poziomem istotności. Algorytm jest prosty: badacz formułuje hipotezę badawczą, przeciwstawia jej hipotezę zerową, przeprowadza badanie, liczy właściwe statystyki i prawdopodobień stwo otrzymania takich wartości statystyk przy przyjętych założeniach (w tym Ho) i w końcu podejmuje decyzję na temat Ho. Decyzja została przedstawiona jako binarna: Ho jest albo nie jest odrzucana. Odrzucenie hipotezy zerowej określane jest jako otrzymanie wyników istotnych statystycznie. W momencie kiedy rozumie się logikę wnioskowania statystycznego, używanie nowych, nie opisanych w skrypcie testów jest dziecinnie proste. Musimy sprawdzić, czy spełnione są założenia dla danego testu i stosować SCHEMAT WNIOSKOWANIA. Testy hipotez o związku zmiennych, z których co najmniej jedna jest zmienną przedziałową,nazywająsię testami parametrycznymi, ponieważdotycząwnioskowania o parametrach populacji. Pozostałe testy określa się jako nieparametryczne. Zdecydowana większość testów parametrycznych ma swoje nieparametryczne odpo-
Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
wiedniki, ale trzeba pamiętać, że te pierwsze mają większą moc. I chociaż należy wybierać test statystyczny, którego założenia są zgodne z charakterem danych, to jak pisze Blalock (s. 476), "z drugiej jednak strony nie należy nadmiernie dążyć do ścislości i ograniczać stosowania tak mocnych technik, jak analiza kowariancji lub regresji tylko do sytuacji, w której jesteśmy pewni spelnienia założeń tych technik. Szczególnie wtedy, gdy nie dysponujemy odpowiednimi technikami nieparametrycznymi i gdy badania mają charakter wstępny, metody takie mogą dać cenny wgląd w problematykę, chociaż ich wyniki należy interpretować ostrożnie". W zadaniach analizowanych w podręczniku zakładaliśmy, że założenia dotyczą ce rozkładu zmiennej są spełnione. Założenia można podzielić na niezbywalne i te, których pogwałcenie nie zmienia istotnie naszych konkluzji. Do tych pierwszych należą wymagania dotyczące liczebności próby. Testowanie wielowymiarowych modeli na małej próbie musi prowadzić do nierzetelnych wniosków. Dlatego nie należy sugerować się faktem, że wszystkie obliczenia w podręczniku ze zrozumiałych względów były prowadzone na bardzo małych próbach. Zaleca się na przykład, aby liczba osób w próbie używanej do analizy czynnikowej była 5 razy (2 razy to minimum) większa niż liczba zmiennych (nie moż na więc przeprowadzić analizy czynnikowej kwestionariusza osobowości liczącego 60 pytań, jeżeli dysponujemy próbą 100-osobową). W wielowymiarowej analizie regresji zaleca się, aby liczba osób wynosiła co najmniej 56 + 8k, gdzie k-liczba predyktorów (zmiennych niezależnych) itd. Jeżeli chcemy, aby moc testu statystycznego, czylijego zdolność do odrzucenia fałszywej hipotezy zerowej, wyniosła 0,90, to konieczna liczebnośćpróby zależy od prawdziwej wartości współczynnika korelacji w populacji. Testujemy przecież hipotezę zerową mówiącą, że p= o. Jeżeli p= 0,1, to zakładaną moc testu statystycznego osiągniemy, dysponując próbą N = 1046 osób, gdy P = 0,2 wystarczy 449 osób, gdy P = 0,5 - wystarczy 37 osób (por. [9]). Analogicznie można określić minimalne liczebności dla testu chi-kwadrat, analizy wariancji itd. Założenia dotyczące kształtu rozkładu są mniej groźne. Wykazano na przykład, że test t jest raczej niewrażliwy na odchylenia od normalności rozkładu w małych próbach. W dużych próbach rozkład t Studenta zbiega do rozkładu normalnego i może my zastosować Centralne Twierdzenie Graniczne. Informacje o odporności różnych testów znajdzie Czytelnik w bardziej zaawansowanych podręcznikach [5, 9, 10], ale trzeba pamiętać, że nic nas nie zwalnia od obowiązku myślenia - czyli sprawdzania różnych sposobów analiz i porównywania wyników. Tak jak pokazaliśmy,testowanie hipotez odbywa się więc według ściśle określo nego algorytmu. Najwięcej problemów sprawia studentom wypisanie zmiennych teoretycznych i ich wskaźników, określenie skal pomiarowych oraz wybór odpowiedniego testu statystycznego. Można tutaj podać dla początkujących badaczy prostą heurystykę, którą przedstawiliśmy na rysunku 10.1. Podstawowe pytanie dotyczy skal pomiarowych.
289
Rozdział
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
• czy przywiązywanie wagi do religii pozwala przewidywać przywiązywa nie wagi do pracy?, to możemy policzyć współczynnik korelacji między zmiennymi; • czy Polacy większą wagę przywiązują do religii, czy do pracy - to możemy zastosować test t Studenta dla grup zależnych. Jeżeli chcemy policzyć różnice w przywiązywaniu wagi do pracy w różnych grupach respondentów, np. podzielonych ze względu na wiek, to zastosujemy test t Studenta dla grup niezależnych (gdy wyróżnione są dwie grupy) lub analizę wariancji (gdy wyróżnionych grup jest więcej). ® Jeżeli chcemy podzielić respondentów na tych, dla których praca (i analogicznie religia) jest ważna i nieważna, to związek między takimi wskaźnikami będziemy liczyć za pomocą testu chi-kwadrat.
SKALE POMIAROWE
o
Test t Studenta dla grup niezależnych Rozdział
Dla
więcej niż
3 (lub
więcej)
Test t Studenta dla grup zależnych Rozdział
5
Jednoczynnikowa analiza wariancji Rozdział 6
5
Jednoczynnikowa analiza wariancji z powtarzanymi pomiarami Rozdział
7
dwóch zmiennych zmienne
ilościowe
Wielokrotna analiza regresji Rozdział
2 (lub więcej) zmienne nominalne 1 zmienna ilościowa
8
Dwuczynnikowa analiza wariancji (ogólnie: k-czynnikowa analiza wariancji, gdzie k -liczba zmiennych nominalnych)Rozdział?
Rysunek 10.1. Zestawienie testów omówionych w
podręczniku
Pokażmy
problem wyboru testu statystycznego na przykładzie. Chcemy przea wagą przypisywaną religii na przykładzie ogólnopolskiej próby reprezentatywnej. W badaniu PGSS respondenci oceniali wagę różnych dziedzin na siedmiopunktowej skali, gdzie odpowiedź ,,1" oznaczała "zupełnie nieważne", a ,,1" - "bardzo ważne". Oba pomiary można uznać za zmienne ilościowe. Wybór testu zależy od naszego zaufania do pomiaru i typu pytania badawczego.
Zacznijmy od policzenia współczynnika korelacji między naszymi zmiennymi. Wynosi on r = 0,06. Przy tak dużej próbie (N = 1751) nawet tak mały współczynnik korelacji jest istotnie różny od zera (p < 0,01). Zastanawiamy się, czy uwzględnienie związku ze zmiennymi socjodemograficznymi wpłynie na wielkość współczynnika korelacji. Okazuje się, że samo kontrolowanie wieku powoduje zmianę na r = 0,09, dołączenie zaś do zmiennych kontrolowanych wykształcenia respondenta (w latach nauki) powoduje wzrost współczynnika korelacji r = 0,11, dołączenie płci r = 0,12. Wszystkie te współczynniki korelacji zdają się sugerować dodatni związek mię dzy analizowanymi zmiennymi. Im wyższa waga przypisywana religii, tym wyższa waga przypisywana pracy. Moglibyśmy się skłaniać do stwierdzenia istnienia w Polsce protestanckiego etosu pracy. Wnikliwy badacz jednak wie, że respondenci mogą w bardzo różny sposób wykorzystywać zaoferowaną przez badacza skalę odpowiedzi od l ("zupełnie nieważne") do 7 ("bardzo ważne"). Może on nie mieć zaufania do różnicowania przez respondenta różnych dziedzin na 7-punktowej skali i chcieć podzielić respondentów na 4 grupy: • • • •
tych, tych, tych, tych,
dla których ważna jest zarówno praca, jak i religia; dla których ważna jest praca i nieważna religia; dla których nieważna jest praca i ważna religia; dla których nieważna jest zarówno praca, jak i religia.
analizować związek między wagą przypisywaną pracy
Przykładowo:
CD Jeżeli chcemy obie zmienne traktować jako zmienne ilościowe i pragniemy 290
odpowiedzieć na
pytanie:
Jak wyznaczyć te grupy? Dosyć bezrefleksyjnym wyborem jest dokonanie podziału medianowego obu zmiennych (lubimy bowiem mieć grupy równoliczne). Taki podział doprowadzi nas do wyników przedstawionych na rysunku 10.2. Test chi-kwadrat nakaże nam odrzucenie hipotezy o niezależności obu zmiennych. Kategorie zgodne (praca i religia ważne, praca i religia nieważne) są naj liczniej reprezentowane, co potwierdza naszą poprzednią konkluzj ę dotyczącą pozytywnego związku między wagą przypisywaną pracy i religii. Opisany w rozdziale dziewiątym współ czynnik korelacji phi jest dodatni rp = 0,126. 291
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
Rozdział 10.
600 , - - - - - - - - - - - - - - - ,
Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
uznałoby, że
nie ma większego znaczenia, który ze wskaźników będzie analizowany. korelacji między ipsatywną wagą przypisywaną pracy i religii jest ujemny i wynosi r = -0,26. Kontrolowanie wieku powoduje zmianę r = -0,24, dodanie do wieku kontroli wykształcenia r = -0,22, dołączenie płci r = -0,21. Wszystkie te współczynniki korelacji zdają się sugerować ujemny związek mię dzy zmiennymi. lm wyższa waga przypisywana religii, tym niższa waga przypisywana pracy. Współczynniki korelacji między wagą przypisywaną pracy i religii zestawione są w tabeli 10.2. Współczynnik
500
400
religia 'O '(J)
o c .o ]
1IIlII
1
II 2
300
nieważna
ważna
Tabela 10.2. Porównanie korelacji wagi religii i pracy dla wag absolutnych i ipsatywnych
2
praca ważna
praca nieważna
Wagi absolutne
Rysunek 10.2. Liczebności grup osób uznających religię lub pracę za ważną lub nieważną według wag absolutnych
Czy możemy już napisać doniesienie z badań i spać spokojnie? Niezupełnie. Szczególne wykorzystywanie skali odpowiedzi prowadzi niekiedy do innych zniekształceń. Dla niektórych respondentów wszystko może być równie ważne (używają tylko prawego końca skali), inni w nastroju bardziej depresyjnym pesymistycznie oceniają dziedziny życia, wykorzystując tylko lewy kraniec skali (wszystko wydaje im się raczej mało ważne). . Rozważmy sytuację, w której radosny respondent ze średnią wagą przypisywaną różnym dziedzinom równą 6 przypisze religii wagę równą 5, zaś depresyjny respondent ze średnią wagą przypisywaną różnym dziedzinom równą 3 przypisze religii wagę 4. Dla każdego respondenta możemy uwzględnić jego ogólną tendencję, licząc wagę ipsatywną będącą różnicą wagi danej dziedziny (nazywanej wagą absolutną) i średniej wagi obliczonej osobno dla każdego respondenta, takjak przedstawiono w tabeli 10.1.
cała
próba (N= 1751)
przy kontroli wieku przy kontroli wieku i wykształcenia przy kontroli wieku, . * p < 0,01; wszystkie
Respondent radosny
Respondent depresyjny
waga religii (absolutna)
5
4
średnia
6
3
5 - 6 =-1
4-3=1
waga dla 6 dziedzin
waga religii (ipsatywna)
i
płci
pozostałe współczynniki
-0,26
0,09
-0,24
0,11
-0,22
0,12
-0,21
korelacji istotne p < 0,001
Musimy podjąć decyzję, czy wierzyć wagom absolutnym, czy ipsatywnym. Można korelacje wagi pracy z wagą przypisywaną pozostałym dziedzinom, co przedstawia tabela 10.3.
to
zro~ić, analizując pozostałe
Tabela 10.3. Korelacje wagi przypisywanej pracy z wagami przypisywanymi pozostadziedzinom
łym
Wagi
Tabela 10.1. Porównanie wag absolutnych i wag ipsatywnych religii dla dwóch osób badanych
wykształcenia
Wagi ipsatywne
0,06*
Wypoczynek Przyjaciele
wagi absolutne
0,194
wagi ipsatywne
0,009(n)
Krewni
Religia
Polityka
0,139
0,105
0,061
0,175
-0,204
-0,216
-0,263
-0,053*
Sąsiedzi
0,089 -0,347
(n) nieistotny, * p < 0,05; wszystkie pozostałe współczynniki korelacji istotne p < 0,001
Zawierzenie raczej wagom ipsatywnym
niż
absolutnym wydaje
się rozsądnym
rozwiązaniem. Nasze konkluzje dotyczące negatywnego związku między wagą przy-
292
Porównanie wag absolutnych wskazywałoby że respondent radosny wyżej ceni religię niż respondent depresyjny. Porównanie wag ipsatywnych prowadzi do wniosku przeciwnego. Policzyliśmy wagi ipsatywne w badaniu PGSS. Współczynniki korelacji między wagami absolutnymi i ipsatywnymi wyniosły odpowiednio 0,78 dla pracy i 0,85 dla religii. Wielu badaczy widząc tak wysokie współczynniki korelacji,
pisywaną religii a wagą przypisywaną pracy możemy sprawdżić, dokonując tak jak
poprzednio podziału medianowego obu zmiennych. Znów test chi-kwadrat nakazuje nam odrzucenie hipotezy zerowej mówiącej o niezależności obu zmiennych, ale tym razem najliczniejsze są kategorie osób wysoko ceniących pracę i nisko religię lub wysoko ceniących pracę i niżej religię. Możemy to zobaczyć na rysunku 10.3.
293
Rozdział
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
600.,..----------,
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
Bezrefleksyjnie przeprowadzony podział medianowy wag absolutnych spowodo grupy osób uważających pracę za nieważnązostały zakwalifikowane wszystkie osoby, które oceniły wagę pracy od 1 do 6, a więc także te oceniające pracę jako ważną (np. ocena = 6). Po obejrzeniu rozkładów nie mamy już wątpli wości, że wagi ipsatywne dadzą nam więcej interesującychwyników także ze wzglę dów statystycznych. Chociaż w tym podręczniku skoncentrowaliśmy się na testowaniu hipotez, czyli ustalaniu czy otrzymane przez nas wyniki są istotne statystycznie, to trzeba pamiętać, że podstawowym celemjest ZROZUMIENIE uzyskanych danych. Testowanie istotności stanowi ostatni etap procesu badawczego. Najpierw trzeba dokładnie obejrzeć dane, czyli wykorzystać procedury wizualizacji opisane w rozdziale 3. Możemy przecież otrzymać wyniki istotne statystycznie, mimo nierozumienia istoty zjawiska. Wiemy, że coś działa, ale nie wiemy jak. Od lat wiadomo było, że aspiryna jest skutecznym lekiem w wielu chorobach, jednak mechanizm jej działania został opisany dopiero w 1982. Wyobraźmy sobie, że należymy do grupy plemiennej, która nie wie, w jaki sposób kobiety zachodzą w ciążę. No cóż, obserwujemy i skrzętnie zapisujemy wyniki. Stawiamy hipotezę, że może to mieć związek z kontaktami z mężczyznami - pytamy kobiety o te kontakty i obserwujemy, czy kobieta jest ciężarna. Zebrane informacje mogłyby wyglądać tak jak przedstawione w tabeli 10.4: dował, że
500
.,.2
.00
NTILES ol NW1_CH
"E
:>
o
(J
300
NTILESoINW1_W
Rysunek 10.3. Liczebności grup osób wag ipsatywnych
uznających religię lub pracę
za ważną lub nie-
ważną według
Związek między obiema zmiennymi jest więc negatywny.
Opisany w rozdziale 9.
współczynnik
phi jest ujemny tp = -0,171. W przedstawionym powyżej przykładzie analiz nie zastosowaliśmy się do podstawowej heurystyki, którą wielokrotnie powtarzaliśmy w podręczniku. Nie sprawdziliśmy rozkładów obu zmiennych, przedstawionych na rysunku 10.4. ROZKŁADY WAG ABSOLUTNYCH
ROZKŁADY WAG
Tabela 10.4. Dane do zbadania hipotezy o seksualnymi
IPSATYWNYCH
KONTAKTY SEKSUALNE TAK NIE
J~WAŻNY ZAWÓD I PRACA
CIĄŻA
~
i ~ "'~.i!i
związku zajścia
TAK NIE
72
Razem
80
8
2 18 20
w
ciążę
z kontaktami
Razem
10 90 100
1(1))
JAK WAŻNY ZAWÓD l PRACA
JAK WAlNA RELIGIA I KOSCIÓŁ
i
!
°J..-"'II>oIIiIfIIIJIIfiI
"""
NW1 CH
-
JAK WfJ.1.NA RELIGIA l KOŚCIÓŁ
294
Rysunek 10.4. i pracy
Rozkłady wag
absolutnych i wag ipsatywnych przypisywanych religii
Wśród
tych kobiet, które odpowiedziały twierdząco na pytanie o kontakty, tylko 8 jest w ciąży. Wśród tych, które nie przyznały się do kontaktów, 2 (taki już los badaczy zadających pytania, którzy niekoniecznie otrzymują prawdziwe odpowiedzi) są w ciąży. Miara współzmienności wyliczona na podstawie takich obserwacji jest nieistotna statystycznie. Czy to oznacza, że nie istnieje związek między zmiennymi? Nie, ponieważ zabrakło nam wiedzy o roli czasu kontaktu. Jest to przykład wskazujący na to, że brak korelacji nie musi świadczyć o braku związku. Przykłady odwrotne (częstsze), gdy otrzymujemy pozorne korelacje, były omawiane w rozdziale 1.. Proces decyzyjny opisany został bez odwoływania się do szczególnych warunków, w których przeprowadza się badanie. W tym sensie procedura rozumiana jest jako uniwersalna dla dowolnych warunków badawczych. Decyzja jest opisana tak jakby była podejmowana bez korzystania z jakichkolwiek innych informacji, ale informacje niestatystyczne wpływają na wnioski na temat badania. Wynik istotny staty-
295
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
stycznie może być zupełnie nieważny merytorycznie. Trzeba zawsze pamiętać o róż nicy między podejmowaniem decyzji statystycznych a wyjaśnianiem. Trzeba też pamiętać o konieczności oceny rzetelności uzyskanego wyniku i niestatystycznych czynnikach wpływających na moc zastosowanego testu. Chcemy wiedzieć, jak rzetelne są nasze wyniki, czy te same lub podobne wnioski byłyby wyciągnięte, gdyby analiza została powtórzona na innym zbiorze danych. W pewnym sensie wnioskowanie statystyczne zastępuje powtarzanie eksperymentu. Z tego powodu reguły decyzyjne są ustalone tak jak gdyby żadne inne informacje nie były dostępne, jak gdyby hipoteza badawcza nigdy nie była testowana lub jak gdyby badacz dysponował tylko jednym zbiorem danym. W pewnych przypadkach koszty lub okoliczności nie pozwalają na analizę innego zbioru danych. Badanie może być zbyt kosztowne lub wymagać szczególnego rodzaju osób badanych, które niełatwo jest skłonić do udziału lub też trudnych do osiągnięcia czy wręcz ryzykownych warunków. W takich przypadkach decyzja musi zależeć od pojedynczej statystyki. Częściej jednak badacz ma możliwość powtórzenia eksperymentu. Nierzadko hipoteza badawcza była już testowana przez innych. Rzetelność wyniku może być oszacowana przez replikację badania. Nasze konkluzje powinny uwzględniać historię podobnych badań. Na przykład jest dobrze udowodnione, że kobiety uzyskują więcej pomocy niż mężczyźni. Jeżeli w naszych analizach różnica między deklarowanąpomocą dla kobiet i mężczyzn okazałaby się nieistotna statystycznie, to będzie my prawdopodobnie powstrzymywać pisanie doniesienia z badań, dopóki analiza nie zostanie powtórzona w taki sposób, że moc testu statystycznego zostanie zwięk szona. Jednym ze sposobów zwiększenia mocy testu jest zwiększenie liczebności próby. Możemy zdobyć większą ilość danych. Możemy też poszukać moderatorów związku - zmiennych, które mają wpływ na charakter związku między płcią biorcy a udzielaniem pomocy. Możemy sprawdzić, czy i jaki charakter ma ten związek ze względu na cechy udzielającego pomocy, np. jego wiek lub płeć. Dotychczas traktowaliśmy pojęcie wariancji zmiennej zależnej tak, że mogło by się wydawać, iż znajduje się ona poza naszą kontrolą. Trzeba być świadomym, że wariancja może być także do pewnego stopnia kontrolowana przez badacza. Indywidualny wynik X może być przedstawiony jako składający się z dwóch komponentów: prawdziwego wyniku i jakiegoś błędu (prawdziwy wynik to to, czym byłby X, gdyby nie było żadnego błędu). Zatem: X
= prawdziwy wynik + błąd.
Jest to klasyczna definicja pomiaru. Błąd może być rozważany jako zmienna losowa, a estymację prawdziwego wyniku można uzyskać przez ustalenie średniej z dużej liczby oddzielnych pomiarów. Przykładem kontroli wariancji może być postępowanie Ebbinghausa *, który prowadził badania na sobie, ucząc się bezsensownych sylab. Traktował on wynik po-
296
• Por. rnsko Ch.A., Schoeningen D.W. (1977). Introductory statistic for psychology. Boston: Allyn & Bacon,
Rozdział
10. Podsumowanie i wskazówki
dotyczące wyboru
testu statystycznego
wtórnego uczenia się jako miarę siły pamięci. Założył, że pojedynczy wynik powtórnego uczenia się składa się z prawdziwej miary siły pamięci i z pewnego blędu. Jednym ze źródeł błędu może być na przykład chwilowa dekoncentracja lub np. miłe wspomnienie zwiększające motywację, które mogą odpowiednio obniżyć lub podwyższyć wynik odtwarzania. Aby ten "pozytywny" i "negatywny" błąd anulować, Ebbinghaus powtarzał zadanie zapamiętywaniawiele razy i obliczał wynik średni. Przy dużej liczbie pomiarów bląd zmieniał się losowo (faktycznie miał rozkład normalny z fi = O). Innym sposobem "kontro,li" wariancji jest kontrola źró deł błędu. Ebbinghaus usiłował kontrolować błąd przez znormalizowanie warunków, w których się uczył. Obserwacje były dokonywane o tej samej porze dnia w cichym pokoju. Materiał do zapamiętania był względnie homogeniczny, a czas jego prezentacji - ściśle kontrolowany i tak dalej. We współczesnych laboratoriach zwierzęta są tresowane w dźwiękoszczelnych pomieszczeniach, które zapewniają pełną kontrolę stymulacji. Wszystkie te starania służą redukcji zewnętrznych wpływów na pomiary i dzięki temu redukują zmienność, która jest przyczynąbłędu. W badaniach nasza możliwość kontroli jest ograniczona istnieniem nieskończenie wielu subtelnych różnic między ludźmi. Próbujemy formułować twierdzenia o tym, jak zachowująsię ludzie, mając na myśli to, jak większość ludzi zachowuje się w więk szości przypadków, w określonej klasie sytuacji. Zatem nasze wnioski mogą nie być ścisłe w odniesieniu do wszystkich ludzi w takim stopniu, w jakim na wyniki badania wpływają owe niemierzone różnice indywidualne. Różnice dotyczące postaw, systemu wartości, zdolności, cech osobowości oraz niedawnych doświadczeń mogą wpływać na sposób reagowania ludzi w eksperymencie lub odpowiadanie na pytania kwestionariusza. Nawet wtedy, gdy potrafimy kontrolować samą sytuacj ę eksperymentalną, ta sama sytuacja może nie oddziaływać na każdą osobę w dokładnie taki sam sposób. Jeśli nawet udałoby się nam tak kontrolować sytuację eksperymentalną, aby była ona dokładnie jednakowa dla każdego, to istnieje realne niebezpieczeństwo takiej sterylizacji owej sytuacji, że badany nie będzie skłonny traktować jej poważnie. Słowo "sterylny" ma bowiem co najmniej dwa znaczenia: l) wolny od zarazków oraz 2) jałowy, bezpłodny. Badacz powinien dążyć do tego, by stworzyć sytuację możliwie "wolną od zarazków", nie czyniąc jej zarazemjałową czy "sztuczną" w oczach badanego. Jeśli wydarzenia zachodzące w trakcie badania czy pytania kwestionariusza nie są dla badanego interesujące i nie wciągają go, to prawdopodobnie jego reakcje nie będą naturalne, a zatem nasze rezultaty będą miały niewielkie znaczenie. Tak więc kontrola to nie wszystko, równie ważne jest, aby procedura badawcza oddziaływała na badanych. Powinni oni traktować to, o co są pytani poważnie i przejmować się tym, gdyż w przeciwnym razie ich odpowiedzi będą pozbawione znaczenia. Wiele trudności sprawia badaczom społecznym fakt, że dwa czynniki decydujące o jakości wyników: oddziaływanie i kontrola prowadzą do sprzecznych rekomendacji. Badanie pamięci przez uczenie się w sterylnych warunkach bezsensownych sylab (wysoka kontrola czynników zakłócających proces) może spowodować bardzo niską motywację badanych do zapamiętywania (zbyt słabe oddziaływanie),a przez to prowadzić do uzyskania czystych, ale zupełnie nieistotnych teoretycznie wyników.
297
Rozdział
298
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
Otrzymanie wyników istotnych statystycznie to nie wszystko. Wszystkie czasopisma naukowe zalecają podawanie współczynników siły efektu, procentu wyjaśnionej wariancji zmiennej zależnej przez zmienne niezależne. Omówione są one dokładnie w literaturze [4, 5, 6], do której odsyłamy Czytelnika. Niektórzy są bardzo zawiedzeni, widząc jak niewielki procent wariancji jesteśmy w stanie wyjaśnić w badaniach społecznych. Chcielibyśmy bardzo silnych zależności, takich jakich dostarczają nam obiegowe przekonania: "wszyscy jedynacy są egoistami". Tak nigdy nie jest. Dlaczego? Bo większość zmiennych jest uwarunkowana wieloczynnikowo. To, że ktoś wychowywał się w domu bez rodzeństwa, a więc ma dużo doświadczeń w relacjach pionowych np. "rodzic-dziecko", a niewiele w relacjach poziomych "brat-siostra", może TYLKO sprzyjać większej koncentracji na sobie przy założeniu, że wpływ innych czynników jest wyrównany. To ostatnie zdanie jest bardzo ważne. Znaczy ono tyle, że jeżeli mielibyśmy dwie "identyczne" osoby różniące się TYLKO liczbą rodzeństwa, to możemy przewidywać, że jedynacy będą bardziej skoncentrowani na sobie niż osoby wychowywane razem z rodzeństwem. Takich identycznych osób nie ma, a istnieje wiele innych zmiennych, które też wpływają na poziom koncentracji na sobie. Kontrola jest jedną z głównych zalet eksperymentu, jednakże nie można objąć całkowitą kontrolą środowiska, z którego pochodzą badani ludzie. Jednym z powodów, dla których wielu psychologów przeprowadza badania na szczurach zamiast na ludziach jest fakt, że umożliwia to badaczowi kontrolowanie prawie wszystkiego, co dzieje się z jego badanymi od chwili urodzenia aż do czasu zakoń czenia eksperymentu: klimatu, diety, ćwiczeń, kontaktów z towarzyszami zabaw, traumatycznych doświadczeń itp. Do badań używa się ostatnio także szczurów o ściśle określonych genach. Psychologowie społeczni nie mają takich możliwości kontroli wpływów genetycznych i środowiskowych, więc procenty wariancji wyjaśnionej przez zmienne niezależne nie będą nigdy imponujące. W badaniach sondażowych możemy minimalizowaćbłąd, poddając analizie złożone wskaźniki zamiast odpowiedzi na pojedyncze pytania (patrz rozdział 3.). Możemy też kontrolować inne ważne zmienne w analizach statystycznych, stosując analizy wielowymiarowe. Nie jest to jednak tak proste jak mogłoby się wydawać. Wprowadzenie dodatkowych predyktorów może zaciemnić obraz relacji między naszymi zmiennymi. Ważny problem stanowi stopień skorelowania predyktorów w równaniu regresji. Zwiększanie liczby zmiennych niezależnych w równaniu regresji daje gorsze wyniki, choć teoretycznie potęgujemy kontrolę potencjalnych zmiennych zakłócających. Często predyktory mogą mieć interakcyjny wpływ na naszą zmienną zależną. Rozważmy ten problem na przykładzie prób reprezentatywnych. Próby reprezentatywne pozwalające na generalizację naszych wyników na całą populację (warunek trafności zewnętrznej) powodują wzrost niekontrolowanej przez badacza wariancji w stopniu często uniemożliwiającym wykrycie związku. W modelach liniowych całkowite zróżnicowanie zmiennej zależnej jest dzielone na zróżnicowanie wyjaśnione zmiennymi niezależnymi i zróżnicowanie niewyjaśnione
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
(błąd). Możemy oczekiwać, że
grupy homogeniczne (np. studenci, rolnicy) nadają lepiej do badań społecznych niż grupy heterogeniczne (np. próby reprezentatywne). Te ostatnie są konieczne i doskonałe dla określania rozkładu zmiennej w populacji, np. przewidywania wyników wyborów. Dla określania związków między zmiennymi różnice w wielu zmiennych socjodemograficznych stanowią źródło wariancji niewyjaśnionej i zaciemniają związek między zmiennymi niezależnymi i zależnymi. Z powodów opisanych wyżej uwzględnienie wszystkich zmiennych socjodemograficznych i ich interakcji w analizie regresji może być ze względów statystycznych (skorelowanie predyktorów, liczebność próby) nieefektywne. Zobaczmy, jak zmienia się procent wyjaśnionej wariancji w wadze przypisywanej pracy przez 4 predyktory: waga przypisywana religii, wykształcenie (w latach), wiek, płeć respondenta w różnych podgrupach badanych (badani mieszkaj ący na wsi, w miastach powyżej 100 tysięcy i w miastach powyżej 250 tysięcy mieszkańców). Największy procent wyjaśnionej wariancji uzyskano w najmniejszej podpróbie, ale nie jest to związane z liczebnością, lecz z charakterem wariancji zmiennych. W tabeli 10.5 przedstawiono standaryzowane współczynniki regresji, liczebność próby i procent wyjaśnionej wariancji. się
Tabela 10.5. Analiza regresji zmiennej WAZNOŚĆ PRZYPISYWANA PRACY z czterema predyktorami
N
Procent
Waga religii
Wykształcenie
Wiek
Płeć
wyjaśnionej
wariancji cała
próba
tylko
wieś
1747
11,7%
-0,21
0,09
-0,18
-0,06
655
9%
-0,14
0,07'
-0,19
-0,09
497
12,7%
-0,25
0,07*
-0,19
-0,04
165
25,4%
-0,41
0,14
-0,15
-0,004(n)
miasta powyżej
100 tys.. miasta powyżej
250 tys.
(n) współczynnik nieistotny statystycznie, * tendencja statystyczna p < 0,1; pozostałe standaryzowane współczynniki regresji istotne p < 0,001
W całej analizowanej próbie jest 45,9% mężczyzn, w podpróbie mieszkającej na wsi 49,3%, w mieście 41,4%. Obie podpróby nie różnią się pod względem wieku, ale mają istotnie różne zarówno średnie, jak i wariancje pozostałych zmiennych. Zróżni cowanie zmiennychjest większe w mieście niż na wsi. W mieście średnia waga przypisywana religii jest mniej sza, zaś przypisywana pracy większa niż na wsi, co zostało przedstawione na rysunku 10.5. Ludzie mieszkający w mieście są lepiej wykształce ni. Wszystkie te różnice mogą odpowiadać za większy procent wariancji wyjaśniony napodpróbie miejskiej niż wiejskiej. 299
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego 1.2...---------------~
Rozdział
Tabela 10.6. Dobór metod analizy danych do problemów badawczych w od pytania badawczego Chcemy
sprawdzić,
ilościowych
jednego
11l
'2
-.2
-o
.~
-.4
II
waga pracy
•
waga religii
J-_ _~-------~-----.J 1.0
2.0
wieś
miasto
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
Rysunek 10.5. Średnia waga przypisywana pracy i religii przez mieszkańców miast i wsi
czy zestaw zmiennych pozwala na stworzenie z nich
wskaźnika.
zależności
Analiza czynnikowa (analiza składowych głównych). Analiza rzetelności - a Cronbacha [por. 21, 10]. rozdział 3.
Chcemy odtworzyć zależności między obiektami w wielowymiarowej przestrzeni, przedstawiając obiekty jak~ ~un~ty, a ich miary. podobieństwa jako odległoscl między punktamI.
Skalowanie wielowymiarowe [por. 21]
Chcemy stworzyć (odkryć) taksonomię obiektów tak, aby obiekty zaliczone do jednej kategorii były bardziej do siebie podobne niż zaliczone do różnych kategorii.
Analiza
skupień
[por. 4]
Chcemy testować model przyczynowy na podstawie macierzy korelacji między zmiennymi.
Analiza Modele
ścieżek równań
strukturalnych [por. 14]
Chcemy badać łączny wpływ paru czynników (zmienne nominalne) na więcej niż jedną
Wielozmiennowa wieloczynnikowa analiza wariancji [por. 4]
zmienną ilościową.
Powtórzmy: Jakość naszego wniosku statystycznego zależy od mocy testu; moc testu zależy od wariancji. Te rozważania są częścią oceny wyników analizy. Jeżeli Ho nie może być odrzucona, mogą być za to częściowo odpowiedzialne niekontrolowane źródła wariancji. Możemy poszukać innych danych pozwalającychprzetestować naszą hipotezę, dobrać bardziej homogeniczne grupy osób badanych itd. Każdy z tych wysił ków byłby nakierowany na redukcjęwariancji i zwiększenie ufności wobec otrzymanej statystyki. Na rysunku 10.1 przedstawiliśmy tylko testy związku między dwiema zmiennymi, ale umiemy już także testować hipotezy dotyczące związku między większą liczbą zmiennych. Gdy mamy dwie zmienne nominalne i jedną przedziałową, zastosujemy dwuczynnikowąanalizę wariancji, gdy mamy więcej zmiennych przedziałowych, zastosujemy regresję wielokrotną (wieloraką) itd. Nie sposób w podstawowym podręcznikuzawrzeć wszystkiego, co jest przydatne w analizach. Przestawiliśmy tylko te testy, które są najczęściej używane w badaniach społecznych. Jeżeli Czytelnik zrozumiał, że wnioskowanie statystyczne jest przeprowadzane ciągle według tego samego schematu, nasz cel został osiągnięty. W tabeli 10.6 zebraliśmy kilka wskazówek dotyczącychskojarzeń (a nie DEFINICJI) wiążących pytanie badawcze z testem, które pozwolą się zorientować, jakiej nieomówionej w tym podręczniku techniki statystycznej potrzebujemy. Wszystkie niezbędne informacje znajdziemy w podanej w rozdziale 1. literaturze.
300
Chcemy zbadać wpływ paru zmiennych nominalnych na zmienną ilościową, kontrolując inne zmienne ilościowe.
Analiza kowariancji [por. 10, 11, 3]
Chcemy zbadać związek między zmiennymi
rs Spearmana
porządkowymi.
r(tau) Kendala [por. 3,10]
Chcemy zbadać związek między zmienną nominalną wyznaczającą podział na k grup niezależnych i zmienną porządkową.
k =2: test Manna-Whitneya k> 2: test Kruskala-Wallisa [por. 10]
Chcemy zbadać związek między zmienną nominalną wyznaczającą podział na k grup zależnych i zmienną porządkową.
k
=2: test znaków, test Wilcoxona dla
par
k> 2: test Friedmana [por. 10]
Kończymy w tym momencie jazdy z instruktorem, co nie oznacza, że zostawiamy Czytelnika samego. Przyszedł czas na lekturę bardziej zaawansowa~ych pra~ metodologicznych [4, 5, 6, 10, 19] i czas na samodzielne eksperymentowame z anahzą danych. Żaden, nawet najlepszy kurs jazdy nie zastąpi własnego doświadczenia. Kwalifikacje kierowcy najlepiej można ocenić, pytając o liczbę godzin spędzonych za kierownicą.Analogicznie nasze kwalifikacje dotyczące analizy danych zależą od liczby analiz, które wykonaliśmy.Oczywiściemoże być to wskaźnik mylący, bo tak jak kierowca może jeździć wyłącznie po wielopasmowej autostradzie, tak my możemy, pracując w mało ambitnej agencji, produkować wyłącznie rozkłady frekwencji ... Życzymy Czytelnikom, aby wyniki ich analiz wzbudzały dreszczyk emOCJI zachęcający do dalszych dociekań. Statystyka jest tylko narzędziem do rozwiązy wania problemów badawczych. A tych w naukach społecznych nie brakuje. Prawidłowe wykorzystanie narzędzi zwiększy w znaczący sposób przyrost naszej wiedzy. Niechęć badaczy do zrozumienia istoty wnioskowania statystycznego zbyt często powoduje, że zgromadzone dane zamiast pogłębiać naszą wiedzę lądują w koszu.
301
Rozdział
10. Podsumowanie i wskazówki dotyczące wyboru testu statystycznego
Przypominamy, że nie omówiliśmy w podręczni ku bardzo wielu ważnych zagadnień metodologicznych, dlatego dalsza lektura jest konieczna [patrz spis literatury w rozdziale 1.]. Mamy nadzieję, że po przełamaniu niechęci będzie ona łatwiejsza. Zapraszamy do zaglądania na naszą stronę internetową www.come.uw.edu.pl/gw i dzielenia się z nami refleksjami.
Tablice
302
Z
P,
P,
Z
P,
P,
Z
P,
P,
Z
P,
P,
Z
P,
P,
Z
P,
P,
Z
P,
P,
0,01 °0,02 0,03 0,04
0,0000 0,0040 0,0080 0,0120 0,0160
0,5000 0,4960 0,4920 0,4880 0,4840
0,5 0,51 0,52 0,53 0,54
0,1915 0,1950 0,1985 0,2019 0,2054
0,3085 0,3050 0,3015 0,2981 0,2946
1 1,01 1,02 1,03 1,04
0,3413 0,3438 0,3461 0,3485 0,3508
0,1587 0,1562 0,1539 0,1515 0,1492
1,5 1,51 1,52 1,53 1,54
0,4332 0,4345 0,4357 0,4370 0,4382
0,0668 0,0655 0,0643 0,0630 0,0618
2 2,01 2,02 2,03 2,04
0,4772 0,4778 0,4783 0,4788 0,4793
0,0228 0,0222 0,0217 0,0212 0,0207
2,5 2,51 2,52 2,53 2,54
0,4938 0,4940 0,4941 0,4943 0,4945
0,0062 0,0060 0,0059 0,0057 0,0055
3 3,01 3,02 3,03 3,04
0,4987 0,4987 0,4987 0,4968 0,4988
0,0013 0,0013 0,0013 0,0012 0,0012
0,05 0,06 0,07 0,08 0,09
0,0199 0,0239 0,0279 0,0319 0,0359
0,4801 0,4761 0,4721 0,4681 0,4641
0,55 0,56 0,57 0,58 0,59
0,2088 0,2123 0,2157 0,2190 0,2224
0,2912 0,2877 0,2843 0,2810 0,2776
1,05 1,06 1,07 1,08 1,09
0,3531 0,3554 0,3577 0,3599 0,3621
0,1469 0,1446 0,1423 0,1401 0,1379
1,55 1,56 1,57 1,58 1,59
0,4394 0,4406 0,4418 0,4429 0,4441
0,0606 0,0594 0,0582 0,0571 0,0559
2,05 2,06 2,07 2,08 2,09
0,4798 0,4803 0,4808 0,4812 0,4817
0,0202 0,0197 0,0192 0,0188 0,0183
2,55 2,56 2,57 2,58 2,59
0,4946 0,4948 0,4949 0,4951 0,4952
0,0054 ,0052 0,0051 0,0049 0,0048
3,05 3,06 3,07 3,08 3,09
0,4989 0,4989 0,4989 0,4990 0,4990
0,0011 0,0011 0,0011 0,0010 0,0010
0,1 0,11 0,12 0,13 0,14
0,0398 0,0438 0,0478 0,0517 0,0557
0,4602 0,4562 0,4522 0,4483 0,4443
0,6 0,61 0,62 0,63 0,64
0,2257 0,2291 0,2324 0,2357 0,2389
0,2743 0,2709 0,2676 0,2643 0,2611
1,1 1,11 1,12 1,13 1,14
0,3643 0,3665 0,3686 0,3708 0,3729
0,1357 0,1335 0,1314 0,1292 0,1271
1,6 1,61 1,62 1,63 1,64
0,4452 0,4463 0,4474 0,4484 0,4495
0,0548 0,0537 0,0526 0,0516 0,0505
2,1 2,11 2,12 2,13 2,14
0,4821 0,4826 0,4830 0,4834 0,4838
0,0179 0,0174 0,0170 0,0166 0,0162
2,6 2,61 2,62 2,63 2,64
0,4953 0,4955 0,4956 0,4957 0,4959
0,0047 0,0045 0,0044 0,0043 0,0041
3,1 3,11 3,12 3,13 3,14
0,4990 0,4991 0,4991 0,4991 0,4992
0,0010 0,0009 0,0009 0,0009 0,0008
0,15 0,16 0,17 0,18 0,19
0,0596 0,0636 0,0675 0,0714 0,0753
0,4404 0,4364 0,4325 0,4286 0,4247
0,65 0,66 0,67 0,68 0,69
0,2422 0,2454 0,2486 0,2517 0,2549
0,2578 0,2546 0,2514 0,2483 0,2451
1,15 1,16 1,17 1,18 1,19
0,3749 0,3770 0,3790 0,3810 0,3830
0,1251 0,1230 0,1210 0,1190 0,1170
1,65 1,66 1,67 1,68 1,69
0,4505 0,4515 0,4525 0,4535 0,4545
0,0495 0,0485 0,0475 0,0465 0,0455
2,15 2,16 2,17 2,18 2,19
0,4842 0,4846 0,4850 0,4854 0,4857
0,0158 0,0154 0,0150 0,0146 0,0143
2,65 2,66 2,67 2,68 2,69
0,4960 0,4961 0,4962 0,4963 0,4964
0,0040 0,0039 0,0038 0,0037 0,0036
3,15 3,16 3,17 3,18 3,19
0,4992 0,4992 0,4992 0,4993 0,4993
0,0008 0,0008 0,0008 0,0007 0,0007
0,2 0,21 0,22 0,23 0,24
0,0793 0,0832 0,0871 0,0910 0,0948
0,4207 0,4168 0,4129 0,4090 0,4052
0,7 0,71 0,72 0,73 0,74
0,2580 0,2611 0,2642 0,2673 0,2704
0,2420 0,2389 0,2358 0,2327 0,2296
1,2 1,21 1,22 1,23 1,24
0,3849 0,3869 0,3888 0,3907 0,3925
0,1151 0,1131 0,1112 0,1093 0,1075
1,7 1,71 1,72 1,73 1,74
0,4554 0,4564 0,4573 0,4582 0,4591
0,0446 0,0436 0,0427 0,0418 0,0409
2,2 2,21 2,22 2,23 2,24
0,4861 0,4864 0,4868 0,4871 0,4875
0,0139 0,0136 0,0132 0,0129 0,0125
2,7 2,71 2,72 2,73 2,74
0,4965 0,4966 0,4967 0,4968 0,4969
0,0035 0,0034 0,0033 0,0032 0,0031
3,2 3,21 3,22 3,23 3,24
0,4993 0,4993 0,4994 0,4994 0,4994
0,0007 0,0007 0,0006 0,0006 0,0006
0,25 0,26 0,27 0,28 0,29
0,0987 0,1026 0,1064 0,1103 0,1141
0,4013 0,3974 0,3936 0,3897 0,3859
0,75 0,76 0,77 0,78 0,79
0,2734 0,2764 0,2794 0,2823 0,2852
0,2266 0,2236 0,2206 0,2177 0,2148
1,25 1,26 1,27 1,28 1,29
0,3944 0,3962 0,3980 0,3997 0,4015
0,1056 0,1038 0,1020 0,1003 0,0985
1,75 1,76 1,77 1,78 1,79
0,4599 0,4608 0,4616 0,4625 0,4633
0,0401 0,0392 0,0384 0,0375 0,0367
2,25 2,26 2,27 2,28 2,29
0,4878 0,4881 0,4884 0,4887 0,4890
0,0122 0,0119 0,0116 0,0113 0,0110
2,75 2,76 2,77 2,78 2,79
0,4970 0,4971 0,4972 0,4973 0,4974
0,0030 0,0029 0,0028 0,0027 0,0026
3,3 3,4 3,5 3,6 3,7
0,4995 0,4997 0,4998 0,4998 0,4999
0,0005 0,0003 0,0002 0,0002 0,0001
0,3 0,31 0,32 0,33 0,34
0,1179 0,1217 0,1255 0,1293 0,1331
0,3821 0,3783 0,3745 0,3707 0,3669
0,8 0,81 0,82 0,83 0,84
0,2881 0,2910 0,2939 0,2967 0,2995
0,2119 0,2090 0,2061 0,2033 0,2005
1,3 1,31 1,32 1,33 1,34
0,4032 0,4049 0,4066 0,4082 0,4099
0,0968 0,0951 0,0934 0,0918 0,0901
1,8 1,81 1,82 1,83 1,84
0,4641 0,4649 0,4656 0,4664 0,4671
0,0359 0,0351 0,0344 0,0336 0,0329
2,3 2,31 2,32 2,33 2,34
0,4893 0,4896 0,4898 0,4901 0,4904
0,0107 0,0104 0,0102 0,0099 0,0096
2,8 2,81 2,82 2,83 2,84
0,4974 0,4975 0,4976 0,4977 0,4977
0,0026 0,0025 0,0024 0,0023 0,0023
0,35 0,36 0,37 0,38 0,39
0,1368 0,1406 0,1443 0,1480 0,1517
0,3632 0,3594 0,3557 0,3520 0,3483
0,85 0,86 0,87 0,88 0,89
0,3023 0,3051 0,3078 0,3106 0,3133
0,1977 0,1949 0,1922 0,1894 0,1867
1,35 1,36 1,37 1,38 1,39
0,4115 0,4131 0,4147 0,4162 0,4177
0,0885 0,0869 0,0853 0,0838 0,0823
1,85 1,86 1,87 1,88 1,89
0,4678 0,4686 0,4693 0,4699 0,4706
0,0322 0,0314 0,0307 0,0301 0,0294
2,35 2,36 2,37 2,38 2,39
0,4906 0,4909 0,4911 0,4913 0,4916
0,0094 0,0091 0,0089 0,0087 0,0084
2,85 2,86 2,87 2,88 2,89
0,4978 0,4979 0,4979 0,4980 0,4981
0,0022 0,0021 0,0021 0,0020 0,0019
0,4 0,41 0,42 0,43 0,44
0,1554 0,1591 0,1628 0,1664 0,1700
0,3446 0,3409 0,3372 0,3336 0,3300
0,9 0,91 0,92 0,93 0,94
0,3159 0,3186 0,3212 0,3238 0,3264
0,1841 0,1814 0,1788 0,1762 0,1736
1,4 1,41 1,42 1,43 1,44
0,4192 0,4207 0,4222 0,4236 0,4251
0,0808 0,0793 0,0778 0,0764 0,0749
1,9 1,91 1,92 1,93 1,94
0,4713 0,4719 0,4726 0,4732 0,4738
0,0287 0,0281 0,0274 0,0268 0,0262
2,4 2,41 2,42 2,43 2,44
0,4918 0,4920 0,4922 0,4925 0,4927
0,0082 0,0080 0,0078 0,0075 0,0073
2,9 2,91 2,92 2,93 2,94
0,4981 0,4982 0,4982 0,4983 0,4984
0,0019 0,0018 0,0018 0,0017 0,0016
0,45 0,46 0,47 0,48 0,49
0,1736 0,1772 0,1808 0,1844 0,1879
0,3264 0,3228 0,3192 0,3156 0,3121
0,95 0,96 0,97 0,98 0,99
0,3289 0,3315 0,3340 0,3365 0,3389
0,1711 0,1685 0,1660 0,1635 0,1611
1,45 1,46 1,47 1,48 1,49
0,4265 0,4279 0,4292 0,4306 0,4319
0,0735 0,0721 0,0708 0,0694 0,0681
1,95 1,96 1,97 1,98 1,99
0,4744 0,4750 0,4756 0,4761 0,4767
0,0256 0,0250 0,0244 0,0239 0,0233
2,45 2,46 2,47 2,48 2,49
0,4929 0,4931 0,4932 0,4934 0,4936
0,0071 0,0069 0,0068 0,0066 0,0064
2,95 2,96 2,97 2,98 2,99
0,4984 0,4985 0,4985 0,4986 0,4986
0,0016 0,0015 0,0015 0,0014 0,0014
....
I\) I\)
I\)
....
I\)
O
.... .... ......... .... .... .... ....W .... ........ O....
():l
W W W W '"w '"w ...... ...... ...... ...... ...... W ...... '"w ...... ...... ...... W .j>,. 01 (j) CO <.O N...... O
W N W
W N 01
W N CO
W W O
I\)
O)
O
O
O
~
W O
N CO <.O
N <.O
W O W
W
I\)
I\) ():l
I\)
.....
I\) O)
I\)
I\)
I\)
C1I
~
W
O)
C1I
~
'"w
W
W
.....
C1I
~
...... ...... ...... ...... ...... ...... ...... ...,., ...,., ...,., W W W '"w W W ...... ~ ..... 01 01 (j) ..... CO <.O (j)
en W
I\)
():l
O)
~
N
CO N
(j) .j>,.
01
(j)
01 CO
(j)
en ..... en CO ......
.j>,.
O> O> <.O
.....
<.O <.O
~ O
......
..... ..... O O W
(j)
~ O CO
:....& ..... ...... ~ ...... ..... ...... ...... .j>,. ..... N......
~
N 01
W W W
..... ..... ..... W .j>,. N <.O
.j>,.
O
...... ..... ~
W
~ ~ .j>,. 01 (j) W
<.O
O
N
W N .....
<.O CO O
N W 01 CO
O
..... ~ ...... ..... ...... (j)
(j)
W
~ ~ CO <.O (j) N
N
'"...... co N
W
CO W W
N _N N .!'V .!'V N N .!'V N .!'V .!'V N _N .!'V N .!'V N N _N ...... ...... .!'......V ...... ...... N N N o '"o '"o o o '"o o '"o '"o ...... ...... o '"o o.j>,. o.j>,. '"o ...... N W .j>,. (j) ..... O...... N (j) .j>,. 01 01 (j) (j) (j) ..... CO CO <.O O O N ...... ...... CO N <.O 01 O O O ...... N 01 CO N (j) O .j>,. <.O .j>,. O (j) W O N
(j)
~
01
N W <.O O
N N N N N N N ...,., ...,., ...,., ...,., "+:. "+:. "+:. (j) (j) ..... ..... CO N 01 W ..... N ..... W <.O 01
N -.j>,.
<.O N
N 01 O O
N
en O CO
N 01
...... CO
N
en N CO
N 01 W <.O
N 01 01 N
N 01 (j)
.....
N
en CO W
N
N
_N
N
N
(j)
(j)
O N
.j>,.
N
N
en 01 O
N
N
N
N
..... CO CO ...... (j) ...... ...... CO .j>,. N
(j)
~
.....
00 (j) O
N W O
(j)
01
CO <.O 01
N
~
O
<.O
W
01
N
.j>,.
N
N
W
01
<.O
<.O CO
W CO
-
.... -C-
00
W O
(j)
CO
CO
.....
(j)
(j)
W
.!'V _W ..... ......
...,., en '"w ..... (j) .j>,. ..... 01 ..... ...... (j)
N
~
(j)
I\)
N ...... .!'WV
W W
(j)
W
N O
S>' ...... 00 ,. N
~
W
W ~
.j>,.
CO N
.j>,.
01
.j>,.
..... ......
O
-.j>,.
W O W
.j>,.
...... .!'V
..... O
(j)
W
(j) ...... co
01
N
......
(j)
N
en ..... (j)
_N (j)
......
.....
W _W N W <.O ...... W
N
en (j)
O
W
(j) ..... "+:.
w
oVl
O
N ~ O
.j>,.
.!'V
N
..... ..... 01 01 O
(j)
W _W _W 01 (j) (j) 01 .j>,. (j) ...... (j) O
N ~
(j)
W
W (j)
..... .j>,.
.!'V
N
N
.!'V
N CO O
N
.!'V
..... 00 ..... ..... :....& ...... co W ..... CO <.O ...... ..... <.O ..... ..... ..... <.O ......
W _W _W _W ~ co o N .j>,. (j) <.O ..... 01 01 CO
S>' (j)
W
_W CO
..... ..... ..... ..... <.O ...... N
<.O
N
N
.!'V .!'V
co co co 00 .j>,. (j) 01
W CO 01 O
...... ..... CO
W
00 CO W
S>' <.O N N
<.O CO
N <.O N
<.O
N <.O
...... ..... ..... ..... .j>,.
W
'"o ...... o N
01 01
O
(j)
.j>,.
.j>,.
-.j>,.
01
01
-.j>,.
W
O
......
CO
W
...... ...... S>' N
_W _W
-.j>,. -.j>,. ...... N W ...,., o o..... .j>,. ...... N ...... W
W <.O
(j)
.!'V
(j)
<.O
-.j>,.
01 CO
01 O
W W 01 01
W S>' ...,., ..... <.O O <.O .....
-.j>,.
01 _01 <.O 01 O CO <.O
(j)
SJ1 ...,., ..... o CO .j>,.
-.j>,.
..... ..... ...... ......
O W N
.j>,.
en O
.j>,.
<.O
to
N 01
.j>,.
......
CO
...... W ...... .!'V (j)
(j) '"(j) co ......
<.O
_01 CO
O
<.O N
.j>,.
O O
W
en 01 (j)
-Q
I ~ "U O
~ O
.~ eS"3
CJr
:J
=
N
-
•
C1I
Ir _
O
~ ~
~ ~ o
en·
Q,
C-
i.il
CD en 2'
III-o.
co' C-
liP
CD tO
-
-
.... o
gC1I
O A
O
N Z
;I
or
li)
m
» -i
:J
m (j)
~ .,
-i C
o o
:J :J
o
C"
(=j' ~
...... (j)
-i C
O
m
Z
~
(j)
W
(j)
en ..... CO
-
I'
II
Uj
o
0\
Tablica 3. TABLICA ROZKŁADU F dla poziomu istotności a= 0,05 i a= 0,01 dfl 1
2
1 2
4 5 6 7
'c :s:o
8
c
9
'E
10
ro
ro
11
'C >"O o ..o
12 13
~
14
Q)
15
'co-
16
.9 en
17
I ....N
18
"Cl
19 20 21 22 23 24 25
1 26 27 28 29 30
32 34 36
38 40 42 44 46 48 50 55 60
4,23 7,72 4,21 7,68 4,20 7,64 4,18 7,60 4,17 7,56 4,15 7,50 4,13 7,44 4,11 7,40 4,10 7,35 4,08 7,31 4,07 7,28 4,06 7,25 4,05 7,22 4,04 7,19 4,03 7,17 4,02 7,12 4,00 7,08
65 70 80 100 125 150 200 400 1000
=
Uj
o
-..l
4
5
6
7
8
9
10
stopnie swobody dla licznika 11
12
14
16
20
24
30
40
50
75
100
200
500
8
161,45 254,30 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 242,98 243,90 245,36 246,47 248,02 249,05 250,10 251,14 251,77 252,62 253,04 253,68 254,06 241,88 4052,18 4999,34 5403,53 5624,26 5763,96 5858,95 5928,33 5980,95 6022,40 6055,93 6083,40 6106,68 6143,00 6170,01 6208,66 6234,27 6260,35 6286,43 6302,26 6323,68 6333,92 6349,76 6359,54 6365,59 18,51 19,16 19,50 19,00 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,42 19,43 19,45 19,45 19,46 19,48 19,48 19,49 19,49 19,49 19,40 19,41 19,47 98,50 99,16 99,50 99,00 99,25 99,30 99,33 99,38 99,41 99,43 99,46 99,47 99,48 99,48 99,49 99,49 99,50 99,39 99,40 99,42 99,48 99,36 99,44 99,45 10,13 9,28 8,54 8,53 9,55 9,12 9,01 8,94 8,85 8,81 8,76 8,74 8,71 8,69 8,64 8,62 8,59 8,58 8,56 8,55 8,53 8,79 8,89 8,66 34,12 29,46 26,18 26,13 30,82 28,71 28,24 27,91 27,49 27,34 27,13 26,92 26,83 26,60 26,50 26,41 26,35 26,28 26,24 26,15 27,23 27,05 26,69 27,67 7,71 6,94 6,59 5,63 5,65 6,39 6,26 6,16 6,09 6,04 8,00 5,94 5,87 5,84 5,77 5,75 5,72 5,70 5,68 5,66 '5,64 5,96 5,91 5,80 21,20 16,69 13,46 18,00 15,98 15,52 15,21 14,98 14,80 14,66 14,45 14,25 14,15 14,02 13,93 13,84 13,75 13,69 13,61 13,58 13,52 13,49 14,37 14,55 6,61 5,79 5,41 4,39 4,37 4,37 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,64 4,60 4,56 4,53 4,50 4,46 4,44 4,42 4,41 16,26 12,06 10,97 9,02 9,08 13,27 11,39 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,77 9,68 9,55 9,47 9,38 9,29 9,24 9,17 9,13 9,04 3,67 5,99 5,14 4,76 4,39 3,75 3,73 3,71 3,69 3,68 3,84 4,53 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,96 3,92 3,87 3,81 3,77 13,75 10,92 9,78 9,15 8,75 8,47 8,10 7,09 6,99 6,93 6,90 6,88 7,31 7,98 7,87 7,79 7,72 7,02 8,26 7,60 7,52 7,40 7,23 7,14 5,59 3,23 4,74 4,35 4,12 3,97 3,87 3,73 3,60 3,49 3,41 3,38 3,34 3,32 3,29 3,27 3,25 3,24 3,79 3,68 3,64 3,57 3,44 3,53 12,25 8,45 5,65 9,55 7,85 7,46 7,19 6,84 6,54 6,36 5,86 5,75 5,70 5,67 6,07 6,99 6,72 6,47 6,62 6,28 6,16 5,99 5,91 5,79 5,32 4,07 2,93 4,46 3,84 3,69 3,58 3,50 3,44 3,39 3,31 3,28 3,24 3,20 3,15 3,12 3,08 3,04 3,02 2,99 2,97 2,95 2,94 3,35 11,26 7,59 4,86 7,01 6,63 6,37 6,18 6,03 5,73 8,65 5,56 5,07 5,00 4,96 4,91 4,88 5,28 5,20 5,91 5,81 5,67 5,48 5,36 5,12 5,12 4,26 3,86 3,37 2,71 3,63 3,48 3,29 3,23 3,18 3,10 3,03 2,99 2,90 2,86 2,83 2,80 2,77 2,76 2,73 2,72 3,14 3,07 2,94 10,56 6,99 4,31 8,02 6,42 6,06 5,80 5,47 5,18 5,01 4,92 4,73 4,65 4,57 4,52 4,45 4,41 4,36 4,33 5,61 5,35 5,11 4,81 5,26 4,96 4,10 3,71 3,48 3,33 3,07 2,56 2,54 3,22 3,14 3,02 2,98 2,94 2,91 2,86 2,83 2,77 2,74 2,70 2,66 2,64 2,60 2,59 2,55 10,04 6,55 3,91 7,56 5,99 5,64 5,39 5,06 4,94 4,77 4,60 4,52 4,33 4,25 4,17 4,12 4,05 4,01 3,96 3,93 5,20 4,85 4,71 4,41 4,84 2,41 3,98 3,59 3,36 3,20 3,09 2,43 2,42 3,01 2,95 2,90 2,85 2,82 2,79 2,74 2,70 2,65 2,61 2,57 2,53 2,51 2,47 2,46 9,65 3,60 7,21 6,22 5,67 5,32 5,07 4,74 4,29 4,02 3,94 3,71 3,66 3,62 3,81 4,89 4,63 4,54 4,46 4,40 4,21 4,10 3,86 3,74 4,75 3,89 3,49 2,30 3,26 3,11 3,00 2,91 2,85 2,80 2,72 2,69 2,64 2,60 2,51 2,47 2,43 2,40 2,37 2,35 2,32 2,31 2,75 2,54 9,33 6,93 5,95 5,41 5,06 4,82 4,50 3,78 3,57 3,47 3,41 3,38 3,36 4,64 4,39 4,30 4,22 4,16 4,05 3,97 3,86 3,70 3,62 3,50 4,67 3,81 3,41 2,21 3,18 3,03 2,92 2,28 2,26 2,23 2,22 2,77 2,63 2,51 2,42 2,38 2,34 2,31 2,83 2,71 2,67 2,60 2,55 2,46 9,07 5,74 3,17 6,70 5,21 4,86 4,62 4,44 4,30 4,19 4,02 3,38 3,31 3,27 3,22 3,19 3,59 3,51 4,10 3,96 3,86 3,78 3,66 3,43 4,60 3,74 3,34 2,85 2,14 2,13 2,16 3,11 2,96 2,76 2,70 2,65 2,60 2,57 2,53 2,48 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,19 8,86 6,51 5,56 5,04 4,69 4,46 4,14 3,06 3,01 4,28 4,03 3,94 3,86 3,80 3,03 3,70 3,62 3,51 3,43 3,35 3,27 3,22 3,15 3,11 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,07 2,10 2,71 2,59 2,54 2,51 2,48 2,42 2,38 2,29 2,25 2,20 2,18 2,14 2,12 2,08 2,33 8,68 6,36 5,42 4,56 2,87 4,89 4,32 4,14 4,00 3,89 3,73 3,56 3,49 3,29 3,21 3,13 3,08 3,01 2,98 2,92 2,89 3,67 3,37 3,80 4,49 3,63 3,24 3,01 2,74 2,04 2,02 2,01 2,24 2,12 2,85 2,66 2,59 2,54 2,49 2,46 2,42 2,37 2,33 2,28 2,19 2,15 2,09 2,07 8,53 5,29 2,75 6,23 4,77 4,44 4,20 4,03 3,89 3,62 3,45 3,37 3,18 3,10 2,97 2,90 2,86 2,81 2,78 3,78 3,69 3,55 3,02 3,26 4,45 3,20 1,96 3,59 2,96 2,81 2,70 2,55 2,19 2,15 2,10 2,08 2,04 2,02 1,99 1,97 2,29 2,61 2,49 2,45 2,41 2,38 2,33 2,23 2,65 2,76 2,71 2,68 3,08 3,00 2,87 2,80 8,40 6,11 5,19 4,34 3,79 3,35 3,27 3,16 2,92 4,67 4,10 3,93 3,68 3,59 3,52 3,46 4,41 3,55 3,16 2,77 2,66 2,51 2,15 2,04 2,00 1,98 1,95 1,93 1,92 2,93 2,58 2,46 2,41 2,37 2,34 2,29 2,25 2,19 2,11 2,06 2,57 8,29 5,09 4,25 2,59 2,78 2,68 2,62 6,01 4,58 4,01 3,84 3,71 3,60 3,43 3,27 3,19 3,08 3,00 2,92 2,84 2,71 3,51 3,37 4,38 3,52 3,13 2,74 2,11 2,00 1,91 1,89 1,88 2,90 2,63 2,54 2,48 2,42 2,34 2,31 2,26 2,21 2,16 2,07 2,03 1,96 1,94 2,38 8,18 5,01 2,60 2,55 2,51 2,49 5,93 4,50 4,17 3,94 3,63 3,36 3,19 3,12 2,92 2,84 2,76 2,71 2,64 3,77 3,00 3,52 3,43 3,30 4,35 3,10 1,97 1,88 1,86 1,84 3,49 2,87 2,71 2,60 2,51 2,45 2,39 2,31 2,28 2,22 2,18 2,12 2,08 2,04 1,99 1,93 1,91 2,35 8,10 4,94 2,64 2,54 2,48 2,44 2,42 5,85 4,43 4,10 3,87 2,57 3,70 3,56 3,46 3,29 3,23 3,13 3,05 2,94 2,86 2,78 2,69 3,37 4,32 3,47 3,07 1,94 1,90 1,84 1,83 1,81 2,84 2,68 2,57 2,49 2,42 2,37 2,28 2,25 2,20 2,16 2,10 2,05 2,01 1,96 1,88 2,32 8,02 4,87 2,42 2,38 2,36 5,78 4,37 4,04 3,81 3,64 3,51 3,40 3,24 3,07 2,99 2,80 2,72 2,64 2,58 2,51 2,48 3,31 3,17 2,88 4,30 3,05 1,91 1,82 1,80 1,78 3,44 2,82 2,66 2,55 2,46 2,40 2,34 2,26 2,13 2,03 1,98 1,94 1,87 1,85 2,17 2,30 2,07 2,23 7,95 2,36 2,33 2,31 4,82 5,72 4,31 3,99 3,76 3,45 3,18 3,02 2,94 2,75 2,67 2,58 2,53 2,46 2,42 3,59 3,35 3,26 3,12 2,83 4,28 3,03 1,79 1,77 1,76 3,42 2,80 2,64 2,53 2,37 2,24 2,11 2,01 1,96 1,91 1,88 1,84 1,82 2,44 2,32 2,27 2,20 2,05 2,15 2,26 2,62 2,48 2,70 2,32 2,28 7,88 5,66 4,76 4,26 3,94 3,54 3,41 3,30 3,14 3,07 2,97 2,89 2,78 2,54 2,41 2,37 3,71 3,21 1,73 4,26 3,40 3,01 2,78 2,62 2,51 2,36 1,98 1,94 1,89 1,86 1,82 1,77 1,75 2,42 2,30 2,25 2,22 2,18 2,13 2,09 2,03 1,80 2,21 7,82 4,72 2,66 2,58 2,44 2,37 2,24 2,27 5,61 4,22 3,90 3,67 3,36 2,49 2,93 2,85 2,74 2,33 3,50 3,26 3,17 3,09 3,03 4,24 3,39 2,99 2,76 2,60 2,49 1,96 1,92 1,84 1,80 1,75 1,73 1,71 2,40 2,34 2,28 2,20 2,16 2,11 2,07 2,01 1,87 1,78 2,24 7,77 4,68 2,23 2,17 5,57 4,18 3,85 3,63 3,46 3,32 3,22 3,06 2,81 2,62 2,54 2,45 2,40 2,33 2,29 2,19 3,13 2,99 2,89 2,70
3
J)1
3
-
3,99 7,04 3,98 7,01 3,96 6,96 3,94 6,90 3,92 6,84 3,90 6,81 3,89 6,76 3,86 6,70 3,85 6,66 3,84 6,64
2 3,37 5,53 3,35 5,49 3,34 5,45 3,33 5,42 3,32 5,39 3,29 5,34 3,28 5,29 3,26 5,25 3,24 5,21 3,23 5,18 3,22 5,15 3,21 5,12 3,20 5,10 3,19 5,08 3,18 5,06 3,16 5,01 3,15 4,98 3,14 4,95 3,13 4,92 3,11 4,88 3,09 4,82 3,07 4,78 3,06 4,75 3,04 4,71 3,02 4,66 3,00 4,63 3,00 4,61
3 2,98 4,64 2,96 4,60 2,95 4,57 2,93 4,54 2,92 4,51 2,90 4,46 2,88 4,42 2,87 4,38 2,85 4,34 2,84 4,31 2,83 4,29 2,82 4,26 2,81 4,24 2,80 4,22 2,79 4,20 2,77 4,16 2,76 4,13 2,75 4,10 2,74 4,07 2,72 4,04 2,70 3,98 2,68 3,94 2,66 3,91 2,65 3,88 2,63 3,83 2,61 3,80 2,61 3,78
4 2,74 4,14 2,73 4,11 2,71 4,07 2,70 4,04 2,69 4,02 2,67 3,97 2,65 3,93 2,63 3,89 2,62 3,86 2,61 3,83 2,59 3,80 2,58 3,78 2,57 3,76 2,57 3,74 2,56 3,72 2,54 3,68 2,53 3,65 2,51 3,62 2,50 3,60 2,49 3,56 2,46 3,51 2,44 3,47 2,43 3,45 2,42 3,41 2,39 3,37 2,38 3,34 2,37 3,32
5 2,59 3,82 2,57 3,78 2,56 3,75 2,55 3,73 2,53 3,70 2,51 3,65 2,49 3,61 2,48 3,57 2,46 3,54 2,45 3,51 2,44 3,49 2,43 3,47 2,42 3,44 2,41 3,43 2,40 3,41 2,38 3,37 2,37 3,34 2,36 3,31 2,35 3,29 2,33 3,26 2,31 3,21 2,29 3,17 2,27 3,14 2,26 3,11 2,24 3,06 2,22 3,04 2,21 3,02
6 2,47 3,59 2,46 3,56 2,45 3,53 2,43 3,50 2,42 3,47 2,40 3,43 2,38 3,39 2,36 3,35 2,35 3,32 2,34 3,29 2,32 3,27 2,31 3,24 2,30 3,22 2,29 3,20 2,29 3,19 2,27 3,15 2,25 3,12 2,24 3,09 2,23 3,07 2,21 3,04 2,19 2,99 2,17 2,95 2,16 2,92 2,14 2,89 2,12 2,85 2,11 2,82 2,10 2,80
7 2,39 3,42 2,37 3,39 2,36 3,36 2,35 3,33 2,33 3,30 2,31 3,26 2,29 3,22 2,28 3,18 2,26 3,15 2,25 3,12 2,24 3,10 2,23 3,08 2,22 3,06 2,21 3,04 2,20 3,02 2,18 2,98 2,17 2,95 2,15 2,93 2,14 2,91 2,13 2,87 2,10 2,82 2,08 2,79 2,07 2,76 2,06 2,73 2,03 2,68 2,02 2,66 2,01 2,64
8 2,32 3,29 2,31 3,26 2,29 3,23 2,28 3,20 2,27 3,17 2,24 3,13 2,23 3,09 2,21 3,05 2,19 3,02 2,18 2,99 2,17 2,97 2,16 2,95 2,15 2,93 2,14 2,91 2,13 2,89 2,11 2,85 2,10 2,82 2,08 2,80 2,07 2,78 2,06 2,74 2,03 2,69 2,01 2,66 2,00 2,63 1,98 2,60 1,96 2,56 1,95 2,53 1,94 2,51
9 2,27 3,18 2,25 3,15 2,24 3,12 2,22 3,09 2,21 3,07 2,19 3,02 2,17 2,98 2,15 2,95 2,14 2,92 2,12 2,89 2,11 2,86 2,10 2,84 2,09 2,82 2,08 2,80 2,07 2,78 2,06 2,75 2,04 2,72 2,03 2,69 2,02 2,67 2,00 2,64 1,97 2,59 1,96 2,55 1,94 2,53 1,93 2,50 1,90 2,45 1,89 2,43 1,88 2,41
10 2,22 3,09 2,20 3,06 2,19 3,03 2,18 3,00 2,16 2,98 2,14 2,93 2,12 2,89 2,11 2,86 2,09 2,83 2,08 2,80 2,06 2,78 2,05 2,75 2,04 2,73 2,03 2,71 2,03 2,70 2,01 2,66 1,99 2,63 1,98 2,61 1,97 2,59 1,95 2,55 1,93 2,50 1,91 2,47 1,89 2,44 1,88 2,41 1,85 2,37 1,84 2,34 1,83 2,32
11 2,18 3,02 2,17 2,99 2,15 2,96 2,14 2,93 2,13 2,91 2,10 2,86 2,08 2,82 2,07 2,79 2,05 2,75 2,04 2,73 2,03 2,70 2,01 2,68 2,00 2,66 1,99 2,64 1,99 2,63 1,97 2,59 1,95 2,56 1,94 2,53 1,93 2,51 1,91 2,48 1,89 2,43 1,87 2,39 1,85 2,37 1,84 2,34 1,81 2,29 1,80 2,27 1,79 2,25
12 2,15 2,96 2,13 2,93 2,12 2,90 2,10 2,87 2,09 2,84 2,07 2,80 2,05 2,76 2,03 2,72 2,02 2,69 2,00 2,66 1,99 2,64 1,98 2,62 1,97 2,60 1,96 2,58 1,95 2,56 1,93 2,53 1,92 2,50 1,90 2,47 1,89 2,45 1,88 2,42 1,85 2,37 1,83 2,33 1,82 2,31 1,80 2,27 1,78 2,23 1,76 2,20 1,75 2,19
14 2,09 2,86 2,08 2,82 2,06 2,79 2,05 2,77 2,04 2,74 2,01 2,70 1,99 2,66 1,98 2,62 1,96 2,59 1,95 2,56 1,94 2,54 1,92 2,52 1,91 2,50 1,90 2,48 1,89 2,46 1,88 2,42 1,86 2,39 1,85 2,37 1,84 2,35 1,82 2,31 1,79 2,27 1,77 2,23 1,76 2,20 1,74 2,17 1,72 2,13 1,70 2,10 1,69 2,08
16 2,05 2,78 2,04 2,75 2,02 2,72 2,01 2,69 1,99 2,66 1,97 2,62 1,95 2,58 1,93 2,54 1,92 2,51 1,90 2,48 1,89 2,46 1,88 2,44 1,87 2,42 1,86 2,40 1,85 2,38 1,83 2,34 1,82 2,31 1,80 2,29 1,79 2,27 1,77 2,23 1,75 2,19 1,73 2,15 1,71 2,12 1,69 2,09 1,67 2,05 1,65 2,02 1,64 2,00
20
24
30
40
50
75
1,99 2,66 1,97 2,63 1,96 2,60 1,94 2,57 1,93 2,55 1,91 2,50 1,89 2,46 1,87 2,43 1,85 2,40 1,84 2,37 1,83 2,34 1,81 2,32 1,80 2,30 1,79 2,28 1,78 2,27 1,76 2,23 1,75 2,20 1,73 2,17 1,72 2,15 1,70 2,12 1,68 2,07 1,66 2,03 1,64 2,00 1,62 1,97 1,60 1,92 1,58 1,90 1,57 1,88
1,95 2,58 1,93 2,55 1,91 2,52 1,90 2,49 1,89 2,47 1,86 2,42 1,84 2,38 1,82 2,35 1,81 2,32 1,79 2,29 1,78 2,26 1,77 2,24 1,76 2,22 1,75 2,20 1,74 2,18 1,72 2,15 1,70 2,12 1,69 2,09 1,67 2,07 1,65 2,03 1,63 1,98 1,60 1,94 1,59 1,92 1,57 1,89 1,54 1,84 1,53 1,81 1,52 1,79
1,90 2,50 1,88 2,47 1,87 2,44 1,85 2,41 1,84 2,39 1.82 2,34 1,80 2,30 1,78 2,26 1,76 2,23 1,74 2,20 1,73 2,18 1,72 2,15 1,71 2,13 1,70 2,12 1,69 2,10 1,67 2,06 1,65 2,03 1,63 2,00 1,62 1,98 1,60 1,94 1,57 1,89 1,55 1,85 1,54 1,83 1,52 1,79 1,49 1,75 1,47 1,72 1,46 1,70
1,85 2,42 1,84 2,38 1,82 2,35 1,81 2,33 1,79 2,30 1,77 2,25 1,75 2,21 1,73 2,18 1,71 2,14 1,69 2,11 1,68 2,09 1,67 2,07 1,65 2,04 1,64 2,02 1,63 2,01 1,61 1,97 1,59 1,94 1,58 1,91 1,57 1,89
1,82 2,36 1,81 2,33 1,79 2,30 1,77 2,27 1,76 2,25 1,74 2,20 1,71 2,16 1,69 2,12 1,68 2,09 1,66 2,06 1,65 2,03 1,63 2,01 1,62 1,99
1,78 2,29 1,76 2,26 1,75 2,23 1,73 2,20 1,72 2,17 1,69 2,12 1,67 2,08 1,65 2,04 1,63 2,01 1,61 1,98 1,60 1,95 1,59 1,93 1,57 1,91 1,56 1,89 1,55 1,87 1,53 1,83 1,51 1,79 1,49 1,77 1,48 1,74 1,45 1,70 1,42 1,65 1,40 1,60 1,38 1,57 1,35 1,53 1,32 1,48 1,30 1,44 1,28 1,42
1,54
1,85 1,52 1,80 1,49 1,76 1,48 1,73 1,46 1,69 1,42 1,64 1,41 1,61 1,40 1,59
1,61
1,97 1,60 1,95 1,58 1,91 1,56 1,88 1,54 1,85 1,53 1,83 1,51 1,79 1,48 1,74 1,45 1,69 1,44 1,66 1,41 1,63 1,38 1,58 1,36 1,54 1,35 1,53
100 1,76 2,25 1,74 2,22 1,73 2,19 1,71 2,16 1,70 2,13 1,67 2,08 1,65 2,04 1,62 2,00 1,61 1,97 1,59 1,94 1,57 1,91 1,56 1,89 1,55 1,86 1,54 1,84 1,52 1,82 1,50 1,78 1,48 1,75 1,46 1,72 1,45 1,70 1,43 1,65 1,39 1,60 1,36 1,55 1,34 1,52 1,32 1,48 1,28 '1,42 1,26 1,38 1,25 1,36
200
500
1,73 2,19 1,71 2,16 1,69 2,13 1,67 2,10 1,66 2,07 1,63 2,02 1,61 1,98 1,59 1,94 1,57 1,90 1,55 1,87 1,53 1,85 1,52 1,82 1,51 1,80 1,49 1,78 1,48 1,76 1,46 1,71 1,44 1,68 1,42 1,65 1,40 1,62 1,38 1,58 1,34 1,52 1,31 1,47 1,29 1,43 1,26 1,39 1,22 1,32 1,19 1,28 1,17 1,25
1,71 2,16 1,69 2,12 1,67 2,09 1,65 2,06 1,64 2,03 1,61 1,98 1,59 1,94 1,56 1,90 1,54 1,86 1,53 1,83 1,51 1,80 1,49 1,78 1,48 1,76 1,47 1,73 1,46 1,71 1,43 1,67 1,41 1,63 1,39 1,60 1,37 1,57 1,35 1,53 1,31 1,47 1,27 1,41 1,25 1,38 1,22 1,33 1,17 1,25 1,13 1,19 1,11 1,16
= 1,69 2,13 1,67 2,10 1,65 2,07 1,64 2,04 1,62 2,01 1,60 1,96 1,57 1,91 1,55 1,87 1,53 1,84 1,51 1,81 1,49 1,78 1,48 1,75 1,46 1,73 1,45 1,71 1,44 1,68 1,41
1,64 1,39 1,60 1,37 1,57 1,35 1,54 1,33 1,50 1,28 1,43 1,25 1,37 1,22 1,33 1,19 1,28 1,13 1,19 1,08 1,12 1,03 1,05
I'
w
o
I~
Tablica 4.
00
TABLICA ROZKŁADU df 1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0,99 0,00016 0,020 0,115 0,297 0,554 0,872 1,239 1,647 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,878 13,565 14,256 14,953
0,98 0,00063 0,040 0,185 0,429 0,752 1,134 1,564 2,032 2,532 3,059 3,609 4,178 4,765 5,368 5,985 6,614 7,255 7,906 8,567 9,237 9,915 10,600 11,293 11,992 12,697 13,409 14,125 14,847 15,574 16,306
0,95 0,00393 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493
0,90 0,80 0,01579 0,06418 0,211 0,446 0,584 1,005 1,064 1,649 1,610 2,343 2,204 3,070 2,833 3,822 3,490 4,594 4,168 5,380 4,865 6,179 5,578 6,989 6,304 7,807 7,041 8,634 7,790 9,467 8,547 10,307 9,312 11,152 10,085 12,002 10,865 12,857 11,651 13,716 12,443 14,578 13,240 15,445 14,041 16,314 14,848 17,187 15,659 18,062 16,473 18,940 17,292 19,820 18,114 20,703 18,939 21,588 19,768 22,475 20,599 23,364
0,70 0,148 0,713 1,424 2,195 3,000 3,828 4,671 5,527 6,393 7,267 8,148 9,034 9,926 10,821 11,721 12,624 13,531 14,440 15,352 16,266 17,182 18,101 19,021 19,943 20,867 21,792 22,719 23,647 24,577 25,508
0,50 0,455 1,386 2,366 3,357 4,351 5,348 6,346 7,344 8,343 9,342 10,341 11,340 12,340 13,339 14,339 15,338 16,338 17,338 18,338 19,337 20,337 21,337 22,337 23,337 24,337 25,336 26,336 27,336 28,336 29,336
ZZ 0,30 1,074 2,408 3,665 4,878 6,064 7,231 8,383 9,524 10,656 11,781 12,899 14,011 15,119 16,222 17,322 18,418 19,511 20,601 21,689 22,775 23,858 24,939 26,018 27,096 28,172 29,246 30,319 31,391 32,461 33,530
0,20 1,642 3,219 4,642 5,989 7,289 8,558 9,803 11,030 12,242 13,442 14,631 15,812 16,985 18,151 19,311 20,465 21,615 22,760 23,900 25,038 26,171 27,301 28,429 29,553 30,675 31,795 32,912 34,027 35,139 36,250
0,10 2,706 4,605 6,251 7,779 9,236 10,645 12,017 13,362 14,684 15,987 17,275 18,549 19,812 21,064 22,307 23,542 24,769 25,989 27,204 28,412 29,615 30,813 32,007 33,196 34,382 35,563 36,741 37,916 39,087 40,256
0,05 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,652 38,885 40,113 41,337 42,557 43,773
0,02 5,412 7,824 9,837 11,668 13,388 15,033 16,622 18,168 19,679 21,161 22,618 24,054 25,471 26,873 28,259 29,633 30,995 32,346 33,687 35,020 36,343 37,659 38,968 40,270 41,566 42,856 44,140 45,419 46,693 47,962
0,01 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 40,289 41,638 42,980 44,314 45,642 46,963 48,278 49,588 50,892