Thomas W. Pavkov, Kent A. Pierce
Do biegu, gotowi - start! Wprowadzenie do
SPSS dla Windows
Przekład:
Jacek Buczny
t( QWP GDAŃSKIE WYDAWNICTWO PSYCHOLOGICZNE Gdańsk 2005
Recenzje wydawnicze: prof. Jerzy Karyłowski prof. Grażyna Wieczorkowska Podręcznik
Spis treści
akademicki dotowany przez Ministerstwo Edukacji Narodowej i Sportu
Original title: Ready, Set, Go! A Student Guide to SPSS® 11.0 for Windows® 1/e by Thomas W. Pavkov, Kent A. Pierce, Perdue University Calumet. Original edition copyright © 2003, 2001 by The McGraw-Hill Companies, Inc. Ali rights reserved. Copyright for Polish edition © 2005 by
Przedruk materiałów graficznych za Copyright © 2005.
Gdańskie
Wydawnictwo Psychologiczne, Sopot
uprzejmą zgodą
firmy SPSS Polska.
Wszystkie prawa zastrzeżone. Książka ani żadna jej część nie może być przedrukowywana ani w żaden inny sposób reprodukowana lub odczytywana w środkach masowego przekazu bez pisemne; zgody Gdańskiego Wydawnictwa Psychologicznego.
Wydanie pierwsze Edytor: Anna Świtaj ska Redaktor prowadzący: Sylwia Kot Redakcja merytoryczna: Jerzy Karyłowski Redakcja polonistyczna: Małgorzata Jaworska Korekta: Małgorzata Drewa Skład: Piotr Geisler Projekt okładki: Agnieszka Wójkowska
Wskazówki dla bibliotekarzy: 1/ metodołogia badań 21 statystyka
Wstęp
9
Rozdział
1. Podstawy obsługi SPSS Początek pracy z SPSS dla Windows Otwieranie plików z danymi Używanie okna "Otwórz plik" Menu w oknie głównym SPSS Przeglądanie danych za pomocą okna "Dane" Przygotowanie danych za pomocą okna "Zmienne" Przeglądanie okna raportu Drukowanie okna raportu Zamykanie SPSS '" Zadania Rozdział
11 11 12 15 18 , 19 20 25 27 29 29
2.
Rozkłady częstości i statystyki opisowe Stosowanie procedury "Częstości" Zadania
, 30 31 34
Rozdział
3. Graficzna prezentacja danych Przygotowanie wykresów Zadania
36 36 39
ISBN 83-60083-08-8
Druk: PPH Follak/Opelgraf Gdańskie Wydawnictwo Psychologiczne sp. z 0.0. ul. Bema 4/1a, 81-753 Sopot, tel.lfax 058/551-61-04, 551-11-01 e-mail:
[email protected] http://www.gwp.pl
Rozdział 4. Testowanie hipotez badawczych dla dwóch prób niezależnych . . . . . . . . . . . . . . . . . . . . . . . . . . .. 40 Stosowanie procedury "Testt dla prób niezależnych" , 41 Wybór zmiennych 41
--- ----- -
6
---- - - -
--
--- -
----
'-, SPIS TREŚCI
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Interpretacja wydruku Zadania Rozdział 5. Testowanie hipotez badawczych dla dwóch prób zależnych Pytanie badawcze i plan badania Hipotezy badawcze Stosowanie procedury "Porównanie średnich: test t dla dwóch prób zależnych" Interpretacja raportu z analizy Zadania ,
44 47
Wybór zmiennych do analizy Przedstawianie relacji między zmiennymi na wykresie Zadania
48 48 50
Rozdział 9. Opisywanie związków liniowych między dwiema zmiennymi Pytanie badawcze Stosowanie procedury "Regresja: liniowa" Wybór zmiennych do analizy Interpretacja raportu z analizy Analiza regresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Analiza regresji wielokrotnej Zadania '"
50 51
54
Rozdział
6. Porównanie prób niezależnych za pomocą jednoczynnikowej analizy wariancji . . . . . . . . . . . .. Stosowanie procedury "Porównywanie średnich: jednoczynnikowa ANOVA" Wybór i definiowanie zmiennych do analizy Wykonywanie testów post hoc (porównania nieplanowane) Interpretacja wyników jednoczynnikowej analizy wariancji Interpretacja wyników porównań testami post hoc Zadania
86 87 88
89 90 92 93
Rozdział
56 56 58
59 60 62
64 65 66
66 69 75
Rozdział
8. Badanie prostych relacji między dwiema zmiennymi Stosowanie procedury "Korelacje"
84
55
Rozdział
7. Porównywanie prób zależnych za pomocą jednoczynnikowej analizy wariancji z powtarzanym pomiarem . . . . . . . . . . . . . . . .. Pytanie badawcze i plan badania Hipotezy badawcze Stosowanie procedury " Ogólny model liniowy: Powtarzane pomiary" Interpretacja raportu z analizy Zadania
77 80 83
76
77
10. Badanie relacji między dwiema zmiennymi jakościowymi 94 Stosowanie procedury "Opis statystyczny: tabele krzyżowe" . .. 96 Interpretacja wyników analizy testem x2 i tabel krzyżowych .... 99 Zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 101 Dodatek: Tworzenie baz danych przy użyciu programów innych niż SPSS Edytor tekstów Pliki tekstowe ze stałymi odstępami między danymi Pliki tekstowe z danymi rozdzielonymi separatorem Otwieranie danych tekstowych przy użyciu "Kreatora importu tekstu" . . . . . . . . . . . . . . . . . .. Stosowanie arkuszy kalkulacyjnych do wprowadzania danych Używanie baz danych do wprowadzania wyników Posługiwanie się "Kreatorem przejmowania baz danych" . . . .. Zbiory danych
103 103 103 105 105
106 108 108 110
7
Wstęp
Niniejszy podręcznik zawiera informacje niezbędne do opanowania obsługi SPSS® dla Windows® oraz do analizy danych na poziomie podstawowym. Można go używać wraz z podręcznikiem do statystyki i metodologii. Prowadzący zajęcia mogą korzystać z tej książki na wiele sposobów, w zależności od profilu realizowanych przez siebie ćwiczeń. Podręcznik ten zrodził się z konieczności dostarczenia studentom podstawowych informacji na temat pakietu statystycznego SPSS dla Windows - programu, którego używaliśmy w nauczaniu analizy danych. Długo szukaliśmy opracowania, które w sposób efektywny i klarowny przedstawiałoby metody analizy zachowań. Nasze poszukiwania zakończyły się jednak niepowodzeniem. Wobec tego postanowiliśmy rozwinąć treści prowadzonych przez nas zajęć - i tak powstała książka Do biegu gotowi - start! Wprowadzenie do SPSS 6.1 dla Windows, której zaktualizowane wydanie (opisujące SPSS w wersji 11.0 i późniejszych) właśnie trafiło do Twoich rąk. W zamierzeniu autorskim ma to być narzędzie, dzięki któremu można się nauczyć podstawowych czynności, niezbędnych w obsłu dze SPSS dla Windows. Kolejne rozdziały zostały poświęcone głów nym zagadnieniom analizy danych. Ponadto każdy z rozdziałów pokazuje poszczególne kroki, które należy ćwiczyć przy użyciu SPSS, ażeby w pełni opanować prezentowaną tu praktykę badawczą; zawiera ryciny, które ilustrują najważniejsze etapy pracy z SPSS; i omawia podstawy interpretacji przeprowadzonych analiz. W swojej książce próbujemy także angażować studentów do samodzielnej pracy z SPSS - służą temu zadania zamieszczone na końcu rozdziałów. Wprowadzenie do SPSS dla Windows może być jednym z głów nych narzędzi pracy ze studentami. Użytkownik programu stopniowo bowiem poznaje poszczególne zagadnienia. Prezentację procesu badawczego rozpoczynamy zawsze od postawienia pytania badawczego oraz od wyboru odpowiedniego testu statystycznego, potem
1O
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
następuje podsumowanie rezultatów, kończymy zaś interpretacją analizy statystycznej. Żywimy głębokie przekonanie, że taki porządek wykładu umożliwi studentom zrozumienie procesu badawczego i nauczy ich samodzielnej analizy danych, dokonywanej przy użyciu SPSS. Treści podręcznika dotyczą przede wszystkim tych metod statystycznych, które są uznawane za główną składową podstawowego kursu statystyki. W rozdziale pierwszym wprowadzamy czytelnika w arkana obsługi SPSS. W rozdziałach drugim i trzecim omawiamy sposoby uzyskiwania statystyk opisowych i prezentowania danych na wykresach. Kolejne rozdziały, począwszy od czwartego, a skończywszy na siódmym, dotyczą porównywania grup niezależ nych i zależnych za pomocą testu t i analizy wariancji. W dwóch następnych przedstawiamy korelację i analizę regresji. Ostatni rozdział pokazuje sposoby analizowania wyników w tabelach krzyżowych przy użyciu statystyki X2 • W Dodatku znajdują się zbiory danych, które wykorzystujemy, przedstawiając wybrane metody statystyczne. Chcielibyśmy wyrazić wdzięczność kolegom, przyjaciołom i człon kom naszych rodzin, którzy wspierali nasze twórcze przedsięwzięcie. Pragniemy podziękować Frankowi Grahamowi za wsparcie, jakiego nam udzielił w początkowej fazie przygotowywania tego podręczni ka, a także naszemu nowemu edytorowi, który ułatwił druk naszej książki w wydawnictwie McGraw-Hill. Jesteśmy wdzięczni Georgii Gero-Chen za koordynację końcowej fazy edycji tego podręcznika. Dziękujemy również naszym kolegom, którzy go recenzowali: Bruce'owi Abbottowi (Indiana University-Purdue University at Fort Wayne), Dennisowi Bergowi (California State University-Fullerton), Kennethowi Bordensowi (Indiana University Southeast), Paulowi C. Cozby'emu (California State University-Fullerton), Bernardowi Gormanowi (Hofstra University), Louisowi Primaverze (St. John's University), Steve'owi Slane'owi (Cleveland State University), B. Michaelowi Thorne'owi (Mississippi State University) i Toddowi Żakraj sekowi (Southern Oregon State College).
Gdańskie
Wydawnictwo Psychologiczne pragnie serdecznie podzię firmie SPSS Polska za zgodę na opublikowanie ekranów z polskiej wersji systemu SPSS. kować
Rozdział
1
Podstawy obsługi SPSS
CELE ZAJĘĆ 1. Początek pracy z SPSS dla Windows. 2. Nauka otwierania plików z danymi. 3. Prawidłowe przygotowanie bazy danych do analiz. 4. Efektywna praca z raportem. 5. Zamykanie SPSS dla Windows.
Książka, którą właśnie trzymasz w ręku, ma dostarczyć Ci informacji niezbędnych dla początkujących użytkowników SPSS dla Windows. Niniejszy rozdział pomoże Ci opanować podstawowe umiejętności
potrzebne do obsługi SPSS: rozpoczynanie pracy z programem i z bazą danych, przygotowanie bazy danych, opracowywanie wyników Twojej analizy danych. W razie problemów poproś o pomoc prowadzącego ćwiczenia. Początek pracy z SPSS dla Windows
Rozpoczynamy od pulpitu systemu operacyjnego Windows, a następnie posługujemy się menu Start (procedurę ilustruje rycina 1.1) albo klikamy na ikonę (skrót) SPSS, znajdującą się na pulpicie. Na ekranie Twojego komputera pojawi się obraz startowy programu (logo producenta i tym podobne). Oznacza to, że procedura otwierania programu została rozpoczęta. Czas uruchamiania
12
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
RYCINA 1.1.
PODSTAWY OBSŁUGI SPSS ~I
Bez nazwy
Plik Edjl'c;a
Uruchamianie
SPSS Edytor danych
Widok Dane
Przekszłał'cenia
Analiza Wjlkresy
Narzędzia
Okno Pomoc
SPSS za pomocą menu systemu Windows XP. -6
8 9 10 11
12
~.
·f3
§.
:
14
!
15
~
L.-.-..2l - 18 19
20
···21
22
Twojego SPSS zależy od konfiguracji komputera. Można przyspieszyć otwieranie i pracę z programem - w tym celu, zanim uruchomisz SPSS, wyłącz inne aplikacje, na przykład edytor tekstu bądź przeglądarkę internetową, które działają w Twoim systemie operacyjnym.
Otwieranie plików z danymi Po uruchomieniu SPSS pojawi się ekran zachęcający Cię do wykonania kilku operacji związanych z otwarciem plików danych. Pierwszym sposobem otwierania bazy danych jest użycie menu Plik w oknie głównym programu. Drugi sposób polega na posługi waniu się specjalnym oknem dialogowym. Wybór sposobu zależy od rodzaju instalacji SPSS w Twoim komputerze. Sposoby te opiszemy dalej. Jeśli specjalne okno dialogowe, pojawiające się na ekranie tuż po uruchomieniu SPSS, zostanie wyłączone, to główne okno programu będzie wyglądało tak, jak na rycinie 1.2. Ekran ten nazywany jest oknem Danych. Aby wczytać dane do analizy,
RYCINA 1.2.
Okno Dane (Edytor danych).
kliknij menu Plik i wskaż kursorem jedną z opcji w podmenu opcji Otwórz. Początkowe opcje menu Plik przedstawia rycina 1.3. Masz do wyboru: stworzenie nowego pliku, otwarcie pliku istniejącego albo dotarcie do danych zawartych w zwykłym pliku tekstowym. Rycina 1.3 pokazuje również, że dostępne jest podmenu Dane już analizowane - dzięki temu możesz uruchomić wybrany plik. Wystarczy, że klikniesz właściwą etykietę. Najczęściej będziesz uży wać opcji Otwórz. Na rycinie 1.3 została ona podświetlona. Jeśli wybierzesz następujące kroki: Plik> Otwórz> Dane, to powinno się pojawić okno Otwórz plik (rycina 1.5). A oto drugi sposób otwierania plików z danymi, zilustrowany na rycinie 1.4. Przy odpowiedniej konfiguracji Twojego programu takie okno dialogowe powinno się pojawiać za każdym razem po
13
14
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI - START' WPROWADZENIE DO SPSS DLA WINDOWS Bez naz"" • SPSS Edytor danych
EJ Bez nazwy - SPSS Edyto! danych Plik Ed)'cja
Widok
Przekształcenia
Dane
• Jl:r;;::LI:U::U;W~
Nowy I
•
Przejmij bazę danych Czyłai dane tekstowe Zapis~
CUl+S
Z_~iak"' ..
Mtfl,j-
I
W'vkresjI
Analiza
Narzędzia
Okno
fhk.
Pomoc
~d.vr.ld
W"ł"k
Qant'
Pq;eb·...l~l.tml<~
An;,hlil
Wy.!!.Je'l' t1d,~d~l"
Qkrofl POlno!,..
~~NI
Polecenia___ Raport___
Skrypt... Inne ...
l
!ar
l!
'ar
r
«ar
I
var
li
var
l!
Pokaż opis pliku___ Buforui dane. __
O"~'
"
CnI>\"
10 11 12
~~ul:" Zmień
eerwer.•.
Zalt"J'Ol'li oWi""""",
0rI+,
Dane już analizowane Ostatnio używane plik.i
13 14 h
• •
16 11
Zakończ
,.'
18 19 20
13'1
3
"n
=i •. •.
23 24
17
25 26
~ ·~gl ~ 'iq ,. 2i!
27 ?U 19
RYCINA 1.4.
Otwieranie pliku za pomocą specjalnego okna dialogowego.
RYCINA 1.3.
Otwieranie pliku z danymi przy użyciu menu Plik. z opisanego wcześniej okna dialogowego, uruchomienie plików innego typu-, Jeże li nie chcesz, by okno dialogowe pojawiało się za każdym razem, gdy uruchamiasz SPSS, zaznacz opcję Nie pokazuj tego okna dialogowego w przyszłosci. rycinie 1.5.
uruchomieniu SPSS. Opcje tego okna pozwalają Ci na uruchomienie samouczka i kwerendy 1, wprowadzanie danych albo otwarcie istniejących plików. Jeśli zdecydujesz się na używanie tego okna dialogowego, to posługuj się opcją Otwórz istniejqcy plik danych. Nazwy plików - wraz z ich lokalizacją w Twoim komputerze - są wymienione w specjalnym oknie. Aby otworzyć plik, należy dwukrotnie kliknąć wybraną etykietę. Jeśli operacja się powiedzie, to SPSS w Oknie danych otworzy wybrany plik (zob. rycina 1.6). Gdyby się zdarzyło, że na liście w oknie dialogowym nie ma potrzebnego pliku, wówczas należy dwukrotnie kliknąć opcję Więcej plików. Po wykonaniu tej czynności powinno się pojawić takie okno, jak na Specjalny plik (przyp. tłum.).
1
zawierający
dane, na
przykład pochodzące
z programu MS Access
Korzystając
możesz się zdecydować na
Używanie
okna "Otwórz plik"
Po wybraniu opcji Otwórz dane pojawi się okno Otwórz plik. Ponieważ Twój komputer może zawierać wiele rozmaitych plików, zlokalizuj na dysku zbiory z danymi. Okno Otwórz plik umożliwia wybór takich danych. Rycina 1.5 pokazuje katalog na dysku Twojego
2 Możesz uruchomić różne
pliki, na przykład raporty (przyp. tłum.).
15
16
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
komputera, który aktualnie jest przeszukiwany w celu otwarcia pliku. Zmiana aktywnego katalogu staje się możliwa po kliknięciu czarnej strzałki po prawej stronie okienka Szukaj w ... Następnie należy wybrać odpowiedni katalog. Obok znajduje się kolejna strzał ka, skierowana w lewą stronę. Jej naciśnięcie spowoduje zaktywizowanie katalogu, który przed chwilą był przeglądany. Duże okno pośrodku tego, które zostało nazwane Otwórz plik, zawiera nazwy plików z danymi. Rycina 1.5 przedstawia listę takich plików, przechowywanych w głównym katalogu SPSS. Ażeby wczytać plik ze zbiorem danych, trzeba dwukrotnie kliknąć nazwę pliku albo go podświetlić, a następnie nacisnąć przycisk Otwórz. SPSS domyślnie wyszukuje plik o rozszerzeniu .sav, na co wskazuje okienko Plik typu ... , znajdujące się u dołu okna Otwórz plik. SPSS będzie zapisywał Twoje dane właśnie w formacie .sau>. Aby przećwiczyć przedstawioną do tej pory część kursu, wyszukaj odpowiedni plik z danymi, wybierz go, a następnie wczytaj zawarte w nim dane. Twój prowadzący ćwiczenia poinformuje Cię, który plik trzeba uruchomić. Kiedy już uda Ci się znaleźć folder przedstawiony na rycinie 1.5, SPSS natychmiast wskaże Ci pliki zawierające dane do analizy. W naszym przykładzie posłużymy się zbiorem danych GSS93 podzbiór.sav. Będzie on dla nas materiałem szkoleniowym wykorzystywanym w dalszej części książki. Dane tego pliku pochodzą z badań Generalnego Sondażu Społecznego", realizowanego co dwa lata przez Narodowe Centrum Badania Opinii Publicznej Uniwersytetu w Chicago. Celem tych badań jest śledzenie zmieniających się trendów społecznych w zakresie takich obszarów, jak wielokulturowość, posługiwanie się internetem czyipraktyki i przekonania religijne. Generalny Sondaż Społeczny (GSS) z roku 1993 został opracowany na podstawie badania losowo wybranej próby 1500 osób w wieku powyżej 17 lat, na stałe mieszkających w Stanach Zjednoczonych Ameryki Północnej. Plik z tymi danymi powinien się Format pliku można rozpoznać, używając opcji Właściwości (po przejściu do bezpoś redniej pracy z systemem Windows) tuż po kliknięciu ikony wybranego pliku prawym przyciskiem myszy (przyp. tłum.), . . . " " 4 W Polsce na taką skalę realizowana Jest między mnyrm DIagnoza Społeczna I Polski Generalny Sondaż Społeczny (przyp. tłum.), 3
PODSTAWY OBSŁUGI SPSS
RYCINA 1.5. Okno Otwórz plik.
znajdować w katalogu macierzystym SPSS. Jeśli jego lokalizacja jest
właśnie taka, to postaraj się go uruchomić.
W oknie Otwórz plik możesz wybrać nie tylko pliki o rozszerzeniu .sau. Naciśnięcie strzałki obok okienka Plik typu... spowoduje, że zobaczysz bogatą listę plików obsługiwanych przez Twój SPSS. Najczęściej będziesz używać plików z bazą danych, poleceniami i raportami z analiz. Na próbę możesz otworzyć plik z poleceniami programu SPSS - jego rozszerzenie (format) to .sps. Taki plik zawiera język wewnętrzny tego programu, który służy do wykonania zaprogramowanych przez Ciebie zadań. Możesz otworzyć także plik raportu - jego format to .spo. Okno raportu zawiera wyniki procedur statystycznych wykonywanych przez SPSS. Kiedy rozpocznie się otwieranie, zwróć szybko uwagę na środkową i dolną część głównego okna programu - miejsce to nazywane jest oknem statusu SPSS. Dzięki niemu uzyskasz informacje o procedurach, które SPSS właśnie wykonuje>. Po zadaniu otwarcia pliku w oknie statusu powinna pojawić się informacja o tym, że SPSS odczytuje dane.
5
Informacje na ogół są podawane w języku angielskim (przyp. tłum.).
17
18 JJ
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS GSS93 podzbiór sev
SPss Edytor danych
Plik Edycia Widok Dane
[1
PODSTAWY OBSŁUGI SPSS
Przekształcenia
Analiza W,kresy
Narzędzia
plikach, na przykład tworzyć i- opisywać dane, definiować zmienne, przeprowadzać analizy statystyczne. Menu Plik zawiera także opcje
Okno Pomoc
L
Id
(~R"~~r~~l~~~~T""T~·;{"~m'i :~-- 4]
c..:Jj
.. . '6 7 8
1
O I' . (
r r'
l
1Ó 11
'12 -'1~
14 15 16 .17 '18 19
"20)
:=.-1!] .
22 23
4 5 6
2 5 5
5 5 1
O O 25
4 1 2
O O 2
45 78 83
99 10 3
7 8 9 10 11
1 5 1 2 1
1 1 3 5 5
22 24 22 O O
2 3 1 1 1
2 2 2 O O
55 75 31 54 29
10 11 7 3 4
12 13 14 15 16 17 18 19 20 21 22 23
1 5 1 1 5 4 4 5 1 5 7 5 1 1 1 1 1 1 3 1 '21 5 2
O 31 24 O O O 22 32 24 24 23 25
O O 3 4 O 98 9 1 2 5 O 2
O 1 4 3 1 4 O 1 2 2 3 2
23 61 63 33 36 39 55 55 34 36 44 80
10 99 3. 3 11 3 1 9 4 6 8 5
RYCINA 1.6. Edytor danych w widoku Dane.
Podawana jest tam również informacja o liczbie danych zawartych w bazie. Udany proces ładowania pliku kończy się wyświetle niem: SPSS Procesor gotowy (rycina 1.6).
Menu w oknie
głównym
drukowania Twoich raportów z wynikami. Posługując się ryciną 1.6, przyjrzyj się dokładnie poszczególnym menu. Niektóre z nich powiązane są z podmenu. Pojawią się one, kiedy kursorem myszy podświetlisz wybrane menu główne. SPSS zawiera bardzo wiele procedur służących analizom statystycznym - część z nich poznasz, pracując z naszą książką. Podkreślamy jednak, że istnieje wiele zaawansowanych analiz statystycznych, których nie będziemy przedstawiali w niniejszym podręczniku.
zcdrac
SPSS
Przyjrzyj się uważnie głównemu oknu SPSS, przedstawionemu na rycinie 1.6. Zwróć uwagę, że znajduje się tam wiele różnych menu i zestawów narzędzi - korzysta się z nich zawsze przy użyciu lewego klawisza myszy. Większość ćwiczeń zawartych w niniejszej książce wymagać bę dzie od Ciebie opanowania umiejętności korzystania z menu Plik, Dane i Analiza. Dzięki nim możesz wykonywać wiele operacji na
Przeglądanie danych za pomocą okna "Dane" Po zakończeniu wczytywania danych wygląd okna SPSS powinien być zbliżony do ryciny 1.6. Na ekranie widzisz Okno danych albo Edytor danych. Narzędzie to pozwala Ci na dwa sposoby przegląda nia Twojej bazy danych, przy użyciu okien Dane i Zmienne", Okno Dane wyglądem przypomina arkusz kalkulacyjny. Liczby, które się w nim znajdują, to właśnie Twoje pomiary - dane do analiz statystycznych. Jeden rząd arkusza zawiera dane dla jednej obserwacji (przypadku) w Twoim badaniu (numery poszczególnych obserwacji znajdują się po lewej stronie). Jedna kolumna to jedna zmienna, którą posługujesz się w badaniu. Każda zmienna jest opatrzona nazwą, która widnieje u góry okna głównego. W zbiorze GSS93 podzbiór.sav są to na przykład nazwy wrstat, agetoed", Wskazanie kursorem danej zmiennej spowoduje wyświetlenie jej dokładnego opisu. Wykonaj tę czynność, aby szybko zebrać informacje o elementach bazy danych. Arkusz w widoku Dane składa się z komórek uformowanych przez linie pionowe i poziome. Dane do poszczególnych komórek
6
Widoki zmieniamy, klikając zakładki znajdujące się u dołu głównego okna (przyp.
tłum.).
7 Rozszerzeniem nazwy zmiennej jest etykieta, którą można przeczytać/opisać za pomocą widoku Zmienne. Nazwa zmiennej nie może zawierać więcej niż osiem znaków i pierwszym z nich nie może być liczba (przyp. tłum.).
19
2O
,-1 GSS93 podzbiór Plik
Ed}lcia
s av
Widok
SPSS Edyto, danych
Dane
Emifil."
Przekształcenia
Analiza Wykresy
Narzędzia
Okno Pomoc
~ ~ 1'"'1("'·1 ~ f..Jl?l ~ ~ -~ ... -Jlld Nazwa r:::e:~~::y-I~~r~k;;ćl:Dzle-~lęi~~ -
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI - STARTI WPROWADZENIE DO SPSS DLA WINDOWS
2 wrkstat
Numeryczny·1
O
3 4 5 6
mantal agewed sibs childs age
Numeryczny Numeryczny Numeryczny Numeryczny Numeryczny
2 1 2
O O O O O
8 brrthmo -9 zodiac
Numeryczny Numeryczny
2 2
O O
11 degree ~padeg ~madeg ~sex ~ race • -n-16i mcome9 1
Nameryczny Numeryczny Numeryczny Numeryczny Numeryczny Numeryczny Numeryczny
2 1 1 1 1 1 2
O O O O O O O
~ nncom91 18 region
Numeryczny Numeryczny
2 1
O O
~partYld ----22 vote92
Numeryczny Numeryczny Numeryczny Numeryczny
2 4 1 1
O O O O
23 po/vlews • _ -24] cappun
Numeryczny Numeryczny
1 1
O O
Numer czn
1
O
:: _--_71
~educ
19 xnorcsrz
........:J2J.
-----1QJ sns
25
unlaw
1
i
Kod responden Brak Brak Obecna sytua {O, Nie dotycz O, 9 Stan CYWilny {1, lonaty/zam 9 Wiek zawarcia {O, Nie dotycz 0,98,99 Liczba braci I {98, Nie wiem) 98,99 Liczba dzreci {8, OSiem lub 9 Wiek responde{98, Nie wiem) 0,98,99 Miesiąc urodz {O, Nie dotycz O, 98, 99 Znak zodiaku r {O, Nie dotycz -O,9B, 99 Lat nauki szko {97, Nie dotyc 97,98,99 Poziorn wyksz {O, Mniej ruz H 7, 8, 9 Poziom wyksz {O, Mniej High ·7, B, 9 Poziom wyksz {O, Mniej ruz HI7, 8, 9 Płeć responde {1, Męzczyzna Brak Brak Rasa responde p, Biała} Dochód łączny {O, Nie dotycz 0,98,99 Dochody z pra {O, Nie dotycz 0,98,99 RegIOn żarmes {O, Nie przypis O Rozszerzony k {O, Nie przypis O Wielkość
mrej 1-1, Nie przypi -1 Identyfikacja p {O, Mocny dem 8,9 Czy glosował {O, Nie dotycz 0,8,9 Czy myśli o solO, Nie dotycz 0,8,9 Za/przeciw kar {O, Nie dotycz 8, 9 la lub rzeciw O, Nie dot cz 0,8,9
O:
RYCINA 1.7.
Edytor danych w widoku Zmienne. możesz wprowadzać, klikając wybraną komórkę
arkusza. Dopiero w aktywnej komórce możesz umieścić wynik uzyskany w badaniu.
Przygotowanie danych za
pomocą
okna "Zmienne"
Zanim przystąpisz do analiz, zadbaj o pełne zdefiniowanie bazy danych. Odpowiednio przygotowany zbiór wyników umożliwi Ci odczytanie wielu informacji, na przykład w raporcie. Każdą zmienną naszej bazy możemy opisać na dwa sposoby jednocześnie: za pomocą ośmioznakowej nazwy lub etykiety. Poszczególne wiersze pozwalają na odczytariie, którego pomiaru dotyczy dana zmienna, jakie wartości może ona przybierać i na jakiego typu skali jest mierzona. Większość baz danych, które
obejmuje program SPSS, ma już odpowiednio zdefiniowane zmienne. Podsumowując, należy stwierdzić, że opisywany tutaj proces jest integralną częścią analizy danych. Przedstawiony etap zrealizujesz przy użyciu okna Zmienne (rycina 1.7). Widok Zmienne różni się od okna Dane tym, że w tym pierwszym zmienne są uporządkowane w rzędach, a w kolumnach widnieją właściwości każdej z nich. Na przykład na rycinie 1.7 czternasty rząd dotyczy zmiennej płeć (sex). Spróbuj kliknąć pierwszą kolumnę w tym rzędzie, a następnie przy użyciu strzałek kierunku na klawiaturze przemieszczaj się w obrębie tego rzędu z jednej kolumny do drugiej. W pierwszej znajduje się nazwa zmiennej. Kolejna zawiera już informację, że zmienna ta zdefiniowana jest jako numeryczna. Trzecia kolumna informuje o tym, ile znaków możemy napisać, wprowadzając dane do zmiennej. Okno Zmienne pozwala Ci na wykonanie wielu zadań. Jeśli używasz pliku przygotowanego przez firmę SPSS, to dostęp do właściwości zmiennych jest szybki i nie nastręcza żadnych problemów. Jeżeli zakładasz bazę danych, to zdefiniowanie zmiennych jest Twoim zadaniem. Możesz wówczas określić skalę pomiarową Twojej zmiennej, a do wyboru masz: jakościową, porządkową i ilościową". Dostępne jest także określenie wartości, które wprowadzasz, gdy brakuje Ci jakichś danych w odniesieniu do konkretnej obserwacji. Przykłady omawiane w tej książce opierają się na bazach danych przedstawionych w Dodatku. Twoim zadaniem będzie więc przygotowanie plików SPSS z tymi danymi. Gdy chcesz wprowadzić dane ze swojego badania, musisz zało żyć własną bazę. SPSS pozwala Ci także na zbieranie danych z plików MS Word, z arkuszy kalkulacyjnych, takich jak MS Excel czy Lotus, albo z baz danych dBase i MS Access (więcej informacji znajdziesz w Dodatku). Postaraj się w tym momencie zaznajomić z widokiem Zmienne. Spróbuj poklikać na poszczególne kolumny i komórki. Zauważ, że w niemal każdej kolumnie pojawiają się przyciski Za pomocą opcji Ilościowa definiujemy zmienne zmierzone na skali interwałowej i ilorazowej (przyp. tłum.).
8
21
22
III GSS93 podzbiór.• av - SPSS Edytor danych Phk
Edycja
-j
I
Widok.
Id
- -- "21wrkstat
i I
•
''::lImantai
"~
41agewed "5 srbs
~chllds
~age l
8 birthrno
-9" rodrac 10 educ "Ti degree ~padeg
Dane
GSS93 podzbióuav - SPSS Edylar danych
Przekształcenia
=
liIumeryczny
Analiza
Wykresy
Narzędzia
Okno
'o
Kod responden Brak
llllllll
ll l ·
f,
e Numeryczny
O
Przecmkcw'
-rr
O Z kropkę O Notaeranaukowa O DataI czas
Co
l
~~ i O l O
Pomoc
r-'(jK"I Szerokość
r:;'"1
l!J.
Mlelsca dZieSiętne@]
Dolar Format uz~tkownlka
Tek~tDw~
13 madeg Numeryczny 1 O 14 sex INumeryczngl1 O 15 race Numeryczny 1 0 O 16 IrIcome91 Numeryczny 2 17 nncom91 Numeryczny 2 O Numeryczny 1 iD fś region 19 xnorcsrz Numeryczny 2 O Numeryczny 4 20 size 'O 'Numeryczny 1 'O 21 partyld 22 'Iote92 Numeryczny ' 1 0 , 23 polvlews Numeryczny 1 O
L......:;::::.. r;:;:;::-1
{O, Nie dotycz 0,9 {1, lonaty/zam9 {O,-N;e doty'czO, 98, 99 {98, Nie wiem} '98,99
\llldok
Dane
Przekształcenia
Analiza Wykresy
N.uzędzia
Okno
Pornoc
i~l~r.sll!!l ;;;)-;::;) ~ fgfl ~ Eimil =rm~l r~~
Po~]
4
°
Kod responden Brak
1
O
1
O
Obecna eytue Stan CYWilny { -...... • '" ...
4 aqewed 5b
Numeryczny
2
O
Wiek zawarcia
Numeryczny Numeryczny Numeryczny
2 2 2
O
Wiek reepcnde f I
3 mańtal
6
:~':ds
.7 age
~~~:;:::~: ~
~
Brak
6
~:::: :;~~~:
r
=========::::l
:: :::::
I {l
,
Numeryczny
2
O
Numeryczny Numeryczny
1 1
O O
Pcnom wyksz {
13 madeg
Numeryczny
1
O
POZlOm wyksz {O, Mmej nlZ HI?, 8, 9
14 sex 15 race
Numeryczny Numeryczny
1 1
O
Piec responde Męzczy Rasa responde{1, Biała}
{O, Mniej High '7,8,9
-Pozrom wyksz {O, Mnrej ruz Hi7, 8, 9 Płeć responde 'p, MęzczyznaBrak Rasa responde {1, Brała] Brak Dochód !ączny'{O, Nie dotycz '0,98,99 Dochody z pra,{O,Nie dotycz 0,98,99 Reglóń'zamles'{OiNle prźYPls:O Rozszerzony k {O, Nie przypis O 'Wielkość miej {-1, Nie przypt -1 'Identyfikacja p {O, Mocny dem8, 9 Czy głosował {O, Nie dotycz '0,8,9 Czy myśli o so{O, Nie dotycz O, 8, 9
- wyjątkiem są kolumny Nazwa i Etykieta. Klawisze te służą do wykonania kolejnych kroków definiowania zmiennej. Rycina 1.8 przedstawia podświetloną kolumnę dla czternastej zmiennej (piec), a także okno Typ zmiennej, które możemy uruchomić, klikając kwadracik z trzema kropkami. Wspomniane okno pozwala ci na zdefiniowanie typu zmiennej. Osoba analizująca dane powinna wiedzieć, w jakim formacie? SPSS je przechowuje. W więk szości wypadków będziesz używać typu Numerycznego, tak jak w naszym przykładzie na rycinie 1.8. Dane możesz też przechowywać w formacie Tekstowym (litery i cyfry), Daty, Dolara, jak również w formacie przez siebie przygotowanym.
Chodzi tutaj o format numeryczny, tekstowy i inne (przyp. tlum.).
16 rncomes'l
Numeryczny
2
17 rincom91 18 regIon
Numeryczny Numeryczny
2 1
meresu
O O
a
lp.
F§I Brak Brak
Dochód łączny {O,Nie dotycz 0,98,99 Dochody z pra {O, Nie dotycz 0,98,99 Rapmnzanues{O.Nie przypis O
O O O
Rozszerzony k {O,Nie przypis O W'ielkość miej {-1. NIe przypl -1
8
Do prawej
8 8
Do prawej Do prawej
8
a 8
8
Do prawej Do prawej Do pralNe)
2
Numeryczny Numeryczny
4 1
O
ldentyfikacja p {O, Mocny dem8, 9
8
Numeryczny
1
23 pcbtews 24 cappun
Numeryczny Numeryczny
1 1
D O O
CZ)' głosował {O, Nie dotycz 0,8,9 Czy mysf o so{O, Nie dotycz 0,8,9 Za/przecIW kar {O, Nie dotycz 0.8,9
Do prawej Do prawej
22 vole92
8 8 8
Do prawej Do prawej
8
Do prawe)
25 gunlaw
Numeryczny
1
O
Za lub przacfw {D, Nie dotycz 0.8.9
8
26 grass
Numeryczny
1
O
Czy manhuana {O, Nie dotycz 0,8.9
8
Do prawej
27 rehg
Numeryczny
1
O
Zjaka religia,
8
Do prawej
O O O
8 8
Do prawe;
Idealna hczba
8 8
Do prawe}
28 lńe
Numeryczny Numeryczny
1 1
30 pillok
NumeryCZny Numeryczny
1 1
31 sexeduc
O
i POrOOC]
Do pra'9Vej
Numeryczny
29 chldrdel
•
pOZ10mWYkSZ{~';'~"~'''':;:;~==;===~====~_~J
20 srze 21 parlyld
19
_
r-iWI
~
~==========:; ! §iJ
10 educ
{O')t1meJ n1Z H) "8, 9
MieSiąc urcdz {i
;;::~::;:,:::;;:=====:=:;
11 padeg degree 12
O O
ilOŚCIOwy
-----11;-.
rEtykletYWillto"",::::,
{O, Nie dotycz O, 98, 99 {O, Nie dotycz ,0,98,99 {97, Nie dotyc97, 98, 99
8 bmfmc 9 zcdrac
Do prawe)
{)ijt?liil:il1fttg---"_M_----
l!.
Pcnom
Wyrównanie
Numeryczny Numeryczny Numeryczny
{98, Nie wiem} O, 98, 99
~ {8, OSiem lub ,9
",'
wattoset
1 Id
2 wrkstat
~ = :'MęzCly~na" Znak zodiaku r ~;iJ 2.. 'Kobteła Lat nauki szko {J . ~----""-l
RYCINA 1.8. Definiowanie typu zmiennej.
9
Plik Ed.vCla
-'-N;;;;;--' [--fYP-- -rszerokoŚĆ-l-D~;e~~--l-EtYklet;-
:4
23
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
{1, Protestant} 8,9
Zycie Jest pas) {O,Nie dotycz 0,8,9
r. Nie dotyczy -1,9
Kontrola uroda {O, Nie dotycz 0,8,9 Edukacja seks {O, NJe dotycz 0.8,9
Do prawe)
Do prawej
Do prawe}
RYCINA 1.9. Definiowanie etykiety wartości.
Okno Typ zmiennej pozwala Ci na określenie maksymalnej liczby znaków, jaką można wpisać do komórki w trakcie wprowadzania danych. Rycina 1.8 pokazuje, że w formacie Numerycznym wprowadzony jest jeden znak i że niemożliwe jest umieszczenie danych po przecinku-''. Jeśli prowadzący ćwiczenia zaleci Ci stworzenie bazy danych, to każda zmienna powinna być zdefiniowana. Odpowiednio przygotowane dane w kolumnie Wartości posłużą Ci do wprowadzania danych. Po raz kolejny zajmijmy się zmienną pleć. Rycina 1.9 pokazuje, że wartość 1 przyporządkowana jest do etykiety Mężczyzna, a wartość 2 - do etykiety Kobieta. Aby zmienić etykietę bądź przyporządkowanie do etykiety, najpierw wybierz 10 W takiej sytuacji, jeśli do komórki wkleimy dane zawierające liczby dziesiętne to SPSS dokona zaokrąglenia (przyp. dum.). '
24
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
G5S93 podzbIór *av - SPSS Ed,tordanych Edyqa WIdok Dane Przekaatełceme Andlml
Phk
W9k'e~.Y
Narzędll
Okno
Pernoc
j@'n~ l!!I j--H ~ ~ ~ Emii =~J ~ --
Nazwa 1 Id 2 wrkstat
~ mantal 4 agewed 5 slbs 6 chude 7 aga 8 brrthmo 9 zadlic
Szerokość
'-Typ
Numeryczny
4
Numeryczny Numeryczny
1 1
Numeryczny 2 Numeryczny 2 "Numeryczny "1 Numeryczny 2
Numeryczny 2 Numeryczny 2
Kod responden Brak Obecna sytua {O, Nie dotycz
Brakidanych Brak
'r-i
Stan cywilny {1, źonatyzarn ~ "Wiek zawarcia{O,NIedotycz
q O Bea braków dIlnych W~rto$Cl dyskretne br.!lkaw
Liczba bracn {98, Nie WIem}
g €
'Miesiąc urodz '{O,Nie dotycz
q O Przedztal-wartosclplWlwarlośćdysktetna
Liczba dnecr {B, OSIem lub ~ Wiek responde{98, NIe wiem} Q
Znak zodiaku r {O, Nie dotycz
q
c=::J c==J c===! r'l,'J,l'l'&"~~
Lm.m.....__.;
Numeryczny Numeryczny Numeryczny Numeryczny
14 sex 15 race
Numeryczny
1 1 Numeryczny 2
Płec reeponde {l, Męzczyzna~8
Numeryczny
Rasa responde{1, Biała}
Dochód łą~zny {O,Nie dotycz 0,98,99
8
18 region 19 xnorcstz
Numeryczny Numeryczny Numeryczny
2 1 2
DochodyZ p13 {O, NIe dotycz D, 98, 99 Reglan aerrues{O, Nie przypis O Rozszerzony k {O, Nie przypis O
8 8 8
20 eue
Numeryczny
4
Wielkość miej {-1, Nie przypl -l
8
21 partyld 22 vote92
Numeryczny Numeryczny
1 1
Identyfikacja p {D, Mocny dem8,9 Czy głosował {O, Nie dotycz 0,8,9
8 8
16 Jn~ome91
1 1
Brak
. __..""--l
8
Numeryczny "Numeryczny
1 1
Czy myśli o sa {O, Nie dotycz 0,8.9 Za/przecIw kar {O, NIe dotycz 0.8,9
8
26 grass
Numeryczny Numeryczny
1 1
Za lub przecIw {O,Nledotycz 0,8.9 'Czy manhuanału. Nie dotycz 0,8,9
8 8
27 rehq 28 hfe
Numeryczny Numeryczny
1 1
ZJaka religia, {1, Protestant} 8, 9 Zycre jest pasj {O, Nie dotycz 0,8,9
8 8
29 chldldel
Numeryczny
1
Idealna liczba {T, Nie dotyczy -1, 9
8
23 polaewa 24 cappun
~gunlaw
G\X'M"'~
Lat nauki sako {97, Nie dotyc ~ L~ Pozrcm wykaz {O, Mnrej ruz H? Poztomwyksz {G, Mniej HIgh ;: Pcncm wykaz{D,MmeJruzHl7",8'"',9 '---°8---",-,=,-----,;"==,---' I
10 aduc 11 degree 12 padeg 13 madeg
~nncom91
2 1
DZiesiętne r=;E=C,y7:i,--r wancec k"C
8
RYCINA 1.10. Definiowanie braków danych.
odpowiedni wiersz w największym oknie, następnie wprowadź wybrane przez siebie znaki, po czym kliknij przycisk Zmień. Jeśli chcesz wprowadzić dodatkowe wartości, to najpierw w okienku Wartość wprowadź liczbę, na przykład 3, a w dalszej kolejności Etykietę, po czym naciśnij przycisk Dodaj. Kiedy zaś planujesz usunię cie danej etykiety i wartości, to zaznacz wybrany wiersz i naciśnij przycisk Usuń. , W pracy badacza, podczas analizy danych, bardzo ważne jest zdefiniowanie tak zwanych braków w danych. Rycina 1.10 przedstawia kolumnę, w której określa się braki w danych. Okno Braki danych uruchamiamy poprzez pojedyncze kliknięcie kwadracika z kropkami w wybranym wierszu (rzędzie). W naszym przykładzie określamy braki danych jako 3 (w takiej sytuacji, gdy w wypadku danej obserwacji brakuje danych o płci, będziemy wprowadzali 3). W oknie Wartości dyskretne braków istnieje możliwość wprowadze-
nia trzech kodów braków, które zależnie od charakterystyki badania mogą oznaczać na przykład "nie wiem" lub "stwierdzenie niepasujące do respondenta". Przedstawiony sposób definiowania pozwala na przygotowanie takiego zbioru, aby można było rozróżniać poszczególne typy braków danych. Przeglądanie
okna raportu
okno raportu przy użyciu Edytora raportów. Po analiz SPSS natychmiast wyświetla raport - rycina 1.11 przedstawia taki przykład. Edytor raportów SPSS składa się z dwóch części. Po lewej stronie znajduje się panel ilustrujący strukturę Twojego raportu. Wskazuje on na rodzaj procedury, która została przez Ciebie zastosowana do analizy danychl '. Po prawej stronie widnieją etykiety, tabele, wykresy i teksty sporządzone przez procedury statystyczne SPSS. Poruszanie się po raporcie SPSS jest skuteczne, kiedy używasz lewego panelu - możesz klikać na wybrane części analiz, wykresy lub tabele. Na rycinie 1.11 zauważysz, że podświetlona jest ta tabela, która zawiera kilka statystyk dla wybranej zmiennej (wiek respondenta). Ikony znajdujące się w lewej części raportu i zawierające minusy pozwalają na zwijanie listy elementów, a ikony z plusami - na zagłębianie się w uzyskane wyniki. Posługi wanie się lewym panelem efektywnie porządkuje proces analizy danych. Poszczególne raporty możesz przeglądać, posługując się menu Okno w głównym oknie programu. Raport SPSS zawiera bardzo wiele danych. Rycina 1.12 pokazuje, że może on uwzględniać wiele dodatkowych informacji, szczególnie w sekcji Uwagi12 (informacje o języku poleceń SPSS i o ewentualnych błędach, które pojawiły się w trakcie analiz). W tej sekcji znajdziesz informacje o tym, w jaki sposób należy przeprowadzać wybrane analizy, aby uniknąć błędów. SPSS
wyświetla
zakończeniu
11 W przykładzie widniejącym na rycinie 1.11 został użyty moduł Częstości. Więcej informacji na ten temat zawiera rozdział drugi (przyp. tłum.). 12 Na przykład, jeżeli sekcja Uwagi jest niewidoczna, co wyraża się ikoną zamkniętej książki w lewym panelu, to można ją uaktywnić, dwukrotnie na nią klikając (przyp.
tłum.),
25
26
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
_-
~~a __ !!~.!:_:!!,J!!!!' _E.o.-t AMli:zll WJlłlreqo
~:::,
"""...
: ... .~.
CqIOl dane tebtoloto
z.....,
Z""'R Z"'RtU;O z hlllłelll.
H~_
p-
Q'~
~I~~III;
-
..
L: ClfJo.S
,
Czestoścl (FREQUENCIES)
z..m
EkqlOlłu~
UW<11l1
PoIr.etOPI$Pli:.u RaportsporządZ'Ono
Udll_sllOOl'
Komentarze Dane
PodlII4dl'lS'druł.u
_pm;i
ZlDIetisefWS. ;Z~~cłI~
Prceam Clsfość
s
" " "ze
Wa2r.a
ra
H
,J 1,1
30
ta
U
22 23
i
te
1,0 t
2,0 1,8 l,' 2,8 2,0
-n 22 42
29 30 31 32 33
30 36
".,.. as --
l,'
31
"
29 33
l,' 2,2
zs
t
1,' 2,8 20 2,0 2,' 1,9 2,2
".. -----........ 2,7
t
~~
.
pol1zblorsav Filtr Waga
PodZialnapodzblory
UcZllaobselWacjlw
+
Tral
rol:tol:%'fTT\phkudarrych Oel'lnlCjabT3kÓWdanyth
1500 Wartosclzdel1nlOwane przez vty!koWT1lkaJakobrakldanyths:j, lraklowanejako bralddanych
statysty!ooollcza;nesa,napodsI3V01e ws~slklch
obserwacjizwatnyml
.'
danymi Polecenie
FREGlUENCH"S
VARlABLES:alle /ORDER: ANALYSIS Czaswykonania Dopu5zczalrlallt2ba obserwacji
zasobY
00001),37
149796
23,1 2" 27,2
".."",.
28,9
Wlekresondenta N
--- ;;.~
::~a~ch T
149~
0","_
RYCINA 1.11. Wygląd Edytora raportów. NetzędzHI
C~ProgramFlles\SPSS\GSS93
21,1
z
V
--
ce-
29-6EP-200423 0245 Plik danych
Uż,'cleobserw.lcli
',2 7,0 8,6 10,6 12,4 13,8 16,7 18,7
t.e
r
Ollano~eplilu
Z_
2,7 O,l
l,' 20
2,1
D_l&d.anaIizow_
t.s
1,1 1,2 l,' 1,0 1,9
s
30
"
"""'" ,J
s
22
28 23
26
28
-~
PrOCenI
W#1iipoWł
Prucent skumulowa"" ,3
MOM
Okno POIIlOC
..
Czestoścl (FREQUENCIES)
I
j :SpsSProce$Ol
RYCINA 1.13. Wybór opcji drukowania w Edytorze raportów.
Drukowanie okna raportu
UW,," RaportspOI7ą.uono
29·SEP·2CO.n02A5
Analizowanie raportu możesz zakończyć zapisaniem go w pliku, albo też wydrukowaniem. Należy w tym celu wykorzystać menu Plik W oknie Edytor raportów. Rycina 1.13 pokazuje dostęp do opcji Drukuj. Po wybraniu menu Plik wybierz opcję Plik> Drukuj. Po kliknięciu opcji Drukuj pojawi się odpowiednie okno (rycina 1.14), które zawiera wiele przydatnych opcji. W okienku Nazwa widoczna jest domyślna drukarkal'. Jeśli podana drukarka jest wła ściwa, wystarczy nacisnąć przycisk OK. Jeżeli plik raportu zawiera wiele tabel i wykresów, może upłynąć parę minut, zanim rozpocznie się drukowanie. Okno Drukowanie zawiera opcje dotyczące
Komenlaru Pllkdany<;tl
Dane
C'lPrCI\lramFlles1SPSs\oSSSJ pOdzblors
Filtr Waga PodZlalnapodzbiory
.
l.JczbaobsBlWaC)IW
Traktowania braków danych
roboc2.Yll1 plikudanych Defmlcjabrakówdanych
1500 Wartośclzdeflnll)W;jn9przez
IJŻIIIkclwmkajalro
braKldanych
są
lraktowanejalrobrakldanych
Utytleobs91W3CJI
Statysti\dcblltzanesąnapodslaWle W$rysll<1chobserwacjlzWilŻnyml
danymi
screcerue
FREOUENCIES VARlAl3LES:age
/ORDER= ANAL.YSIS
ZasoDy
C:zaswy!ronanla
00000,37
nocuszczainaucma obserwacji
RYCINA 1.12.
Część
raportu,
149796
przedstawiająca zawartość
pola uwag.
13 Jeśli korzystasz z drukarki sieciowej, skonsultuj się z prowadzącym ćwiczenia albo z administratorem sieci, czy do wydruku możesz użyć podanej drukarki (przyp. tłum.).
27
28
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Zamykanie SPSS Stan: Typ,
Jeżeli używasz
Gotowe HPLaserJet 1100(MS)
Gdzie: LPT1: Komentarz'
D
Drukuj do pliku
Zakreswydruku---------,
Kopie----------,
O
Liczba kopii:
Ca/'y widoczny raport
€t Zaznaczony fragment
komputera publicznego, na przykład w pracowni komputerowej, grzeczność wymaga, by kończąc pracę, zamknąć SPSS. Kiedy już zakończysz wszystkie analizy, uruchom menu Plik i użyj opcji Zakończ. Po wykonaniu tej operacji SPSS zapyta Cię, czy zapisać plik danych. Jeżeli odpowiesz Tak, do bazy danych zostaną wprowadzone zmiany. Ponadto jeśli aktywny będzie Edytor raportów, to program zapyta Cię, czy zapisać raport. Po wykonaniu wszystkich operacji SPSS zakończy pracę.
ZADANIA Mamy nadzieję, że udało Ci się opanować podstawy SPSS dla Windows. Na zakończenie tej części kursu, proponujemy Ci wykonanie kilku prostych zadań: 1. Uruchom SPSS, wczytaj plik z danymi podanymi przez pro-
RYCINA 1.14. Konfiguracja wydruku raportu.
wadzącego ćwiczenia. Posługując się widokiem Zmienne, dodaj dwie zmienne, a następnie je zdefiniuj. Określ rodzaj skali pomiarowej, rodzaj konstruktu bądź cechy dotyczącej każdej z nich oraz przybierane przez nie wartości. 3. Zanotuj wszelkie trudności, które pojawiły się w trakcie pracy z materiałem zawartym w niniejszym rozdziale i podczas wykonywania zadań, i skonsultuj je ze prowadzącym
2.
wyboru drukarki, stylu wydruku, liczby kopii. Zmiana drukarki jest możliwa, jeśli klikniesz strzałkę znajdującą się po prawej stronie okienka Nazwa. Wybór właściwego urządzenia następuje poprzez pojedyncze kliknięcie na jego nazwę. Opcja Właściwości pozwala na ustawienie różnych opcji drukowania!". Liczbę kopii wydruku ustalasz w odpowiednim oknie. Możesz posłużyć się opcją Drukuj do pliku, jeżeli komputer, na którym właśnie pracujesz, nie jest podłączony do drukarki. Do użytku jest jeszcze opcja Zakres wydruku, przydatna wtedy, gdy chcesz wydrukować wybrane fragmenty raportu. Przed drukowaniem upewnij się, że Edytor raportów jest aktywny. Jeśli pracujesz z głównym oknem programu, na przykład z widokiem Dane, to używanie opcji Drukuj w menu Plik zakończy się próbą albo wydrukiem całej bazy danych! Chodzi tutaj o (przyp. tłum.).
14
określenie,
czy druk ma
być
kolorowy,
czarno-biały
i tym podobne
ćwiczenia.
29
ROZKŁAD CZĘSTOŚCI I STAlYSlYKI OPISOWE
31
Stosowanie procedury "Częstości" Rozdział
2
Rozkłady częstości
i statystyki opisowe
Dostęp do tej procedury uzyskasz po uruchomieniu SPSS i po wykonaniu kroków opisanych w poprzednim rozdziale. Na początku Edytor danych będzie zawierał pusty arkusz. Próba uruchomienia procedur statystycznych przy takim wyglądzie edytora jest jednym z naj częstszych błędów popełnianych przez użytkowników SPSS. Uruchomienie procedury Częstości będzie możliwe dopiero po załadowaniu danych z wybranego pliku. Jeśli chcesz sobie przypomnieć, jak otworzyć zbiór danych, wróć do rozdziału pierwszego. W niniejszej części podręcznika będziemy używali pliku GSS93
podzbiór. sav. CELE ZAJĘĆ 1. Nabycie umiejętności 2. Nabycie umiejętności 3. Nabycie umiejętności 4. Nabycie umiejętności
stosowania procedury Częstości. obliczania miar tendencji centralnej. obliczania miar rozproszenia. odczytywania raportu.
[] GSS93 podzbiór sev - SPS5 Edytor danych
Plik Edycja
Dane
Przekształcenia
Analiza
1
Wykresy
Narzędzia
OPIS statystyczny
Okno
Pomoc
..
Tabele specjalne Porównywanie średnich 1
!2 ' . --31
Opisywane tutaj zadanie będzie Twoim pierwszym doświadczeniem, w którym bezpośrednio i samodzielnie zmierzysz się z SPSS. Nauczyszsię między innymi, jak dokonywać wstępnej analizy danych za pomocą procedury Częstości. Naukowcy często posługują się tą procedurą, zanim przystąpią do testowania hipotez badawczych. Dlaczego to robią? Przede wszystkim po to, by zobaczyć, jak rozkła dają się wyniki badań, jakie wartości przyjmują miary tendencji centralnej i rozproszenia. Wiedza oparta na tych statystykach może Ci pomóc w wyborze sposobu dalszej analizy danych, a także w interpretacji jej wyników. Pierwszym krokiem wstępnej analizy danych jest nadanie wynikom przejrzystej formy. Dzięki temu łatwiej dostrzeżesz prawidło wości występujące w wynikach. W osiągnięcie tego celu pomoże Ci obliczenie statystyk opisowych oraz wykresów dostępnych w procedurze SPSS Częstości.
'Widok
4 5 6 7
~ 9
I. ~~~J r-- 12 13
t::iID
! I
.15 16
I..• ·• ~~j 19 20 21 22
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
RYCINA 2.1. Wybór procedury
1 1 1 2 5 5 1 5 1 2 1 1 1 5 4 1 7 1 1 1 3 2
Częstości.
zcdr
Ogólny model liniowy
5 8 2
Modele mieszane Korelacie Regresja
Analizy logliniowe Klaa:yfikacia
99
Redukcia danych Skalowanie Tesły nieparamełryczne Analizy przeżycia Wieloklotne odpowiedzi Analiza braków danł'ch ...
3 10 11 7 3 4
10
5
o
O
10
1 4
31 24 O
O 3 4
99 3
O O
O
11
98
22
9
3 1
32 24 24 23
1 2 5 O
5 5 5 1 1 1
1 1
3
9 4 6
8
32
ROZKŁAD CZĘSTOŚCI I STA1YS1YKI OPISOWE
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Rycina 2.1 pokazuje menu Analiza ze wszystkimi opcjami służą cymi do analiz statystycznych. Wybierz opcję podmenu Opis statystyczny. SPSS wyświetli zestaw opcji służących do wyliczenia czę stości, statystyk opisowych, eksploracji, tabel krzyżowych i statystyk ilorazowych. Kliknij na Częstości (rycina 2.1). Po wyborze tej opcji SPSS pokaże ekran, na którym będzie widniała, między innymi lista Twoich zmiennych (rycina 2.2). Wybierz zmienną do analizy w lewym okienku. Możesz to zrobić, podświetla jąc ją kursorem i jednokrotnie klikając przycisk myszy. Następnie kliknij na nią dwukrotnie. W naszym przykładzie do wstępnej analizy wybierzemy zmienne Wiek respondenta (age) i Lata nauki szkolnej respondenta (educ). Po przeniesieniu zmiennych z lewego okienka do prawego, okno Częstości powinno wyglądać tak jak na rycinie 2.2. W tym oknie wyświetlane są etykiety zmiennych. Wygląd ten można zmienić tak, aby SPSS wyświetlał wyłącznie nazwę zmiennej. W tym celu wybierz menu Edycja w głównym oknie programu, następnie Opcje, po czym kliknij na zakładkę Ogólne. W jej górnej części znajduje się opcja Listy zmiennych. Jeśli chcesz, by na liście znalazły się jedynie nazwy poszczególnych zmiennych, wybierz Pokaż nazwy. Zmiany tego typu warto skonsultować z prowadzącym ćwiczenia.
Zaznacz polecenie Pokaż tabelę częstości 15 - SPSS wyprodukuje wtedy zestawienie statystyk dla wybranych zmiennych. Jeśli nie chcesz uzyskać takich danych, kliknij na białą kratkę, tak aby czarny znaczek zniknął. Używając opcji Częstości, można uzyskać wiele statystyk opisowych i wykresów. Do tych ostatnich uzyskujemy dostęp poprzez opcję Wykresy. SPSS zawiera zaawansowane narzędzia do graficznej prezentacji danych - w poszukiwaniu szczegółów zajrzyj do następ nego rozdziału. W trakcie wstępnej analizy danych badacze wykorzystują rozmaite zestawienia statystyk opisowych. Niektórzy z nich wolą, aby wartości statystyk były wyświetlane w porządku malejącym, inni zaś 15 W białej tłum.).
kratce powinien
pojawić się
charakterystyczny czarny znaczek (przyp.
tif> Liczba dzieci [child & \@> Miesiąc urodzenia K;i
i>, Znak zodiaku resp ~%l ~:~"j
<'f;> Lat nauki szkolnell~
i> Poziom wyksztatc.~ ;Jj~l
Zmienne:
i> Wiek respondenta [age]
•
F'lec respondenta [:e.,]
&'
',0/
Poziom wyksztatc~:tl
,.~ Poziom wYksztatce~~
.&
~
Rasarespondenta llt~ ~c' Dochódłączny g
~ Pokeż tabele częstości
RYCINA 2.2. Okno Częstości.
- żeby były ułożone od najmniejszej do największej. Aby wybrać jedną z tych dróg, kliknij na klawisz Format w oknie Częstości. W oknie Częstości: Format możesz ograniczyć liczbę kategorii pojawiających się w tabeli częstości - takie postępowanie służy klarowności prezentacji Twoich wyników. Spróbuj poeksperymentować z opcjami w oknie Częstości: Format. Jakie rezultaty udało Ci się osiągnąć?
SPSS może wyliczyć dla Ciebie wiele statystyk - oddzielnie dla każdej zmiennej. Po kliknięciu na klawisz Statystyki, który znajduje się w oknie Częstości, pojawi się kolejne okno Częstości: Statystyki. Ulokowane są w nim zarówno wartości percentyli, miary tenden-
cji centralnej i rozproszenia, jak i innych charakterystyk rozkładu. Uzyskiwane tu statystyki są szczególnie przydatne we wstępnej fazie analizy danych. Każdy użytkownik SPSS powinien rozwinąć nawyk używania Częstości w konfiguracji dostosowanej do własnych potrzeb. Rycina 2.3 pokazuje, które statystyki wybrał przykładowy badacz. Są tam kwartyle, trzy miary tendencji centralnej, skośność i kilka rozmaitych miar rozproszenia. Ćwiczenia zawarte w tym rozdziale możesz wykonywać przy użyciu opcji wskazanych na tej rycinie - oczywiście, jeśli prowadzący ćwiczenia nie zdecyduje inaczej.
33
34
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
ROZKŁAD CZĘSTOŚCI I STATYSTYKI OPISOWE
EJ
CzęstOŚCI- Statystyki Wartości
percentyli-------..,
~ Kwartyle
D
Punkty podziału dla
D
równych grup
l...--....I
L____
j
o Odchylenie standardowe o Wariancja o Błąd standardowy średniej
I Anuluj I Pomoc J Dalej
D Suma D Wartości są środkami grup Rozkład--------,
Rozproszenie
r
~ Mediana ~ Dominanta
OPercentyle:
D
Tendencja centralna ~ Średnia
D D
Minimum
~ Skośność
MakSimum
D Kurtoza
~ Rozstęp
RYCINA 2.3. Okno Częstości: Statystyki. Naciśnięcie klawisza Dalej kończy wybór statystyk i pozwala na powrót do okna Częstości. Upewnij się, czy opcja Pokaź tabelę czę stości jest zaznaczona. Następnie kliknij OK. Po zakończeniu obliczeń w oknie statusu powinna pojawić się informacja, że procesor SPSS jest gotowy - w tym momencie wyniki Twojej wstępnej analizy danych znajdują się w oknie raportu.
ZADANIA i drukować raport będący wynikiem użycia Częstości. Wykonaj teraz następujące ćwiczenia: 1. Otwórz plik z bazą danych i użyj procedury Częstości. Przyjrzyj się informacjom zawartym w oknie raportu. Zwróć szczególną uwagę na tabelę częstości i jej relację z miarami tendencji centralnej, rozproszenia i z kształtem rozkładu. 2. Sporządź krótki raport pisemny, którego tematem będzie charakterystyka uzyskanych wyników. Opisz każdą ze zmien-
Wiesz
już
jak
przeglądać
nych, które zawiera Twój raport. Możesz wypunktować najważniejsze informacje. Nie ograniczaj się do przepisania danych zawartych w wydruku, opisz także wnioski, które Ci się nasuwają. Spróbuj odpowiedzieć na takie pytania jak:: "Dlaczego średnia danej zmiennej przyjmuje wartość 40,41?" czy też "Dlaczego mediana zmiennej jest większa od jej śred niej?" Odpowiedź na pytania tego typu wymaga szczegóło wego przyjrzenia się kształtom rozkładów a także miarom tendencji centralnej oraz rozproszenia. Przy wykonywaniu tego zadania przydatna może być rycina 1.11, pokazująca raport po przeprowadzeniu procedury Częstości.
35
GRAFICZNA PREZENTACJA DANYCH
37
1165593 podzbiór.eev - 5P55 Edytor danych Phk.
Edycja
Widok
Dane
Przekeatełcenie
Analiza
Wykresy
Narzędzia
Okno
Pomoc
OCZę.lolic;
Rozdział 3
~1~-c=r~"~~jT~~~~;; 3 2 2' 4 1i 2 2
Graficzna prezentacja danych el Pckeatabele częstoser
~ 11 12
"Ul ,~ -~2.41
CELE ZAJĘĆ 1. Przygotowanie wykresów za pomocą opcji Wykresy w oknie Częstości. 2. Drukowanie wykresów. 3. Interpretacja wykresów.
15 16
fi 18 19
'2Ó 21 22
W tym rozdziale omowimy tworzenie i interpretację wykresów. Proponowane tu ćwiczenia nie powinny sprawić Ci większych trudności. Zaczniemy od miejsca, w którym zakończyliśmy pracę w rozdziale 2.
Przygotowanie wykresów Zanim przejdziesz do tworzenia wykresów, pamiętaj, aby wybrać taki typ wykresu, który jest dostosowany do charakteru skali pomiarowej. Słupki służą do wizualizacji danych na skali nominalnej. Histogramów zaś używa się do opisu danych zmierzonych na skalach interwałowej i ilorazowej, szczególnie gdy mamy do czynienia ze zmiennymi o charakterze ciągłym. Aby uzyskać wykres, należy wykonać następujące kroki: Analiza> Statystyki opisowe> Częstości> Wykresy. Otwieranie tej ostatniej opcji zostało opisane w rozdziale 2. Po naciśnięciu klawisza -rc-z__ 1_..
c rvc c ~_L_':' ........... 1..._ _ rt_,.. ....,.,..,!~;. lVl",.l,N".ł'U""" ('ł"Ur1"~ '::t 1 \
()'lrnn
I Statystyki I~
10 11 12 13 14 15 16 17 18 19 20 21 22
2 1 1 1 5 4 1 7 1 1 1 3 2
5 5 5 1 4 -5 5 5 1 1 1 1 1
1 O O O O 2 2
43 43 45 78 83 55
x Typwyk,esów-----, ~
o Brak
O Wykresy O Wykresy
I Anulul J
słupkowe
kołowe
~
@ Histogramy ~ Z krzywą normalną
24 23
5 O
2 3
5
448
36 44
2 99 10 3 10 11 7 3 4 10 99 3 3 11 3 1 9 4 6 8
RYCINA 3.1. Okno Częstości: Wykresy.
to pozwala na wybór kilku rodzajów wykresów: słupkowego, koło wego i histogramu. Jeśli klikniesz teraz na opcję Wykres słupkowy lub na opcję Wykres kołowy, będziesz mógł wybrać pomiędzy wykresem prezentującym częstości a wykresem prezentującym dane procentowe. Jeżeli natomiast klikniesz na opcję Histogram, będziesz mógł zdecydować, czy chcesz, by na wykresie pojawiła się krzywa rozkładu normalnego. Wyboru takiego dokonasz, klikając na opcję Z krzywą normalną. Użyj
klawisza Dalej, aby zakończyć budowanie wykresów. SPSS powróci teraz do okna Częstości. Naciśnij OK. Na ekranie powinno się pojawić okno raportu. Kliknięcie na etykietę Histogram, w lewym panelu Edytora raportów, spowoduje podświetlenie utworzonego histogramu. Wynik tej czynności przedstawia rycina 3.2. Teśli wybierzesz wiecei niż iedna zmienna.
38
r ,
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
-
-
!oRapcrt @CJ:O'$latcl(FREQlA:NOES)
~
GRAFICZNA PREZENTACJA DANYCH
.
Wiek respondenta
"I~~
~Sl~1a
.a:Jj-
Eksport do p l i k u - - - - - - - - - - - - - - = = = = : . ,
300,-----------,
14Woekrespoodertll
Plik-
200
.
J
Lt2ii~_am_FI~es\S_PS_S_\O_UT_P':':"
Eksportuj---------,
Format eksportu-----..,
G Wszystkie wykresy
Typ pliku
O Widoczne wykresy
~_Mall
o Wybrane wykresy
La
100 Odch Sld = 17.42 Średnia = 46,2 N = 1495,00
o 21,3 36,3 51,3 66,3 81.3 28,8 43,8 58,8 73,8 88,8
RYCINA 3.3. Okno eksportu raportu
Wiek respondenta
ra powinno RYCINA 3.2. Histogram w oknie Edytora raportów.
to w lewym panelu edytora znajdzie się więcej wykresów do zaznaczenia. W wypadku histogramów SPSS dodaje do wykresu kilka statystyk, takich jak odchylenie standardowe, średnia i liczba obserwacji. Wybór opcji Z krzywą. normalną. powinien spowodować pojawienie się odpowiednio dopasowanej linii. Wybierając zmienne opisane na skali ciągłej, zwróć szczególną uwagę na to, jak histogram jest dopasowany do krzywej normalnej. Rzuć okiem na rycinę 3.2. Widać tam wyraźnie, że rozkład wybranej zmiennej jest skośny dodatnio i niedopasowany do krzywej normalnej. Twoim ostatnim zadaniem w tym rozdziale będzie wydrukowanie wykresu. Uczynisz to metodą opisaną w rozdziale 1. SPSS pozwala Ci także na wyeksportowanie wykresu, tak aby możliwe było odczytanie go w innym programie. W tym celu wejdź do menu Plik, a następnie wybierz opcję Eksportuj. Na ekranie Twojego kompute-
się pojawić takie
okno, jak na rycinie 3.3. Uruchom op-
cję Wykresy w okienku Eksportuj. Za pomocą klawisza możesz też określić wielkość uzyskanego eksportu. W tym celu w oknie Rozmiar eksportowanego wykresu zaznacz żądaną wielkość. Od wyboru opcji drukowania może upłynąć kilka lub kilkanaście sekund, zanim rozpocznie się drukowanie. Wykresy zajmują
dużo pamięci, dlatego też przygotowanie do ich wydrukowania zabiera trochę czasu.
ZADANIA Sądzimy, że przygotowaliśmy Cię do tworzenia wykresów. Uzupełnij swą dotychczasową wiedzę, wykonując kilka dodatko-
wych zadań (przy użyciu zbioru GSS93 podzbiór.sav): 1. Wybierz przynajmniej jedną zmienną do utworzenia wykresu. 2. Wydrukuj raport. 3. Korzystając z wydruku, opisz w krótkim raporcie uzyskane informacje, przede wszystkim kształt rozkładu, skośność a także ich relacje do miar tendencji centralnej. Uwzględnij też dane dotyczące rozproszenia. o
'
39
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB
NIEZALEŻNYCH
mogłoby brzmieć:
Rozdział
4
Testowanie hipotez badawczych dla dwóch prób niezależnych
CELE ZAJĘĆ 1. Nabycie umiejętności formułowania hipotez badawczych, dotyczących różnic pomiędzy dwiema niezależnymi populacjami. 2. Opanowanie procedury Test t dla prób niezależnych w celu weryfikacji hipotez badawczych. 3. Wykształcenie zdolności podsumowywania rezultatów analizy na podstawie raportu.
Większość hipotez badawczych głosi, że dwie populacje różnią się między sobą, Przetestowanie tego typu twierdzeń staje się możli we, gdy zostanie wybrana właściwa procedura statystyczna. W tym rozdziale nauczysz się, w jaki sposób porównywać pomiary pochodzące z dwóch różnych populacji przy użyciu testu t dla prób nie-
zależnych.
Przed przystąpieniem do testu należy podjąć decyzję, co ma być przedmiotem porównania. W podjęciu takiej decyzji pomocne bę dzie sformułowanie pytania badawczego. Pytanie takie powinno precyzyjnie wyrażać to, czego mianowicie chciałbyś się dowiedzieć na podstawie dokonywanych porównań. Załóżmy, że interesuje Cię porównanie kobiet i mężczyzn pod względem wieku zawarcia związku małżeńskiego. W takim wypadku Twoje pytanie badawcze
"Czy kobiety i mężczyźni różnią się wiekiem w momencie zawierania małżeństwa?" W zależności od tego, jak zostanie sformułowane pytanie badawcze, wybiera się odpowiednią procedurę statystyczną. W naszym przykładzie pytanie badawcze sprowadza się do porównania kobiet z mężczyznami pod względem wieku zawarcia pierwszego małżeństwa. Twoim zadaniem będzie zatem wykonanie testu t dla prób niezależnych. Chcąc odpowiedzieć na postawione pytanie badawcze, musisz sformułować hipotezę, którą można będzie zweryfikować za pomocą testu t dla prób niezależnych (więcej na temat testowania hipotez znajdziesz w podręczniku do statystyki). Gdy hipoteza będzie już gotowa, przejdź do jej testowania przy użyciu procedury statystycznej omawianej w niniejszym rozdziale. Do analizy użyj danych o wieku kobiet i mężczyzn w momencie zawarcia pierwszego małżeństwa. Informacje pochodzą z Generalnego Sondażu Społecznego, przeprowadzonego w roku 1993 (plik GSS93 podzbiór.sav).
Stosowanie procedury "Test t dla prób niezależnych" Najpierw wczytaj plik z danymi. W celu wykonania Testu t dla prób niezależnych użyj menu Analiza - w taki sposób, jak pokazuje rycina 4.1. Następnie kliknij na podmenu Porównywanie średnic~. Wyświetli się wówczas wiele dodatkowych opcji, takich jak: Srednie, Test t dla jednej próby, Test t dla prób niezależnych, Test t dla prób zależnych, jednoczynnikowa ANOVA. Wybierz opcję Test t dla prób niezależnych poprzez użycie lewego klawisza myszy (Analiza> Porównywanie średnich> Test t dla prób niezależnych).
Wybór zmiennych Po wyborze opcji Test t dla prób niezależnych w SPSS pojawi się okno zawierające listę zmiennych zawartych w pliku danych. Twoim zadaniem będzie wybranie dwóch rodzajów zmiennych: 1) zmiennej albo zmiennych testowanych (zmiennej albo zmiennych zależnych);
41
42
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
NIEZALEŻNYCH 43
-:J GSS93 podzbiór sev - SPSS Edytor danych Edycja
Plik
Widok
Dane
Przekształcenia
:~lg=r41 ~ l;)fr-:<] ~ Ikl C? I ~ 8 1116_.....wrkstet ~
'cc-T-;d
'---------.il ~
q
~ ~
q
~ ~
---.l!J
c=:J] ---.l1I ~
3--=---.!2J 16
~
g g
22
r
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 161 17 18 19 20 21 22
-
. JP wrkslat
,
1 1 1 2 5 5 1 5 1 2 1 1 1 5 4 11 7 1 1 1 3 2
• •
Raporty warstwowe
Opis: statystyczny
., ,
mantalt
Narzędzia
Analiza Wykresy
.,
Ogólny model liniowy Korelacie Regresia Klasyfikacja
Redukcja danych
Skalowanie nieparamełryczne
Analizy przeżycia Wielokrotne odpowiedzi
O O O 31 24 O O O 22 32 24 24 23
.1
Srednie... Test t dla jednej próby...
•·1
Test t dla prób zależnych ... JednocZ}fnnikowa ANOVA...
• • • • • • •
Analizy logliniowe
5 5 5 1 4 5. 5 5 1 1 1 1 1
Pomoc
zodl
.iMMiflm··,i1ł&"HH1lH:
Modele mie:szane
Tesły
Okno
1 1 O O 3 4 O 98 9 1 2 5 O
RYCINA 4.1. Uruchamianie procedury Test t dla prób
U
4~
L
O O 2 2 2 2 O O O 1 4 3 1 4 O 1 2 2 3
45 78 83 55 75 31 54 29 23 61 63 33 36 39 55 55 34 36 44
99 10 3 10 11 7 3 4 10 99 3 3 11 3 1 9 4 6 8
niezależnych.
2) zmiennej grupującej (zmienna niezależna). Zmienną testowaną jest ta zmienna, przy której użyciu chcesz sprawdzać postawioną hipotezę. Zmienna grupująca określa, na podstawie jakiej własności zamierzasz utworzyć porównywane grupy. W tym rozdziale Twoim zadaniem jest porównanie wieku, w jakim kobiety i mężczyźni zawierają pierwsze małżeństwo. Aby wykonać to zadanie, z listy zmiennych wybierz Płeć respondenta (sex) i uczyń ją zmienną grupującą (zob. rycina 4.2), a Wiek zawarcia małżeństwa (pierwszego) (agewed) - zmienną testowaną. Skorzystaj z treści przedstawionych w niniejszym rozdziale i wykonaj kolejne zadanie, w którym wybierzesz własne zmienne do analizy (chyba że ich wyboru dokona prowadzący ćwiczenia). Zwróć szczególną uwagę na to, na jakiego typu skali została zmierzona każ da ze zmiennych. Zmienna testowana powinna być zmierzona na
(~ Stan cywilny [marit' .... <%> Liczba breci i sióstrr <%> Liczba dzieci [chiid. s » : <@Wiek respondenta %~il /.}.. Miesiąc urodzenia
f.••
Zmienne testowane:
<%> Wiek zawarcia mełżeństwe I !
l
i
;m
W
!
"#"; Znak zodiaku resP'~I'~ <%> Lat nauki szkolnell;t~ •
•
/#"; Poziom wyksztai'cEI "~ Poziom wyksztai'cE/~~
~ Poziom WYksztai'ce~~i;W!ff "~ <@ Rasa respondenta
CM....
• "",!::\,"'""',J" ....::,~.A...~,~..'-"""""_~
Zmienna grupująca:
Definiuj grupy...
[ Opcje...
J
.
RYCINA 4.2. Wybór zmiennych do testowania i grupowania.
skali interwałowej albo ilorazowej (w naszym przykładzie wiek w latach jest zmienną na skali interwałowej). Gdyby Twoja zmienna zależna została zmieniona na skali nominalnej lub porządkowej, test t dla prób niezależnych nie byłby testem właściwym. Następnie, po ustaleniu zmiennej grupującej, SPSS zapyta Cię, jakie grupy (o jakich kodach) chcesz porównać - wskażą to dwa znaki zapytania. Dopełnij przygotowanie analizy przy użyciu polecenia Definiuj grupy - dzięki niemu określisz, które grupy zostaną porównane (zob. rycina 4.3). W roboczym pliku zmienna Płeć jest zdefiniowana w sposób następujący: ,,1" dla ,,Mężczyzna" i ,,2" dla "Kobieta". Rycina 4.3 pokazuje, że grupę pierwszą tworzą osoby z kodem ,,1", a drugą - z kodem ,,2". Po zdefiniowaniu grup kliknij Dalej - w ten sposób powrócisz do ekranu przypominającego rycinę 4.2. Po wybraniu zmiennych do analizy naciśnij OK, aby wykonać test t dla prób niezależnych. W oknie Edytor raportów SPSS pokaże wyniki analizy. Aby je wydrukować, użyj menu Plik kiedy okno raportu będzie aktywne (drukowanie raportów opisano w rozdziale pierwszym).
44
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB NIEZALEŻNYCH
lIJGSS93 podzbiór .•av . SPSS Edytor danych Plik. Edycja
Widok
Dane
Przeksztetceme
Analiza
Wykres\'
Narzędzia
Okno
Pik
Pomoc
,"""
\ó....
"'....
F_ot
-
I ~~~ -. -. --l
2 2 2 O
I:J
Delimui grupy
12 13 14 15 16
17
1 1 5 4 1 7
18 19
1
20
1 3 2
21 22
UZYI określonych weteser
Grupa 1 Grupa 2
I~
OEJ
r
Pomoc
43 44 43
..
r"
grvp Tesldl8próbnleu
O Punktpodziału
1
32 24 24 23
1
1
2
2 2 3
5 O
i i statys1yk1dla grup
45' Wlekzawarcla
78
malżeńs!\ova(plerwszego)
83
Plećresondental I
Średnia
N
Mężczyzna
492
Kobieta
710
34
36 44
RYCINA 4.3. Definiowanie grup.
Interpretacja wydruku Nasz przykład służy przede wszystkim temu, aby pokazać, w jaki sposób należy interpretować wyniki analizy z zastosowaniem testu t dla prób niezależnych. Interpretacja odbywa się dwuetapowo. Pierwszy etap polega na ocenie homogeniczności wariancji wabu populacjach. Test t dla prób niezależnych oparty jest na kilku zało żeniach dotyczących porównywanych populacji. Standardowa wersja tego testu zakłada, że wariancja jest taka sama w obu populacjach. Procedura Test t dla prób niezależnych sprawdza to założe nie za pomocą Testu Leuene'a jednorodności wariancji (zob. rycina 4.4). Test ten bazuje na statystyce F, którą poznasz w dalszej części tej książki. SPSS oblicza zarówno wartość statystyki F, jak
oecnaeme standardowe
I
~::~~ I
~~:~: I
8~d
I
standardowy średnie
ii
:~~~ I
I
i
Test dl<JprobnlezaleZflYCh
reeneene'e
!
Jednorodności
wariant l
TesllrÓW!loSCiSrednlcn
29
36 39 55 55
I
I
55 75 31 54
..
rsrcmcse
Islot F Wiekzawarcia
zercacn
małUńslWa
o
lplerwszego)
rowność
wariancji
33
I
rI
Test T (T-TEST)
steIłysI\'Id dkl
61 63
i~
- . __._---_._.,,---,~
._'-'-'---~-.
-;00 ~ )I
23
€:
__
.._ -_.
Okno p -
"~~~.mT(T.TEST) Uw"
1
Narzędzia
~~!!l~fI!!l(leHil~~!Il1
[iliJ i l l g:jJ
O O O O 2
....,. "'......
,342
(dwus\lO
M'
Błąd
Rozntca
standardcw
95% przedZllilUfnoscl dlaroznl średnich Dolna
Gama
ramca
granica
ność
I
dl
,559
8,066
1200
,000
2,32
,288
1,756
2,885
8,085
1065
,000
2,32
,287
1,757
2,883
!;rednlch
yrćinłcy
N"
aetozonc rownośc
,
wariancji
.
\ "',d ~
,'
RYCINA 4.4. Wyniki analizy przy użyciu procedury Test t dla prób niezależnych.
i odpowiadający tej wielkości poziom prawdopodobieństwa (p). Wartość p wskazuje, jakie jest prawdopodobieństwo popełnienia błędu pierwszego rodzaju (czasami wartość tę określamy jako uzyskany poziom alfa). W przypadku testu Levene'a wartość p pozwala na ocenę, czy porównywane populacje mają taką samą wariancję. Jeżeli wartość p jest mniejsza od 0,05 (p < 0,05), to, musimy przyjąć, że populacje mają różne wariancje. Natomiast jeśli wartość p jest większa od 0,05 (p > 0,05), to założenie o równości wariancji da się utrzymać. Dopiero po zakończeniu pierwszego etapu interpretacji wyników możemy przystąpić do właściwej weryfikacji naszej hipotezy badawczej. Robimy to, opierając się na wynikach testu t dla prób niezależnych. Wyniki testu t można znaleźć w oknie raportu (zob. rycina 4.4), w tabeli z nagłówkiem Test t równości średnich. Tabela ta zawiera dwa wiersze wyników.
45
46
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB NIEZALEŻNYCH
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
Wyniki umieszczone w pierwszym wierszu dotyczą sytuacji, gdy można założyć, że porównywane populacje nie różnią się pod wzglę dem wariancji (Założono równość wariancji). Natomiast wyniki umieszczone w drugim dotyczą sytuacji gdy takiego założenia przyjąć nie można (Nie założono równości wariancji). Jeżeli wartość testu Levene'a wskazuje, że wariancje nie różnią sie istotnie (P > 0,05), to należy oprzeć się na wynikach testu t, umieszczonych w pierwszym wierszu. Jeśli zaś wartość testu Levene'a wskazuje, że wariancje są istotnie różne (P < 0,05), to należy oprzeć się na wynikach umieszczonych w wierszu drugim. Wyniki umieszczone w wierszu drugim zawierają poprawkę uwzględniająca niespełnienie założenia o równości wariancji. W przykładzie przedstawionym na rycinie 4.4 wartość testu Levene'a i wielkość p wskazują, że wariancje w grupach są podobne (nie różnią się istotnie). Należy zatem interpretować wyniki znajdujące się w wierszu o nazwie Założono równość wariancji. Po określeniu tego, który wiersz należy czytać, można przystąpić do interpretacji wyników testu t. SPSS oblicza wynik tego testu, pokazując jednocześnie wartość p dla tej statystyki. Poziom p (dwustronny) pozwala ocenić prawdopodobieństwo popełnienia błędu pierwszego rodzaju. Jeśli wartość p jest mniejsza niż założony poziom alfa (przyjmuje się zwykle p = 0,05; lub P = 0,01)16, powinno nas to skłonić do odrzucenia hipotezy zerowej a wiec do uznania, że porównywane populacje (mężczyźni i kobiety) różnią się od siebie w zakresie średniego poziomu zmiennej zależnej. Gdyby natomiast uzyskana wartość p okazała się wyższa niż założony poziom alfa, odrzucenie hipotezy zerowej nie byłoby możliwe. Znaczyłoby to, że brak jest wystarczających podstaw do stwierdzenia, że porównywane populacje różnią się od siebie w zakresie średniej wartości zmiennej zależnej. Nie oznacza to jednak, że bylibyśmy upoważnie ni do stwierdzenia, że są one takie same. 16 Warto zwrócić uwagę, że jeżeli podajemy założony poziom prawdopodobieństwa (alfa), to po znaku p piszemy ,,=". Natomiast jeśli podajemy uzyskaną wartość p, to zwykle używamy znaku nierówności, na przykład p < 0,05, p < Ó,Ol lub p < 0,001 (przyp. tłum).
SPSS wskazuje, że poziom p jest mniejszy niż założony (czyli alfa = 0,05). Można zatem stwierdzić, że różni ca między kobietami a mężczyznami pod względem wieku w momencie zawierania pierwszego małżeństwa jest istotna statystycznie. Dochodząc do takiego wniosku, odrzucasz jednocześnie hipotezę zerową o braku różnic między tymi grupami. Wartości średnich'? wskazują, że mężczyźni później niż kobiety zawierają swoje pierwsze małżeństwo. Jeśli poziom prawdopodobieństwa (p) jest niższy niż 0,001, to SPSS podaje wartość ,,0,000". Przy pisaniu raportu wartość ta powinna być przedstawiona jako p < 0,001. W naszym
przykładzie
ZADANIA Sądzimy, że
potrafisz już testować hipotezy badawcze przy uży ciu procedury Test t dla prób niezależnych. Naukę na podstawie tego rozdziału zakończ, wykonując następujące ćwiczenie: 1. Sformułuj pytanie badawcze odnoszące się do relacji między dwiema zmiennymi. 2. Sformułuj hipotezę, której weryfikacja wymaga porównania dwóch prób niezależnych. 3. Zweryfikuj swoją hipotezę używając testu t dla prób niezależ nych. 4. Sformułuj jedno-dwuzdaniową konkluzję opisując wyniki w terminach zmiennej niezależnej i zmiennej zależnej.
17
Można
je znaleźć w tabeli Statystyki dla grup (przyp. tłum.).
47
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB ZALEŻNYCH
Rozdział
5
Testowanie hipotez badawczych dla dwóch prób zależnych
CELE ZAJĘĆ 1. Nabycie umiejętności formułowania pytań odnoszących się do różnic między dwiema zależnymi populacjami. 2. Nabycie umiejętności formułowania hipotez na podstawie pytań badawczych. 3. Opanowanie procedury Test t dla prób zależnych. 4. Nabycie umiejętności podsumowywania wyników analizy na podstawie raportu.
Procedura Test t dla prób zależnych służy do oszacowania, czy śred nie pochodzące z dwóch powiązanych ze sobą populacji różnią się między sobą. Rodzaj populacji i sposób jej dobierania zależy od postawionego pytania badawczego. Często badacze formułują pytania o następującej strukturze: "Czy uczestnicy badania po otrzymaniu określonego oddziaływania eksperymentalnego będą zachowywali się inaczej niż przed poddaniem ich oddziaływaniu?" Pytanie tego typu zakłada, że wystąpi powtórzony pomiar pewnej zmiennej. Taki schemat badania określa się mianem metody powtarzanych pomiarów lub test/retest.
Pytanie badawcze i plan badania Plan badania w układzie z powtarzanym pomiarem Przykładowe pytanie badawcze brzmi: "Czy lek stymulujący pamięć będzie wpływał na zdolność osób cierpiących na chorobę Alzheimera
do zapamiętania słów z listy?" Przed rozpoczęciem kuracji badamy u każdego pacjenta poziom zapamiętywania słów z listy. Ponowne badanie pamięci przeprowadzamy po zakończeniu kuracji. W teście t dla prób zależnych porównujemy wynik każdego pacjenta przed kuracją i po niej. Plan badania grup
niezależnych
z doborem parami
w układzie z powtarzanym pomiarem Opisywany tutaj test t może zostać użyty także wtedy, gdy w badaniu występują dwie niezależne grupy, przy czym osoby badane zostały dobrane do grup w taki sposób, by zapewnić, że grupy nie róż niły się od siebie w punkcie wyjścia. Mamy tu do czynienia z planem badawczym wykorzystującym dobór parami. W pierwszej fazie realizacji takiego planu należy utworzyć dwie niezależne grupy, tak aby były one jak najbardziej podobne ze względu na jakąś zmienną pozostającą w bliskim związku z naszą zmienną zależną. Postępo wanie to ma na celu zapewnienie równoważności grup w punkcie wyjścia. Przykładem może tu być badanie, w którym starano się odpowiedzieć na pytanie, czy grupa studentów, która weźmie udział w kursie przygotowawczym, wypadnie lepiej w teście zdolności akademickich (GRA) niż druga grupa, niebiorąca udziału w takim kursie. Jeśli tuż przed rozpoczęciem badania, przez przypadek, jedna z grup będzie o wiele słabsza pod względem zdolności akademickich, to wynik badania będzie obciążony błędem. Aby się przed tym ustrzec, badacz w pierwszej fazie badania ranguje wszystkie osoby badane pod względem średniej ocen uzyskanych w trakcie studiów. I tak, dwie osoby o najwyższej średniej ocen zostają następnie losowo przydzielone do grup: jedna do grupy eksperymentalnej (kurs przygotowawczy), a druga do grupy kontrolnej (brak kursu przygotowawczego). Podobnie postępujemy z kolejnymi parami złożony mi z osób badanych o zbliżonych rangach. Postępowanie to zapewni znaczny stopień podobieństwa między grupami w zakresie umiejętności akademickich (mierzonych na podstawie średnich ocen) w punkcie wyjścia. Następnie członkowie jednej z tak utworzonych grup (grupa eksperymentalna) biorą udział w kursie przygotowawczym, natomiast
49
5O
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB ZALEŻNYCH
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
członkowie pozostałej
grupy (grupa kontrolna) nie biorą udziału w żadnym kursie. Wreszcie, członkowie obu grup zostają poddani testowi zdolności akademickich (GRA). Analiza danych opiera się na porównaniach wyników uzyskanych w teście zdolności akademickich przez osoby należące do kolejnych par, dobranych ze wzglę du na średnie ocen. W takiej analizie używa się testu t dla prób zależnych, traktując przy tym wyniki testu zdolności akademickich (GRA), uzyskane przez członków danej pary, w taki sposób, jak gdyby pochodziły one od jednej i tej samej osoby.
pamięci
dwukrotnie. Dane dla obu pomiarów zakodowane są pod odrębnymi nazwami. Pokazane jest to na rycinie 5.2 - wyniki pomiaru pamięci przeprowadzonego przed zastosowaniem leku znajdują się w kolumnie oznaczonej przed, a wyniki pomiaru pamięci przeprowadzonego po zakończeniu kuracji - w kolumnie oznaczonej po. Kliknij pierwszą nazwę, a następnie drugą. Następnie za pomocą strzałki przenieś to zestawienie do okna Pary zmiennych. Uruchom procedurę, naciskając OK.
Interpretacja raportu z analizy Hipotezy badawcze Hipoteza zerowa może przybrać dwie formy. Pierwsza mówi o tym, że średnie w grupach eksperymentalnej i kontrolnej nie różnią się między sobą (test obustronny). Druga wskazuje, że średnie różnią się w taki sposób, że jedna jest większa albo mniejsza od drugiej (test jednostronny). Jeżeli zaistnieją empiryczne podstawy do odrzucenia hipotezy zerowej, znaczy to, że mamy odpowiednie podparcie dla hipotezy alternatywnej. W teście t dla prób zależnych pomiar zmiennej zależnej musi być dokonany na skali interwałowej albo ilorazowej. Do przedstawiania omawianej procedury użyjemy zbioru dotyczącego oddziaływania farmakologicznego na osoby z chorobą Alzheimera (tabela 1 w Dodatku). Zmienną niezależną jest to, czy pacjent jest jeszcze przed kuracją, czy już po niej. Zmienną zależną natomiast jest liczba zapamiętanych słów.
Stosowanie procedury "Porównanie średnich: test t dla dwóch prób zależnych" od menu Analiza, następnie kliknij na Porównywanie średnich i przejdź do Test t dla prób zależnych (Analiza> Porównywanie średnich> Test t dla prób zależnych). Sposób uruchamiania testu ilustruje rycina 5.l. Po wybraniu wskazanej opcji SPSS pokaże Ci okno zawierające listę zmiennych tworzących Twoją bazę danych. Zmienna grupują ca nie jest tutaj potrzebna, ponieważ każdy pacjent przeszedł test Zacznij
pracę
Dane z analizy zostaną przedstawione w raporcie (rycina 5.3). Dwie tabele zawierają statystyki opisowe dla obu pomiarów. Z pierwszej odczytasz średnią, odchylenie standardowe oraz błąd standardowy średniej, a druga zatytułowana Korelacja dla prób zależnych, zawiera współczynnik korelacji pomiędzy obu pomiarami, a także istotność korelacji. Warto zwrócić uwagę na istotność korelacji. Jeśli byłaby ona nieistotna (p> 0,05), to można by mieć wątpliwości co do celowości zastosowania użytego tu schematu badawczego. Korelacja przedstawiona w naszym przykładzie jest relatywnie wysoka (r = 0,82) oraz istotna (p < 0,001; w poprzednim rozdziale wspomniano, że SPSS podaje poziom istotności jedynie z uwzględnieniem trzech miejsc po przecinku - wszystko poniżej 0,001 podawane jest jako ,,0,000"). Tabela Test dla prób zależnych zawiera porównania dwóch śred nich. Jej najważniejsze części to komórka dla testu t, liczba stopni swobody (df)18 oraz poziom istotności statystyki t (Istotność dwustronna). Statystyki te pozwalają na testowanie hipotezy zerowej. W naszym przykładzie t(39) = -2,29 - wartość ta jest ujemna, ponieważ średnia z pierwszego pomiaru pamięci jest mniejsza od śred niej z drugiego pomiaru. Liczba stopni swobody równa się liczbie par poszczególnych wyników w testach pamięci minus jeden (df = 40 - 1 = 39). Dwustronny poziom istotności dostarcza informacji początkowe
18 Skrót pochodzi od wyrażenia degrees af freedom, co w stopni swobody (przyp. tłum.).
tłumaczeniu
oznacza
liczbę
51
52
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB ZALEŻNYCH
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS elzheimer sav
Plik
Edycia
Plik EdJcia W"Jdok Wstaw
S PS S Edptor danych
Widok
Dane
Przekształcenia t.. .~~aliza'"~ ..~ykre~~."_~~~~,~~a
W1 ~ ~~ ~ ~ ~A ą I·" r~ lilii Ik t? I"" [~~..~_:.~.~~.~ ~
-
r~~I;(~c_[
L..-.2J ~
~
:~41
.. 61 ~
5 6
~ ~
7 8
~~
.·~~~·I
1 2 3 4
~
~9 : 10 10 O] 11 ! ~~12J 12 CEl 13
L:...El
§
~
14 15
17
16 17
I ~~... ~:I
~~
r·· .201
20
i
I ...
...
retest
21 18 29 42 21 37 23 15 29 35 18 37 23 18 23 42 21 28 15 18
li! , ' _ emu In:; Ei,jjii'+rtttaM l '-1 Raporty warstwowe Opis statystyczny
::::"~-ł
23 11 29 34 14 38 24 21 24 41 21 33 19 20 31 42 22 40 26 12
~
I i I,
I I
I
Ogól"y model liniowy
..I
Korelecle
..
Regresja
.,:
Klasyfikacja Redukcja danych
Skalowanie Tesł}' nieparamełJyczne Analizy przeżycia Wielokrotne odpowiedzi
Pomoc
,
Modele mieszane
Analizy logliniowe
Okno
l-M"lm"iih'4+
, ,
•
I~~ st
'ff
!lty stylo;l tl1tIpro b Zale±nyCh
Pomoc
.; St~dl,)próbZ
"Ci",·••
QljKorel$CJe,*,pr6bzlIleznYCh Błąd
e srecma
Jednoczynnikowa ANOVA...
Para 1
, , , ,
Paml!;!cprzedpotl301em
Odchylenie standardowe
N
slandardO'WY
sreomer
leku
26,98
40
8,931
1,412
Pamlęc po podanlllleku
28,98
40
9,437
1,492
KO'eltlcledlaprobzależnych
eere
,
1
KorelatJa
N Pam1ećprzedpodanlem leku &?amlęt po
40
puaamuleku
Istotność
,820
,000
Testdlaprobzalezllych
RÓZnlcewprobachzale
ot Para
1
Pamięć
T~D1lt!;lawn~l;/l1IlusWldoczne
Odchylenie
Średnia
standardowe
po pouanru
-2,00
5,514
dla rotnlty
!sloJno
sreomcn
stanclardowr sredma
przed
podamemlelruPanuęć
..
oh 95% przedZIał urncśn
Błąd
ara
Dolna
śe
ranlca
Górna gl'
-3,7T
-,23
t -2,2S0
(:~:)tr
df
as
,028
leklJ
Ff:spss PrOe~r
golow
<'
i
"'~ ~jf iHlsf\v 544-pkl
RYCJNAS.3.
RYCINAS.1. Wybór testu t dla prób
....". Wpkr8q NarzodZla Okno
-,1:,,',
Średnie ... T eet t dla jednej próby... Teet t dla prób niezależnych...
x
_ B FOfmal:
~!!I.!!łJ@]]j!iI'''IC?I~~CIJI flli] [fr] i@CI~ TestTI --~:~stT(T-TEST)
Raport Z wynikiem badania pamięci osób chorych na Alzheimera.
zależnych.
lEI
T est I dla prób zależnych
'%> Kod pacjenta [Id]
(i> Pamięć przed podanie\ '%> Pemięć po podaniu le~
Aktualny wybór Zmienna 1. Zmienna 2:
RYCINAS.2. Wybór pary zmiennych.
Pary zmiennych'
rzed --
II)
o prawdopodobieństwie popełnienia błędu (błąd pierwszego stopnia), kiedy chcesz orzec, że różnica między średnimi jest istotna. Podczas oceny tego, czy taka różnica występuje, posługujemy się odpowiednimi kryteriami (przyjmujemy, że p = 0,05 albo p = 0,01), zwracając uwagę na poziom istotności dla konkretnego wyniku w teście t. Jeśli uzyskana wartość p jest mniejsza od założonej, to masz podstawy do odrzucenia hipotezy zerowej o braku różnic mię dzy średnimi i możesz wnioskować, że średnie dla tych pomiarów istotnie się różnią. W naszym przykładowym badaniu przyjęto, że alfa = 0,05, i testowano hipotezę dwustronną. Uzyskana istotność dla testu dwustronnego (p = 0,029) była mniejsza niż wartość kryterium. Jeśli postawilibyśmy hipotezę kierunkową (z góry wykluczając możli wość pogorszenia się pamięci pod wpływem terapii), to należałoby podzielić uzyskany poziom istotności przez dwa (0,028: 2 = 0,014),
53
54
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
a następnie uzyskaną wartość trzeba by było zestawić z kryterium. W każdym z tych wypadków poprawne będzie odrzucenie hipotezy zerowej i przyjęcie hipotezy alternatywnej, iż lek efektywnie oddziałuje na pamięć osób z chorobą Alzheimera.
ZADANIA było
pokazanie Ci procedury Test t dla prób zależnych, służącej do porównywania powiązanych ze sobą zmiennych. Posługując się zbiorem danych, dostarczonym przez prowadzącego ćwiczenia, spróbuj zanalizować wpływ zmiennej niezależnej na zależną. Wykonaj następujące czynności: 1. Zapisz hipotezy zerową i alternatywną dla wymienionej analizy. Określ, czy masz do czynienia z hipotezą jednostronną, czy dwustronną. 2. Przeprowadź analizę przy użyciu procedury Test t dla prób Naszym celem
zależnych.
3. W dwóch albo trzech zdaniach zapisz ogólne wnioski wypły wające z przeprowadzonej analizy. Przedstaw je w języku testowania hipotez.
Rozdział 6
Porównanie prób niezależnych za pomocą jednoczynnikowej analizy wariancji
CELE ZAJĘĆ 1. Nabycie umiejętności formułowania pytań pozwalających na zbadanie różnic między więcej niż dwiema grupami. 2. Nabycie umiejętności testowania hipotez za pomocą procedury Jednoczynnikowa ANOVA. 3. Trenowanie interpretacji wyników uzyskanych dzięki jednoczynnikowej analizie wariancji. 4. Nabycie umiejętności interpretowania wyników, będących rezultatem testów post hoc Tukeya i Scheffego.
Wiele przedsięwzięć badawczych zakłada porównania między śred nimi pochodzącymi z więcej niż dwóch populacji lub więcej niż dwóch warunków eksperymentalnych. Załóżmy, że jesteś badaczem testującym nowe leki na ból głowy. Chcesz porównać efektywność kilku rodzajów leków, lub też skuteczność tego samego leku podawanego w różnych dawkach. Za pomocą testu t mogliśmy dokonywać prostych porównań pomiędzy dwiema średnimi. Jednakże porównania złożone, na przykład pomiędzy czterema średnimi, są skomplikowane i czasochłon ne. Jeżeli chcielibyśmy użyć testu t, to musielibyśmy dokonać kilku
56
PORÓWNANIE PRÓB NIEZALEŻNYCH...
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
porównań, co w konsekwencji utrudniłoby wyprowadzenie wnio-
sków z badania. jednoczynnikowa analiza wariancji (jednoczynnikowa ANOVA) pozwala na porównywanie wielu średnich jednocześnie, zwalniając badaczy z konieczności przeprowadzania wielu testów t. SPSS ma możliwość dokonania porównań wielu populacji lub wielu grup badawczych.
[[] kardiolog sev - SPSS Edytor danych
Plik Edycja
Wyobraź sobie, że jesteś kardiologiem badającym grupę swoich pa-
cjentów - zmienną zależną może być poziom cholesterolu, a niezależną - grupa wiekowa. W tej sytuacji możesz sformułować interesujące pytanie badawcze: "Czy pacjenci/pacjentki z następujących grup wiekowych: młodzi, w średnimi wieku i starsi, różnią się poziomem cholesterolu?" Aby odpowiedzieć na to pytanie, należy najpierw podzielić pacjentów na trzy grupy wiekowe. W pierwszej grupie znalazłyby się osoby poniżej 35 roku życia, w drugiej - pomiędzy 35 a 50, a w ostatniej - pacjenci powyżej 50. Kolejny krokiem będzie porównanie grup pod względem średniego poziomu cholesterolu we krwi. Zauważ, że masz więcej niż dwie grupy do porównania. W takiej sytuacji procedura jednoczynnikowa ANOVA jest właściwą metodą statystyczną. Rozpocznij analizę danych od wprowadzania informacji zawartych w Dodatku (tabela Kardiolog), a następnie zapisz je w pliku, na przykład kardiolog.sav. Rycina 6.1 pokazuje sposób uruchamiania analizy. Kliknij kolejno na Analizę, Porównywanie średnich i jednoczynnikowq ANOVA (Analiza> Porównywanie średnich> jednoczynnikowa ANOVA).
Widok
Dane
Przekształcenia
Analiza
1~11iII1~11S] I"'lc-·I ~ Iiilli] ~ B 1 Id
--,- -- T111
~
=3 ---2J --61 - --o
Stosowanie procedury "Porównywanie średnich: jednoczynnikowa ANOVA"
~ ~
----!QJ
--.!..!J
~ ~
=l d q ~ 19
- . -221
-
Id
1Ir~-;:~Jl 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
ch-~It]
3 2 2 3 2 3 3 3
1 2 3 1 3 3 3 1 3 3 2 3 2
Opis statystyczny
"
--
Narzędzia
Wykresy
Raport, warstwowe
,
"
Ogólnymodelliniowy Modele mieszane
249 245 238 243 238 238 263 256 256 173 254 261 209 262 251 264 130 264 239 259 205 255
• •
Korelacie Regresia
Analizy logliniowe Klasyfikacja Redukcja danych
Skalowanie T esl, nieparametryczne
AnalizjI przeżycia Wielokrotneodpowiedzi
•
• • • • • • • • •
Okno
Pomoc
Srednie... Test t dla iednei próby... T eet ł dla prób niezależnych...
Tesl t dla prób zależnych...
-,
..
,
•
RYCINA 6.1. Wybór procedury Jednoczynnikowa ANOVA. •
El
Jednoczynnikowa ANOVA Zmienne
"%> kod pacjenta[Id]
•
zależne-
poaom cholesteroh l [chole J
Czynnik.
[2J
Wybór i definiowanie zmiennych do analizy Zmienne Twojej bazy danych zostaną wyświetlone w okienku po lewej stronie, jak na rycinie 6.2. Wybierz swoją zmienną zależną - kliknij na jej nazwę, a następ nie przy użyciu strzałki przenieś ją do okienka Zmienne zależne.
57
I~rupa Wiekowa [gr ~!'e.'5.LJ r~·..
RYCINA 6.2. Wybór zmiennej
zależnej
i
fP;tg 10;;;=:1
niezależnej.
I
::e:
58
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
,
PORÓWNANIE PRÓB NIEZALEŻNYCH...
!
W tym ćwiczeniu zmienną zależną jest chole (poziom cholesterolu). Zmienna gr_wiek jest zmienną niezależną. Kliknij na jej nazwę, a następnie za pomocą strzałki przenieś ją do okienka Czynnik. Wartości dla zmiennej wiek zostały przyporządkowane do etykiet w następujący sposób: ,,1" do "poniżej 35", ,,2" do "pomiędzy 35 a 50", a ,,3" do "powyżej 50".
Wykonywanie testów post hoc (porównania nieplanowane) Przystąpmy do
ustawienia kolejnych opcji. Po użyciu klawisza Opcje możesz obliczyć statystyki opisowe, test jednorodności wariancji, a za pomocą Post hoc opracować testy porównań analitycznych. Naciśnij klawisz Post hoc, aby uruchomić okno jednoczynnikowa ANOVA: wielokrotne porównania post hoc (por. rycina 6.3). Dzięki SPSS możesz wykonać wiele testów analitycznych (post hoc), służących do porównywania średnich. Podobnie jak test t, testy post hoc służą 'do porównania średnich (pamiętaj, że jednoczynnikowa analiza wariancji może za jednym razem oszacować różnicę
El
Jednoczynnikowe ANOVA Wielokrotne porównama post hoc Zełożerne o równości
~
D D
Bonterroru
O
Sidak
Ul
Scheffe FR·E·G·W Q R·E·G·W
Interpretacja wyników jednoczynnikowej analizy wariancji Przeprowadzenie analizy jednoczynnikowej zakończy się wyświetle niem wyników, takich jak na rycinach 6.5 i 6.6. Pierwsza z nich pokazuje tabelę ze statystykami opisowymi dla każdej z grup. Są nimi: liczebności, średnie (tuż obok znajdują się przedziały ufności dla średnich), odchylenia standardowe i błędy standardowe średniej dla zawartości cholesterolu we krwi.
wariancjl--------------,
o S·N·K
ONIR
D D
pomiędzy średnimi w wielu grupach). Możesz wybrać test Tukeya i Scheffego, klikając na okienko przy nazwie testu. Pod koniec tego rozdziału przyjrzysz się wynikom tych testów, widniejącym na rycinie przedstawiającej raport. Po ustawieniu testów post hoc kliknij Dalej. Następnie uruchom okno jednoczynnikowa ANOVA: Opcje poprzez naciśnięcie klawisza Opcje (zob. rycina 6.4). Wybierz Statystyki: Opisowe i Test jednorodności wariancji (test jednorodności wariancji Levene'a). Po naciśnięciu Dalej pojawi się główne okno jednoczynnikowej ANOVA. Zakończ przygotowanie analizy, klikając OK.
~
D
Waller·Duncan
S\w\Jneł:~ ['. ~ bł~ TW llTgp2: - --.....J D Dunnett K~eg:>l~ kon\NM r-L-·-.-.-. -""8"'" Teiil --
GT2Hochberga Tukey
D b Tukey'a D Duncan O Gabriel
@ D~Of\I"l)'
O / Koni"*,,, O >KorllQ/r,a
RYCINA 6.4. Okno Opcje dla Jednoczynnikowej
ANOVA.
Slalysl.ykl-----------. ~ Opisowe
D Efekly stełe i losowe ~ Tes! lednorodnoścl wenenqi
Brak zełozenre o równoścI w a n a n C f I - - - - - - - - - - - - - - ,
D
D T2 Tamhane'a D 13 Dunnetta
OWeich
Poziorn
istotnoścr
1,05.-J
O
Games·Howell ["'Da!;
D
II
C Dunnetta Anului
1/
Pomoc
Brown-Forsythe
D Wykres średnich Braki danych~------------___.
e Wył-ączanie obserwacji analiza po analizie RYCINA 6.3.
Wybór testów post hoc.
O
Wył-ączanie
wszystkich obserwacji z brakami
59
6O
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
PORÓWNANIE PRÓB NIEZALEŻNYCH...
Raport zawiera także wyniki testu jednorodności wariancji dla grup wiekowych. Jest to taka sama procedura jak ta, którą SPSS przeprowadzał podczas wykonywania testu t dla prób niezależnych. W naszym przykładzie nie ma istotnych różnic pomiędzy trzema wariancjami w grupach - F(2;57) = 0,45; P < 0,05. Istotność jest większa niż założone 0,05, co znaczy, że pomiędzy tymi wariancjami nie ma różnic istotnych statystycznie. Podsumowanie ANOVA zostało przedstawione w dolnej części ryciny 6.5. Tabela ]ednoczynnikowa ANOVA zawiera sumy kwadratów między grupami i wewnątrz grup oraz sumę kwadratów ogółem. Danym tym towarzyszy informacja o stopniach swobody (df). W tabeli tej pokazane są również średnie kwadraty (dla efektów między- i wewnątrzgrupowych), które służą do obliczenia statystyki F19. Szczególną uwagę należy zwrócić na wartości F oraz Istotność (prawdopodobieństwo popełnienia błędu pierwszego rodzaju). Rycina 6.5 przedstawia rezultaty porównania trzech grup wiekowych na podstawie zmiennej zależnej, którą jest poziom cholesterolu - F(2;57) = 37,66; P < 0,001. Wartość w kolumnie Istotność wskazuje na prawdopodobieństwo popełnienia błędu pierwszego rodzaju - wynosi ona ,,0,000" (p < 0,001). Załóżmy, że testujesz hipotezę, przyjmując poziom alfa równy 0,01. Czy postąpisz prawidłowo, odrzucając hipotezę zerową, gdzie uzyskane p < 0,001? Odpowiedź jest twierdząca - każda wartość poziomu prawdopodobieństwa mniejsza niż 0,001 jest mniejsza od 0,01.
Interpretacja wyników
porównań testami
post hoc
Przyjrzyj się wynikom (średnim) w tabeli przedstawionej na rycinie 6.5, a z pewnością zauważysz różnicę między grupami. Wyniki ANOVA nie pokazują, które z grup różnią się istotnie od pozostałych. Aby się tego dowiedzieć, możemy się posłużyć wynikami testów post hoc, które obliczył SPSS. 19 F to stosunek średniego kwadratu grup (przyp. tłum.).
między
grupami do
średniego
kwadratu
wewnątrz
61 _
PIk
EdJ'Cllł
WIdok Wtlaw
ForIRat Analiza 'W'.vklMJ'
~["I8J~~ i!!I EiI immlbUil ~ ~
(!EJ a:=J
IJJ'l'ffi I
.... _
\!J.R_
-
m
@JednOCZ\'Mlkowa8MlJuwarill [EJTytul
mI
Narzl;dzta Ok""
Po_
~
~
Jednoczynnikowa analizawariancji (ONEWAY)
s--
:
~Uwagl
-ICi
Test jednorodnosa Wl!lI'lanql
I
St.-nyscykloplsowa
!
JednaC%YIV1ikowll ».NOVA
i T""
Porcwnerue
l
poziom cholesterolu
--E:T~posthoc
.
w~okrotne
E: Grupyjedr'la"odne
~Tytul
95%prtedzlalufnoscldla
..
(, poziomchQl~erolu
N 20
ponlleJ35
35 a 50
srecma
Ogółem
Dolna
Błąd
etancaroowe
slandardol'l'j 2Q,'139 4,526 26,424 5,909 27,536 6,157 37,352 4,822
178,50 231,35
00 00 60
po~eJ50
242,60 217,48
granica 169,03 218,99 229,71 207,83
ocma granica 187,87 243,72 255,49 227,13
Minimum 130
MakSimum
167
173 130
57
,637
JedlloczYłlIukowt'l
•
ANOVA
;<
poziomeholesterolu
MiędzY
grupami
Wewnątr:zgrup
Ogółem
-1
"
1 wybtanee~enły (w tomOukrylelZWIn~le
.
areom df
kwadrat 2 23428,317 622,041 57
lstcmcść
F 37,004
,ODO
~
59
.
_
•..
-
"
~15PS5 Pr()~SOl gotowy
RYCINA 6.5. Wyniki jednoczynnikowej analizy wariancji.
Rycina 6.6 zestawia rezultaty porównań grup wiekowych, które przeprowadzone za pomocą testów Tukeya i Scheffego. Zwróć uwagę na część tabeli Porównania wielokrotne, która odpowiada wynikom testu HSD Tukeya - pierwszy i drugi wiersz zawierają wyniki porównania średniego poziomu cholesterolu w grupie "poniżej 35" ze średnimi w grupach "pomiędzy 35 a 50" i "powyżej 50"; w pierwszym porównaniu między grupami "poniżej 35" i "pomiędzy 35 a 50" różnica średnich wynosi -52,85*. Poniżej tabeli Porównania wielokrotne znajduje się informacja, iż symbol" *" (gwiazdka) przy danej wartości oznacza, że różnica między średni mi jest istotna statystycznie (p < 0,05). Różnica istotna statystycznie występuje też między grupami "poniżej 35" i "powyżej 50" (-64,10). Zwróć uwagę na porównanie grup "pomiędzy 35 a 50" zostały
I
i
Istotnosć
da
Suma kwadratów 46856,033 35456,350 82312,983
209
259 266 266
[
Tes! Jedno'oduosci waj lanCIi onacm ehofesterolu Test Levene'a df1 ,455 2
""
,I I
średnie
Odchylenie
pomiędzy
--._...
x
.-
:Et
62
PORÓWNANIE PRÓB NIEZALEŻNYCH...
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
"'m-
Analiza
F_t
"'''''''''' "'" ~li:i~rl1il ['iI ~ ~ !tlI:lĘn?J ~ ~ m I Edycja
W$ław
[ill] GJ..3
-. x
Pnmoc
1.
,
~
ccaom chcieeterciu
JeQ'nQCzynnikowlllln81lzewarlll
IT~"
_ UwtI!il1
MiędzY grupami grup
stll!:ysłytloplSO'Nfl
'
Okno
r",I~1 ~ll
l!;1,Raport
- I.§I
Nafzędzla
TesiJednorodno'l;ClwarlanCJ
ł Jedr>oc::t\"fY"dllowl!I ANOVA
;";;:""
I~~~~
1 46856.633
l
l ~~~t l
df
[
2[23428.317 [
Wewnątrz
35456,350
57
OgO/em
82312,983
es
F
l'stotnośt
37.664 [
622,041
,000
I
I
[.
.'
Testy post hoc
- .'1;: OrupvJedr"lCW"odne
0
~.
flflTytul Q'jPOZlomchclesterolu
Porównania wielokrotne zrntennazatearep02lomcno\es;alOilJ 95%przedZlał
.
reetrukeve HSD
(I) grupa wiekowa
(J)arupawlekowa
35
pomll~dzY35a50
porużer
poW'/ŻeJ50 pamlęd!Y35a50
ponliej35 powyżej 50
powyz:sJ50
conuer as
ncneer ss
ccmrecv asaso
pomlędzy35a50
'rast schene
powy'lej5Q
ccrmeczv asaeu cenner as powrzeJ50
powyz:eJ50 pontze)35 pomlli!dzy35a50
R6zr'IIC3
Bląd
Istotno
srednlch(l-J)
standardowy
s
-52,aS" -64,11Y' 52,85" -11,25 64,10" 11,25 -52,85" -64,10" 52,85" -11,25 64,10" 11,25
7,887 7,887 7,887 7,887 7,887 1,887 7,887 7,887 7,887 7,887 7,887 7,887
,000 ,000
,ClOO ,334
,ODO ,334 ,000 ,000 ,000 ,J68 ,000 ,368
ufnoscl Dolna Górna rarnca eramea -71,83 -33,87 -83,08 -45,12 71,83 na7 -30,23 1,13 45,12 83,08 -7,73 30,23 -33,OJ ·72,67 -83,92 -44,28 72,67 (33,OJ -J1,07 8,57 44,28 8J,92 -8,57 31,01
pytanie badawcze odnoszące się do zbioru danych, wskazanego Ci przez prowadzącego ćwiczenia. Twoja zmienna niezależna powinna być na co najmniej trzech po-
ziomach-".
e 10
Sformułuj
2. Postaw hipotezy badawcze i przetestuj je, używając procedury Jednoczynnikowa ANOVA. 3. Wykonaj testy porównań analitycznych pomiędzy Twoimi grupami. 4. Napisz krótki raport, zawierający wyniki analizy wariancji i testów post hoc oraz ich interpretacje w kontekście pytania badawczego. Opisz swoje wyniki, odwołując się do relacji mię dzy Twoimi zmiennymi.
"s !P
"R6zmcasrednlchJesllslotnanapozlomle 05
*
,
",'''TT
Kikn, dwuk.rotn~, 4b
edJllow~ć
1-,,"
obiektTabela
,-~
-,,-
'-,,,,-
.fu
r2e$ławna
"..
"-
.fu~
RYCINA 6.6. Wyniki zastosowania testów post hoc Tukeya i Scheffego.
50" - brak gwiazdki przy różnicy średnich oznacza, że rozbieżność między tymi średnimi nie jest istotna statystycznie. Podsumowując, jednoczynnikowa ANOVA posłużyła nam do określenia różnic między grupami wiekowymi. Dokładna analiza różnic, dokonana za pomocą testu Tukeya, wskazuje, że istotność statystyki F wynika z tego, iż grupa młodszych pacjentów - "poniżej 35" - ma generalnie niższy poziom cholesterolu niż pozostałe grupy. Wyniki testu Scheffego potwierdzają ten wniosek.
i
"powyżej
ZADANIA Niniejszy rozdział miał Cię przygotować do przeprowadzania jednoczynnikowej analizy wariancji w celu oszacowania różnic pomiędzy grupami. Wykonanie następujących ćwiczeń pozwoli Ci na ugruntowanie zdobytej wiedzy:
W jednoczynnikowej analizie wariancji liczba poziomów jest równa liczbie porównywanych grup (przyp. tłum.).
20
63
PORÓWNYWANIE PRÓB ZALEŻNYCH...
możliwość badania więcej niż
dwóch powiązanych ze sobą prób. przy tym pamiętać, że sposób analizy zależy od pytania badawczego oraz od planu badania, sformułowanych przez badacza.
Należy Rozdział
7
Pytanie badawcze i plan badania
Porównywanie prób zależnych za pomocą jednoczynnikowej analizy wariancji z powtarzanym pomiarem
CELE ZAJĘĆ 1. Nabycie umiejętności tworzenia pytań badawczych dotyczą cych różnic pomiędzy więcej niż dwiema próbami zależnymi. 2. Nabycie umiejętności formułowania hipotez badawczych. 3. Opanowanie umiejętności wykonywania procedury Ogólny model liniowy: Powtarzane pomiary w celu przetestowania postawionych hipotez. 4. Nabycie umiejętności interpretacji wyników procedury Pow-
tarzane pomiary.
Analizę
wariancji w układzie z powtarzanym pomiarem możemy w SPSS uruchomić za pomocą menu Analiza i Ogólny model liniowy: powtarzane pomiary. Stosujemy ją, mając do czynienia z planami badawczymi przedstawionymi w rozdziale piątym, ale w wypadku gdy są więcej niż dwa poziomy zmiennej niezależnej. Taki rodzaj analizy nazywamy ANOVA z powtarzanym pomiarem jednego czynnika. ANOVA z powtarzanym pomiarem, podobnie jak test t dla prób zależnych, służy do oszacowania, czy związane ze sobą próby różnią się istotnie, czy nie. Przewagą tej pierwszej metody statystycznej jest
Wyobraź
sobie, że obserwujesz niemowlęta, i zauważasz, że na fotografiach ludzkich twarzy skupiają one swoją uwagę dłużej niż na obrazach przedstawiających figury geometryczne. Na podstawie tych obserwacji możesz zadać sobie pytanie: "Czy układ elementów twarzy: oczu, nosa czy ust i odległości między nimi, wpływa na zdolność niemowląt do spostrzegania twarzy?" Aby odpowiedzieć na to pytanie, możemy zastosować prosty schemat badawczy z powtarzanymi pomiarami, w którym mierzymy zakres uwagi niemowlaka w zależności od tego, który z trzech rodzajów bodźców był by prezentowany Bodźce typu "A" byłyby bodźcami kontrolnymi i składałyby się z pustej, owalnej figury o kształcie twarzy ludzkiej. Dwa pozostałe rodzaje bodźców składałyby się z takiego samego owalu co bodźce typu "A", ale dodatkowo zawierałyby elementy twarzy ludzkiej: oczy, nos, usta i uszy. W wypadku bodźców typu "B" ułożenie tych elementów byłoby przypadkowe. Natomiast w wypadku bodźców typu "C" poszczególne elementy byłyby uło żone jak na ludzkiej twarzy. Ponieważ mamy tu do czynienia ze schematem badawczym z powtarzanymi pomiarami, każde niemowlę zostanie poddane kolejno działaniu każdego z trzech rodzajów bodźców "A", "B" i "C". Ponadto w każdym wypadku, prezentowana figura umieszczona zostanie w polu widzenia niemowlaka i pozostanie tam tak długo, dopóki niemowlę będzie na nią patrzeć. Przedmiotem pomiaru będzie to, jak długo niemowlę przyglądało się danej figurze. Czas ten bę dzie mierzony z dokładnością do 0,1 sekundy. Żeby uniknąć efektu kolejności, każdy niemowlak zostanie losowo przydzielony do jednej z grup różniących się pod względem kolejności prezentowania bodźców (ABC, ACB, BAC, BCA, CAB i CBA). W konsekwencji powstanie zatem sześć grup eksperymentalnych różniących się kolejnością prezentowania bodźców.
65
66
PORÓWNYWANIE PRÓB ZALEŻNYCH...
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
..
, Plik Edycja
Hipotezy badawcze Hipoteza zerowa w tym wypadku głosi, że średnia ilość czasu spę dzonego na przyglądaniu się prezentowanym figurom będzie taka sama bez względu na to, czy prezentowane były figury typu A, B czy C. Natomiast zgodnie z hipoteza alternatywną średnie te powinny się różnić między sobą. Wstępna analiza zmierzająca
do weryfikacji hipotezy alternatywnej, która ma charakter bardzo ogólny, może zostać uzupełniona bardziej pogłębioną analizą post hoc, pozwalającą na stwierdzenie, które typy różniły się miedzy sobą istotnie.
---1J2 I
1r--"3 .~
~
!==i F--=i, ~
§
10 11
i~;1
~ 15
Stosowanie procedury "Ogólny model liniowy: Powtarzane pomiary" Do wykonania analizy użyjemy zbioru danych pochodzących z omówionego powyżej badania nad rozpoznawaniem twarzy. Zbiór danych zamieszczono w końcowej części niniejszego podręcznika (w tabeli Niemowlaki). Dane dla poszczególnych pomiarów zakodowane są pod odrębnymi nazwami. W naszej bazie danych pomiary czasu skupiania uwagi przeprowadzono w warunkach "A" (pusty owal), "B" (twarz zdeformowana), "C" (twarz naturalna). Występu ją one pod nazwami: oval, deform, face. Kliknij na Analizę, a następnie na Ogólny model liniowy. Postę puj zgodnie z tym, co przedstawia rycina 7.1. Pojawi się lista opcji, którymi dysponuje SPSS w ramach ogólnego modelu liniowego. Wybierz Powtarzane pomiary (ścieżka: Analiza> Ogólny model liniowy> Powtarzane pomiary). Kiedy wykonasz ostatni krok, SPSS wyświetli okno OML Powtarzane pomiary: definiuj czynniki (por. rycina 7.2). W pierwszym okienku (Nazwa czynnika toeumqtrzobiektowego-Ti SPSS podaje domyślną nazwę czynnikl. Możesz ją zmienić, ale nie możesz wpisać Chodzi tutaj o nazwę zmiennej niezależnej zmieniającej się wewnąttz osób - w omawianym przykładzie jest nią rodzaj prezentowanej figury (przyp. tłurn.), 21
Przekształcenia
'Widok Dane
Analiza I 'Wyk,e.y
1~llIIll!I ~ 1·'It'>t1 ~ !kl&? II1lI El 111 Id ..:Q Id I oval I deform
•
r---w
~
r----m
R
67
180 50 70 40 80 80 60 50 110 60 50 100 160 140 180 50 70 40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
170' 70 120 60 90 60 80 70 120 70 120 70 140 120 170 70 120 60
Narzędzia
Raporty warstwowe Opis statystyczny
..
Porównywanie średnich
, ..
-
Modele mieszane
, , ,
.1
.!
Analizy logliniowe Klasyfikacja
,
Redukcja danych Testy nieparametryczne
Analizyprzeżycia Wielokrotne odpowiedzi
,I
Pomoc
Jednej zmiennei ... Wielu zmiennych...
.,-
Korelacje Regresja
Skalowanie
Okno
ąęę
II
dar
6 iff"' i+ I:M i 'i
Składowe
wariancji...
I
, , , , ,
120 90 150 150 90 340 60 170 90
~
RYCINA 7.1. Uruchamianie procedury Ogólny model liniowy: powtarzane pomiary.
Nazwa cZ.'r'nnika
wewnątrzobiektowego: ~~!::!j
Liczba poziomów:
El
cZ.'r'nnik1(3)
~ ! Po;;~~ r·'~p>~;~;;·;-J
RYCINA 7.2. Ustalanie poziomów czynnika
wewnątrzobiektowego.
I
,]
1~~ecisa.Y - SPSS Edytor danych Phk
EdycJa WIdok
Dane
~
Pl2el!.t:ztatcenia
Anqhz.i) Wvkre~y
Nar7ęd2'la
Okno
,
','
Pernor-
.1
Id
oval
"
Interpretacja raportu z analizy eefcrm
face
var
'Jar
'a"
,':;1
ver
~"..r
VEl,'~
Testowanie efektów
międzyobiektowych
Patrząc
~
---- .---f-_. .--- .- -- ---.------ ------- .--+- ----" - ---.. --- .-- .i -- ------- - -RYCINA 7.3. Wybór i definiowanie zmiennych wewnątrzobiektowych.
nazwy, którą zawiera już Twoja baza danych. W okienku Liczba poziomów wpisujesz wartość, która odpowiada liczbie pomiarów wykonanych w Twoim badaniu. W naszym przykładzie należy wpisać ,,3". Następnie kliknij Dodaj oraz Definiuj, aby otworzyć kolejne okno - takie jak na rycinie 7.3. W oknie OML Powtarzane pomiary należy zidentyfikować pomiary, które odpowiadają poszczególnym warunkom eksperymentalnym. Zacznij od kliknięcia na nazwę oval (pusty owal). Następ nie, używając górnej czarnej strzałki, ustal, że pod nazwą oval zapisany jest pomiar odpowiadający pierwszemu poziomowi zmiennej niezależnej. Po wykonaniu tej operacji oval znajdzie się w prawym górnym oknie i stanie się pierwszym poziomem powtarzanego pomiaru. Czynność tę powtórz w odniesieniu do pozostałych pomiarów (deform, face), czyli określ pomiary odpowiadające drugiemu i trzeciemu poziomowi zmiennej niezależnej. Całą operację należy zakończyć, naciskając OK.
na wyniki ANOVA z powtarzanym pomiarem, zwrocmy najpierw uwagę na tabelę zatytułowana Testy efektów międzyobiek towych (zob. rycina 7.4). Zawiera ona dane odnoszące się do specjalnej hipotezy zerowej, która głosi, że średnia ze średnich powtarzanego pomiaru równa się zero. W naszym przykładzie charakter procedury badawczej umożliwia zignorowanie tego testu. Jest tak dlatego, ponieważ w naszym eksperymencie czas mierzony jest od momentu ukazania się figury, części twarzy bądź całej twarzy, a nie od momentu zwrócenia przez niemowlę uwagi na ów obiekt. Czas taki nigdy nie będzie wynosił zero' Możemy zatem stwierdzić, że ta hipoteza była fałszywa już w momencie zbierania wyników. Wartość testu (F(1;17) = 82,52) i poziom istotności (p < 0,001) wskazują na fałszywość hipotezy zerowej. Jednakże gdyby sposób obliczania wyników został zmieniony w taki sposób, że czas od momentu pokazania niemowlakowi obiektu do chwili zwrócenia przez niego uwagi na ten obiekt zostałby odjęty od pomiaru całkowitego, uwzględniają cego również czas utrzymania uwagi na obiekcie, średnia średnich z poszczególnych grup pomiarów mogłaby równać się zero. W takiej ~Rd1l0!12 SPS5E----l!I8ł:! PI"
''''''',
Widok
Wstaw
For",at
Na~dzia
W,kres,
Analiza
Okno
P_o
~JIi!l~l~1~ ~ ~ ;lBlill,.;Ico] ~ ~ W! [illJ l!B ~, '::''!il ~II -
!T"" •
-
CIyrv1lklwewntl!rzol:
QB Tes!. erervczrcse Ma (itTestyelelo.l:awwr:wn (i TllStykonlrsstowwe .Qjj
Miara ł14IARA..1 zmrenna crzecsne'ccea Średnia
.. I
Zr6dło zmrannośr!
IlntenePI
areo
·-~l
1
Testyefektówml~2YOtJlektowych
Uw,,"
QiłTe~WrellZlmennyC
,
~
~;~l'lymodelnnIoWY(OL
.%
..
RYCINA 7.4. Testowanie efektów
ł l'łP\\\surny kWadrat6w
l
I 666666,667 1 137333,333
4
"
l ~~~~I l 11666666.71 17 8078,431
F
\lsIOlno1>ć
82, 5241
I ~
,000 I
Th .,'
llj'sPSSPfoce$oi"gotci~
międzyobiektowych.
-- "--'H
;
li3:W~3ll5-Pkt-
L
hipotetycznej sytuacji dane składające się na zawartość tabeli Testy efektów międzyobiektowychmogłyby mieć znaczenie. Testowanie
Epsilon. 2. skorzystać z tabeli Testy wielu zmiennych.
sferyczności
Wyniki testu sferyczności Mauchly'ego zostały przedstawione na rycinie 7.5. Interpretując te dane, postępujemy w podobny sposób, jak w wypadku tabeli korelacji przy teście t dla prób zależnych, co zostało opisane w rozdziale piątym. Tabela dla testu sferyczności odnosi się do kolejnej specjalnej hipotezy zerowej. Zaprzeczenie jej bądź stwierdzenie, że nie ma podstaw, by ją odrzucić, wpły wa na wybór, której tabeli zawierającej wyniki ANOVA należy użyć. W pewnym uproszczeniu test sferyczności bada, czy korelacje pomiędzy wynikami dla trzech warunków eksperymentalnych są sobie równe. Rezultat testu Mauchly'ego pozwala na dokonanie wyboru jednej z dwóch tabel: 1) Testy efektów wewnqtrzobiektowych albo 2) Testy wielu zmiennych. Do testowania hipotezy sferyczności słu ży statystyka Xl. Jeśli Xl jest nieistotne statystycznie to wyniki ANOVA powinniśmy analizować, korzystając z tabeli Testy efektów wewnqtrzobiektourych. Natomiast jeśli Xl jest istotne - czyli wartość uzyskanego poziomu istotności (w tabeli) jest mniejsza od przyjęte go kryterium (alfa = 0,05) - to możemy postąpić na dwa sposoby:
..
.
Plot. ."",
x
_ Cl
....odok \lIsI_
Format Analiza "'J'k""'.P
NarzędZia
Okno
P,,,.. ,,
ri;;l:prl!ir~1~ ;!] ~ ilmllll;lJ:?J ~ ~ :Il1
IB!] [!8 -
m
PIT,r~
I
!!;JR_
-
@
~
Test sterycznoSclMauchly'egob
Ogony model!InlOWY (GL
I'TyluI
,;
I
Miara MIARA 1
Uwagi
Gi CZlnrnklwewną!:rzob 41ł Te$lYwfelUZlfNennyc
fa Testy eteld6w wewrs il'TestYkOnlr~owwe Testyefeldowmaędzy
.. I
Efektwewn Irzoblektov"y C:lYNNIK1
I
W Mauchly'ego ,374
IP~bI"o", I
I
lstnmośc
I
l
l
• "'00'
l
oreersicue Dolna granica chi-kwadrat e-cereser Huynh-Feldt e sllon dl 15,721 ,639 2 ,000 ,615 ,500 macierzykowananonbłędów nrtonurmallzcwanych przekształconych zrl1lennych
I
I
Testuje hipotezę zerową o proporcjonalnoścI zateżnvch co maclef'Z\lJednostkoweJ a Może byc użyta do korygowaniastopni swobodydla usredmcnvcblestow Ietomośct Skorygowane testy są crreoetewrcnew tabeli Testy erektówwewnąUzobfektovwch
D I~ %
b
Plan Inlercept Plan wewnąt120blektcrwy CZYNNlK1
,
>q
"
1. dokonać korekty wyników korzystając z jednej z popra~ek.za wartych w tabeli Test sferyczności Mauch!'yego, pod nagłowklem
, m:SPsS"ProCeSOI \lotowy
--- -
---T
I
0
':-frr
"_" ,!H11<~_,_"' 203 W 570pkl
Zasady stosowania poprawek opartych na statystykach epsilon są bardzo skomplikowane, dlatego też lepiej jest oprzeć się na jednym z testów zawartych w tabeli Testy wielu zmiennych. Zawarte tej tabeli testy nie są wrażliwe na złamanie założenia o sferyczności.
v:
Testy wielu zmiennych
. ' .
.
Dane zawarte w tabeli przedstawionej na rycmię 7.5 wskazują, że założenie o sferyczności zostało złamane - Xl(2) = 15,72, P < 0,001. W takiej sytuacji powinniśmy op~zeć się .na wynikach jednego z testów zawartych w tabeli Testy ioielu zn:tennych (zob: rycina 7.6). Najczęściej używaną jest tu lam~da WIlk,sa..W. t~beh przedstawionej na rycinie warto~ć lambdy. ~llk,sa, kt.orej uzyjerny do testowania hipotezy zerowej głoszącej, ze średnie pochodzą ce z pomiarów czasu skupiania uwagi na obiektach typu "A",. "B" i "C" są równe, wynosi 10,41, przy liczbie stopni swobody 2 l 16. Wartość statystyki F i uzyskany poziom istotności (p = O,OOl).'p o zwalają na odrzucenie tej hipotezy zerowej, a w k~nsekwencJl na przyjęcie hipotezy badawczej głoszącej,. że własnoś~l spostrzegan~ go obiektu mają istotny wpływ na to, jak długo niemowlę skupia na tym obiekcie uwagę.
Testy efektów wewnątrzobiektowych . Jeśli zdarzyłoby się, że test Mauchly'ego okazałby SIę lllelst~tny (p > 0,05), to moglibyśmy wówczas oprzeć .się na danych umle.szczonych w tabeli Testy efektów wewnqtrzobtekto~~h (por., rycina 7.7). Wartość F dla zmiennej CzyNNIK1 odnosi ~lę .do hipotezy zerowej mówiącej o braku różnic pomiędzy średnimi. W naszym przykładzie F(2;34) = 14,21 a p < 0,001, efekt jest więc istotny.
Al.
Porównania post hoc
RYCINA 7.5. Testowanie
sferyczności.
Jeśli nasze wyniki pozwalają n~ stwierdze,~ie~ że ist~ieją ~odst~~ do odrzucenia hipotezy zerowej o braku rozmc pomiędzy średnimi,
• -
'"'V U'l;;UU
Plok EdJclll "'lilak
UV' VYYI - '" IAn l! YVt'nUVVAULt::Nlt:: UU
"'"...
F....a1 AnaIaa
-
"'..
NarzędZIa
::;J-'SS DLA WINDOWS
POROWNYWANłE PROS ZALEZNYCH...
-
Dkno p"",,,
.
"
~[!!J~EJflil"'łE?ll§I~JJI [ill] 8:J ~ [ff'ID:] I -
~,Raport
l:.J
- @ OgólnymodellnlOWY (GL
I
Efekt CZYNNIK1
QJCZymki weWNtr:t
.QJ
-I
(.lJTestyelekWwwewn Testykontraslćwwe
SladPllI,1I
LOlmbdaW!Jksa ŚładHotelJmga
(,i Te$fsteryczooSclMll
-
~,
Testywieluznuellll)'Cł"P
Tylu/
" Uwagi
ot
NaJ\'VlększY
l:uef\lfjaslekRoy'il
Teslyefeldowmlędzy
Wartost ,556 ,434 1,302 1,302
F dfhlpoleZl" 1O.413~ 2,ODO 1O,413~ 2,000 10,413 1 2,000 10,413 '
dfbłędU
Istotność
15,000 16,000
,001 ,001 ,001
16,000
,001
16,000
2,000
D r
,
aS1alyslykadokladna
b
:
Plan lntercect Planwewnąlrzobleldovw- CZYNNIK1
.
l!!f •
.
kI:spss Procesa-gotoWY-
Khkrij dllUaotflle, aby edytować oblekł Tabelll~lawna
I
--
'I
ł1
~
i I" 1,"
iL.J
'"
432
,kt
A
RYCINA 7.6.
Testy F dla zmiennej zależnej w powtarzanym pomiarze.
-
"
.
Testyefektów wewnątrzoblekłowy.::h MiaraMIARA 1 źr6dłozmrennoscI CZYNNIKl
kwadratów
Ol
36433,333
ereenbcuee-cersser
36433,333 36433,333 36433,333 43566,667
1,230 1,277 1,000
34
1281,373
43566,667 43566,667 43566,667
20,915 21,716 17,000
2083,075 2006,158 2562,745
H~h-Feldt
Dolna granicaepsilon 8/ąd(ClYNNIKl )
Średni kWadral
TypIII sumy sremzncecze'cżcna
srervcznosc założona ereenhcuse-eelsser HtJYI1h·Feldl Dolna granicaecencn
2 18216,667 29614,084 18520,604 36433,333
F
retcmośc
14,217
,000
14,217
,001 ,001 ,002
14,217 14,217
D
mispSSProc~golowy
RYCINA 7.7. Testy efektów wewnątrzobiektowych.
to chcemy zwykle dowiedzieć się, które ze średnich różnią się mię dzy sobą istotnie. W wypadku gdy decyzja o dokonaniu takich porównań podjęta jest już po rozpoczęciu analizy danych, porównania te noszą nazwę post hoc. Niestety procedura SPSS Powtarzane pomiary nie dostarcza wyników porównań post hoc.
Najprostszym sposobem uzyskania zarówno z góry zaplanowanych porównań między poszczególnymi średnimi, jak i porównań post hoc, jest posłużenie się testem t dla prób zależnych. Odwołując się do naszego przykładu, możemy powiedzieć, że skoro mamy trzy warunki eksperymentalne, to możemy porównać "A" z "B", "B" z "C" i "A" z "C". Jednakże w takiej sytuacji dochodzi do sumowania błędów. Otóż w trakcie dokonywania pojedynczego porównania dwóch średnich za pomocą testu t zakładamy, że maksymalny dopuszczalny błąd wynosi p = 0,05. Każdy kolejny test to 0,05 wię cej. W wypadku trzech testów mamy zatem do czynienia z błędem wynoszącym 0,15. Rozwiązanie tego problemu, które powinno zapobiec wzrostowi dopuszczalnego błędu, może polegać na przyjęciu niższego poziomu alfa dla każdej analizy przeprowadzanej testem t dla prób zależ nych. Możemy podzielić 0,05 przez 3 (3 odpowiada liczbie warunków eksperymentalnych). Uzyskamy wtedy wartość 0,0167, co będzie naszym poziomem alfa, dla porównań za pomocą testu t. Ponieważ powinniśmy w tym wypadku testować hipotezę jednokierunkową, należy podzielić przez 2 wartości istotności, które SPSS wskaże nam dla każdego porównania, a wynik tego wyliczenia porównać z wartością alfa = 0,0167. Rycina 7.8 pokazuje rezultaty porównania trzech par pomiarów dla poszczególnych warunków eksperymentalnych. Oto interpretacja tabeli z tymi wynikami: 1. Porównanie warunków oval i deform. Otrzymana wartość p =
0,0245 (0,049:2) jest większa niż 0,0167. Znaczy to, że uzyskana wartość t wynosząca 2,122 nie była wystarczająco wysoka, aby można było odrzucić hipotezę zerową. Nie możemy zatem stwierdzić, że niemowlęta reagują inaczej w wypadku prezentacji pustego owalu, niż w wypadku prezentacji owalu zawierającego losowo rozmieszczone elementy twarzy. 2. Porównanie oval i face. Otrzymana wartość p < 0,0005 «0,001:2) jest mniejsza niż 0,0167. Znaczy to, że uzyskana wartość t wynosząca 4,358 była wystarczająco wysoka, by odrzucić hipotezę zerową. Możemy zatem stwierdzić, że niemowlęta skupiają uwagę
I ;os
74
PORÓWNYWANIE PRÓB ZALEŻNYCH...
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
~ Phk Ed)'citI
'W.doŁ
-
--"---
."
Format Anabza W,luesJ' N• .,.",..
Wstaw
, ~~l~SlJ ~ ~
a iilliłlcU? I~ [§I wI
-_.'Okoo
-
-
-o x
P~
~lli~;'ffIq![~11
8
{§I Raport
l§} TestT (T.TEST)
e !.i
U"I'l' agl
statystyki dl&prób za Qj'Korelacjedlaprobz
aoauce wpróbachzaleznych 95%przedzlal
.~
umoscr orerczmcy eręomen
,.
Błąd
Brednia Para
1 Para 2 Fara
....,---J
·,r·---·-·-----, l
! !,
Test dlapilili zaleznych
drylu!
;
~bJaneelernerIIJl(wlymOukJjile/zwlmęłe)
blalyowal-'twarz
zoerormowena biały owal· twarz naturalna tearzzdefurmcwana -fwarznaturalna
""···H··"._·....__
,
..
Odchylenie standardowe
standardowy
sreomer
Dolna granica
ramce
df
ł
tstomosc (dwustronna)
-11,67
23,326
5,498
-,07
-2,122
17
-SO,OO
58,410
13,767
-89,05
-30,95
·4,358
17
,000
-48,33
61,093
14,400
-78,71
-17,95
-3,357
17
,004
_. ..
------lłlSPSSPioĆeros !lOto~
-23,27
Górna
--··--h,
---,--,-~,-,-,--
--
r
~~
,049
,
.$l,
~
.. [dG
- -- - [H-lllS-W Sif~l- .4
RYCINA 7.8. Porównania metodą post hoc dokonane za pomocą testu t dla prób zależnych.
istotnie dłużej na figurze przedstawiającej twarz niż na pustym owalu. 3. Porównanie deform i face. Otrzymana wartość p = 0,002 (0,004:2) jest mniejsza niż 0,0167. Uzyskana wartość t = 3,57 była więc wystarczająco wysoka by umożliwić odrzucenie hipotezy zerowej. Możemy wiec stwierdzić, że niemowlęta skupiają uwagę istotnie dłużej na figurze przedstawiającej twarz niż na figurze zawierającej elementy twarzy umieszczonej na owalu w sposób losowy.
Wnioski
Porównanie czasów skupiania uwagi na poszczególnych obiektach wskazuje, że obecność pewnych elementów twarzy nie spotyka się z taką samą reakcją niemowląt, jak obraz będący odzwierciedleniem całej twarzy. Niemowlęta naj dłużej skupiają swoją uwagę na obrazach odzwierciedlających naturalny układ elementów twarzy ludzkiej.
ZADANIA Niniejszy rozdział miał Cię nauczyć analizy wyników pochodzą cych z więcej niż dwóch pomiarów zmiennej zależnej. Skorzystaj z dodatkowych danych, które może Ci przekazać prowadzą cy ćwiczenia, i w celu ugruntowania zdobytych umiejętności poćwicz analizę wariancji z powtarzanym pomiarem, wykonując następujące zadania: 1. Sformułuj i zapisz hipotezę zerową w celu dokonania analizy danych. Jaka to hipoteza? Jedno- czy dwustronna? 2. Przeprowadż analizę, korzystając z procedury Powtarzane pomiary. Jeśli okaże się, że istnieją różnice między grupami pomiarów, to dokonaj pogłębionej analizy tych różnic. Wykorzystaj opisaną w tym rozdziale metodę porównań post hoc. Zapisz plik raportu. 3. W dwóch, trzech zdaniach zapisz swoje wnioski z przeprowadzonej analizy. Wskaż, czy różnice pomiędzy grupami okazały się istotne, czy nie. Jeśli okazało się, że różnice pomię dzy grupami są istotne, to wskaż także, która grupa różni się istotnie od pozostałych.
75
BADANIE PROSlYCH RELACJI MIĘDZY DWIEMA ZMIENNYMI
od -1 do 1. jego maksymalne wartości wskazują na dos- negatywną (-1) i pozytywną (1) - korelację-s. Natomiast r = wskazuje na całkowity brak związku między zmiennymi. Wartość bezwzględna współczynnika korelacji może wynosić od do 1 - im wyższa wartość, począwszy od 0, tym większa siła związku pomiędzy zmiennymi. waha
Rozdział
8
Badanie prostych relacji między dwiema zmiennymi
CELE ZAJĘĆ
1. Nabycie umiejętności formułowania pytań badawczych dotyczących korelacji pomiędzy dwiema zmiennymi. 2. Opanowanie umiejętności wizualizowania relacji pomiędzy zmiennymi za pomocą wykresu. 3. Nabycie umiejętności interpretacji współczynnika korelacji Pearsona.
Korelacja jest metodą statystyczną, która służy do badania relacji pomiędzy dwiema zmiennymi. jedną zmienną określamy jako X,
drugą jako Y. Mogą one występować w sposób naturalny lub też
być efektem oddziaływań eksperymentalnych.
Wyobraź sobie, że jesteś socjologiem i że interesuje Cię zależność między poziomem wykształcenia a dochodami. Możesz postawić następujące pytanie badawcze: "Czy ludzie lepiej wykształceni zara-
biają więcej niż osoby gorzej wykształcone?" Po zebraniu danych, na przykład wśród osób pracujących w turystyce, relację pomiędzy badanymi zmiennymi zbadasz w SPSS, stosując współczynnik korelacji Pearsona. Przeprowadzając tę analizę, dowiesz się, jakie jest natężenie tego związku oraz jego kierunek - pozytywny bądź nega-
tywny. Współczynnik korelacji nazywamy czasem miarą związ ku między dwiema zmiennymi. Wartość współczynnika korelacji r
się
konałą
°
°
Stosowanie procedury "Korelacje" Analiza przykładu będzie oparta na wynikach przedstawionych w Dodatku, w tabeli Korelacje. Po utworzeniu bazy danych (nadaj jej nazwę, na przykład "Korelacje", i zapisz na dysku) wykonaj następujące kroki: kliknij na menu Analiza, potem na Korelacje (por. rycina 8.1). Z uzyskanego podmenu wybierz Parami (SPSS pozwala na wyliczenie wielu typów korelacji - skorzystaj z podręczników lub z wiedzy prowadzącego ćwiczenia, by dowiedzieć się czegoś więcej na ich temat).
Wybór zmiennych do analizy Procedura Korelacje: parami służy do oszacowania korelacji pomię dzy dwiema zmiennymi. Wyniki analizy przedstawione są w postaci tabeli (matrycy) pokazującej wartość współczynnika korelacji dla każdej możliwej pary zmiennych. jeśli użyjesz dwóch zmiennych, to SPSS utworzy tabelę typu 2 x 2. Typ tabeli jest zatem uzależniony od liczby użytych zmiennych. Definiowanie analizy możesz rozpocząć od okna Korelacje parami (por. rycina 8.2). Również w tym wypadku spotkasz się z opisanym w poprzednich rozdziałach sposobem wyboru zmiennych. Wybierz zmienne do analizy: lata nauki (wykszt) i aktualne zarobki (zarob). Korelacja r = 1 oznacza, że im wyższa wartość jednej zm~ennej, ty~ wy~sza warto~ć drugiej, na przykład im większy promień koła, tym dłuzszy J<:go ob~od - Jest .zalez~ ność wprost proporcjonalna. Korelacja r = -1 o~nacza, z~ Im wyzsza wart?s~ Jednej zmiennej, tym niższa wartość drugiej, na przykład Im więcej kupionych batomkow, tym mniej pieniędzy w portfelu - zależność odwrotnie proporcjonalna (przyp. tłum.). 22
:?
77
78
1':1
BADANIE PROSTYCH RELACJI MIĘDZY DWIEMA ZMIENNYM
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
_" x
.3J re
acje -
SPSS Edytor danych
Plik Edycja
Widok
Okno Pomoc
Przekształcenia
Dane
I A~aliz;:
l~l ~ ~ ~ ~ ~ R: , IU 1 Id ~~ . _ li1 j [~
:-.~----"
~ . .
11
15
12420'-j
warstwowe-'-;.·.,.....;;;;...~;;;,;;.-------...J średnich ~ Ogólny model liniowy ~ r';-='::=-~-- ---------- ~-=t;: Modele mieszane • I. I var "=r- ;~7"-J ~ -;;;.~~t=
2
12
, 8880 I 8640 27500
Regresja Analizy logliniowe Klasyfikacja
GykS:;~"=T~~~b~-1-:i
Id
2
I~
3 4
~
~ .. " 51
Wykres}' Narzędzia Okno Pomoc Raporty OpiS statystyczn.v ~ Porówn.vwanie F===========",j
w m 6i9i
12 17
.!tw;mi:r···Cząslkowe . ';
,
"port
Korelacje
~Kore~
-lG:'JTytul ~UW8Ql
'Llil_
Kor~1acle
Odległości .
.:,-.:..::.::.:::..:=.::.....J
lata nauki
+
Korelac]aPearsona Istotność (dWUstronna) N KOTelaClap",arsona Istotnost(dlHUslronna)
lata nauki 1
aktuaine zarob'o
,iO" ,ODO
30
30
5 6 7 8 9
18 12 8 8 8
31300 10980 10080 7860 8940
Redukcja danych Skalowanie Testy nieparametryczne Analizy przeżycia Wrelokrotne odpowiedzi
10 11 12 13 14 15 16
12 15 12 12 8 16 15
12300 12660 8400 9360 12780 18100 10980
4,67 5,33 6,83 ,00 34,00 3,00 4,00
~
17 18
19 12
36800 12300
10,58 25,58
relacji Pearsona.
~
19 20
12 15
9780 8280
8,92 10,08
~~
~~
~~~~~
,42 8,00
SPSS umożliwia wyliczenie kilku współczynników korelacji dla zmiennych zmierzonych na różnych skalach pomiarowych. Współ czynniki 'f-b Kendalla i r Spearmana możemy liczyć dla danych porządkowych lub rangowanych, a r Pearsona - dla danych mierzonych na skali ilościowej. Zmienne składające się na naszą bazę danych są danymi tego ostatniego typu . Możesz wybrać jedno- albo dwustronny test istotności współczynnika korelacji. Wybór sposobu testowania istotności zależy od treści hipotezy badawczej. Jeżeli klikniesz na polecenie Oznacz korelacje istotne, to SPSS po wyliczeniu współczynnika korelacji oznaczy gwiazdką (*) te wartości, które będą istotne statystycznie. Tak jak w poprzednich przykładach, wartość p informuje o prawdopodobieństwie popełnieniu błędu pierwszego związanego z odrzuceniem hipotezy zerowej. W wypadku korelacji hipoteza zerowa gło si, że dwie zmienne nie są ze sobą skorelowane. Odrżucenie hipotezy zerowej bądź brak możliwości podjęcia takiej decyzji zależy od poziomu alfa przyjętego przed przystąpieniem do analizy (zwy-
~
~
~ ~
~ ,11
:"12] ~ ~
Y
,16
~ '. .. 17'
~."""~9 :
...
~~
• • .• •
KOfelaqe palamI
~ numerIdent9flkacyln.l,' p
Zmienne
,-,~ skala dośwredczeme zl
r;{ii>;:-;-:Iat~an-a""uk-='lw-Y""ks-'tl-~ ~ aktualne zarobki [zarob]
OJ Współ'czynnlkl korelacll---------~ ~ Peerson
D
teu-b Kendalla
[ Test IStotnOŚCI
C!J
Dwustlonna
o Spearman
o Jednostronna
~ OznaczkorelacjeIstotne
RYCINA 8.2. Wybór zmiennych do analizy za współczynnika korelacji.
N
.ro
1
,ODO 30
30
_ KorglaCJaJesllstotna na ponomrę O01 (dIM.lstronme)
I
RYCINA 8.3. Raport z wynikami analizy dokonanej za pomocą współczynnika ko-
RYCINA 8.1. Uruchamianie procedury Korelacje: parami. •
aKtualnezarobkJ
pomocą
kle p= 0,01 lub P = 0,05). Rycina 8.3 przedstawia wyniki analizy opartej na naszych danych przykładowych. SPSS wyliczył, że współczynnik korelacji
80
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
pomiędzy zmiennymi
lata nauki i aktualne zarobki wynosi r = 0,70, gdzie N = 30. Wartość współczynnika korelacji jest dodatnia, co oznacza, że zmienne te wzrastają w tym samym kierunku - osoby z wyższym wykształceniem uzyskują wyższe zarobki, a osoby słabo wykształcone zarabiają mniej. Zauważ, iż gwiazdki-t przy r oznaczają, że współczynnik jest istotny przy p = 0,01.
Przedstawianie relacji
między
zmiennymi na wykresie
Do graficznego przedstawienia związku między zmiennymi ilościo wymi badacze używają wykresu rozrzutu. Takim wykresem możesz się posłużyć, aby przedstawić, jak zmienna X współzmienia się ze zmienną Y. Dzięki takiej wizualizacji łatwiej wykryć anomalie w danych. Anomalie takie widoczne są w postaci punktów szczególnie oddalonych od innych punktów wykresu. Anomalie mogą mieć duży wpływ na wartość współczynnika korelacji. Warto zwrócić szczególną uwagę na takie sytuacje i w razie konieczności eliminować je z analizy. Po wyliczeniu współczynnika korelacji Pearsona Twoim zadaniem będzie wizualizacja korelacji pomiędzy zmiennymi. W tym celu użyj menu Wykres, a następnie Rozrzutu (zob. rycina 8.4). Poszczególne punkty, przedstawiające wynik danej osoby, będą umieszczone pomiędzy dwiema osiami współrzędnych. Na osi X znajdzie się zmienna wykszt, a na osi Y - zarob. Po uruchomieniu opcji Wykres: rozrzutu pojawi się okno przedstawione na rycinie 8.5. SPSS pozwala na wygenerowanie różnych typów wykresów - warto poeksperymentować z opcjami przedstawionymi w oknie Wykresy rozrzutu. Pozwalają one na różne sposoby graficznego przedstawienia związku między zmiennymi. Wykresy rozrzutu nadają się najlepiej do przedstawienia relacji między zmiennymi zmierzonymi na skali ilościowej. Używanie tej metody do obrazowania
23
W psychologii zazwyczaj wartość r istotną na poziomie alfa = 0,05 oznacza się jed(*), a wartość r istotną na poziomie alfa = 0,01 - dwiema (**) (przyp.
ną gwiazdką tłum.).
BADANIE PROSTYCH RELACJI __irelocre
PliIe.
~P5S
Edytor danych
Edycja Widok
Dane
MIĘDZY DWIEMA ZMIENNYMI
_
Przekształcenia
Analiza "vi kre$}'i Narzędzia
Okno Pomoc
Galeria Interaktywne Słupkowy...
~
I
Id 1 2 3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
21 22
12420 8880. 8640 27500. 31300 10980 ·10080·
dosw 1,17 27,00
7860 8940 12300 12660 8400 9360 ·12780 18100 10980 36800 12300 9780. 8280. 14820 13560:
Liniowy... Warstwowy... Kołowy . Max-Min .
,001 - - - - - -1 3,17 Perero ... 3,92 Kalty kontrolne... 14,42 '28,67
Skrzynkowy .
Słupki błędu .
'18;501~jiiiiiiiil 8'." 14,001 Hlstogram.. _ 4,671 p·P . 5'331' K-K . 6,83 Sekwencyiny . ,00, Krzywa ROC . 34,00 Szeregi CZ8a:owe
~
3,00 4,00' 10,58 25,58 8,92 10,08 ,42 8,00
RYCINA 8.4. Wybór opcji Wykres: rozrzutu.
RYCINA 8.5. Wybór typu wykresu rozrzutu.
: Wykresy rozrzutu
[II ..
~
I:~~:I Nakładany
1#13'W
Macierzowy
-=.. Pomoc
relacji między zmiennymi mierzonymi na skalach nominalnej i porządkowej jest mało przydatne. W naszym przykładzie będzie my korzystali z typu wykresu Prosty, ponieważ chcemy przedstawić relacje między dwiema zmiennymi. Zaznacz więc ikonę Prosty i naciśnij klawisz Definiuj.
81
82
BADANIE PRU::; I Y\.;H
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Pfik Edycja \J/'Idok 'Wataw forIUl
OśY:
-@> numeridentyfikacyjny -@> skala doświadczenia z
Liik-,lu-.~-!~_-e_-z~-~o-bk-i-[z-aro-b-]-
""""'. "'......
!~I~lelm.Il'!l1!lEl 11lIlII1'6U1 \ ~ ~ [ill] lB3 @Id] Em!U11
Narzędzia
un
Ok. .
tlt: LAI.-.J l IVII"UL.1
P_c
.-1!iIR_ -
t§l1Nykres (ORAPH)
.
IT~~ • UWtlgl
Wykres (GRAPH)
40000
,
Ustaw znaczniki wedi'ug:
[}] [ .
L"VI~"'~ ~ . . , , - , . . . • ••••
o
-.J
"
30000
"
użyj do opisu obserwaqi ,
20000
~
S z a b l o n - - - - - - - - - - - - - - - - - - -......
D
@
c
]'l
Zastosuj szablon wykresuz:
~
r Pik. l
ł
•
~
"
10000
c
!
,
ID
c
O'
6
8
10
12
"
16
18
20
lata naukl
RVCINA8.6. Wybór zmiennych w celu utworzenia wykresu.
RVCINA8.7. Raport przedstawiający wykres relacji pomiędzy zmiennymi: lata
nauki a aktualne zarobki.
Kiedy to zrobisz, SPSS otworzy okno Prosty wykres rozrzutu (zob. rycina 8.6). W tym oknie ustalisz, na których osiach zostaną przedstawione Twoje zmienne. Najpierw zaznacz zmienną lata nauki (wykszt) i przy użyciu drugiej strzałki (licząc od góry) ustal, że będzie ona tworzyła oś X. Następnie wybierz zmienną zarob i za pomocą pierwszej górnej strzałki przenieś ją do okienka dla zmiennej y. Całą operację tworzenia wykresu zakończ, naciskając OK. Uzyskasz taki wykres jak na rycinie 8.7. Uzyskane wykresy możesz wydrukować. W tym celu użyj opcji Drukuj w menu Plik. Drukowanie wykresów może zajmować trochę czasu - im bardziej nowoczesny komputer, tym szybsze drukowanie. Możesz zmienić tytuł swojego wykresu. W tym celu dwukrotnie kliknij na domyślny tytuł wykresu (Wykres (GRAPH) i wpisz własną nazwę. Przypominamy, że SPSS ma możliwość eksportu wykresów do plików graficznych.
ZADANIA Celem niniejszego rozdziału było przygotowanie Cię do badania relacji między dwiema zmiennymi ilościowymi. Wykonanie następujących zadań ugruntuje twoją wiedzę: 1. Użyj bazy danych dostarczonej przez prowadzącego ćwiczenia do postawienia pytań badawczych i hipotez. 2. Przetestuj te hipotezy, używając procedury Korelacje: parami. 3. Przedstaw relację między zmiennymi za pomocą wykresu. 4. Sformułuj wnioski z przeprowadzonej analizy.
--
OPISYWANIE ZWIĄZKÓW LINIOWYCH MIĘDZY DWIEMA ZMIENNYMI
Rozdział 9
Opisywanie związków liniowych między dwiema zmiennymi ! /
CELE ZAJĘĆ 1. 2.
Zrozu~ienie związku między korelacją a regresją.
NabY~le .umiejętności formułowania
hipotez badawczych przewidujących wpływ jednej lub wielu zmiennych niezależ nych (predyktorów) na zmienną zależną (kryterium). 3. N~b~cie umiejętności wykonywania analizy regresji przy uzvoiu SPSS. 4.
Nab~c!e umiejętności formułowania wniosków na podstawie wynrkow zastosowania procedury Regresja: tiniows.
w: po?rzednim. rozdzial~ uczyliśmy się, w jaki sposób mierzyć rela-
CJę m~ędzy dWIe~a zmIennymi. Do tego celu używaliśmy współ cz~nTI1ka korelacji Pearsona. Budowaliśmy także wykres rozrzutu,
pozwalał ~a rozszerzony opis relacji między zmiennymi X i Y. ~ .ty:n. rozdzI~le skupimy się na opisie relacji pomiędzy zmien-
ktory
pomocą analizy regresji. Jest to metoda starystyczn~ słuząca d~ przed~ta~ieni~ związku między zmienną zależną nymi I1osCI?wymI za
(~~~terlUm? a z~~ennymI mezaleznymi (predyktorami) za pomocą h~ll regresp; LI.n~a regresji j.est to prosta dopasowywana do punktow ?rzeds;tawIającychwyniki uczestników badań (por. rozdział 8) :v ta~ sp~s?b, aby odległość pomiędzy tymi punktami a linią była
Jak najmniejsza,
Zwykle X o~reśl~ się ~ianem zmiennej niezależnej (predyktoY - zmI~nneJ zale.znej. Tak jak w przypadku korelacji, dla kazdego uczestmka badania powinniśmydysponować pomiarem na
re~), a
zmiennych X i Y. Mówimy, że X pozwala na przewidywanie Y. Matematyczną reprezentacją takiego sformułowania jest wzór:
Y' = a + bX gdzie: Y' to przewidywany wynik pomiaru zmiennej zależnej (kryterium); a to wartość tak zwanego wyrazu wolnego, a inaczej punktu przecięcia osi Y z linią regresji; b to współczynnik regresji, czyli miara nachylenia linii regresji względem osi X; X to wartość pomiaru zmiennej niezależnej (predyktora). W rozdziale tym przedstawimy dwa warianty analizy regresji: regresja z jednym predyktorem i regresja wielokrotna. Pierwszy z nich pozwala na opisanie związku między jedną zmienną niezależną (predyktorem) a zmienną zależna (kryterium), drugi zaś - na opis związku kilku zmiennych niezależnych (predyktorów) z jedną zmienną zależną (kryterium). Zaletą regresji wielokrotnej jest jej całościowy charakter, możliwość jednoczesnego uwzględnieniawię kszej ilości predyktorów. Matematyczny zapis regresji wielokrotnej z dwoma predyktorami przedstawia się następująco:
Y' = a + b1X1 + bzXz gdzie: Y' oznacza przewidywany wynik pomiaru zmiennej zależnej (kryterium); a - wartość tak zwanego wyrazu wolnego, inaczej punktu przecię cia osi Y z linią regresji; b1 - współczynnik regresji dla pierwszej zmiennej niezależnej (pierwszego predyktora); Xl-wartość pomiaru pierwszej zmiennej niezależnej (pierwszego predyktora); bz - współczynnik regresji dla drugiej zmiennej niezależnej (drugiego predyktora); X z - wartość pomiaru drugiej zmiennej niezależnej (drugiego predyktora).
85
......
UU 1:l1l:l.JU
OPISYWANIE ZWIĄZKÓW LINIOWYCH MIĘDZY DWIEMA ZMIENNYMI
\,jU I UWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Pytanie badawcze Analiza regresji pozwala odpowiedzieć na podobne pytania jak w wypadku analiz z zastosowaniem współczynnika korelacji Pearsona. ~ poprzednim rozdziale rozważaliśmy pytanie: "Czy ludzie ~ar~zi~J ",!ks~tałceni zarabiają więcej?" Uzyskane wyniki wykazały istmeme silnej pozytywnej korelacji między latami nauki i zaróbka~i (r = O?OS): ,Biorąc ~o pod uwagę, możemy sformułować pytame o możliwość przewidzenia zarobków danego pracownika na podstawie informacji o jego poziomie wykształcenia. Analiza regresji jest metodą statystyczną, której możemy użyć w celu udzielenia odpowiedzi na takie właśnie pytanie. Natomiast ~naliza regresji wielokrotnej pozwoliłaby w tej sytuacji na zbadanie iednoczesnegc oddziaływania dodatkowych czynników. Taką analizą mozemy Się posłużyć, formułując następujące pytanie badawc~e: "Czy d~świadczenie zawodowe wraz z poziomem wykształce m.a pozwalają na przewidywanie poziomu zarobków?" Tak posta~lOne pytani~ implikuje, że zarówno doświadczenie zawodowe, jak i wykształceme mogą jednocześnie oddziaływać na pensje uczestników przeprowadzanego badania. Zmienną zależną (kryterium) był~by w .tym ~padku wielkość aktualnych zarobków, a zmiennymi niezależnymi (predyktorami) - doświadczenie zawodowe i poziom
wykształcenia.
W wypadku współczynnika korelacji Pearsona siła i kierunek :elacji między zmiennymi X i Y wyrażona była za pomocą wielkości i znaku. współczy~nika r. W wypadku analizy regresji relację mię dzy zmienną zalezną (kryterium) a zmiennymi niezależnymi (predykto~ami~ określamy w podobny sposób, posługując się współ c~ynm~am~ b. Im wyższa wartość wyliczonego dla danej zmiennej niezależnej (predyktora) współczynnika b - niezależnie od jego znaku ~ w tym większym stopniu poziom zmiennej niezależnej (k~yt~num) uzależniony jest od poziomu tej właśnie zmiennej zaleźnej ,
przewidywaniu wartości zmiennej Y (kryterium) współczynnik b pełni rolę mnożnika; wzrostowi zmiennej X o jedną jednostkę pomiarową towarzyszy wzrost zmiennej Y o b jednostek pomiarowych-". Znajomość poziomu zmiennej X oraz wielkości odpowiadającego jej współczynnika b ułatwia więc przewidywanie poziomu zmiennej Y. Celem analizy regresji wielokrotnej jest wskazanie tych zmiennych niezależnych (predyktorów), które łącznie wyjaśniają najwię kszy procent zmienności zmiennej zależnej (kryterium). Uwzględ nianie w równaniu regresji kolejnych zmiennych niezależnych (predyktorów) jest korzystne wtedy, gdy powoduje to wzrost możliwo ści przewidywania (wyjaśniania) zmienności w zakresie zmiennej zależnej (kryterium). Współczynnik determinacji r 2 wyraża to, jaki procent wariancji daje się wyjaśnić przez uwzględnione zmienne niezależne (predyktoryj-'. Myślenie o analizie regresji w kategoriach przewidywania poziomu zmiennej niezależnej (kryterium) na podstawie poziomu zmiennych zależnych (predyktorów) nie oznacza, że zakładamy tu istnienie zależności o charakterze przyczynowo-skutkowym. Analiza regresji stanowi często jedynie bardziej złożoną formę analizy opartej na badaniu korelacji. Stąd też stwierdzenie w analizie regresji związku miedzy zmienną niezależną (predyktorem) a zmienną zależną (kryterium) nie musi wcale oznaczać występowania związku przyczynowo-skutkowego.
Stosowanie procedury "Regresja: liniowa" W przykładzie tym użyjemy zbioru przedstawionego w poprzednim rozdziale. Otwórz zatem bazę danych przygotowaną w Dodatku. Aby uruchomić tę procedurę, kliknij na Analizę, a następnie na Regresję i przejdź do menu Liniowa (por. rycina 9.1).
W wypadku, gdy b ma wartość ujemną, będziemy mieli do czynienia ze spadkiem przewidywanego poziomu zmiennej Y. 25 Na przykład r 2 = 0,34 oznacza, że zmienne niezależne (predyktory) wyjaśniają, a więc pozwalają przewidzieć 340/0 wariancji zmiennej zależnej (kryterium; przyp. tłum.).
24
87
Plik
Edycja
Widok
Dane
Analiza' Wl'kresJI
Narzędzia
Raporty warstwowe
•
Opis statystyczny
..
Porównywanie irednich ..
1c==.;+-_ _.:.J1 2 3 4'
5 6 7 8
15 12 121 17' 18 12 8
8'
98 10 12 11 15 12 12 13 12 14 8 15' 16 16 15 17 19 18' 12 19 12 20 15' 21 15 22 15
12420
Okno Pomoc
<%> numer ident~fikac~in~ <%> latanauki [w~kszt] <%> skala doświadczenia z
t============J
~:::~:~:~~:OWy
: '
Korelacie
•
-~··TY~1=-~r···:J-···~
- ... . ~:~~' 1·!!~~~~·~I'~ ••"••• I'.lasyfikacia Redukcja danych Skalowanie
Test, nieparametrgczne
Porządkowa
4,67 5,33 6,83 ,00 34,00
PLUI.L
Metoda
ProbiL. .1 - - - - - - - - -1
,
[WNK»
4,00
10,58
12300 9780 8280 14820 13560
25,58 8,92 10,08 ,42 8,00
[N~;ęp~Cl
1~~.:~~ __~ ..._·8
Nieliniowa... Szacowanie wag... Podwójna MNK,.,
'3,ÓO
368ÓÓ
[P;;=-~]
w [~!:~~~~.~~j
logistyczna... Wielomianowa logistyczna...
AnalizJI przeżjlcia Wielokrotneodpowiedzi .. !
Blok 1 z l
Zmienne nlezalezne
Analizy logliniowe
27500 31300 10980 10080 7860 8940 12300 12660 8400' 9360 12780 18100 10980
Zmienna zalezna:
\}] E~~~.~~~L~J
RYCINA 9.2. Wybór zmiennych.
porównaj z RYCINA 9.1. Wybór procedury Regresja: liniowa.
J
ryciną 9.3. W
oknie Regresja liniow~: statystyki wybierz
współczynnik regresji oszacowania, dopasowanie r:zodelu: st~tysty
ki opisowe. Następnie kliknij Dalej - w ten sposob przeJdZ1es~ d.o głównego okna. Zakończ procedurę, naciskając OK. SPSS przeJdzIe do utworzenia raportu.
Wybór zmiennych do analizy Interpretacja raportu z analizy Gdy p~zej~z~esz do wspomnianych menu i opcji, wyświetli się okno Regresja .ltnto~a (por. ~ycina 9.2). Dzięki niemu możliwe będzie ws~azame zmiennych niezależnych i zmiennej zależnej. Wybór tych zm~ennych o.dbywa się w standardowy sposób. Najpierw wybierz zmienną zalezną a następnie zmienną albo zmienne niezależne. SPSS pozwala na użycie tylko jednej zmiennej zależnej. W zależności od te?o, czy chcesz ~kon~ć prostą analizę regresji, czy też regresję wlelo~rotną, wybierzesz Jedną bądź więcej zmiennych niezależnych. Głowne ~kno modułu Regresja liniowa zawiera wiele opcji podstawowych l zaawansowanych, pozwalających na wyliczenie róż nych statystyk. Najpierw kliknij na Statystyki, a efekty swojej pracy
W niniejszym rozdziale przedstawimy dwie analizy. Pierwsza z nic~ jest analizą regresji z jedną zmienną niezależn~ (~red~ktorem), ~to rą będzie poziom wykształcenia (lata naukt), .1 z~llenną zależną (kryterium) aktualne zarobki. Ten m~de1 stan~wl ~aJprostszą wer~Ję analizy regresji. Kolejną analizą będzie regresja WIelokrotna z dwie. ' ma zmiennymi niezależnymi. W pierwszym wypadku aktualne zarob~i s~ ~mlenną zalezną, której wartości będziemy próbowali pr~eWl?ZleC z~ pomocą predyktera lata nauki. Związek między ty~~ zmIennymI został o~zaco wany przy użyciu współczynnika korelacii (r = 0,7; zob. rozdZIał 8).
9O
OPISYWANIE
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
ZWIĄLKUVV
LlI'<'UVV l~'
, ,."..,-_.
-
_" x
~ Dopasowanie modelu
o Przedzial-y ufności D Macierz kowarianCJI
O Zmiana R·kwadrat lt1 Statystyki opisowe
D Test wspóthnlowoścl D KorelaCie serraczęstkowe I cząstkowe
_
~RllPOr1
-.
..I!il""'''' T~"
~~oplsOWe
~:::~awedz
Model- podSlUn"wanle
• LJ 1
\,
8~d
\ 8k0lY9OWane \ standardOWy'
R R-kWadral .705~ ,497
R-kW'adrat ,479
I
oszacowania 546S,441
a Predyklory(S1ala),lalanaukl
Reszty-------------------....., O Durbin-Watson
O
Dlagnostyka obserwaCJami @ OtGe!W
~~
LJ odchi,*1ia t~"t1d
O W~,,1he oos>afwaqe
RYCINA 9.4. . ." . modelu regresji: współczynmk determinacJI. podsumowame _ ox
RYCINA 9.3. Wybór statystyk.
z tym, przeprowadzając analizę regresji, powinniśmy się spodziewać pozytywnej wartości współczynnika regresji dla zmiennej lata nauki. Celem kolejnej analizy będzie dodatkowo oszacowanie wpływu informacji o doświadczeniu zawodowym na możliwość przewidywania wysokości osiąganych dochodów. Ażeby oszacować równoczesny udział przedstawionych tu zmiennych, w okienku zmiennych niezależnych należy umieścić zmienną dosw (wynik na skali doświadczenia zawodowego) oraz zmienną urykszt (lata nauki). Twoim zadaniem będzie zatem przeprowadzenie dwóch analiz: 1) z zastosowaniem zmiennej niezależnej lata nauki, 2) z zastosowaniem zmiennych niezależnych lata nauki i doświadczenie zawodowe. W
związku
Analiza regresji Interpretacja wyników tej analizy powinna się opierać na trzech rodzajach informacji, zawartych w raporcie wygenerowanym przez SPSS. Czytanie raportu zacznij od zwrócenia uwagi na współ czynnik determinacji umieszczony w tabeli Model - podsumowanie (zob. ryc. 9.4). Współczynnik ten oznaczony jest jako R2. Widzimy, że wartość R2 wynosi 0,497. Oznacza to, że około 50%
Analiza warialłCJl b Suma Model
1
kwadratów
Regre$la Reszta o~ółem
827525946 831307601 1,665E+09
Istotność
dl 1 28
8,JE-+OB 3,OE+07
27,673
,000.1
29
a Predyl
RYCINA 9.5.
, .' . gresji . Test F, służący do oszacowania istotnoscl rownanla re
wariancji zmiennej
zależnej jest wyjaśniona za pomocą zmiennej la-
ta nauki: . m ws ółczynnikiem jest statystyka F, która Ko.lejnym w::nY 673 P(zob. rycina 9.5) Jeśli F jest istotne, czyalfa (zwykle przyblera wartosc 2 6" . . li uzyskane ~ jest mn~ej~ze ~d Pa~i~j~:eg~~s~~z~~:~a przewidzieć O 05) t mozesz uznac, ze rown . , .' o . . . I. ej' (kryterium) w stopniu statystyezme poziOm zm1ennej meza ezn
istotnym.
l'
rócić na tabelę zatytułowaną Współ-
Szc~e.gólnąbuwag~ na ;zJ) Z';,naj'dują się tam statystyki, które
czynnzkt (zo . ryema
. .
92
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
PODSTAWY OBSŁUGI SPSS
wskazują, czy wybrana zmienna nie zależna jest istotnym prędykto rem zmiennej zależnej (kryterium). Powinniśmy przeanalizować na-
93 _ D
•
_ D
•
stępujące współczynniki: Wsp6łczynrllkl
B niestandaryzowany współczynnik regresji
WspÓ/cZ';l'Inlkl
Model
1
Analiza regresji wielokrotnej
Oznacza to, że każdy dodatkowy rok nauki związany jest średnio z przyrostem zarobkówo 1807,836 jednostek (przyp. tłum.). 27 Współczynnik ten równy jest współczynnikowi korelacji między obu uwzględnionymi w analizie zmiennymi (przyp. tłum.). 26
(Stala) lala nauki
standardu
-9923,665 1907,836
813113
4712,057 343,662
,105
l -2,106 5,261
Istotność
,044
,ODO
RYCINA 9.6. Ocena istotności predyktora w analizie regresji.
_.
n--r·
W'J'ł!;reS)'
mi
:.J ir;Q]QI3f"PJ
H_zędzia
li....
......
~=~DW'C:
=::I,m
r
""""
.
stlllystyldofll$ovve; Korlll&cje ,
l1riennewprowllC' ~-~~
._:'; .
roI'
ArIalizawarlar\ejl
-"
!$t"
:;,
Współczynniki WspólCZ!łnnlki
mestancarecwane
.:.
standaryzowa ne
~.
Błąd
Model
t
1:-
Wspołczynnikl'
--~
•
Analiza ta uwzględnia dodatkową zmienną niezależną (predyktor) - doświadczenie zawodowe (zob. ryc. 9.7). Wyniki analizy wskazują, że doświadczenie zawodowe jest istotnym predyktorem zarobków. Oszacowany poziom istotności 0,046 jest niższy niż 0,05 (p < 0,05), więc w tym wypadku uwzględnienie w analizie dodatkowego predyktora opłaca się. Włączenie tego predyktora pozwala na pełniejsze wyjaśnienie zróżnicowania w zakresie zarobków i zwiększa możliwość przewidywania. W analizie tego typu warto jest rozważyć możliwość uwzględnienia jako zmiennych niezależ nych (predyktorów) wszelkich dodatkowych zmiennych, o których sądzimy, że mogą być związane ze zmienną zależną (kryterium).
8
SI zmJennazareżna aktualne.zaro.bkl
Beta standaryzowany współczynnik regresji (wynosi on 0,705);27
Przedstawiona tabela wskazuje, że dla zmiennej wykszt poziom istotności oznaczony jest jako 0,000 (p < 0,001), co oznacza, że poziom wykształcenia (mierzony w latach nauki) jest statystycznie istotnym predyktorem wielkości wynagrodzenia.
na
Błąd
(wynosi on 1807,836);26
Istotność prawdopodobieństwo popełnienia błędu pierwszego rodzaju dla zmiennej niezależnej lata nauki.
stancswzoea
nrestanoa cwana
B (81ała)
-19073,6 2316,749
lala nauki
sxata ooswacezsnra zawodowego
a zmtenna
zareżna
270.036
slandardo'fl<)'
Bela
t -3,Q53
6247,413
406,034 129,334
,903 ,331
5,706 2,OBB
IstolnoSć
«
::
,005 ,000
4,
,046
[]
aktualne zarobki
~
~ISPSS PtOCtror gotowy
-
,
"*1',:'*"
-
~
1101
RYCINA 9.7. Ocena istotności predyktorów w analizie regresji wielokrotnej.
ZADANIA Korzystając z
tej samej bazy danych, spróbuj znaleźć dodatkodo tego analizy regresji. Uwzględnij następujące etapy: 1. Sformułuj pytanie badawcze. 2. Zastosuj SPSS do przeprowadzenia prostej analizy regresji oraz regresji wielokrotnej przy użyciu co najmniej dwóch zmiennych niezależnych. 3. Opisz wyniki obu analiz, zwracając szczególną uwagę na znaczenie poszczególnych zmiennych niezależnych (predyktorów) w przewidywaniu wartości zmiennej zależnej.
we
zależności, używając
~ ~
~if
164 W463pkl
A
BADANIE RELACJI MIĘDZY DWIEMA ZMIENNYMI JAKOŚCIOWYMI
używasz statystyk,
Rozdział
10
Badanie relacji między dwiema zmiennymi jakościowymi
CELE ZAJĘĆ
1. Nabycie umiejętności formułowania pytań badawczych dotyczących relacji między dwiema zmiennymi nominalnymi. 2. Nabycie umiejętności posługiwania się procedurą Tabele krzyżowe.
3. Nabycie umiejętności używania SPSS w celu obliczenia statystyki X2 • 4. Nabycie umiejętności opisywania analiz przeprowadzanych za pomocą X2•
W praktyce badawczej bardzo często stajemy w obliczu sytuacji, w której zmiennych nie sposób zmierzyć na skali interwałowej czy ilorazowej. Ponadto zdarzają się dane, które nie układają się zgodnie z rozkładem normalnym. Wówczas możemy użyć jednego z testów nieparametrycznych. Różnią się one od testów parametrycznych, takich jak test t, tym, że nie wymagają od badacza sformułowania założeń o normalności rozkładu czy jednorodności wariancji. Testy z rodziny metod nieparametrycznych nadają się zatem do analizowania wyników uzyskanych dzięki pomiarom zmiennych nominalnych i porządkowych. W niniejszym rozdziale omówimy test nieparametryczny Chi-Kwadrat (X2 ) . Analizując dane za pomocą testów parametrycznych,
na przykład średniej i odchylenia standardowego. Natomiast stosując test X2 , szukasz różnic pomiędzy częstościa mi (%) czy proporcjami występowania zjawisk (jakości), obserwowanych w dwóch różnych populacjach (próbach). Pytanie badawcze powinno sugerować relację pomiędzy dwiema próbami. Może my zatem zapytać: "Jaki jest procent kobiet i mężczyzn pilotujących samoloty w stosunku do całej populacji kobiet i mężczyzn?" Sformułowanie odpowiedzi na to pytanie wymagałoby określenia proporcji mężczyzn, którzy są pilotami, w stosunku do mężczyzn, którzy nie posiadających takich uprawnień, oraz proporcji pilotujących kobiet w stosunku do kobiet, które pilotkami nie są. Różnice mię dzy tymi proporcjami możemy oszacować za pomocą X2 • Taką wersję X2 nazywamy testem dobroci dopasowania. W innej sytuacji badawczej możemy chcieć odpowiedzieć na pytanie, czy istnieje związek pomiędzy dwiema zmiennymi mierzonymi na skali nominalnej. Korzystamy wówczas z odmiany testu X2 do badania niezależności. Najpierw należałoby zadać odpowiednie pytanie badawcze, na przykład: "Czy proporcje występowania kobiet pilotów i mężczyzn pilotów różnią się w wybranych liniach lotniczych?" Przeprowadzenie badania wymagałoby określenia stosunku kobiet pilotujących samoloty do mężczyzn pilotów w każdej opisywanej firmie. Następnie należałoby porównać takie proporcje (parami). Po wykonaniu serii porównań można byłoby określić, czy liczba kobiet i mężczyzn pilotujących samoloty zależy od linii lotniczej. Niniejszy rozdział wskaże Ci, w jaki sposób używać SPSS do budowania tabel krzyżowych, pozwalających na wykonanie testu niezależności dla dwóch zmiennych jakościowych. Tabela krzyżowa powstaje na skutek zestawienia częstości występowania poszczególnych rodzajów obiektów. Dwa wiersze tabeli tworzy pierwsza zmienna i jej dwie kategorie (jakości), natomiast kolumny tabeli powstają na podstawie drugiej zmiennej i jej dwóch kategorii-", W celu wyliczenia statystyki X2 SPSS musi zestawić liczebności obserwowane (występowanie poszczególnych obiektów w rzecżywi-
28
Mamy w tym wypadku do czynienia z tabelą 2 x 2 (przyp. tłum.).
95
96
BADANIE RELACJI MIĘDZY DWIEMA ZMIENNYMI JAKOSCIOWYMI
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
stości) Z liczebnościami
oczekiwanymi (liczebność obiektów przy założeniu, że badane zmienne są niezależne od siebie) i oblicza róż nice pomiędzy nimi (matematyczną formułę tego testu znajdziesz w k~żdym podręczniku do statystyki). Wraz ze wzrostem różnicy pomiędzy liczebnościami obserwowanymi i oczekiwanymi wzrasta wielkość X2 • Natomiast wraz ze wzrostem wartości tej statystyki rośnie prawdopodobieństwo istnienia zależności między badanymi zmiennymi. Zanim przystąpimy do procedury Opis statystyczny: tabele krzyżowe, musimy sformułować pytanie badawcze i hipotezę badawczą, którą będziemy testowali przy użyciu testu X2 • W niniejszym rozdziale do analizy użyjemy bazy danych - opisanej między innymi w rozdziale pierwszym - GSS93 podzbiór.sav. Na jej podstawie zbadamy związ~k między płcią a poglądami w sprawie kary śmierci. Naszym pytamem badawczym będzie: "Czy kobiety różnią się od mężczyzn w swoich poglądach na temat stosowania kary śmierci?" Udzielenie odpowiedzi na to pytanie wymaga postawienia hipotezy zerowej. Następnie będziemy mogli przeprowadzić analizy testem X2 •
Stosowanie procedury "Opis statystyczny: tabele krzyżowe" Otwórz plik z bazą danych, kliknij na Analizę, Opis statystyczny, a następnie na Tabele krzyżowe (por. rycina 10.1). Po uruchomieniu tej procedury SPSS wyświetli okno przedstawi~ne na rycinie 10.2. Po jego lewej stronie mamy do dyspozycji zmienne bazy danych. Jedną z nich należy umieścić w okienku zatytułowanym Zmienne w wierszach, a drugą w okienku Zmienne w kolumnach. W naszym przykładzie pierwszą zmienną będzie płeć respondenta (sex), a drugą za/przeciw karze śmierci (cappun). W kolejnym okienku Warstwa 1 z 1 (poniżej Zmienne w kolumnach) moż na umieścić trzecią zmienną, co pozwoli na uzyskanie trójwymiarowej tabeli krzyżowej, która umożliwi ocenę związku pomiędzy trzema zmiennymi jakościowymi. Po wyborze dwóch zmiennych dla zbudowanej przez Ciebie tabeli SPSS powinien obliczyć statystykę Xl. W tym celu naciśnij
... .. Plik Edycja \\Iidok
Dane
Przekształcenia rAnaliz .. ! \\IykJesy
a
~J ~ [,,,I,,·] ~ rgliI ~ L~_~ . . __~__~ -.. . c---.: t-~~ ...~._--J
,--~~Ic:::ri ~-a~p;~~::~~:el ~~~::~~~ c....=JJ ~ ~
~
~
~
lt=:ID
~ 10
i
~
LJ1l
,~-.u·131 ~
la ~
,
17 18
~ ; ~ . ·20
IqI 22
Narzędzia
Raporty warstwowe l.
Porównywanie średnich Ogólny model liniowy Modele mieszane Korelacie
• "..: • • • • •
2 Na pełnym etacie Kawaler/pa! Regresja 3 Na pełnym etacie Rozwledzl~ Analizy logliniowe 4 Na mepelnym eta Kawaler/pai K.lasyfikacja 5 Emerytura/renta Kawaler/pa! Aedekcle danych Skalowanie 6 Emerytura/renta Zonaty/ran l esty nieparametryczne 7 Na pełnym etacie Zonaty/za~ Analizy przeżycia 8 Emerytura/renta Zonatylzan Wielokrotne odpowiedzi 9 Na pełnym etacie Rozwledzl l 1 10 Na mepełnym eta Kawaler/panna Nie dotycz 1 11 Na pełnym etacie Kawaler/panna Nie dotycz O 12 Na pełnym etacie Kawaler/panna Nie dotycz O 13 Na pełnym etacie Zonaty/zamęz 31 3 14 Emerytura/renta Separacja 24 4 15 Bezrobotny I pas Kawaler/panna Nie dotycz O 16 Na pełnym etacie Kawaler/panna Nie dotycz
• •
•
17 Zajmuje Się dome Kawaler/panna Nie dotycz 18 Na pełnym etacie Zonaty/zamęz 22 19 Na pełnym etacie Zonaty/zamęz 32 20 Na pełnym etacie Zonaty/zamęz 24 21 Czasowo me prac Zonatylzamęz 24 22 Na mepełnym eta Zonaty/zamęz 23
Pomoc
Okno
Częstości...
Statystyki opisowe...
Eksploracia...
.1eliiAISfJ'ł+1
.i
Nie wiem
9 1 2 5 O
::II
,.
Statystyki ilorazowe.__ u
O O O 2 2 2 2 O O O 1 4 3 1 4 O 1 2 2 3
hmo ~ Maj erpień
zndrac B\ Panr Wodn Brakod Wa Ry Wa Strzel R Ry B
Luty 43 45 Brakodpo 78 PaźdzIerni Marzec 83 55 Paźdzlerm Listopad 75 Lipiec 31 Marzec 54 29 KWieCIeń 23 Paździarru Skorpi 61 Brakodpo Brak od ' Marz~ec Eiar 63 Ry Marzec 33 Listopad Skorpi 36 Ry Marzec 39 Styczeń KoZIOroz 55 Wa 55 WrzeSIeń B 34 KWieCień Bliźnię 36 Czerwiec Le Sierpień 44
RYCINA 10.1. Wybór procedury Opis statystyczny: tabele krzyżowe.
klawisz Statystyki, a rezultaty tej czynności porównaj z ryciną 10.3 (okno Tabele krzyżowe: statystyki). Zauważ, że w oknie masz do dyspozycji kilka statystyk. Prezentowane tutaj ćwiczenie odnosi się tylko do jednej - zaznacz opcję Chi-kwadrat. Następnie kliknij Dalej, by przejść do głównego okna. Na zakończenie użyj jeszcze opcji Komórki. Po naciśnięciu tego klawisza SPSS wyświetli podopcje do wyboru (w oknie Tabele krzyżowe: zawartość komórek). Aby w pełni zrozumieć wyniki zawarte w tabeli krzyżowej, należy zaznaczyć podopcje wskazane na rycinie 10.4. Wybierz zatem Obserwowane, Oczekiwane, Procenty: w wierszu i Procenty: w kolumnie. Wszystkie te statystyki opisowe pozwalają na lepsze zrozumienie znaczenia statystyki X2 • Po wyborze wymienionych właściwości tabeli krzyżowej kliknij Dalej. Naciśnij OK, aby zakończyć procedurę Opis statystyczny: tabele krzyżowe.
98
BADANIE RELACJI
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Liczebności,----------
2mienne wwierszach. <~ Płeć respondenta [sex]
Poziom w!l'kszta!'c ;... <~ Rasa respondenta ,~"
~ Obserwowane
'~;j~ Dochód łączn!l' gO':'I;
!r:----] Pomoc
~ Oczekiwane
Dochod!l' z prac!l' r
Zmienne w kolumnach:
~ Region zamieszk
~
:
Rozszerzory kod <~ Wielkość miejsc ~ Iden!!l'fikacja po.
MIĘDZY DWIEMA ZMIENNYMI JAKOŚCIOWYMI 99
I~
---
Warstwa 1 z1 - - - - - - - - - - - - .
~ CZ!l' gl-osowa!' w ~ CZ!l' m!l'śli o sobie ja
Procent!l"----
Reszt!l'---------.
~ 'W wierszu
DNiestandaryzowane
~ 'W kolumnie
D Standaryzowane
D
D Skorygowanestandaryzowane
Procent całości
<%> Za lub przecIw poz <%> CZ!l' marihuana po\'< , <%> Z lakareligia, k '
D D
RYCINA 10.4.
P.Qkaż zgrupowane w!l'kres!l' słupkowe
Określanie właściwości tabeli krzyżowej.
jJkr!l'i tabele
Interpretacja wyników analizy testem X2 i tabel krzyżowych
RYCINA 10.2. Wybór zmiennych do tabeli krzyżowej.
Tabele
E2J
krzyżowe:
El
Statystyki
Chi-kwadrat
Nominalne--------.
O Współ'cz!l'nnik kont!l'ngencji O PhiiV Cramera O Lambda O Współ'cz!l'nnik niepewności
D
Korelacje
Porządkowe---
D Gamma D dSommersa O teu-b Kendalla O teu-cKendalla
O Kappa O Ryz!l'ko względne O McNemar O Stat!l'st!l'ki Cochrana i Mentele-Heenszełe Te,.~~~:ćwącAQl;~ b~'lJS4~"
RYCINA 10.3. Wybór statystyki
x2•
D
, __
Dalej
I Anului
I l
[PóffiOCJ
Analizę raportu zacznij od zwrócenia uwagi na liczebności oczekiwane i obserwowane, znajdujące się w poszczególnych komórkach tabeli. Przydatne będzie również zanotowanie proporcji pomiędzy komórkami, na przykład proporcji mężczyzn do kobiet opowiadają cych się za stosowaniem kary śmierci. Różnica pomiędzy poszczególnymi liczebnościami determinuje wartość Xl. Im jest większa, tym wyższa wartość statystyki Xl. Możemy zatem powiedzieć, że niezależność pomiędzy dwiema zmiennymi jest funkcją wielkości Xl. Istotność tej statystyki wskazuje, że istnieje zależność pomiędzy
dwiema badanymi zmiennymi. Musisz zachować ostrożność, gdy obserwacji w każdej komórce jest mniej niż pięć. Jeśli będziemy próbowali przeprowadzać nasze analizy przy użyciu tak małych liczebności, to SPSS wyświetli stosowne ostrzeżenie o zbyt małych liczebnościach (n) w komórkach. Kiedy dysponujemy niewielką liczebnością próby badawczej, obliczanie Xl jest obciążone błędem i może prowadzić do niewłaściwe go oszacowania związku pomiędzy zmiennymi.
1OO
DO BIEGU GOTOWI - START I WPROWADZENIE DO SPSS DLA WINDOWS
BADANIE RELACJI MIĘDZY DWIEMA ZMIENNYMI JAKOŚCIOWYMI _o x
-
-
F-~~~~~~'--~._~-~'._-~~~~~~--~~tli to. roll'Ultow
n
1
sr-ss
ld
I!I@E!'
E;: R~port
.,T"" I"ITestYOli~llIdrEII
- f§
Tabe/ekrzyxowec ._ UWagi
Tabela krzyżowa Piec reSpOhdellta• Za'JH2rtCJW kdłze smlelCl za łllorderSłw
InfotlTlaCJ8O 8nalrzow
Testy Chi-kwadrat
la/PI!8CIWkarze smlerclzamareterslwa Piec respondenta
.
Męzezvzna
kobieta
Llczebnosc Llczebnoscoczeklwana
PIZaclW
50Z
105 137,3
'etomośc
O"6fęm
469,7 82,7%
%zZafPrzeClWkarze śrmarcl za morderstwo Uczebnosc
17,3%
100,0%
46,7%
oczecwana
33,4%
43,7%
572
zos
781
604,3
176.7
%ZPletrespondenta
73,2%
% zZafprzecrwkalZe śmJefC!Zi!imOrderslwo
26,8%
53,3%
66,6%
56,3%
Llcz&t1nescoczeklwana
%zPlecrespondenla % zZalprzeclwkarz8
sm(erCllClmorderstwo
1D74 1074,0
31'
1388
314,0
77,4%
22,6%
1388,0 100,0%
100,0%
100,0%
Chl·kv;tadraIPaarsona
601,0
781,0 100,0%
uc:zebnosc
warrośc
607
%zPlećrespoMenta
uczecncść
Ogółem
Z,
Poprswkana cląglosć' ..
Ilorazwiarygodności
17,47Db 16,934 17,800
"
tstomcsc
dekładna
a
dokładna
(jednastr
(dwustronna)
(dWlJs!ronna)
anna
,000 ,000
,000 ,000
Dokladnl'testF\shera Testzw1ąZl
NWainychobserwacJt a
tstctoceć
aSl'mpto\yczn
17,458 1388
,000
,000
Obllczonewrłączmedlatabell2x2
b ,0%kamorek (O)ma uczeunosc oczekiwaną mniejszą mż 5 Minimalnaliczebność oczekIWana wynOSI 137,32
100,0% KIit~dwu"',.fotnle,abyedytowaćobleklTabelapI2estawna
l!iiSPSS Procesor golowy
1ISPSSP/OCtJ$Of gołOW)l
RYCINA 10.6. RYCINA 10.5.
Zawartość tabeli krzyżowej przedstawiona w raporcie SPSS. Rycina 10.5 pokazuje raport analizy związku między zmiennymi Zawiera on tabelę krzyzową, przedstawiającą rozkład liczebności w poszczególnych komórkach. Dysponujemy czterema kategoriami osób, powstałymi w efek~ie zestawienia dwóch zmiennych dwukategorialnych. Mamy męzczyzn "za" albo "przeciw" karze śmierci oraz kobiety za" alb~ "pr~eciw" tej. kar~e. Dokładna interpretacja tej tabeli wy;;'aga udzieienia odpowIedzI na pytanie, między którymi liczebnościami wy~tępuje różnica. Duże różnice wskazują na rozbieżność między męzcz~znami a kobietami w poglądach dotyczących kary śmierci. Natomiasr małe różnice między liczebnościamiwskazują na niewielką różnicę w opiniach na temat tej kary.
~łeć respondenta i za/przeciw karze śmierci.
Samo tylko wystąpienie różnicy pomiędzy liczebnościami ocze~iw~~y~i i o~ser,:owanymi nie uprawnia nas jeszcze do konkluzji, ze r?zmca ta Jest Istotna. Musimy wziąć pod uwagę statystykę X2 ~ycma 1?6 poka~~je tabelę, w której powinniśmy szukać tych informacji, Wartosc współczynnika X2 znaleźć można w kolumnie Wartość, zaś ilość stopni swobody w kolumnie df. Poziom istot-
Wyniki testu chi-kwadrat w oknie Edytora raportów. ności
dla tego X2 znajduje się w kolumnie zatytułowanej Istotność asymptotyczna (dwustronna). Jeśli uzyskane p jest mniejsze albo równe założonemu alfa (zazwyczaj przyjmujemy 0,05 albo 0,01), to mamy podstawy do odrzucenia hipotezy zerowej, która gło~i, że badane zmienne są od siebie niezależne. W naszym przykładzie X2 (1) = 17,47 i P < 0,001, co wskazuje, że kobi~ty i mę~cz!ź~i mają inne opinie na temat ka:-y ś~ie:ci. Warto ,te~ za~,:azyc, :e respondenci generalnie opowiadają SIę za ~arą s~mercI, J.~dn:k~e proporcja poglądów "za" wśród mężczyzn Jest WIększa niz wsrod kobiet. Statystyka X2 Pearsona, którą możesz znaleźć na rycinie 10.6, nie jest tym samym, co współczynnik korelacji P~arson~. Karl Pears~.n był wprawdzie twórcą obu tych statystyk słuzą one Jednak do roznych celów.
ZADANIA
W rozdziale tym omówiliśmy sporządzanie tabel krzyżowych i używanie testu X2 do badania związku między dwiema zmiennymi nominalnymi. Spróbuj wykonać następujące zadania:
1O1
102
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
1. Sformułuj pytanie badawcze. 2. Przetestuj swoje hipotezy przy użyciu statystyki X2. 3. Dokonaj interpretacji uzyskanych wyników. Napisz kilka zdań podsumowania.
Dodatek
Tworzenie baz danych przy użyciu programów innych niż SPSS
Edytor tekstów I
Do przygotowania bazy danych możesz użyć prostego edytora tekstów. Zbiór danych tekstowych może być z łatwością przetwarzany przez Kreator importu tekstu, wbudowany w SPSS. Taki zbiór danych należy przygotować w jeden z dwóch przedstawionych tu sposobów i zapisać w formacie tekstowym (ASCII)29. Kreator importu tekstu czyta zbiór przygotowany jako: 1) plik ze stałymi odstępami między danymi, 2) plik z danymi rozdzielonymi separatorem, na przykład przecinkiem. Opisany tutaj sposób przechowywania danych w plikach tekstowych jest pozostałością po erze kart perforowanych, wypartych przez bardziej wyrafinowane metody zbierania i przechowywania informacji.
Pliki tekstowe ze
stałymi odstępami między
danymi
Informacje dla każdej obserwacji wpisuj do pojedynczego wiersza. Czasami danych jest tak dużo, że jedna obserwacja zajmuje dwa wiersze lub więcej.
29
Chodzi tutaj o zbiór .txt (przyp.
tłum.).
\
104
DODATEK. TWORZENIE BAZ DANYCH PRZY DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
UŻYCIU PROGRAMÓW INNYCH NiŻ sess
105
_ l:l ,X
Każda
liczba, litera czy symbol, które tworzą jedną zmienną powi~na zajmować pojedynczą kolumnę w wierszu. Rycina D.l ;okazuje .dane dla czterech obserwacji. Aby ją sporządzić użyliśmy Notatnika systemu Windows. W pierwszym wierszu znajdują się nazwy ~miennych, oddzielone od siebie spacją. Nie musisz zapisywać w pliku tekstowym nazw swoich zmiennych. Kreator importu tekstu umożliwi Ci nazwanie zmiennych w trakcie importu danych. Nazwy zmiennych możesz także wprowadzić, używając Edytora danych SPSS. Rycina D.l wskazuje, że masz do czynienia z czterema zmiennymi: ID (to nie jest zmienna), Imię, Wiek, Płeć i Wynik. Zwróć uwagę, że pierwszy wiersz w pliku zajmują nazwy zmiennych i dlatego dane dla pierwszej obserwacji muszą być wprowadzone pod spodem. Kolumny z danymi są od siebie oddzielone spacją, co pozwala na uporządkowanie zbioru. Pamiętaj, że: 1) Kreator importu tekstu rozpozna zmienne Imię i Płeć jako zmienne tekstowe, 2) dla drugiej obse~wacji, w kolumnie Wiek, brakuje danych - w takiej sytuacji, a ~akze ~edy, gdy używasz pliku ze stałymi odstępami, jeśli brakuje Ci pomiaru, pozostaw puste miejsce, 3) dziesiętne zmiennej Wynik zajmują jedną kolumnę.
Dane dla zmiennej typu numerycznego mogą zawierać maksymalnie 40 znaków. Natomiast w wypadku zmiennej tekstowej możesz wprowadzić do 255 znaków. Każdy wiersz może zawierać do 1024 znaków (łącznie ze spacjami rozdzielającymi zmienne). Takie ograniczenia mogą powodować, że wiersze będą podzielone na zbyt małą liczbę kolumn. Możesz temu zaradzić usuwając rozdzielenia kolumn (kasuj spacje dzielące kolumny). Taki sposób zwiększania objętości bazy może prowadzić do sytuacji, w której dane z pliku tekstowego będą wczytywane w chaotyczny sposób i odtworzenie właściwej struktury danych w SPSS stanie się niemożliwe. Zanim przystąpisz do pracy, upewnij się, że dane zaczynasz wpr~wadza~ w pierwszej kolumnie, czyli od pierwszego miejsca po lewej strome okna edytora. Po przygotowaniu zbioru w opisany sposób zapisz go w pliku tekstowym. Jeśli do tego celu użyjesz rozszerzeń .~xt albo .dat, to SPSS automatycznie rozpozna Twoje pliki z danymi,
Plik. Edycja Format Widok. pomoc
lo Imię
Wiek Płeć Wynik 8953 Jane J. Smitz 22 K 95.3 8954 John H. Smith M 90.0 8955 Zelda T. Smith 24 K 91.7 8960 Arthur A. Smithe 24 M 97.5
RYCINA 0.1. Okno Notatnika
Z
,;
wynikami dla czterech obserwacji.
Pliki tekstowe z danymi rozdzielonymi separatorem Plik tego typu zawiera rozdzielone znakiem dane, które SPSS rozpoznaje automatycznie. Aby Kreator importu teks~u mógł dobr~e spełniać swoją funkcję, zmienne powinny być rozdzielone .tabulaCJą, przecinkiem lub średnikiem. SPSS umożliwia rozdzielame danych również za pomocą wymienionych znaków. Zmienne rozdzielone przecinkiem ilustruje rycina D.2. Znak ten możesz zastąpić tabulacją i średnikiem. Przy ta~im sp~sobi~ organizacji zmiennych nie stosuj spacji do rozdzielama, pomewaz Kreat~r rozpoznaje ją jako część składową zmiennych tekstowych. Za~,:az, że braki danych tworzymy przez pozostawienie pustego mi~Jsca między przecinkami. Wstawiaj spację między separa~ory rozd~i~la jące zmienne, jeśli braki w danych chcesz kodowac we właściwy sposób.
Otwieranie danych tekstowych przy użyciu "Kreatora importu tekstu" Wybierz menu Plik, a następnie Czytaj dane teks~o~e. Zaznacz pyk tekstowy z danymi i naciśnij Otwórz. Uruchomi się .Kr~ator, który poprowadzi Cię przez całą procedurę wczytywama i tworzem~ zbioru danych w SPSS. W trakcie tego procesu program poprosi
°l
U
6 DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS DODATEK. TWORZENIE BAZ DANYCH PRZY UŻYCIU PROGRAMÓW INNYCH NiŻ Plik
Edycja Format Widok
/D,lmię,Wiek,Pleć,Wynik
ssss 107
Pomoc
x
8953,Jane J. Smftz.22,K,9S.3 89S4,John H. Smith, .M,90.0 895S'zelda T. Smith,24.K,91.7 8960,Arthur A. Smithe,24,M,97.5
,j
Illlilj I 41 ~~- ·1. L
D ~, , - ft
J ]r!) flik
=
IT
H2D
Ar~usZl
RYCINA 0.2.
U 1100"10.F l2J- .»]
f.
lO
t-
Nar2ędzia Q.ane Qkno Pomo~
I B I ~ I ~ . ~lIDl ~•
_ ~dycja Ytldok W~taw Format _ _
Gotowy
Arkusz2
--
C
D
E
F
G
H
Arkusz3
l
Okno notatnika z wynikami rozdzielonymi przecinkiem.
Cię o: 1) podanie nazwy Poszukiwanego pliku, 2) określenie sposobu rozdzielania zmiennych (za pomocą stałych odstępów albo sepa-
ratora), 3) podanie, czy w pliku znajdują się nazwy zmiennych, 4) wskazanie linii, w której znajdują się dane dla pierwszej obserwacji, 5) określenie, ile wierszy zajmują POszczególne obserwacje, 6) podanie, ile obserwacji i zmiennych zawiera baza danych, 7) zapisanie używanego pliku w wybranym formacie, 8) wklejenie odpowiedniego polecenia do Edytora poleceń. Ponadto program zapyta Cię, czy zapisać ustawienia importu. Jeśli dla SPSS nie będzie jasne, gdzie się zaczyna, a gdzie kończy linia z danymi dla pojedynczej obserwacji, program poprosi Cię o ręczne rozdzielenie zmiennych. Może się zdarzyć taka sytuacja, że będziesz dysponować plikiem tekstowym, który nie zawiera rozdzielonych danych. Rozdziel zmienne za pomocą separatora, aby skorzystać z Kreatora. SPSS umożliwia Ci zbudowanie specjalnego polecenia, które może posłużyć do importu danych niemających wyraźnego podziału zmiennych. Użyj systemu pomocy SPSS, aby dowiedzieć się więcej.
Stosowanie arkuszy kalkulacyjnych do wprowadzania danych Z danych zapisanych w arkuszach Excela i Lotusa SPSS korzysta bez trudu. Struktura takich zbiorów danych podobna jest do budowy plików tekstowych ze stałymi odstępami między danymi.
RYCINA 0.3. kalkulacvjneqo . Okno arkusza z wy nikami wpisanymi dla czterech obserwacji.
. zmienne ułoź ozone są w kolumnach, a obserwacje . Oznacza to, . ar kusza kalkulacyjnego mozesz . h ze W . wszym WIerszu pIer . " d k by informacje umIeszw wierszac. . nych Parniętaj Je na , umieścić nazwy znuen " h yp;isane są zmienne. Rycina D. 3 czać w kolumnach, do ktory~ . prz . . Tym razem umieściliśmy zawiera dane przedstawione JUZ wczesmej. je w arkuszu Excela. Jak w SPSS korzyst~ć z ~anyCh umieszczonych
w arkuszu kalkul.acYJnym. d
Wykonaj
rzyć bazę
następującą
proce danych SPSS.
urę,
b na podstawie arkusza stwoa y
, Plik a następnie wybierz Otwórz i Dane. 1. Otworz menu. '. liku arkusza. 2. W dolnym ok~e~ku wplszb~a:::-~;mat poszukiwanego pliku _ artypu: wy ~e lik Lotusa .u/", 3. W okienku kusz Excela ma rozszerzeme .xls, a p
ruu
4. 5.
Na~iśnij ?twórz.
.
arkusza
JeślI w pierwszym wI:rszu. nych, to zaznacz oPCJę Czytai
znajdują się
nazw
nazwy zmieny zmiennych z pierwszego
wiersza danych. . , , ust al zakres importu danych. istnieje taka komecznosc, 6. Jeśli 7. Kliknij OK.
1O8
DO BIEGU GOTOWI - STARTI WPROWADZENIE DO SPSS DLA WINDOWS
Używanie baz danych do wprowadzania wyników SPSS może korzystać z baz danych, które mają rozszerzenie .dbf, Nazwy poszczególnych pól bazy traktowane są przez SPSS jako nazwy zmiennych. Jeśli tworzysz zbiór w programie do baz danych, to pamiętaj, aby nazwy zmiennych nie miały więcej niż 8 znaków. Gdy zdarzy się, że nazwy te będą dłuższe, SPSS skróci je do ośmiu zna3o ków • Jeśli po skróceniu nazw dwie zmienne będą musiały nazywać się tak samo, SPSS zapisze w pliku wyłącznie jedną z nich. Jak w SPSS korzystać z wyników umieszczonych w bazie danych?
Przeprowadź następującą procedurę, aby otworzyć wybraną bazę danych. 1. 2. 3. 4.
Wybierz menu Plik, a następnie użyj Otwórz i Dane. W okienku Nazwa pliku wpisz nazwę poszukiwanej bazy. W okienku Pliki typu: wybierz opcję dBase (*.dbf). Zakończ operację, klikając na Otwórz.
Posługiwanie się "Kreatorem przejmowania baz danych" Kreator importuje dane ze specjalnych plików, które posługują się protokołem ODBC. Programy Microsoft Access i Excel wykonują swoją pracę również na takich plikach. Kreatora możesz uruchomić, używając menu Plik i opcji Przejmij bazę danych: nowa kwerenda, a także za pomocą okna dialogowego, które przedstawiliśmy na rycinie 1.4. Otwieranie bazy danych programu Microsoft Access za pomocą SPSS
Wykonaj następującą procedurę, aby skorzystać z danych zapisanych w bazie.
30
W wersji SPSS 11.5 zmienne zostaną nazwane VI, V2, V3 i tak dalej (przyp. tłum.).
DODATEK. TWORZENIE BAZ DANYCH PRZY UŻYCIU PROGRAMÓW INNYCH NiŻ SPSS
opcji w następującej kolejności: Plik> Przejmij bazę danych> Nowa kwerenda. 2. Wybierz opcję Bazy danych MS Access, a następnie Dodaj źródło danych. 3. W oknie zatytułowanym Źródła danych użytkownika dwukrotnie kliknij na Bazy danych MS Access. 4. Po uruchomieniu okna ODBC - ustawienia dla programu Microsoft Access naciśnij klawisz Wybierz. 5. W oknie Wybierz bazę danych zaznacz katalog, w którym znajduje się poszukiwany plik bazy danych. W okienku po lewej stronie kliknij na odpowiednią nazwę. 6. Wróć do podstawowego okna - trzy razy naciśnij OK. 7. W oknie Kreatora przeimoioania-baz danych kliknij ponownie na Bazy danych MS Access, a potem naciśnij Dalej. 8. Jeżeli chcesz, aby SPSS użył wszystkich elementów bazy danych, to najpierw zaznacz jeden z nich, a następnie - utrzymując na niej kursor i przytrzymując lewy przycisk myszy - przeciągnij tę część z lewego okna do prawego. Możesz sprawdzić skład poszczególnych części bazy. W tym celu użyj ,,+" do pokazania struktury bazy. Po utworzeniu żądanej formy importu (przez przeciągnięcie elementów bazy do prawego okna) naciśnij Dalej. Po wykonaniu tej czynności możesz zakończyć cały proces importu bazy danych. 9. Przed naciśnięciem Zakończ możesz wykonać jeszcze inne operacje - możesz na przykład przefiltrować dane, używając w tym celu opcji Dalej w oknie Kreator przejmowania danych - krok 2 Z 6, co skieruje Cię do okna Kreator przejmowania danych - krok 4 Z 6. W tym ostatnim naciśnięcie Dalej doprowadzi Cię do kroku 5 z 6, a wówczas możesz wybrać te zmienne, które powinny się znaleźć w zbiorze SPSS. 10. Naciśnij klawisz Dalej. Ostatni krok - 6 z 6 - zawiera podsumowanie wykonywanych przez Ciebie operacji. Naciśnij Zakończ, aby ukończyć import. Rezultaty swoich operacji możesz zapisać w specjalnym pliku - SPSS Query File (*.spq) - użyj w tym celu klawisza Przeglądaj, umieszczonego po prawej stronie okienka Zapisz kwerendę pliku. Zapisując plik SPSS Query File, znacznie
1.
Użyj
109
11 O
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
przyspieszysz ponowne otwieranie wybranej bazy danych. Jeżeli baza danych, której używasz, nie zmieni miejsca na dysku, to po raz kolejny z niej skorzystasz, używając opcji Plik> Przejmij bazę danych> Uruchom kwerendę. W otwartym oknie poszukaj pliku o rozszerzeniu .spq.
Zbiory danych Na końcu książki umieściliśmy tabele z danymi. Znajdują się tam wyniki, którymi posługiwaliśmy się w rozdziałach piątym, szóstym, siódmym, ósmym i dziewiątym. Skorzystaj z nich, ćwicząc zakła danie zbiorów i wprowadzanie danych w Edytorze danych SPSS, w edytorze tekstów, w arkuszach kalkulacyjnych i w programach tworzących bazy danych typu ODBC.
DODATEK. ZBIORY DANYCH
TABELA 2. Kardiolog.
TABELA 1. Alzheimer PRZED
PO
1 2 3 4 5
21 18 29 42 21
23 11 29 34 14
6 7 8 9 10
37 23 15 29 35
38 24 21 24 41
11 12 13 14 15
18 37 23 18 23
21 33 19 20 31
16 17 18 19 20
42 21 28 15 18
42 22 40 26 12
21 22 23 24 25
29 42 21 37 23
32 37 17 41 27
26 27 28 29 30
14 29 40 17 37
24 27 44
31 32 33 34 35
23 18 24 36 35
22 25 34 45 43
36 37 38 39 40
42 21 37 20 21
40 20 42 29 25
ID
24 36
ID
GR WIEK
CHOlE
ID
GR WIEK
CHOlE
1 2 3 4 5
2 3 2 2 3
249 245 238 243 238
31 32 33 34 35
3 2 1 3 2
213 167 173 182 249
6 7 8 9 10
2 3 3 3 1
238 263 256 256 173
36 37 38 39 40
2 1 1 2 1
239 190 201 241 198
11 12 13 14 15
2 3 1 3 3
254 261 209 262 251
41 42 43 44 45
1 2 2 1 1
180 219 222 201 168
16 17 18 19 20
3 1 3 3 2
264 130 264 239 259
46 47 48 49 50
2 2 3 1 2
214 234 253 185 248
21 22 23 24 25
3 2 2 3 2
205 255 203 254 234
51 52 53 54 55
2 1 1 3 2
167 161 171 266 254
26 27 28 29 30
1 3 1 1 1
168 248 151 151 203
56 57 58 59 60
3 1 1 3 1
173 187 182 259 188
111
11 2
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
TABELA 3
TABELA 4 Korelacje.
Niemowlaki ID
OVAL
DEFORM
FACE
ID
WYKSZT
ZAROB
DOSW
1 2 3 4 5
180 50 70 40 80
170 70 120 60 90
340 60 170 90 60
1 2 3 4 5
15 12 12 17 18
12420 8880 8640 27500 31300
1,17 27,00 0,00 3,17 3,92
6 7 8 9 10
80 60 50 110 60
60 80 70 120 70
180 140 120 230 120
6 7 8 9 10
12 8 8 8 12
10980 10080 7860 8940 12300
14,42 28,67 18,50 14,00 4,67
11 12 13 14 15
50 100 160 140 180
100 90 140 120 170
90 150 150 90 340
11 12 13 14 15
15 12 12 8 16
12660 8400 9360 12780 18100
5,33 6,83 0,00 34,00 3,00
16 17 18
50 70 40
70 120 60
60 170 90
16 17 18 19 20
15 19 12 12 15
10980 36800 12300 9780 8280
4,00 10,58 25,58 8,92 10,08
21 22 23 24 25
15 15 15 15 15
14820 13560 12660 12840 15660
0,42 8,00 0,83 5,58 3,83
26 27 28 29 30
16 12 17 12 12
14400 10740 32500 14280 9240
3,83 4,00 1,50 6,00 1,08