uwe
w. Gehring . comena wei ns
Grundkurs Statisti k f ür Polito logen und Soziologen
Uwe W. Gehring . Corne lia Weins
Grundkurs Statistik für Politologen und Soziologen 5., überarbeitete Auflage
III
VS VERLAG FÜR SOZIALWI SSEN SCHAFTEN
Bibliografisctle Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Interne t über http://dnb.d -nb,deabrufbar.
1. Auflage 1999 2. Auflage 2000 3. Auflage 2002 4. Auflage 2004 5., überarbeitete Auflage 2009 Alle Rechte vorbehalten
e VS verleg für Sozialwissenschaften I GWIJ Fachverlage GmbH, Wiesbaden 2009 Lektorat: Frank Schmdler VS Verlag für SOzialwissenschaften ist Teil der Fachverlagsgruppe Springer scence-ausness Media. www.vs-verlag.de Das Werk einschließlich aller seiner Teile ist urheberrech tlich geschützt Jede Verwertung außerhalb der engen Grenzen des Urheberrech tsgesetzes ist ohne Zustirnrnung des Verlags unzulässig und strafbar. Das gilt insbesondere für vervenäregungen, Übersetzungen, Mikroverfilrnungen und die Einspeicherung und Verarbeitung in elektronischen Systemen, Oie Wiedergabe von ceoraucnsnamen. Handelsriemen. Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme , dass solche Namen im Sinne der werenzecnen- und Markenschutz ·Gesetzgebung als frei zu betrachten w ären und daher von jedermann benutzt werden dürften , Umschlaggestaltung: xünkett c pka Medienentwicklu ng. Heidelberg Druck und buchbindensehe Verarbeitung: Kr ips b.v., Meppel Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier ennteo in me Netherlands ISBN 978.J.S31·16269.Q
Fü r Willy H. Eirmbte r
Vorwort zur 5. Auflage Die empirisch ausgerichteten Soxialwissenscbafteu verlangen YO II ihren Ab.. solventen einen siche ren Umgan g mit den Met boden (!,'T Dat enerhebung
lind Datena nillyst>. Auch im Studium der
Polit ikwüsefl,~ th flJt
und 111'[ So-
zio logie spielt die ßp sehäfti gllng mit de n Tech niken r!PT empirisr-lu-n Sozialtorschuug und der Statistik eine wichtige Rolle. Die .....nwcndung stetist iSr!W T Met hoden \\"' IH l" sicher nicht zuletzt durch die rasa nte Entwicklung leistungsfähiger Personalromputer un d einfa ch bedienbarer Statistikprogramnie IlPgüns tigt. Gr1l1ll lhW'llr].> St atisrikkenntnlsse sind jrdoeh nicht nur bei f'igP flf'1l Analvsen llnabdingb;u. Ein r rllehlieh er Teil de r sozialwissenschafrllr-hr-n Litera t ur kann oh ne diese Ke nntnisse nicht mohr nachvoll7.0g:P I\ werden. wie ma n, um nur zwei Beispiele 7.11 neunon. a n d (>11 Artikoln in der Politischen Vierteijahresschrift oder der K ötner Zeit.~ rhrift fü,' So ziologie un d So zialpsy cholOl}ie nachvollziehen kann . Xicht zuletzt stellen Sratistik keunmlsse - lind (\if' ß f'lwr rsd lllng entsprechender Soft warf' - f'iIW SchHissf'lqllalilika tion für den Arbeitsmarkt da r. Das Buch ist aus einem Manuskript out sta nden. das wir für dte Tetlnohnie rinnen lind Tctln-h mer unserer K urse"Einfüh ru ng in dil' Xlethoden de r empirischen Sozialforschu ng und Statistik" verfasst haben. Vom Umfang: lind I nhalt her ist da s Buch für einen Kurs von vier Semcsterwocbenstunden konzipie rt , Ziel ist d it>Vermit tlu ng grundlegender Kennt nisse in den Met hoden der Da tener hebung lind der Statisti k, dit' e int' l'jgellsländige ß eschäft ig ung mi t welterfllhrenden ~ 1('tll(Hlen e rlniiglk ht . ~la th elllatisdll' Vorkennt nisse \\'PHI('1l nicht vorausgesetzt. Das Buch gliedert sieh in die Teil e Methodenlehre (Ka pitel l - -I), Dcekri ptive S tat istik (Ka pitel 8 ) und 11lferenz..~tatist ik (Kapitel 9 - 12). ö
-
Methodenlehre
In Kapitel I werden
1J!iSM~ns chuftsth f:01'(~ti.~chc GnmdlfJgctl erläutert. Oll' Wa h l eines goeignot on F07'.~cJt1mg.~des l:gns, Kap itel 2, steht am Begin n einer Unt ers uch ung . In Ka pitel 3, Afes.~ ell, geht es um die Fragt', was unter ei ner Messung vers tanden wird , welche Gütekrite rien a n (' i1J(' Messung angeleg t werden könn en und wie man meh rere Messungen zu einem m-nen "k.~s instr umcnt zusammenfassen ka nn . In den Soxialwissensrhaften dominiert nach wie vor die Befra gung , (11'r
viii
Statistik Die Stat isti k liibt s ich allgemein ln einen dcsk riptinai lind einen i7l!CTWZTeil gliedern. Xlit desk ript iven S t a t isti ken werden vorliegende Da ten besr-hrleben. Die l nfer envs taristi k 1iel t darauf a b. mit Da ten etue r Auswahl (Stic hprohe) auf eine griibN e Ge sa mt hpit 111 s,h1ipf;I'II. ,~t (ltistL~chen
Den dc.~k7"ip tivw Tei l beginnen wir mi t einem Kapit el 111 Tcbdlcn. und Gm phikcu (K a p it el Zi). :>' Iit Mittel- lin d St7"C UJm9.~ jJ)c rlC71 [Ka pitel G) wer -
den Vern-ilungen von xler kmalen charak terisier t . Dip Stärke der Rp1it-'hung 1wisd wII 7wt'i Merkmalen kann mit ZU,~(l11lm f:tlh ml.g,mUlßr 71 (Kap itl'1 7) ausgedriivkt werden, während (He lineare Eill!achf"P!J,r.~,~ i () " (Ka pit el 8) es ennögltelu, die Grök> des [linearen] Einflusses eines Merkmals auf ein
anderes
1 1l
berechnen .
Den Auft a kt
1II1ll i7l!e7"Cnz,~tati,~Ii.~chcll Teil bildet Ka pitel 9, in dem wir :-' Iiiglkhk('il l'n darst ellen . per Allswahlvelj ahn:n Stichproben z uv lehen, die Aussagen über eine Grundgesamtheit I'rla1l 1)('1I . Grundlage solcher Schlüss(' sin d l j/ah r<~ ch ei nlichkei t.~ ve rleilull!J m (Ka pi tel 10). \I it Kon fidenzintervalh-n , Ka piteln 11, schä tzen wir Param eter der Gru ndgesamt beit a uf Basis einer Stichprobe. Teetuerjahrcn: Kapi tf'1 12, dienen da zu . lI ypo lhf'SI'll über eine Cruudgesat nthult an einer einzigen Stich pro be ZIl testen .
In Anhang A finden sich die für die lnferenzsrarist ik notwendigen Z- , fund \2_Tabf'l\pn. In Anhang n hir-ten wir die Lösungen zu den Übungsaufgaben. die sieh a m EJl(If' jNlps Ka pitels befinden. D ips!' Aufga ben s ind dazu gedacht. s ieh über die wichtigsten P unkt " jedes Ka pit els noc hm als Kla rholt ZIl verschaffen. Ein Rcgi,~ l e,. soll helfen . schnelle Antworten au f konkrete Fragen 1 11 lx-kommen . Schlieslich bieten wir mi t de r OnlineUlltc,.,~Wtzun9 zahlrek-he weitere Informarlonen an, d ip VO ll den au f Spitp x gena nnten WWW-Sen-ern bezogen werden können . Das Ruch ist so a ufgeba ut, dass a lle Berech nu ngen \ "0 11 Ha nd bzw. mit eincm Taschenrechner nachvollzogen werden können. Unsere Erfahrung mit Sta tist fkkurscn un d Ein füh rungen in SPSS und Stata zeigt . dass P robleme weni ger in der Bedienung der Software (vgl. zu SPSS: B rosius :WUÜ; ZIl Stata: Kohlvr und Krcu tcr 2UU8) a ls vielmehr im Vers tändnis der st at istischen Verfahrenbestehen. F ür diej enig en . die dip DI'ispipII' mit S PS S oder Stata nachrechnen wollen. hahen wir die Da tensätze auf der l ntemetseit e rles Buches zur Verfügung gestellt:
Das Bu ch wurde mit dem Tex tsatzsys tem UTS\:lt geset zt. die Graphi ken wur den weitgehend mit dem P rogram m TDA von Cötz Rehwer und Ulrich Pött er - eigentlirh ein P rogra m m zur ErcignisdateuanalvSI:' - erzeugt . Anker dem haben wir die Sratlstik-Lernprogramme GSTAT und GSTAT2 VOll Fred TIiikt'r verwand t, mit denen d ie Grundlagen der Inferenzst a tls tik auf einfache Ar t und \ \"t'!st' nachvollzogen werden könneu. AI1I' gen a nn ten Prog ra mme sind frei er hältliche Software: HTS\ 2e ist u. a. auf der Sl'it {, http : / /www . dan t e . de erhältlich . T DA wird un ter http ; / / wvw. s t a t . r uhr - uni - boc hum.deltda . ht ml zur Verfüg ung gcstellt . GSTAT un d GSTAT2 finden sieh im In t ernet un te r h t t p ; / / www. s t a t oe k . vt s o . un i -goett ingen .de /us er/ f red/; flie d a Zllw·hiirig!:' Literatur kann preis günstig üb er den Buchhandelbezogen werden (vgl. Böker 1993. 1998 ). In der ak tuellen Auftage haben wir den Titel geä ndert. \\" ir tragen damit der Tatsache Rechnung. d ass das Buch glpidll'rmllbf'll für Lehrvo ra ustalruu gen iu der Politikwissens chaft lind der Soziologie verwendet wird . Die inhaltlichen Beispiel e sta mmen vorwiegend aus der polirischeu Soziolo gie . wodu rch der AuwP/ldungslH'zug für Studierende lwider Fächer gl'gl'IJI'Il ist. TIpi den Teilue h nierinnen und Teilnehmern unserer St at ist ik- \ 'era nstaltungen an den Universitäten TriPL ;>'l
Trief. Xlai 2009 Cornclia \\"t'lI1S
Uwc Geh rin g
Online- Unterstützung Auf ()I' II unrPU genannten IVWIV-Seit P U bieten wir Materialien und erg änzf'ndf' lnformatkmen an. Unter anderem findet sich dort eine FormelsammJung Inklusive der Tabollen au s Anh an g A. Die Tabellen , Abbildungen lind Formeln dieses Bur-hex können in sta rk n >rgril!i.rrtp r Form (Will Beispiel für Folien) kopi ert werden. Fü r diej enig en , die die Beispiele mit Hilfe \"(1Il SPSS, SAS o de r Stata nachrech ne u wollen. stehen Dan-nsät ze lx-rei t. Schlieslieh H 'I"W l'iSf'1l .. Links" auf weitere lnformatiouen im :"f'll . http : / /www .grundkurs -statistik .de
Inhalt Tab elle nverzeich nis
xv
Abb ild ungsve rzeich nis
XVII
1 Wisse nschaft st heoret ische Grundlage n 1.1 1.2
1.3
Wissouschaftsthcorton Das Forschungsprogramm des Krit ischen Ra tionalismns 1.2.1 Dip Struktur einer wissenschaf'tllchen Erklärun g 1.2.2 Falsifika t ion statt Ind uk t ion 1.2.:.1 Basissa t zproblem 1.2..t P rob a bilis tische Hyp othesen Der Ablauf de, Forschungsprozesses I.:U .Der Kreis der Wissenschaft' . 1..1.2 Der Ablauf PiJ H"f empirischen Unte rsuchung
2 Forsch ungsdesigns 2.1 Datenerhehung 2.2 EIIt'IIP der Untersnehung setnh- It
3
4
1 1
-t -t
G 8 9 10 10 11
15 15 17
2.3 Umersuchungsanordnung . 2." Zeitdimension Übungsa ufgalx-n
22 31 40
Messen
41
3.1 3.2 :3. 3
Messen in de r empirischen Sozialforschun g Skalenniveaus . . . . Skallenmgsverfahre n :3.:3.1 Likert-Skala . 3.:3.2 Cuttman-Skala
3A
Gütekriterien einer
~ res.~llng
41 ..j:l
-\.7 -\.8 5;)
GI
3.-\.. 1 Rr liabilitiü 3.-\. .2 Validität Übungsa ufgaben ..
GI G-\. G8
Erhebun gsm ethod en -\.. 1 Ikfragung . . . -\. .1.1 Form ell der Befragung -\.. 1.2 Dip Fragf'1l . . .
70 71 73 76
xii
I" halt
·U .3 .1. 1..1
Der Fra gebogen . . . Der Ablauf der Befra gu ng
8.1 88 91
ß('o ba rht llllg . . . . . . . . . . Ka tf'gor i" IIl'lltwicklulIg ß f'obarht ungssd wltla Ablauf einer Beobachtung 4.3 Inhaltsa nalyse Übungsaufgaben
.1.2
9:3
4.2.1 4.2.2 .1.2.3
94
95
Du 99
5 Tabellen und Graphiken
100
Ta llt'II.'n.
IOO IOO lO.1 110 l lO I1G 118
;j.l
5.1.1 5.1.2
Tabellarische Darst ellung eines v lerkmals . Kreuz t abollen
Graphikl'll . . . . .. . . . . . . . . . . . . . . . . Unterschiedliche Arten graphischer Da rstellungen :\lissbraw h graphischf'r Da rst ellungen . Übungsaufgaben
5.2
5.2.1 5.2.2
6 Lage- und St reuungsmaße
120
Lagpma bt' . G.l.l :\Ioda hl"f'rt .. G.1.2 :\It..liall .. G.1.3 Arit hmetisches Mir tel. G.2 Streuungsmako . G.2.1 Index qu alit a tiver Variution G.2.2 Var iationsweite G.2.3 Quartflabstand ." G.2.-t \ "a ri
122 122 123 12G 130 130 131 l.12 1.% 137 138 1.10
Zusamme nhangsmaRe
141
G.l
7
7.1 7.2
Kreuz t ab ellen und statistische Una bhängigkeit ~ I~k für zwei dichotome Merkmale 7.2. 1 7.2.2
7.3
~ I
7.3. 1
P roz entsa t zdifferenz
Odds- R
v
1.12 1.15 1.l5 UG U8 U9
J"halt
7.3.2 Das prr E· ~ l a b lambda (Al :\laN' für zwei ordlnalskalicrtc xlerkmalo 7.;; :\Iab für ein notuinalskalicrtes lind ein met risches Merkmal: era-Quadra t (1/2) 7.G ~ lafM> fiir zwei met rische :\lnkwalt>; Kovarianz uurl Prod II k t - ~ Ioment- Kortela t ton Uhuugsaufgaben
7.-1
8 lineare Regression 8.1 Grundgeda nke der Rt>g rpssiousa na lyst> . 8.2 Das mathematische ~ [ ollell der linearen Regression 8.3 Bestimmung der Regressions funk t ion 8.-1 Qualität der Regresston . Übungsa ufgaben . . . . .
9 St ichproben ziehung
xiii
1;;3 l ;;G 161 16;; 17;;
177 177 178 179 18-1
192
193
9.1 Grundlagen , . , 19'1 9.1.1 Grundgesamtheit . Allswahlgf'sal1lth t'it und Stkhllrob f'19;; 9.1.2 ß efra gungs vorwoigerung 198 9.:1 Zu fall und \Yalll"1;dlPiulic-hkpit . 201 9.3 ZlIf
10 Wahrscheinlichkeit sverteilun gen 10. 1 Rt>lat iH' lIäuligkt>it lind \Yah rsd winliehkE'il 10.:2 Häufigkeif en lind ..\ ntl'ilt' in Stichproben 10.2.1 Blnomlalve rretlnng 10.2 .2 lI ype rgl,(llllt'l risl:lw Venetlung . . 10.3 Stic hpr obenmitt elwerte . . 10.3.1 Normalvr-rteiluug und St auda rdnonnalvencilung . 10.3.2 Die Verteilung der Stichprobenmit.telwerte 10.-1 Der Zentrale Crcnzwcr tsa tx Üblltlgsallfgalll'll
223 2:2;3 2:28 228 23-l 23::; 238 2-l-l 2-l8 2;;3
xiv
I"halt
11 Konfiden zintervalle 11.1 P un kt schätzun g 1L2 Konfidenzintervall für den Mittelwert 1I . 1L:3 Koufi de nzimer vall für den Antt-'i1s\\"f'rt 0 11..1 0" 1" Einfluss des Stichprobemimfangs Ühu ugsaufgabon
12 Hypo the senprüfung 12.1 Grundlagen 12.2 Test ('ln.'s Mittelwerts 12.3 Tests für Xllttelwemmt vrschtedc 12.3.1 Test für unabhängige Stichproben 12.3.2 Test für a bhängige Stichproben 12.-l y2-Tt's t auf Unabhängigkeit Übungsaufgaben .
254 25 -l
2GG 2GG 2G8 271
272 272 27G 28G 287 292 298 3UG
Anhang A: Tabellen zur Berec hnung der Fläche unt er den Wahrsc he inlichkeitsve rteilungen 308 Anhang B: l ösungen der Übungsaufgabe n
312
literatu rverze ichnis
329
Register
342
Tabellenverzeichnis LI 1.2 2.1 2.2 2.3 3.1 :3.2 3.3 3.4 3.i)
-1 .1 -1 .2 -1.3 ;:i. I ;:i.2 ;:i.3
jA ;:i.;:i ;:i.G ;:i. 7 ;:i.8 G.I G.2 G.3 GA G.;:i G.G G. i" G.8 G.O 7. 1
Deduk uv- nomolo gische Erklärung . . . . . . . . . . . . .. j Die CAS\ lJ:\-f\lassifikiltion . 1-1 Schulbildung lind geringfügige [lpS('hiifti gnng :WOG 28 Wahlabsicht und Stirnmuhgabe in Eric-Counrv bei den P räsidcntschuftswnhlen in den US.-\, 19-10 . ;3-1 Stichprobenstruktur des Soxic ökonomischen Panels ;38 Ex tremgruppenanalyse ;:.:3 Tn-ll nsl"härfl:'- l\m-lfizielltf'il lind Cronbachs (\ G--l Modellkonforme Antwortmuster bei der Guttman-Skala ;)8 Nicht modell kon forme Antwortmuster bei dor Guttman-Skala ;)8 Gu ltman Skala - Politische Beteiligun g l U98 GO Fonneu de r Befragung in der Ma rkt - lind Xleinungsfcrschung i -l Inte r viewd a uer 1)('1 ALLflCS- Umfrag('1I . . . . . . . SC Int er viewere ffek t bf'i de r mündlichen Betragnng [Spaltenproveut e] . 90 Notanon lx-t H äufig keitsa us zählungen 101 H äu figkeitsauszä hl un g der \Yahlah...eicht im :\.LLD US 199.!. 103 Häufigkeitsauszä hlun g der \ Ya hla bsieht mit untcrscbtedlicher Prozeutuierungsbasis . . . . .. IO.! Kreuztabelle der wahlabsiehtmit dem Schulabschluss - absolut e lI ä llfigkf'itf'lI 10i" Krouztabello der \Ya hla bs id lt mi t Bild ung - absolute lI ä ufigkeiten und S paltr-nprozente 108 Kreuz t ubelle der Wahlabsicht mi t dem Schulabschluss - ahsolut e Häuhgkciten und Zeilenprozente . . . . . . . 109 Ergebnis der Reichstagswahl vom 14. September 19:30 118 \Yir tsd la ft lid w Ei nst ellungen im A LI,B US 199..J. . 119 Svmesterzuhl von Politologen. ungmppicrte Daten 120 Seruesterzuhl \ '011 Poli tologe n: l l äuflg keit s t abelle 121 Roltgtouszugehörigkott 1:l3 Schulabschluss 12;:i E inHIIs,<; \"011 Ausreiser n . 127 Semesterzahl - ;:i P unk te- Zusammenfassung . . 133 Berechnung der Varianz aus rler primären Ta fel 13G Berechnung der Varianz aus den gruppierten Darr-n 137 Univariate Ma szahlon und Skalenniveau 13V Zusa mmcuhangsma t,c . I ·n
xvi
Tabd /.." ""I'U' ich ,. i~
Einstellung zur A b t reibung na ch Erheb ungs ge biet {H äufigkeiteu] , . . , . . , . . , . , , . , , . . , , 7.3 Allgemeine Fo r m einer Kreuztabelle , , .. , , , . , , , . , 7..1 ß p(lll
1l(' . . 7.10 Ar!witstlm is der OT W 199-l 9.2 A usschöpfung beim ALLOUS 200 G 9.3 Mö gl iche Ereignisse heim zweimaligen W,'rfell eines Wür fels 9..1 Wahrschei nlichkeiren fiir Stichproben . . . , . . , , .. , , 9. 5 Auswahlwahrscheinlichkeit heim P PS-Dpsign . . 10.1 Wahrscho tnltchkott lind rel a t ive Hä uf i gke lt beim \rpr fm f'i!l P S W iirft·Js , .. , , .. , , . , , , . . , , . . , , 10.2 A ntf' ils\wrtf' der Zahl (i bei lOO W ürfell . w.a Ameilswerte der Za h l G !wj 100 \rii rfl'n und 1.00 0 \r ipdl'l"holung-n . lOA Altcrsdurchschnitt e bei 1.000 Stichproben de r Grübe 1.000 11.1 P unk t- lind Intervallschät zung . . , , . . . , , . , , , , , , 12. 1 Fehle r bei rler llyporheseuprüfuug 12.2 KOllti n gf'n zt a lll' l1(' - Einstellung Zlllll Schwangersehaüsabb ruch un d Geschlecht 12.:3 Indiffere nzta belle - Einstellung W ill Schwangers chaftsubhmr-h lind Geschlecht .. , 7.2
l -t2 l -t:3 l -la 1-l5 I G2 I G-l 15G WO 171 189 19-1 19'J 20-l 20 7 2 1G
225 22 7 229
23 7 2, 0 27-l .'30:3
.'3 0:3
Abbildungsverzeichnis LI 1.2 2.1
Der Status wm Theorien . . . . . . . . . . . . . . . . . .. T heor-iegewinnung und T heorieprüfung . . St tmmenanteile der XSDAP und der KPD bot Arbeitslos en und Ix-i allen Wä hl"fI] [Angaben in P rozent } 2.2 S O]OIllOIlS Vier-Gruppen-Design . 2.3 Sr!winbHls
4.1
Sonnta~frage
im ALLßL'S 1990 .
welligen Mlrn-lwerren
Srinunonanteil der enu und Ka tholikena nt eil in wahlkrefson 7.G Lese- und Mathematikkennt nisse
22 23
29 :jO 32 3:3 42 49
50 5(;
81
4.2 Frage mit Mehrfachantworten .. 4.3 Ra ting-Forma t m it slr-hen Stufen . 1..1 Pa rteiident ifikations frage im ALLOUS 1990. . L j F tktivos Beobachtun gsprotokoll einer Stupa-Sitzung 3.1 Balkendiagram m der Wahl a bsic ht .. 3.2 Säuh-ndiagranuu der Wa hla hsicht .. 3..1 ~ Iilli- /r-. lid i-..Joh nach Sehnlabschluss und Geschlpdlt 3A Tortendiagramm der Wahlabsicht 3.3 Alt er von Kur steilnehmern . 3.. G ;-'; SDAP-W ählerant eil bei der Reichst agswa hl 1933 . i).7 Wahlabsicht bei Ver änderung des y-Arhsell<'' 'abtalws 3.8 Wa hla bsicht mit korrek te r und falscher Grund linie . G..1 Symmetrische und linksstelle Verteilnu g . G.2 Quartila bsta nd . . . . . . . . . . G..1 Oox-and-\Yhiskpr-Plot 7.t Kenntnisse in Alltagsma the mati k 7.2 Kenntnisse in Alltagsma the ma ti k nach Geschlecht 7.3 S timmenant eil der enu und Katholikenanteil . . 7.4 Stimmenantei l (IN enu lind Ka tholikena nteil mit den je7.i)
2 10
8:3 83 8• 9G 110 111 112 1U 113 11i)
IlG 117 129 1.1.'3 134
IGI IG3 IGG
IGT ~ \\'t'i
1G8 1. 3
A bbild 11"!I~ " 'TZ<' iCh ,. i~
7.7 8.1 8.2
8.3 8A
9.1 9.2 10.1 10.2
10.:3 1O..t 10.5 10.6 10.7 11.1
11.2 11.:3 lU
11.Z> 12.1 12.2
12.:3
12.4
12.5 12.6
Darstellu ng un terschiedlich hoher Korrelat tonen , .. , , . 17-l vorschledeno lineare Funk ti onell " " , . . " .. " . 179 Regression des C frli-Stimmenantcils auf den Kat holikenant eill Sd 185 Varlanzze rleguug imllnearen Rf'g n'ssionslllOd ,'11 ~ khtli llf'arl' Zusa llllllt'llhäng<' 190 Auswa hlgesamt heit und Grundgesamt heit 197 \rahfScheinl irh kf'itS\'l'rtf'illlng des Fra uen a nt ei ls 208 Simulation dos \rt'rff'ns eines \ r iirft'1s . . . 226 Anteilswerte der Zahl G bei W O würfen und 1.000 W it't)l'r· holuugcn , .. ,. ." . . . , . . " . . . " .. , .. , 230 Altersdu rchschnit te !wi 1.000 Stiehprohen der Griil;e 1.000 238 Xormal verteilungen m it versr-hir-denen Pa ram et er n j' lind $2 2.tO Fl.lchen unte r der St a udanlnurmal vern-ilung . . 2.t2 Altersverteilung der bundesdeutschen Bevölker ung 197.t. Jl = 3 7, 27 und (J = 22,.tß J ahre 2.t9 Grundgesamt heit. Kenuwertevorteilu ng lind St iehprolw. 252 9Z> <.X- \\'a h rschei ul ichkei tsint er vatl einer St unde rd normalvcr tcilung .. , . . . , . . . , .. " . . . " .. , . , . 2Z>7 \Yahrschei nl lchkei tsint ervall einer Standurdnor rualvert eiIung 258 \ Yah rschet nllchk ei ts tnt ervall ei ner St ich prolu-nmi t t l' Iwert everteilung . . . , .. , , . . . , , .. , . , . 2Z>9 K(l1T lide llzi nte rva Ile be i uuterschiedlichen S t ichprnln-nmütelwen en 2G2 I· Vertellungen in Ahhänglgkeit vom Freihe usgrad 2G5 Stirhpro be nmi llt' lwt'rlt'H'rteilungeJl mit 110 = 13,5 und nntorschiedlichen Standa rdfehlern (T t • • , • • • , , • • , , • , 278 ZWf'is<'il ig,>r Ablehnungsbereich (gra u S/:hra llit'rle Fläche) he i einem Signifikanz nive au \ '0 11 5 % in der Standardnormalverteitung . 281 Einsei 1iger Abk-hnungslx-n-ich (gra 11 schra fttcrr e Fliid lt' ) bei einem Signifikanzniwa u H In ;j % in der Sr anda rdnormalver teilurig , , 28-1 lrrtumswahrscheinlirhkeit en fiir den \rer! 0 bei verschieden f'U Xullhypothcscn /l :5 0 .. , . . , , . . . , . . . , . . . 29':; '1' 2.Vf,rtt'il ung für \'t' rsth i''fII'\Ie Freiheitsgrade . , . . :301 Able hnungsbereich in eine r y2. Vt'rt ei]llllg mi t dj = 1 IlPi otnem Signifi kanznivea u von Z> % 302
1 Wissenschaftstheoretische Grundlagen 1.1 \Vi~lSI.· ll1..c haftst hcoricn 1.2 Das Forschungsprogramm des Kritischcn Ra t iona lb ll11l:> 1.3 Der Ablauf des Forsdlll ll l-,'1
1 ·1 10
1.1 Wissenschaftstheorien Es ma g vielleich t verwundern , dass ein Blich zur empirischen Sozialforschung lind Statistik mit einem Kapi tel zur Wlssenschuftsrbccrlc beginnt. Da die Vergehensweise eine r Untersuchung j edoch vom wissenschaftstheoretische n Blickwinkel w'prä gt wird . werde n wir dieses Kapitel vor allem dazu nut zen. eine sohr bekannte wtsseuscha üsr hoorouschc Pos it io n, den Krit ische n Ra tionalismus. III skizzieren . G run dlcgondo Elnfllhnmgen in d ie \ ri;;;;(,l\;;chaftsth eorie bieten Poser (2001), Rltsort (2003) und C ha lmers (200? ). Zunächst dazu , was \r isseusdlaft über haupt ist. :-' Iit Hilft' von Wissen;;('haft versuchen Xlenscheu. ih re Erkenntnis Ilher die Realit ät zu erwei te rn (vgl. Patvelt 2007, Gi ). Was passiert lH'i de r P hotosynt hese, wie entstehen 51('1"1\('. was sind rlie Ursachen gt'st'lls('ha fl lid wr Ungleichheu und welche Gr ünde sind ausschlaggebend fiir dle Wa hl einer bosrinunreu Pa rte!" Wtssens chaft liehe Erkeunt nisgcwin nung unterscheidet sieh da bei nicht prinzipiell davo n. wie man im Alltagsleben \rissen er wir bt . Folgert TIlIIU ,HIS der Beobachtung. dass da s morgendliche Fr ühs t ücksei imm er da nn ha rt wird , wenn man PS zehn Minuten lan g kor-ht, dass alle Eier nach einem zehnnuntltlgen Kochvorgang hart sinrl, so ha t mall sein \\"isspn auf die gle icht> Art und \\'(' ist' (nä mlich dnn-h Verallg emeinerung] erweitert wie der \\"isse nsehafl lt' r, ON mehrmals nach Zuga bt, einer Substanz zu ..tnor anderen die glt'id w eheunsehe Rea kt ion beobachtet und dara us ableitet, dass diese Reak t ion inunor statt finde t. Im Gegensatz zum Allt ags wisse n zeichnet sich \r i.Sst' lIsd laft jedoch durch einen höheren Abst ra ktionsgra d . ..in syst ematist:heres \ 'orgplwll lind vor a llem die kri tische Überprüfu ng rler ge wo nnene n Erkenntnisse aus. Leider ist es jedoch - wie wir später noch sehen werden - a ur-h mi t Hilft, von \\"isst'llschafl ni..ht möglich zu überprüfou , ob die gt'wo tllU'm 'll Erkenn t nisse wahr sind .
Il';s,. """,,:hafhlheurd isd,,, Gru"d'''9''''
2
\ r issr IlSrhal"t slllPor i,'1l (de r Plural zf'igt schon a n. dass PS mehrere gibt) sind A/l$.~fl!lf'nbiindd dariiber, mas Wi.~.H:ns rh aft ist und wie dtose \'01" 711gehen hat. Sie sind a lso noch keine Theorien über einen Ausschnit t eil ' ]" Rea lit ät [al so v: B. dir Stenn-ntstchung oder das \Yahlwrha lt t'u ). sondern Theorien iiber Theorien. die auc h Bis Mete theorien lu-a-irhm-t werden . \rissl'llsrhaftstllPorit'll hestlmmen a lso. wie rlie r-igr-nt lieh i lltl'rt>s.si!:'fpl](11'
Theorie iilwr dip Rt'alitiit auszusehen hat. Si\, IwS(:häft igl'll slch mit Fragen wlo: \r('tehe Auss agen sind in Theorien zulässi g, welebo Xlothoden werden angewendet , welche Ziele verfolgt \r issPllscha ft'! Sind nor ma t ive (wertende) Aussagen in der W is,<;('llsd lllft ertaubt oder nicht? L!1\f1: \\"{'Idw Rolle spielen W"l"t{' in der W issenscha ft. Theorien treffen da gegen Au-sage ll tlher einen Ausschuit t der Rf'a litiH , eine Theorie des \rählen-erhal· tens also üb,')' das Wa hlver halten. wie es in Abbildung 1.1 zu m Ausdruck kommt .
Abbildung 1.1: Der Status
Wi "",nsc hafiSlhc",rien
\ '011
Theorien
Au,,,,<,,,,, über Th eorien (l. B. t-:rilisch", Ralioo.); smus)
I
~
Aus",<,,,,, uberdie RealHAI R. Thoorie d.. Wähl"",,,,hallcn, )
( ~.
I
~ In der de ut schen Pulitikwissensrha fr wurde lan g!' Zeit eine Uuu-r sdu-irlung der wjs,<;('lIsrhaflstl lt,'o)'('tisdwlI Posltionen in n01'1/wtiv-olltol oyi.cch. l, m1Jiri$ ch- ana lyli.~ch und k1'itisch -dia lrkti.~ ch \"(ll"gmOlllll1t'1I (\·gl. zur Einführun g Druwe 19U·t, iJj·j-l). Diese Ansätze uurerscheidou sieh VOI" allem in Bez ug a uf den Erk-nutnisgcgcustund (\ r as soll erkannt und erklärt Wl'I"r1!'II'!) und die Erkennt nisquelle (Empirie Oll!'r Vernunft"}. Die normctio-
onleloqisch s: iVisselisehaf t versucht , da s Wesen ih res C eg eu st andcs. a lso z. B. des Staates od er der Cescllsrhaft. ZII erfassen. Ziel der Ontologie ist ps, da s \\'PHt'tl , d. h. den Idealz ustand eines Gf'gl'lJst
deru nicht erfasst . Die Unt orsduedo z wtsehon verschiedenen wtssenschaftstheor ot isehon Stan dp unkten kristallisierten sich im 20. Ja hrhun de rt in der Hert lll ·leilsdebatle un d im Positioismuss trcit heraus {vgl. Rit scrt 200:3. ü::.i- I-tO). Im \\ht urtt' iJ:.;s trl'it wurde im Verein für Sodalpclitik vor altern um die Fra ge gest ritt en . welche Rolle \\'1'1'1 (' innerhalb der \ \'issellschaft spielen. Xlax Wplwr vertrat in dieser Auv-iuanderset zung das Wertfreih e it~llO<~ t ll l/lt, die Forderun g der Tr ennung von \\,pr turtf'ilpil lind wissensrhaftbcheu Aussagen. Im Posiuvtsruusst relt wurde d ie Ausotnandersetzung ewischou Kar! Popper und Han s Alb ert a ls Vertretern des kritisr-hen Ra tionallsIllU S auf der einen Seite lind Tbcodor Ado rno lind Jürgon ll abor mas a ls Vert ret er n der kritjsrhen T heori e a uf dP1' anderen Seite gefüh rt. wobei die Differen zen nicht einfa ch best immbar sind. Im Kern ging P S auch
hier UIlI die Rolle YOIl werten in der Wi S~wllschaft lind die Aufgabe YO Il Wissenschaft. , r issell seh aft lid lt' Krit ik ist für Vertr eter der kriti schen T heorie immer a uch C csollsrhaftsk riri k.
1.2 Da s Forschungspro gramm d es Kritischen Rat iona lism us Der Krtttsche Ra t ionalismus is t ein von Ka r! Haimund Pop per begründetcs Forschungsprogramm (vgl. Po pper 1971). Der zen t rale wissensch aft stheoretische Beit rag bes teh t in der Aufgabe des Rechtfertigungsged a nken s von Theori en zug unsr en des Falsifikat ionsprinzips . Xlit Rech tfert igun gsgeda nke ist der Versuch gemeint, Theorien d ur ch ihre n Wa brhoir sgehal t zu bes t ät igr-n. Wahrheit bedeutet dabei nichts a nderes als die Üben-lnst imuumg mit der Realit ät . W ir werden die Poppcr'scbe " f.' nc\t' in der 'n.s.S\'llscha ft xtIll'urif' answ,II\' IUI von der St ru k t 11 r eine-r wissl'nsrhaftliehen Erklä ru ng erläutern.
1.2,1 Die St ruktur e iner wisse nschaft liche n Erklärung Ein Ereignis zu erklären hoik r, dass wir os a us GC'Sl'tZPll und Ra ndhedlngungen rledukr iv ablei ten. Das von POPJlPr gewäh lto Beis piel zur illus tration einer wisseuseh aft firhen Erkl ärung ist ein Faden , der reijst . Kau sal ist das ReibeIl des Fadens erkl ärt. wenn ma n weib . d ass der Fadr-n eine Rei bfes tigkeit von I kg besitzt , aber mit einem Gewic ht von 2 kg lx-lastet wurde. Dil' Erklärung heinhal tet ein Gl'sl'tz (,) l'd('s nw.1, IW' lU I ein Faden mit einer Last von einer gl'wis.'wn ~li nd('s t grü M> lx-lastet wird , zer reikt ('1"" ) und Randbedlngnngen ("F ür diesen Faden hier b eträgt di psl' Gröf.,p I kg - un d "Das a n diesen Fadr-n angehä ng te Gl'w icht ist "i n z-kg-Cowicbt'') (POJlW r HH1,:H L), " 'eil d urch logische Ablei ru ng (dcdukuv) von einem Ges\:'tz und (1<'11 Randbcdiugungcn a uf das zu erklärend c Erei gnis « las Reif.,pll des Faden s] ge.. sehlo.s.S\'1l wird . Iwil>t dieses :-' llld,,11 dedljkti1! - rLO mologi~'rh e Erklä rung. Die
St ruktur dieser Erklärung wurde von J1I'Irl PI'1 lind Oppr-nlu.lm (l 9~ 8 ) herausgea rbel te t , weshalb (Ii"sl' a uch als ll-O-S rhema bez eichnet wird (vgl. O pp 2(HJ5, -lß..52),
Tabelle l. 1: Dcduktiv-nomologisrhe Erklärung Handbedingung
Alle Rotdrosseln waudem Allo Arbeiter Wii1I 11 ~ll $ I' D
Zu l'r klärl'ude Beo bachtung
Vugd X ist eine Ro tdrossel
.
Per SOll Y wä hlt die $ I' D
Expl a lla lls
Ex pl,\l7all. lulll
Prämissen
Ko nklus io n
Eine dedll kth'- nolllologisdw Er klärung bes teht also a ll ~ miurlesteus einem CCM:tZ. m indest ells einer R(lIl rlbcdi1l!llmfj und einer n eoha rhtung, die erklä rt worde n soll (Z11 erklän:ndc .~ E7Y'ignis). Gf>sd~ r s in d determinisüsche, rä umlieh un d zeitlir-h un begren zte Aussagen. Determinist isch bedeutet . dass G l'SI't Zf> als All-Aussagen formulier t werden können. :\ [] E'II Elenwntcn der interessierenden ~ kJlg(' wird eine Eig ens..haft zug eschri eben. GeSI't ZE' und Randbe dingungen werden a uch als Explana ns oder P rämiss en he zeidulf't . de r zu erklärende Sachverha lt als Explana ud um od.'r Konk lusion . Anband de r beiden Beispiele in Ta belle 1.1 kann das Prinzip verdeutf..ht werden . Im ersten Beispiel möch te n wir erklären. waru m ein bes timm ter Vogel im \rinter dip südlichen Gf'tildr' hevorzugt , ß pisp ir lswf'isp könnte n wir den Vogel in IInSf>J"('1ll Garte n als Rotdrossel ldentifizleren u nd u ns noch d unkel aus dem Biologieunterricht da ra n erin nern . dass aBI' Rot drosseln Zug vögel sind . DE'r beo bac htete Vogel fliegt also im \r illtt>r in den Sü-h-n. weil er ein e Rotdrossel is t. Im zweiten Beis piellautet d as G l~l'tZ . d
srn
Ans wahre n P rämissen l asSI' 1I sich mit Hilfe lle r deduk tiven Logik wahre SehlüsS(' ableiten . Das Umgekehrte gilt nicht. Aus "IIl]liriseh z utreffenden Schlussfolger un gen ka nn nicht die \ra hrhei t der Präunssen !!;f'fo]gert werden . ß l'ispit>lswels(' kÜlllltl· (11'1" beobachtet e Vogel zwar wandern. aber nicht deshalb. weil er I' Ü H' Rotd rossel ist , sondern weil er zu einer a nd eren Sort e Zugvög el zählt. Das hera ngezogene Ces-tz wä re in diesem Fall als o nicht diE' richtige Erklä ru ng für rlas Zugverhalten des \ 'ogf'ls . weil es skh nic ht um eint' Rotdrossel ha ndelt.
6
11'i.,s'''71,'(." aJtsl""an,!i..,·/", G,'tl"dlug""
Die Gi ilt ig kr it otner wissensr-haft.llcln-n Erklä ru ng beruht de mnach auf der If oh rh ei t I]"]" im Expla na ns verwendeten Aussagen . F ür die wlssenseha ü srhcorettsche Auseinandersetzung spielte \'0 1" allem die For derung wahre r Gt's l'tZ(' eine grot,(· Rolle, Eine ~ liiglichk('i t , die immer wieder in Bet racht gf'zogl' lI wurd e, ist d ie Verlfikatlon vo n GI'Sr tz PIl durch / nd ukt io71 (vgl. Posor 2U01 , 108- 119). Die Ind ukt ion ist ebenso wie die Deduktion ein Schlussverfa hren. Allerdings worden lx-i der Ind uktion aus singulären Au ssagen (..Dieser Schwan ist wci];", .rler Schwan dort hinten ist weib" usw.] allg eTlWIIll' Aussa gen ("Alle Schwäne sind weib") abgeleitet . Im Gegl'llsatz 7lI ded uk t iven Schlüssen sind induktive Schlüsse gehal tserweit er nd. weil wir auf eine g riifif're Zah l von Fälb-n S(·hlieN' ll. Oie Verlfika tlon von Gesetzt'1l durch Ind ukt ion hat allerdings einen Haken. der seit H ume als das l n d ulzti rl1lsJ! m h!em bekannt ist. Auch wenn wir his her immer nur wl'ik> Schwäne gese hen ha ben , kön nen wir da ra us nicht folgern. dass d tos auch in Zukun ft so sein wird. Zudem ist r-s lllii~ li('h , dass es ulchc-wetjc Schwäne giht odo r ga b. dir- wir nicht beobachten bzw. beobachtet haben. Dir er n üch t er nde Ant wo rt ist da her: \Yir können die \ r a hrhe it \"011 Gesl't z('n nicht durch Induk tion beweisen. Das heist natü rlich nicht , dass ein Gesetz nicht wah r sein kann: die \r a hrlwit ist ahe r nicht feststellbar. Popper hat dies kla r erkann t und zeigt UIlS eine Alternarive au f. Ein Gl'Sptz läss t sich zwa r niemals durch B eobacht ung en bewahrheiten (verijizieren). Eine piUligf' wilh>rspred wlldr' ß m had lt llng reicht jt>dodl ans, 1I1lI eine gest'tzpsart igp Aussage zu wtdo rlogon (fai.~ ijizi rf'cn ) .
1.2,2 Fals ifikatio n sta tt Induktion \ r egell des Induk t ionsproblems sch lägt Po pper vor, a lle .,G eS(' tze" st rikt als Hypot hes en aufzufassen. Als Xlögliohkeit de r Fa lsi fika tio n von Hyp otln-sen kann das lf-O-ScJu:mu verwenrlet werden: Aus der Jlypot]It>S(' und den Ral ullH,di ngllllgell \\'(' I"I]f'1I nmhachtll ilgssä tzf' abgeleit et , die im kr itiS('hf'1I Hariou alis mus ßa,<;issätzc genannt werden. Erweist sich ein ß asissa tt als falsch , S() wird d ir- 1I.l" po t lws p widerlog t. Sobald wir eine ('inzi~(' Rotdrossel entdecken. die im Wtn tor hier bleibt, wi,<;,<;cn wir. dass nicht alle Ro tdros seln Zll g\'Üge1 sind. Vora usgeset zt , es hand elt sich tat sächlich Ulll eine Rot d rossel. Allgemein formuliert: Liegt dto Randbedingung vot . nicht aber die Schlussfolgerung, da nn ist die Hypot hese widerlegt .
lr ir geh en $0 lcnqe VOl l Jet' Gült igk ei t der llypoth ese eus. bis dies e sich al« Jalsch enoicsen hat. Solange wir allssc hliE'blic h Rot dr osseln beobach-
7
\1'1I, die im Wlnte r in (!P Il Süden fliegen. gehen wir also VOll der C ült igkoit der Aussago "Alle Rot drosseln wandern" aus. Eine Hypothese wird bolb e... hal te n, wenn die Ra ndbedingung und der Busissa tz zutreffen. Gleichzeitig versuchen wir. unsere Hypot hese wiede rholt an rler R ealität 111 prüfPli . Eine T heorie ha t sich nac h POPPI'f lWlJIählt, wenn sie mehr eren strengen P rüfungen standgehalt en ha t. lI iil t eine Hypot hes e einer P rüfung nicht stand. so muss sir verworfen lind durch eine IlP1 U' ersetzt werden.
Falsifi kat ion wird erst möglic h. wenn die Hyp othesen auch ra tsächlieh .an
(11'T Erfah rung scheit ern köunen- {vgl. POPWf 1971 , 15). Oif' Aussagen, I\iP in lI y p ot )ws t'1I lind Gesl'lzf'lI w>r wf'ud l,t \\"(')'(1.' 11 , mÜSSt'lI ('mlJ iri.~ ch c71
Gehalt haben. Die Aussagf' ,.\ rf'r ßi isps tut, landet in der TWill''' beruht wie alle mctophysi.~ chcTl Aussogen nicht auf Erfahru ng und kan n daher auch nic-ht durch Erfahru ng widerlegt werden. An der Rt'a litä t können ebenso wenig Aussagen scheitern. die immer wah r sind. Selche Aussagen werden als Tautologien bezeichnet. E in Beispiel für eine Tautologie wäre: .X ach dem Les en Ik s Ka pitels 7.Uf \Yis.v'nscha rts t!wllri{' vers tehen Sie das Fals ifika tion sprinzip oder Sie verstehen ps nic ht:' n i {~l'l" Satz ist immer wahr, denn d ie Folgerung bein haltet alle miigli dll'll Erf'ignisse. l n die sem rrtvlalen Beispiel ist die Tautologie na tü rlich leicht 7. 11 entdecken. In sozialwissr-nschaftl idn-n T heorien kann das schon schwier iger sein (vgl. Dickmann 2008, 137 f.). Dip potf'mipl1e Falslfizierbarkelt von 1Iypo theS('1l grona t empirische \risS('lIschaft pll \ '0 11 nicht -em pir isch en \YissI'IlSl::haftl'll ab.
Nicht widerlegbar sind auch ExL~tcnzuU$.~(Ig en , d. h . .Aussagen über das Vorhandensein eines C egcns ta nde- oder mehrerer G egl' lls t än d t', Eiuemögliehe Existeuz nns sage lautet etwa: "Es gib t einen wf'if,PIl Schwan." \Yollt t'll wir dif'se Aussag!:' widerlegen. S() müsst en wir l\i{' Fa rbe alle r Schwäne in Vergangenheit , Gegenwart und Zuk unft kennen. Umge kehrt reicht bereits ein ein ziger zut reffender FilII 7.111' ß cwa hrhcitung einer Existenzaussage. St'IWIl wir ein en weise n Schwan. d a n n ist die Aussage verifizier t . An d iesem Beispir-l 7.eigt sieh d ie ..h ymm etrie z'w üchen Fulsifikatü m und Verifikation hei All-Aussegen und Exis teuz aussugen. Bei einer Exist euzanssage genügt ei nt' zutreffende Beobachtung 7.11 1' Verifikati on. währen d diese nicht widerlegt werden kann. Gerrauumgekehrt verhält e, sich mit t!PII in ll ypmhesa-n verwende ten All-Aussagen: Hier genügt bereit s eine wi!ll'l'Spredlelllle ß p.. obachtung zur Falsifikatlun, wäh rend All-A ussagen auch du rch noch S() \"ip lp zutreffende Beo ba cht un gen nicht veri fiziert worden können. So wurde dio für Europäer durch zuhln-ic h« Beobacht ungen lx-legt e Aussago "AIIl'
11'i.,s'''71.' ,." aJtslh"af"C1is,'/.., G,'tl" dlag",.
Schwän e stnd \\·"ib' · mi t der Ent der-kuug sehwarzt' r Schwäne in Aust ralton um 1700 widerlegt (vg l. POSI'r 200 1, 111). Das :-"(0<1,,11 einer wissenschaftliehen Erklärung geht von raum-zeitlich 1ITlbeschr änkten All-Aussagen a us. Häufig ha ben wir es jed och mit ra umzeitlich begrenzte n T1yp otlwst'll hzw. T heor ien zu tun. So behauptet die Theorie des Wprt,,\\'a llllt>ls von Ronnld l ngh-ha rt (Inglehart 1977) in nachindustriellen Gesollschaften ein Wandel von materiellen hin zu postmatericllcu Werten (vgl. einführend Bärkltn lind Klein 1998). Räu mlich un d zeitlich wird die T heorie a uf .arach-indust rielle Ocsellschaftcn- bes chränk t (was daru nte r versre nd en wird , ist nur eine Defini t ions frage] , ÜIll'r a ndere Gesells chaften wird also zunächst keine Auss agt' getroffen. Der lnformationsgehalt de r Theorie wird du rch die Ein grenzuug ge ringer. Die Gefahr bes teht darin, dass die raum-zeitliche Elngrenzung einer Theorie so weit geh t . dass I'S keine potr-nzielh-n Fals ifika teren mehr für (Iil' T heorie gibt. Dip Theorie wäre da nn gegenüber Kritik immunisiert.
1.2.3 Ba sissatzp roblem Die Falsifikation von I1ypotltesl'll ist mi t einem Problern konfront iert , (las Popper das B(I.~ i.~.~atzp roblem gena nnt ha t. \r ir haben gesagt . dass eine Hypothes e da nn falsifizie rt ist. wenn sie einer Konfront a t ion mit der Realität nich t stan d hä lt . Eine I1 ypot h t~l' kann jedoch nie d irekt durch n eoh.. achturi gen geprüft werden. sondern nur anhand einer Aussage Ilher eine Beobachtung. Dlese Beo bacht ungsa ussage kann a ber fehlerha ft SPill. Ik-ob.. achtungon - selbst Beobacht un gen mit blosem Auge - sind Beobacht un gr-n im Licht e einer Beo bachtungs- bzw. xlessthcorlc. Dies e kann sieh gPllIIUso als falsch er weisen wie die eigentlich int eressierende T heorie, r, B. weil unser Inst r ument etwas a nderes misst als das. was es messen sollte. Basis,<;äul' sind da her ..objek tiv krltlsle rbare P riifsiit zf'" (PoPPl'r 197 1. 7G). dere n \ r a hrltl'it f'hl'ns o wf'nig bewiesen werden kann. wie die der T heorie
selhst, Aus diesem Dilemma befreit sieh dip \ r is,<;('llsehaft, indem sip stülsr-hwotgcnd ven-iubart , dass der Forscher hei der Überprüfung elnor Theorie den höchstmöglichen methodischen Standa rd einhält und sl,iTlI' VorgchcnswciS/.' nachprüfbar und da mit (11'f Krit ik zugänglich mach t. Ist dies dn Fall . dann werden die ßasissätzl' vorläufig anerkannt . Dip .-\kzP)ltallz der Oasissiit~p ist demnach eine konvenuonollc Festsetz ung. POPPt'r hat für da s
P ro ble m d er schwankenden empirischen nas i.~ ein a nschauliches Blld gefu nden. Die W isst'llse hilft is t für ihn ein Bau. dessen P feiler nicht au f FHs griiudr-n. sondern sich ..von 0 1)('11 her in den Sumpf senken - aber nicht bis zu einem na türlichen -gegelx-non' G rund:': .wenn mall hofft. {lab sie d as Gebäude tragen worden , besrhllojst ma n. sich vorläu fig mit de r Fest igkolt dor Pfeiler zu begnügen- (Pop pe r HI7I, '(j).
1.2.4 Probe bilistische H ypoth esen Das Fa ls ifikat ion spr inzip ist zwa r ei nt' feint' Sache. fun k tioniert in der !J{,,sch ru-bem-n For m jt>clod l nur Iwi l ly porhesen de r For m ,.Illl11Wr wenn X, rlaun Y''. Solche lI y pot h t>st>1I werden als det erminixtisch bf'zl:' id lllet, In d{'11 SoziflIwis S('llsrhaftl>n g ibt I' S aber bis her keine det erministischen I1yporheson. Sozialll' issf'IlSdlaft lidlt' T heor ien und Hypothesen worden daher als statistische bzw. probabillst tsr-he A ussa gen formuliert . \\'ir beh a upten nich t mehr, d ass a lle Ar beiter di toSP D wählen, sondern treffen eine Wahrscheinlieh keirsa ussage. Ol'ispi e!slw isp i 11 d er For m: •.Ar bei t er st ir nmcn hä nfiger für die Sr D als für jede r-iuzclne andere Pa r tei." Bei A rbeitern müsste die S P D demna ch die stärkste Parte i Spill. Diese Einschränku ng hat erhebliche Konsequenzen . .-\l1S einer prohabil!srisr-hen Hyp ot ht'Se nnd den An filngsbf'{linguugt'fl kann das Ex planandum nicht me hr m it Hilfe der rlednkt iven Logik abgt'lt>i tl' t wI'rdell. Ist t>inp Pl:'rSl JIl Arbeiter, dan n ist dle \\'ahrsd win lieh keit einer \\'a hll'llts dll' illllllg zugunste u der SP D (bei Gti lt igk('it der Hypot hese ] zwar hoch. twt räg t ahr-r nich t lOOY! . \Ypil d a,'; E xplanaudum n ur wahrscheinlich (nich t aber logisrh zwingend) ist , sprechen wir hier von einer iuduk tiv-sta ususcheu E rklärun g (vgl. Opp 2UOG, GGf.). Ein einzelner Ar beiter, der eint> f1ntlt> rt' Partei a ls die S P D wählt, widerleg t nicht d il' lly po t IH'SP. P robabillstische Hy pothesen können dah er nicht d urch einen einzi gen Fa ll falsi fizil' rt werden. \Yir sehen d ie Hypothes e j rdorh dann als "fals ifizipr t'· a n. wenn wir bei ei ner hi nreichend gro N'1l Za hl von Arbeitern beispielsweise einen böhoron P rozent sa t z a n C D U· ab an SP D-\\'ähll'ru feststellen wü rden . Diese A kzep ra uz einer .Falsifikation'' proba bilis tis rher Hypot hes en beruht jedoch auf 111:'1' Anunluue, lla~s d il:' pl'O ba bilist isdw Hypothese fiir j('<:11' IJI'lil:'bigt' Teilmenge \"0 11 Fälton gilt (vgl. daz u P rim u nd Tilrua un 199 7, !S9 ff.).
11'i.,s'''71,'(."aJtsl""un,t i..,·}", G,'tl"dlug",.
10
1.3 Der Ablauf des Forschun gsproz esse s 1.3.1 "Der Kreis der Wi ssenschaft" 0 1'11 Ahlauf des FIlrsdu lIIgspnJzPssPS kann man sieh Wl1' in der folgenden Abhi] r]ulJg als Kreislauf vorstellen {vgl. \Yal1 ac(' 1971 ). Wi Sst'llsc!laft ist demnach uichrs anderes als eine Verzahnung von T}u:oricgewirm ung lind Thc07i c1Jl'üf ung mit tels Ind ukt ion un d Deduk tion.
Abbildung 1.2: Tllt'oripgt'winuu ng lind TIH'or it'priifllng The<.lI"ie/11lPo,heso: I NDI ; ~ no s
• f.l.i fi ~ati",,/ : Re"iihnmg
OPl" cigenrltch krea ti ve Tellbesteht in de r Entwicklung von T heorien hZII".
Hypothesen. W i(' du- verschiedenen Pfeile in de r Graph ik andeuten SO Il I' II, ka nn man B Ur die unterschiedlichsten Arten 7 11 Theorien flp langl'll ( 7. B. durch Xar-hdenken]. Ei ne gt.'hrä ud llidw ~l f'thodt.' besteht in de r Yf'rallgf'meinr-rung einzelner n f'{ )!>ar ht ullgt'll durch [nduk ticn. \Yir könnte n r, n . f'im' Vielzahl von Schwä nen beobachten. Dar au s. dass alle \ '0 11 uns beobachteten Schwäne wt'ib sind, gelangen wir zu de m Schl uss... Alle Schwä ne sind wels-. Wi r können noch so viele \\'('ib;' Schwäne beobachten - ein Beweis fiir die \Yahrheit de r Theorie ist es nicht . wie wir geseh en haben. Aus diesem Grunde scheidet das Induk tions pr inzip zur Priifu n,q einer Theorie a us. Als ~lügli chkf'it der Kritik HI/I T heorien wurde von POPPf'f deshalb rlas Falslfikat lonsprlnvip ver geschlagen. \Yir leiten aus unserer Theorie ß asissiitz;> ab und schauen. ob (li e st' mit IIllst' H '1I Ik-obacluungen in Einklan g ste hen oder nicht . Im ersteren Fall hat s ieh unsere T heorie lx-wäh rt . im
11
let zteren ist sie fals ifiziert [gcs rrichclre Linie ). Da mit beginn t der Kreislau f von Neuern. Die vorha ndenen Beobachtun gen kön nen als Grundlage de r Xlodifikation der T heorie ode r einer IlP1WII T heorie dienen.
l.akatos (1974) hat darauf hingewiese n. dass T heorien in d t'l" Praxis nicht allem a ufgrund falxifi ziereudor Beobachtungen aufgegeben werden (kiin111'11 ). Dips wäre angcsichts de s Bas issa tzpr oblem s un d !IN da m it verbuudenen Unsicherheit über dlo empirische Basis a uch eine selbst mördodsehe St ra tegie. Eine Theorie wird ers t da nn prt' jsgegelwll, wenn wir eine alternative Theorie lJf's it zl'll. dle einen theorer lschen Gf'h o-l!tsii IJl'l'St"h llsS a ufweist (die einen gril b!'l"p ll Geltun gsbereich als die alt!' Theorie ha t ), der zu min dest teilweise empirisch IH' \\·äh rt ist ( p rogn~$$ive Probleuwcrectue bung ). \\"ird eine faJslfiz jprtt' Theorie ll1il ll gt'l~ gepig tlPtl'n' r T heorien beibehalte n bzw. so modifiziert . dass widersprechende Beobacht ungen aus de ren Gelt un gsbereich ausgeklammert werden , dann handelt es sich Ulll eine deqenerai ive Problem verschiebll1lg (vgl. zur Einfüh r ung in di e wissenS(·ha ftst lWOl"f't ischell Positionen VOll Kulm. Lakatos 11 1[(1 Foyeralu-nd Poser :WOl ).
1.3.2 Der Ablauf e ine r e m pirisc he n Untersuchung Ausgangspnn kt einer Unters uchung ist im Idealfa ll e ine Theorie. d. h. ein ..S y.
Pr ä zisierung der Beg riffe 7.ur Über prüfung einer 1I~'poth(~(' müs sen die verwendeten Begriffe zunäc hst p riizise definiert werden. Begriffe sind ~ litt('L m it deren Hilfe wir rlas Chaos von Eindrücken xpra r-hljrh ordnen. Es sind Regeln zur Strukturieruug von \\'ah rtlphlllllngpu. Sie sin d Ilallt'i niemals itlplltisch mit der Reali tä t , sondern bezeichnen unser ~Iod{'ll von d er Rt·a litä t. Dip Bildu ng
12
11'i.,s'''71,'(."aJtsl""un,t i..,·}" , G,'tl" dlug",.
von ß .'griffpll erfordert da her immer ein gp\\'issps ~ I ab an Abstraktion, rl. h.•-ine T heorie d a rüber, wa s die gemeinsa men Merkmale des mit dem Begri ff Bew-khneren sein sollen.
n ,'gritft' ha ben unterschiedliche Fun ktionen : Sie ermögl ichen die Kom munika tion iib' >1" Gegenst ände und dienen der Kla ssifikation (vgl. a usführlleher ?\ laYll tz ('I al. 1978,9 -22 ). Di('S(' Aufg ab en von Begrltfen sind nicht trivial : Ohne einen Begriff ,.Yor ur tpile'· ist eine Vers tändig ung üb t'f di ps!'s P hä nomen nicht möglich. Begriffe, die meh rdeutig ode r un best immt sind, erfüllen ihre Fun ktion nicht mehr. Mehr deutig ist ein fk griff, wenn versrhicdene Inh alt e mit demselben Begriff bezeich net werden. z. ß . kan n mit .Hahn" das Tier 0,11'1' ein WasserlHl!lII gemeint sein. Unbestinun t ist ein Begriff. wenn er nicht pr iizise genug gefas st ist. Aus d iesem Grunde wird die \ "n\I'f'ndlln g von ß l'grilfrn in wlssonschaftltchen Tex ten m it Hilfr von Defin itionen (vgl. Opp 200;), 106- 131) fostgeleg t. Realdefin ition en treffen Aussagen über die Besch afJenheit der RealiNiI . versucht wird nach dieser Auffassung. das \YeseTl eines Gegenstandes zu erfassen. Die Form der Definition cu tspricht normaler weise einer lstAllssa gl'. Realdefinitionen be inhalten demnach empirische Aussagen und können daher wahr oder falsch sein. Ein Beispiel wär e dto Aussagp ,$ oziole gte ist ei ne empirische \Yissensc haft.., Der Wa hr heit sgehalt der AUSSll.gt· kann heurt etlt worden. \Yiirdp Soziologil' als Wissenschaft sich nicht auf Erfahrung gründe n, dann wär e (IiPSt· Definit ion falsch. Opl' (2005, 113 f.) verweis t a uf d ie ~ 1 ('hr(lt'lItig k{' it \"011 \\ 'psplIsIJl's timlllun p;pn {Bodou t uugsanalvscn. empirische GI'SO' tZP, Begriffsex plik a tionen . norma ti ve Aussagen usw.) und rät dos halb von ihrer Verwendung ab.
In den Sozialwissenschaften \\"" 1"111'11 in der Rl'gl' l Xominaldefininone n verwf'tI(IPI. Eil)!' Nomi11f1ltiefilli t i oll ist pin(' Fr sü etzlJflg IÜT Vertl'f~1UlImg e ille.~ lJegrifJes. Ein Beispie l für pi!w nominale Definition von Herrscha ft findet sieh bei Ma x Wplw r: .H nrrschaft soll heißen die Ch ance, für einen Be-
fehl bestimmten Inhalts bl' i a ngehbaren Personen Gehorsam zu finden{lk-rvor hcbu ng ergänzt , \\",'Iwr 1980, 28). Der Begriff dessen Bedeutu ng ft's tgelpgt wird, hier llerrscua ft , wird a uch a b Definiendum bezeichnet. der definierende Ausdruck "Cha nce ... Gehorsam zu finden" a b Defin iens . Die ßl'st
etwas umst ändlich wäre ). Eine Xominaldefinltion ist eine Festset zun g üb er die' 'erwcnduug eines Begriffs. Sie beinhaltet keine empirische Behauptung und kann da her auch nirht. wahr oder falsch sein. F ür ein gf'!;t,IH'lIPs Untersuchungsinteresso kan n sieh eine Nominaldefi nition lediglich als mehr oder wl'llig('r z\\'rl:kmäbig (' 1"\\"(' i S1' Il . Max ' Y('brrs Horrscha fts begrlff be... zieht sieh ausschlteklich au f Int era ktionen zwischen x fenschen. He rrschaft iiber Tiere. d ie Natu r r -t c. wird durch seinen Herrschaft sbeg riff nich t er... fasst. Ein e nomin ale Definiti on von Vorurt eilen könnte etwa lallten: .Llnt er Vorur teilen S\11J1'1l )wg
Als Operationalisb-rung bezeichnet man all e Forschungsoperationen die notwendig sind. um einen Beg riff zu messen. Eine Operationalisierung H ili , 'orurt eilen geg enii her .-\us!ä nde m kiillllt e Pt wa sein: .J e s t är kt'r pin Brfra gn-r der Aussagt' -wenn Arlwi lspliitzl' knapp werden . d a nn sollt e mall die in Deutschland lebenden Auslauder wieder in ihn' Heimat schicken' au f einer Sif'!lPlIst ufigPIl Skal a zustimm t . umso gri.ii'. pr sind de-se-n Vorurteile gegenüber Ausländern ansgeprägr-, Diese Operat Iona hsiorung zielt a uf I'i ne Befrag ung von Personen a b. Der Ausländeranteil kann operatiruralisiert werden als das Verhältnis der bel den Einwohnemeldeämtern reg ist rier ten Per senon mit ausländischer St ua tshürg ersr-h aft zu allen IJPi den Einwehnemr-ldeämteru registrierten Personen. Hier wird auf a mtllche Da ten zur ~ Iess u 11g zu rück gcgriffen. Es gib t für jf'f!ell Begriff \'t>rsfhi pdt,tU' ~lii g!ithk ('i tPn d er Opt'ra tionalisierun g. Im amerikanischen Kont ext wird Bild ung häufig als d it, Za hl clt'r Schulja hre operationalislert , die eine Person absolviert hat. Eine altemative Operationalisier un g ist die C.-\S~ IL\'-Skala (z. B. Lerhert " t al. :lO()(j ). CAS~ I [\' steht für Comparntive Analysis of Social :-' lo biJity ln l nd us trtal Nanous. CAS~II?\ kom bin iert allgemeine und bcruttirhe Zerti fikate zu H'1"S\·hledenen Sr ufen (T alwJlp 1.2). I F ii r cl ie Opera t lonalixierung de r Bildnng Dil' h:a l."l.;o'-;P lI 2" - 2h . 2" ~ i",J ,...,-ta ll~"ht, w,>;J im d""t~dJ<''' BildullK~~y~t"m di,' allgemeine Sokund a ra us bihluug p .l itt ll'f{' Helfe. 2b ) im A nsd lluss an di...allgomeiuc S('hlllhild ulIl\ ,,;W'f Iwrutlil"l,('n Aus hihhlll K (2a) m n l\lsl\" lLt (" I\!. I., ~,l ll'ft " t "I. 2006 , 1).
14
Tabel1(' 1.1: Dip 1'1 11> Je
,. 21>
2" _J!;tm
ae., voc 3'1
31>
CAS~ II:\-l\lassi fikatioll
Kein Abschluss Hauptschulabschluss o hne beruflichen AI . S{·h llls.~ Hall ptschulahschluss 11 nd beruf idll' AIls1 .i I(luug Mittlcre Reife ohuo 111'ruflic!l(' AllShildllllg Mittlere ]b-ife und berufliche Ausbildu ng Fachhochschulreife,' Ahit 1lI" ohne Iwrtl tlid u' Ausbildung F
durch die CAS~If:'\-Skal11 spricht . dass dit'S!' d ie starke Str at.ifizierung allgemeiner Ahsdlliisse [Haupt schule. Realschule und G....nmasunu] lind dip berufliche Spexitir ä t des deutsche n Bildungssvstetus augemessen plfasst, die sich mit!' !" anderem für die ]wl"lIHidw Ers t pla t zierung als bedeutsam erwiesen haben (vgl. 7.. B. Müller und Sha vit lUU8 ). Eine gegeb ene Opcrauonalisieruug kann sich im Verla uf des Forschu ngsI)l"OZl'~Srs als a n gl'Ill{,~SI'1l oder unangemessen erweisen. (Jpera tionalixierungo n müssen daher genauso zur Disposition st ehen wie Hypothesen au ch. Ist die Datenerhebung abge-chlosscn. dann kann der Fehler kaum mehr kor rigie rt werden.
Erhebung und Auswertung von Daten Der let zte und für (Iip P rüfung der Theorie l'lltsdw idpntle Schritt lx-steht in der Erhebu ng von Oat ('11 durch Beobacht un g im weiteren Sinne. Die kla..slschen For men der Dat enerhebung sind die Befragu ng, die Inh altsana lyse und die Beo bachtung. :-' Ian muss jedoch nich t zwan gsläufi g eigene DlIt('1I l'rhpb('ll. Für viele 1Jllt l:'l's uc hu ngsz\\"I'(:ke kann man auf Daten zuri k kgl'l'ifen. die Andere erboben haben und für wissenschaltliehe Anal ysen zur Verfügun g s tellen. W ir werden im folgenden Kapitel darauf zurürk komrnen. Dip Daten miissen dann im Hinblick auf die tnteros storendo ll ypothese statistisch a usgewertet werden. Voraussetzung für die Akzeptanz der empirischen Result ate ist die Einhaltung der methodischen Sta nda rds . Die Erhebung und die statische Auswertung rler weiteren Ka pitel dieses Buches .
H IIl
Daten sin d Gegens ta nd
2 Forschungsdesigns 2.1 Ib tt·tu'r lwlm llj!;
15
2.2 Ebene der Uuu-rxuchuugsoiuheir 2 .:~ Uutersurhungsanotdnung 2.4 'l..r-itdimension
. .. 17
.
22 :31
Bei de r Wah l des Forschnngs.lesig ns müssen vprsch ied plJf' Aspek te beachtet werden: Sollen d ie Da ten selbst erhoben werden ode r kann auf bere its vorhandene Dat en zur ückgogrtffon lI'('n!en '! Auf welche Unt orsuehungsebene zielt die Frages tell ung'? Welchen Zei t raum sollen die Da ten a bdecken" Wird ein Experiment ode r x, B. eine Umfra ge durchgeführt" Da das Forsdlll llgsliesign im i\aehhinpin nicht meh r wrändprhar ist, ist es wk-htlg. eine Unters uchung gena u zu pla nen, U Tll nicht später a uf unb ra uchba ren .D ateufriedhöfe rr- zu sirven ode r Elns r-hrankungen hinsidl t lich de r Giiltigkott der erzleiten Ergolmts se hinnehmen zu müssen. Da ten können ab "l)eob aehlt'h' Merkmalsausprä gungen au f Xlerk rnalsdimens ionen von Untersuchungseinheit en- ( r-. l ll ~· llt z et al. l !Ji 8, 3J) gekennzeichnet werden. Ab Untersuclllm9.~e inheil e 71 (a uch; Mvr kmals tr äger ] werden die Einheiten Ilf'zpidulf't, an rlenen die np ohachtlw gf'1l vorgenommen werde n. Unt ersuchnngseinhelt en sind häutig Personen, ps kann sich aber a uch um Ha usha lte, Staat en oder a ndere Einheiten ha ndeln. Merkma lsdimensioneu - wir werden im \Ye iteren den Beg riff Merkm ale verwenden - wären be i Personen z. B. das Ges chlecht, das Alter oder das poli tische Int eresse. Die mög lichen Ka tegorien der Merkm ale werden als Me rkmals(lllspriiylln!Jcll he-eichnet., Das :\Jf'rkmal ..polit is<:hes lnt n ess<'" könnte die Ausprägllllgf'lI .•sta rk", .mittel" und ,.~chwach" a nnehmen. Vm11\ IJlcn sind Merkmale \"0/1 Unt ersuch ungseinheiten. die mi ndes tens zwei Aus prägungeu a nnehmen können. Sind den Ausprägungen bereits Zahlen zugeordnet worden, otwa I fiir ,,stark!'s",:2 für ,Ju iu lpn's" und 3 fiir ,;,eh wadws" politisehe, Interesse (siehe Ka pitel S]. dann werden diese a uch Werte genannt .
2.1 Datenerhebung Eint, de r wichtigsten Em schcidungcu. die bei de r Pl a nun g einer Unu-rsuchung getroffen werden Il1U SS, betrifft die Frage, uier die Z11 analysierenden Da ten erhebt. Man unt erscheidet z\\'is<:hl'll:
16
• Pri märanalyse • Sekundäranalyse Im ersten Fa ll werden die bcnötlg ten Da (I'1I selbst erhoben lind von demjenigcn . der die Da ten erhoben ha t . auch IIJ('Ist ausgewertet - deshalb Psi m ärarwlysc. Im zweiten Fall werte-t ma n von a nderen e rhobene und in der
Regel Ilf'ff'i ls ausgewertete Daten ein weiteres Mal au s - deshal b Sebmdiirrm aly<~e. ßpi der SrklllHläran alysf' köuuen die Oa l ('11 ursprünglh-h zu eine m \"ii ll ig an deren ZWN:k e rhoben worden sein. \rk ht ig ist nur. dass sie dem Untersuchungszweck der er neuten .-\nal ySl' dienlic h si nd . Eine Prim ärer hebung bietet den eutschr-ldenden Vort eil. dass gcnuu die ~ I('rkmalsallsprägllng('n erhoben 1\"1'1"(\('11 könne n , die benötigt werden. 0 1' 1" Xaclucilbesteht dari n. da ss dies m it hohen (ma nchma l zu hohen] Kost en verbunden se tn kann . ß pi Sekuudäraualvsen s tehen milgli("hl'rwl'i~l' nich t alle gpwünschll' ll lnformarionen zur \ 'prfiigllllg - dafiir hat man nur sehr geringe (oft sogar ga r keine] !\OSI Pll zu tragen. Besonders gros ist (I('!" Preis unterschied zwisc hen Primär- und Sekundär a nal ysen lw i Umfra gen. Allein d ir' in einer mü ndlichen Um frage anfa llen den Kos ten zu!" Beza hlung der Interviewer bzw. Por to kosten zur Versendung der Fragebögen können erheblich sein. So ha t 199G eine ra. ciustündige bevölkerungsweite Befrnguug m it dem vom Zentrum für Umfragen . Met hoden und Analysen (ZU:\L\)I in Mannheim und de r Oes ellschaft für Markering-. Kommunikations- und Sozlalforsr-hung milli (G F ;>' [-G ET AS. IU'IIII': lP SOS) in Harnburg gPlllt'illsa m durchgeführten S 0 7.1ALW!SSE:-.'SCHAFTE:-; ßUS ca. 400.000.- D:\[ W'kost t'l. :2 Dte Kosten einer Sekundära nal yse eines vergleichban-n Dat ensat zes. nämlich des von uns auch in diesem Lehrbuch imme-r wieder verwendeten ALLBL'S 1[J9 -1, beliefen sich da gegen nur a uf 17j,- D~ I [inklusive Codebuch]. F ür St udierende Ix-laufen sich die Kosten für eine AI.LßUS-Cmfra ge aktuell au f maxi mal Zj Euro
(Daten auf CD).
In Denrsehlanrl werden Sekund ärdaten
\'011 dpr Abteilung Dan-narchiv und Da tenana lyse der GESIS (Früh er: Zonrralarchlv für empirische Soaialforschung. ZA ) in Köln arc hiviert und gegen Ent gelt für Sekundäranalysen bereitgestellt . Der Dat c nbc.~t a fldskatalog list et mehrere ta usend
I Heut e: ('proH'r for Survov l)" sigll a nti ~ l ell ll}t l{)l"KY ( CS [) ~ I) der GES !S. 2 Der Su~ i:o l wisS('llsdm rl t'lIB u, wurde zwi"'!wlI 1985 um! 1998 ('im""l jährlit-IJ uurchgeführt.
17
für die wissenschaftliche Öffent lichkeit verfügbare Studien a uf. Ein!' R".. eherehe im Da tenbestandskatalog ist übor dio l nrern ets eirc der GESIS (ht t p; / / www. ge s i s. or g/di ens t l e i st ungen/ dat en/) möglich. Ülwr die GESIS können für WIS.-;('lIs("haftlid lf' ZWI'("kt> unter anderem die Daten des AU .nUS. des Politbaronu-ter und St udien 111 Bundes- und Landt agswahlen l.ovogon worden. Das Angebot ist nicht a uf deutsche St udien 1)('schränkt . Es umfasst 1l11("h tntern attonnlc Erhebungen wie den ISSP (Intemat ional Soda! Survey Programme). die E UfO ] H' 1l11 Valu f;';; St ud v oder das Euroba rometer. Sek undä rdat en sind auch bei a nderen Insti t ut ionell erhältlirh. Dip Statist isdlt'1l Landesämte r lind das Statistisd lf' Buudesa uu in \ \'i psbal]1'1l sind eine wichtige Quelk- für Sekundärdaten . Dort kann mall u. a . , r ahIund Volks aäh lungsda tr-n a uf unt erschiedlichen regionalen ElwllPIl (z. 13. für Verwal tun gseinheiten wie C cmoindcn und Kreiso. a ber a uch fiir Landtugswahlkreise IISW. ) in maschinenlosbarer Form erbalten. Vom Deu tsehen Instit ut für Wir tschaftsforschun g (DHr) in Betliu wird das Soxioökonomische Panel (SO EP ) a ufbereiter und eben falls für wisseusrhaftliehe 7.w('cke zur Verfügung gest ellt . Das Sovio- ökouomisrhe Panel beinhaltet unt er a nderem de tailliert e Indik a toren zur berufllcln-n und Einkornmcnssituation eh-r Befragten und is t daher eine wichti ge Da tenquelle zur .-\nal yst, sozia lpr Unglelchheit , Ein wicht iger Da teu gpllt'f ist auch das Forschungsdatenaentmm ( FDZ ) der Bundesagentur für Arbott im Inst it ut für Arbeits markt- und Ber nfssfc rschung (I.-\ß ) in Xürn bcrg. Das I.-\ ß stotlt Dat en zur Verfüg ung, die a us den Meldungen der Arbei tgeher a n die Sozialvcrsichorungsrräge r sta mmen. Solche für Verwa ltungszwecke erhobenen Daten nennt man a uch prozesspredusierte Date n . Da neben erhebt (las JAß auch selbst Dat en. wie das 13t't l"iehspa url. Die Da ten des 1:\13 eTmiiglieht'1l detaillierte .-\nal yst'll dvr Erwerbsbiogra phie von Personen .
2.2 Ebene der Untersuchungseinheit i\;J.t"h (II'T Ebene a uf der dip Dat en er hoben werrleu, wird häutig unt ersohleden zwischen :
• Individualda ten • Aggrega tdaten
18
I n dl vld u aldateu heinhalten Informat ionen über Perso nen bzw. indivl-
duolle Xlerk malo. ßrlspielr wären die ' Yah la bsitht oder das :\1IPI" von Personell . A ggreg atd a t e n heinhalten Informa t ionen Iiher G rllP PPIl bzw. Kollek ti ve, die a us der Zusammenfass ung (Aggregation) HJII Messwr-r teu rler Mitglieder dieser Kollektive ]IPru IIPl\ . 7 . dur ch Summenbildung. Prozentuierung oder «lne andere Rechenopera non. Boi Aggrogatrla ten handelt PS s ieh immer Ulll ,.abgp]eil r l r Da ten- [ Pappi 1977,81 ). Aggrega td a ten werden also nicht 1In den Kollek tiven selbst gewonnen. sondern an den Mitgliedern dieser Kollekt ive. Die Mitglieder der Kollek t ive können. müsson e her keine IIHli\"jf!UPIl sein. Die Stimmenanteile von Pa rteien oder (las Durr-hsr-lmi ttsalter der Bundesrleutsr-hen sind Aggrf'ga t llatf'll . dip aus rlen Individualda ten \Yahla bsieht. un d Alter geb ildet wurden. Da ten. die 'Üllm/ich aggregiert wur-len ('I. B. auf der Ebene von Gr'lllf'indl'n, \ Ya hlkrr iSl'll oder Staaten} . »onnt man auch ökolotli.~ch c Daten. l ndivldnaldate n stnmmon zumeist aus Umfragen, Aggrega tdate n worden hä ufig von der am tllchcn Stat istik bereitgestellt .
n.
Oeb-gen rlich werden a uch solche Dat en \'011 Kollekt iven als Aggreg atdaten bezeir-h net . clif' nicht auf Aggregation beru hen, wie v, ein Index zur :-' If's:'; llng von Bürgerrechten in Staaten [vgl. wtdmaier 1997, 10.\). Xach der Klassifikation \'011 Laxarsfeldund :-' Iellzl'l (1972, 228f.) ha ndelt PS skh hierbei lIlll ein globales Merkmal (!Jlolm/propcrly ) d l'S Kollekti vs. Ein anderes ß pispipl für ein globales Merkmal wii rl' das Rpgir rn ngs.-;ystf'In eines Staates. Globalo Mer kma le \\ '(' r ;]('11 direkt am Kollek t iv gemess en und besitzen nach der Vorstellung HlI\ Lasa rsfeld und :-' [ellz('1 (19, 2) kelne Ent sprech un g a uf der E1Jl'IH' der :\Iitglil'(k r des Koll ekt ivs. Aggregierte und globale xter km alc sin d eine Untergruppe der Kollektivmerkmale (vgl. dazu Pa ppi 19,7. S. 8Uf.).
n.
ü b Individualdaten fH11'r Da l PII für Kollektive erhoben werden. lu-stimmt sich aus der Fors chungs fra ge. Geht P S 11m ~ Ioti\"e der \Ya hlt'lltsd wi;]ung. so werden skh die Hypot hes en mög!i('hen l"t'isp au f Eigenschaft en (·iuZI'Iner \Yäh lpr wie deren Ka nzl erpräferen z ode r Pa rteildentif ikat ion richten. \\'(' 1111 alle int crcs sivrcndcn Xlerk male auf der Individualebene an gesiedel t sind . handelt ('S sirh um eine I ndividualhypot hese. Anders verhält ('S sieh dagegen. wenn eine Hypothese übe r 111' 11 Ein fluss des Ka th olikena nteils au f den Stimmenantei l der Chr istdemok ra ten in \\'a hlkncb t'1l formuliert wird (vgl. Ka pitel 8 ), Hier bezieht s irh d ip JlYPol ht'SI' au f Kollekt ive. Dips ist lnsbes oudero in der Vergleichenden Poli ti kwie...enschaft und der lnrerua tionalcn Polit ik (vgl. \\'idmait'r l!.l97) häufi g der Fal l. So beinhaltet lx-isplels-
weise da s viel dis kut iert e Theorem vom .Dcmokra tis chcn Frieden", da ss demok ra tische Staaten keim ' Kriege gcgcueinander führen {vgl. Teusch un d Kahl :WOl: Cha n 1997), Na türlich können sieh ll yp ofhf'SI'n a uch auf Kollekt.ive und Individuen boztehen. Etwa da nn, wenn die Thes e beinhal te t , dass d ie S timma bga be zug unsr en der C OU bei Kat holik e n mit zunehmendem Ka t holikenant eil in der Ge meinde s teig t. Od er wen n beh aupt et wird . dass Vorur teile nicht nu r von l ndivid ualmerkrualen wie Bild ung usw.. SO Jl(lern a uch de r Grük der Minderheit in l'i1WIIl Uebiet a b hängen. Es ha ndelt sich hier 11m :\11'hrl'hl' lJeu hy pot lll'sl'Il, wei] rlie Kollek tivmerkurale (Kat holikenant ell. G rüt:,1' de r Minderhei t ] lind individuelle Merk mal e (Konfl'ssion , Bild ung } als relevant zur Erkläru ng des Verhaltens [St tmma bga be] bzw. der Ein stellungen (Vorur teile] a ngesehen werden. Mehn-beuenunalySI '1I (vgl. Dit ton 1998: Snljders und ß osker 1999) erla uben d ir simultane An alysl' von Da ten a uf verschi edeneu Ebenen. Xlch rebcncnanalvson setze n veraus. dass hi nreic hend viele Ind ividu ell lind Kollektive un ters ucht werden. Nach Snijders und Bcskcr (1999, 1..\0. 150) soll te n a uf jeder EI)('ne mindestens :.10 Einlu-iren IIIl1l'fSIlChl \I"l'nlell. Bei Analysen in de nen Staat en (lil' Kollektive s ind, iSI d ips l' Bedingung für die Ebl'lll' de r Staaten hä ufig nich t erfüllt . Zudem muss sichergestellt sein, dass auch d ip Kotlektivmerkmale genügen d Vari anz au fweisen. So sollte sieh beis pielsweise de r Katholikenan teil in (INI nur ersuchten Kollek tiveuunterschelden. Aggrega tdaten könn en a uf eiuom untcrschiedllchcn A9yreglllioll$llivrau vorliegen: ß undcsr agswahlergcbnis«- beispielsweise a uf Ebene der Bundes tagswählkreise. auf Ebene der Bundesländer oder a uf Bundeebene. Von den St ut istis chcu Ar mern werden z. n. die urs pr üng lich als Individualdate n \'l)rl il>gelu!l't1 Volksvählungsdaten (Gl>:;('hll'thl . Hpligiollszilgehiirigkeit. ß l'ru fszuge hörigkl'it, Sehnlabschluss US \ \·,) au f verschie douon Ebe nen (C emetnden , Kr etso usw .) aggrl'giprt lind auch nu r in nggregicrter Form weite rgegeben. Au s na heliegenden Gründen werden a uch Wahldaten nur als Aggrega td a ten zur Verfügun g gestellt. :\Iit der Aggr ega tion is t ein Informut ions verlus t verbunden. Bezogen au f das Volkszäh lun gslx-ispiel: die agg regicm-n Volkszä hlun gsd a ten geben lediglich Ausk unft über die Anza hl der ~ Iä n n er, der Fra uen. der Menschen mir einem bes timmu-n Schula bsr-hluss usw. in eine m hestlnunten Gehil'l . \\'je vipll' Frauen und wie viele ~ Iii llll('r welchen Schulabschluss haln-n, lässt sich den agg regicrten Volkszählungsd at e n nicht mehr ent nehnu-n. Aus de n aggregterton Volk szähluugsdat en lassen sich die urspr ünglichen Individualda ten nicht mehr herstellen. eine Disaggrega tion der Da ten ist nicht möglich.
20
\\'i" da s Belsph-l der Volkszä hlu ngsda t t'1I zl'lgI, welche nur a ls Agg rega trla te u :l.Ilgä ngt ieh gemacht werden. kann ma n sieh nicht lmmor aussuchen , ob man mi t Individual- oder Aggrega tdaten a rbei tet. So ist die hist orische wahlfoochung weit gehend auf die Analvse von Agg rega tda ten a ugewieSI' II . da bis in d ip GOn Jahre des :W. J ahrhunderts Umfragedaten sphr rar sind . Fiir Anal ysen der \\'ah ll'll rlos Deutschon Reichs greift man a uf die Volkszähl ungs- und \\'a hlda l l'll z ur ück. die in dor Slati.~tik des Deutschen R ei chs ver öffentlicht wurden {vgl. exemplarisch \ r inkl.,!" 19U:i : Fa lt er 199 1). Es kan n a lso passiere n. dass man Aussa gen übe r Ind ivid uell t reffen möchte. ta tsik hlieh a ber Hili" Aggrega tdat en 7111" Verfügung stehen.
Ökolog ische r Fehlschluss In rllesem Zusammenhang mus s man darauf ach ten. keinen Fehl.·;chlliss zu IWgl' lw ll, Fchlschliisse entstehen im me r dann, wenn A u.~.~ ag t'd 1thc it un d U1l1cl'sllchungseinheit fl uf unt erschiedlichen Ebt'nen fl ny e,~ it'ddt sind . Schhcst ma n von Beziehungen a uf der Aggregatebene auf Boziehungeu der Individualebene [allgemein: ein er niedrigeren Ebene} . hpgt'hl man einen iikologi.~cJU'11 Feh/.~ chlu.~.~ . Schliest man im umgekehr te n Fa ll von ßI'zit'hangen auf ( 1(' 1' Individualebe ne a uf Beziehungen der Aggr ega tebeue, lipgt ein individualisti scher Fehlschluss vor . Für tlif' Sozia hvisst'IlSchaftf'n ist \'01' allem de r ökolo gis che Fe h ls chlu ss (vgl . Rohinso n 19;j()) von Bedeut ung . da die Da ten hiiufig in st ärkor a ggrogierter Form vorliegen. a ls ma n sio für d ip heabsichtigten Aussagen bräuehr e. So schlossen einige Histor iker (vgl . dto Lit r-ra tu r hinwr-ise bei Fa lt er et a l. 1983, i:i28) a us dem bei den Reichstagswahlen zwische n 193U und 19;32 zeit gleich erfolg ten Ans tieg der Arbeitslos igkeit und den Wah lerfolgen rler :'\SO AP a uf Reichsebene. da ss A1'1H'itslos t' iiht>rp rolltll't itHla l hä ufig für tlif' ;';SD .\ P ges tim rnt hä t ten. Au fgrund von Zusammenh äng en a uf der Reichs eb ene (Za hl der Arbcitslos en und ;';S DAP-S timllll' n) W U H II' II Aussagen über Zusammen hä nge auf de r individuellen Ebene (Arlwits losigke it ulld :'\SOA P -Sti llllll a bga be) getr offen. Dieser Schluss ist jedoch nirht Zl\ l ä.~sig und kan n s ieh a uch inha ltlich a ls falsch erweisen. nä mli ch dan n, wenn Arbeitslose nich t überpropertinna l häufig für die :\,SOAP gest immt haben ("gI. auch Frev und \Yt>t:k 1981, (i lind 2i:i ), Au f dE'1' l ndivlduale bene lässt sk h tipI' Zusammenhang nicht mehr nu rersuchen. Allerdings kann man den Zusammenbang a uf e inem II icd rigorcn Aggrega tionsni veau prii fen. So ste11ten Fa lte r 1'1 111. (1983)
21
fest . dass die :\SDAP in Krci$C1I mit ei nem hohen Anteil erwerbsloser Angestellter und Arbei ter durchschnit tlich keine höhe ren Stimmcnauwi11' l:'rzipltf'. Im G l'gp1Jt f'il: 111 K reis en mit einem hohen Erwerbslosenanu-ll schnitt. diE' i\SDA P durchschnittlieh sogar schlechter ah (vgl. Fal te-r et al. 198."3. ::i32). Die ErgehnisSf' von Falter Pt al. sprechen gegen den auf Reichs lind Bezlr ksobe no (vgl. Frey und W{'l'k 198 1) festgest el lten positiven Einfluss de r Erwerbslosigkeit a uf den Sthnmonzuwachs der :\SDA P zwischen 19;30 und HI:3:1. da die Er klär ungskraft auf Krpisl'b l'IIP höh er ist als a uf rler Ebene der l1l'zirke hzw. des gesamt en Reiches. Dennoch kann mall alleh von EII'II wenigl'r stark aggrogt-rten Kreisdaten nicht einfach auf das Wahlvorhalten von Arbeitslosen schlteten. Zwa r ist das Problem des ökologtsehen Fehlschlu sse, nic ht lös bar : ps sind jedoch statistische Verfuhren entwickelt worden (öko logische l n/ercnz ). mit deren Hilfe Zusammenhäng- dE'1" individuellen Ebene ,geschlitzt werEII'II können. ~ Ii t einer iJko!oyiHchert RC9re<~8 ion zeigt Fal ter (199 1). dass die Stnnmeuanteile für die XSDA P bei Arbeirstosen unterdurchschnittlich waren. Arheirslose schelnen in de utlich stärkerem Umfa ng für die KPD als die ;\,SDA P ges timmt ZII haben [vgl . Abbildung 2.1 ). Zumindest direkt scheint die ;\,SDAP nicht von de r Xlassenarbeitslcsigkeit profitiert zu ha ben. Dip neue ren Verfah ren (vgl. King 1997) kombinieren die \"IJIl Falter verwendete Methode der ökologtsehen Regression mit der ~ Ip lholll' der Grellzen (method 0/ bOIJ7Id.~ ) lind treffen weniger restriktive Ann ahmen zur Schätzung der Anteile {vgl. einführend Gschwcnd l UU;j ). O hne Hinzuzi eh ung solcher Verfa hren sollten die Aussagen e iner Untersuchu ng sich immer a uf Ilie Ebene der Untcrsuclmugs-mhcit {Analysoebene beziehen. nie auf eine alldf'H' Ebene. An ei 1I('1ll weit eren gern verwendet eil BI'ispi el (vg l. Biirk 1i tl und Kh-i1I 1998. 3::i L) lässt sieh d te Problema ti k des iikologis("hpn Fehlschlusses besonders gut vordeutlichcn: Bei Bundesragswahlen hes teht auf Wahlkreisebene ein positiver Zusammenhang zwis chen dem Anteil III'r A usländer und d ('111 Stimmenanteil der GRÜr\EK. Den noch würde niema nd a us diesem Ergf'bnis folgern , dass Auslauder in hohem Umfang dle G RÜr\ EX wähl en , da Ausl änder auf ßllndl'Splll'IlP kein Wa hlrecht besit ze n. Dip AIls.sagl' .~J e höhor der Ausländeranteil in einem Wahl kreis. II111S0 1I1'S.<;I'f schneiden die G RÜr\ E:\ ab- iSI richtig: dip Aussag!' . ~\lIsländl'f wählen ülx-r proporuoual häufig die G RÜ:\E:\" dagegen offenk und ig falsch.
22
Abbildung 2. 1: SI tnunen nntetlo der ;';SDA P un d der h:P D Iwi Arllt'its loSt'1I und IH'i a llen wählern {Angaben i n P rozent ]
" "
"
•
" "
IQJlJ
" "
"
IQJJ I' PII
',D~P
[) M beo", _
lS ~ II . W "' I ..
Quelle: Falter l!.f9 L 311. 1932.1: Juli 1932, 1932N : November 1932
2.3 Untersuchungsanordnung Concrcll kann man zwischen zwei Gruppen gen unterscheiden:
H lI\
Unu-rsuchungsanordnun-
• Experimente
• Ex-pos t-Iacto-Anordnungeu In E xperim e nten werden die Br-diugungen der Unte rsuchu ng selbs t he rges tellt und unterliegen dami t der Kontrolle lind der Eiuflussualnue des Forschers ('· gl. Sarris 1999). Expvritue nu-lle Anordnungen sehen bei zwei GmpIH '1l so a us, (lass einer Gruppe eine Behandlun g zuteil wird ( R:rIJITi/1Ient flI.Qrllllpr ) , einor vwoiton Gruppe - die steh ansonsten von der ersten Gruppe nir-ht ll11tE' rsdwidrl - jedoch nicht ( Kontroll.lJ'"7IPpc ), \ \'ip die Beha ndlung (trea tlllefit oder Stilmdus) wirke kann nat-h dem Versuch an möglichen Unters chieden zwischen Experimental- und Kont rollgrupp- ab-
gplc'Sc'n \l"1'nlt'll. Der Stimulus ste llt clip una hhä ngigp Variable dar; di r \ '1\rtablo a lso, von der ein Einfluss auf da s lnt eresslorende ~krk m a l (d ip abhängige Var iuhln ] venuutot wird.
23
Ulltf ,'sucl.lIny"u,,,,nfn ully
Um die Unterschiede zwischen Experimen tal- und Kont rollgruppe a uszuscha lten. werden d ie ZUf Verfügung st ehenden P robanden nach einem Zufallsverfahren den GruPPf'll ZlIAf'wiesell: dipsf's Verfahren nennt ma n Iiando mis ierunq orh-r Zufallsauft eilung. Randomisiort e Gruppen d ürften sieh in der Verteilung ihre r Eigens cha ften. einmal abgese he n von Zufallsschwank ungen. nicht un terscheiden. Durr-h die Randornisir-rung wird slchergcs tcllt , dass mögheho Unte rschiode zwischen Kontroll- und Ex peri men talgruppe lIa rh dem Experimen t tat sächlich auf den Stimulus zurückzufilhren siurl lind nich t etwa aus der unte rschiedlichen Zusammensetzung der llt'idf'll Gruppen result ieren. Die UfS
1l.~,I,..,.:lI tlmK.
T:
RI RI
~:
t n ' atl lll'lIt ,
t , ta t, ü ü
T
ü ü
T
() ()
Vorhe r-:\'ach her-~ It'SSlillg Xac hh or- 1'1 lessu ng
H: Ra udm nlsil'rullK
Bisher wurde von randonnsterton Gruppen ausgegungr'n. Eine alt om aüve Strategie zur Ausschaltung von systematis chen Unte rschioden zwisrln-n Kon troll - und Experiment alg ruppe ist di e Paralh-lis ierung (m Il Iehing). Zwei Xlethoden werden unterschieden. B..i der Parallel isb-run g von G1'llPpen (ma trhed fl''O!W~ ) wird versucht, dieselbe Randver teilu ng bestim mt er Merkmale in beiden Gruppen he rzust ellen. r, ß. Geschlecht und Bildu ng. Die Gruppr-n ha ben dann einen gleichen Anteil an x länner n lind Frau-
24
en lind die gleiche Bild un gsst rukt ur . Bei der Pa rnllelisierung von Pa aren (m alchrd pairs ) wird versucht , dass in beiden Gruppen Pe rsone ll mi t 01'11 gleichen :\Jerkmalskomb irw tione71 - z. B. Bildung UJl(] Ceschleeht - vorn an den silu\. Einer Frau mit. Hochschul abschluss in c\1'1" Exper-iment algruppe
wird dan n eine Frau mit Hochschulabschluss in c\1'1" h':ontrollgruppf'
"11-
geordnet . Dir Merkmalskombinationr-n von Bildu ng lin d Gf'S('hll'fht sind dann in den GruPPCIl gleich. Matchill.Q-\ ·/'rfahn·tl sind de r Randomislerilli g im allgemeinen unterlegen. Es ist kaum möglich. die G ruppen narh mehr als zwei Xlerktualskombinatiunen zu ma tchen. Selbst WI:'I1I1 die Kombi nat ion von Ceschiecht lind Bildung in den Cruppen ident isch ist. Iwibt dies 11 ir-ht . (lass d ir G ru ppe n i Il ande ren fii r 1lie U nt er suchuugsfrage hedenrenden Merkmalen (Dritt varia blen} gleich sind . Dies ist der em seholdende \ 'ortl'i1 der 7.lIfal1sallfteilung. Exporinn-ntelle Desig ns finden sieh häufi g in der der Psychologie lind :-' h'dixi n, in let zterer vor allem zum Testr-n der wirksamkett neuer :-' It...tlkamente. Den Mit gliedern der Versuchsgruppe wird hier bei d as :-' ll'(likalllt'nt verabreicht , während die :-' lit glil'dl' r 111'1" Kont rollgruppe lediglich ein Plarebo erhalten. Von einem nlilUlve7..~1tdt spricht ma n. wenn di p P roba nden nich t WiSSI'Il , ob sir- zur Experimental- oder Kont rollgruppe gehören. Damit S1Jll verhindert werden . da ss die Vcrsuchsu-ilnchmer aufgrund ihres \\"iS.~I'IlS um den Erh alt oder Xk-ht-Erhalt de r Beha ndlu ng eine 1I1J1l'rschiedliche Reak tion zeigen. Doppelbiind vcrslIchc ltogen vor , wenn \\'p{lpr die P robanden noch der Versuchsleiter wissen, wer zur E xperimont al- bzw. KOlli rollgruppe gehört. Hier mit sollen unbewuss te ß ceinß ussuugen durch de n Versuchsleiter ausgeschaltet werden. S tellt ma n bei den ~ lit gliedern der Experimentalgruppe eine Verbesserung des C csuudhcit saus ta nds fest, bei den :-' lilglied f'l'lI lief KOlltroll gnlPPf' jedor-h nich t , so kann dips !Jl' i randomisienen G rn pP1'1l auf die '\"irkllllg d l's zuvor verabreichten :-'!I'c1ikaments zu rück geführt werden. Experimentelle Anordnungen zeichnen s ieh d urch die Randomisierung un d das kontrollierte Setzen der unabhängigen Variable HII S. Aufgrund von Randc misicrung und zeitlicher Abfolge von Stimulus (unabhängiger \'ariable] und Wirkung (a bhä ng ige Variable} ermöglichen Experimente die P rüfung kausaler Hypothesen. Dies ist der entscheidende \ 'or ll'il im \ '('1'gleic h zu 111'11 nac:hfolgl'llli diskutier ten Ex-pos t-facto-Andordnuugen. Ein Xachtell experlmentellor Unt ersuchungsformen besteht allerdings in der Schwierigkeit der Verallgemei nerung der Ergebnisse. d. h. der cxtrm en Validität. \ '01" allem des halb. weil bei Expetinn-nten meistens a ndere -
Ullte ,'sucl.lIny"u,,,,nfnully
2J
einfachere - Bedingungen hergestellt worden . a ls slo in der Roa llr är VOI"herrschen. Dips gi lt in besonderem Umfang fü r E xperiment e in küns tlichen Umgehungen ( [,ablJl,(,$Jlerim ertte) .
In den Sr)zialwissf'nsthaft f'1I sind experimentelle Unrerxnehungsancr dnungen mit ranr lomisierten Gruppen q uantitativ eher von untergeordneter Borleutuug [vgl. exe mplari-ch Usohwvnd und Hooghe 20(8). Sie scheinen abe r in dE'1I verga ngr'nen J ahrzehnr e n a n Bedeut ung g l'II"O IlIll'1I zu haben. wie eine Auswertung der Artikel der Arm-rican Polit ica l Science Review na ln'lvgt (vgl. Druckman 1'1 al. 20(6). Dip Dom ina nz nieln -experimentelh-r Unt ersuchungsa nordnungen Hegt da rin begrüudot , dass d er Stimulus häufig ulcht vom Forscher gt'Sl'lzl word en kann. Man denke z. B. an d iE' Fragf', ob Arbehslosigkelt po lit ische Apathie erzeugt. HiN lassen sie h keine G ruppen bilden , dere n :\l ilg!.if'(lt'r nach dem P rinzip der Zufa llsau fl t'ilun g Ar beit slosigkeit a usgesetzt werden (Experimenrnlgr upp e] «der nicht (Konrrollgr uppc). um a nschliebcnd poli tis ches Verhal ten zu nWS:SPII, (Es wäre ethisch auch nicht verm.tbar.] Methodenexperimente werden häufiger durchgeführt. So wurden im Allbus 2006 mit dem T hemenschwerpunk t .Einstellungen gegenüber et hnischen G ru p pen in Deut schla nd': bei der Erhebung von eini gen Ein stellungen gegenüber Auslaudom [vgl. Abbllrlung 3.2 , S. 49 ) dir- P riva t holt der fit 'Fragungssuuaüon variier t (vgl. \rasml'r ot a l.. 20(7) . Bot einem Tell der Befra gten wurden d ip Einstellungen vom Interviewer i n einer mündlichen Befra gu ng mit Computer er ho ben (ccmpun-r asslsted person al interview, CAP I), Ein a ndere r Teil der Befra gt en füllte d ie Antworten seIhs t a m Computer a us (cOlll \l1lfl' r asslst ed self interview, CASt). Dip Zntellung zur CAPI bzw. CASI-GfllPPt' erfolgte zufällig. Es ha nd elt sk I! a lso um ra udomisierte G ruppen . Da s Selbs tausfüllen ist IH'nigpr ,,iiffputl k h", weil di t- Einst r-llungen nich t dem ln tervicwor mi rgeteilt werden müsse n. Man kann daher erwarten . dass die CASI-ß.{raglell eine geri ngere Tendenz a ufweisen , ihre Antwor ten andem auszurichten. wa s sie für soz ial erwünscht halte n [vgl. Ka pitel .U ), Mit dem ALLßUS 2006 kann dies kontrolliert werden. weil eine Skala zur ;"IIOSSll11g slwialpr Erwüns elu hei t und die \ '0 11 den Befragten als stlZia l erwtlnsr-ht angpsp hpllf'n Posi tione n zu den vier Aussagen erhoben wur den . Die E x -post-fa cto-A nordnung ist d i(' in den Sozlalwlssonschafren a m häufi gs te n vorkommende Untersuch un gsanordnung. Da bei kan n E'S sich tt1 11 t-ine Befra g ung. eine Beobacht un g oder eine Inh a ltsa nal yse ha ndeln [siehe
26
Kapi tel .{). Die Untersuchungseinheit en - meist. sind PS Teilnehmer emor Befragung - worden erst im !'/achhinein (" e x post"}. n ämlich bei der Datenauueertunq. in Experimental- und Kontrollgruppe unterteilt. Unt ersucht ma ll mit einer Umfrage, ob Arbeitslosigkeit. die " 'a hl ext remer Pa rteie n IwgiinstigL so würde man die Stirhprube IH'i rler Answertung in Arbeitslose nnd Xieht-Arbpits losp a uftollen lind für I)('ide Gruppen (las Wahlverhalten {gemessen :1. . Tl durch die \\'a hb onnt agsfragt') ermit teln. Zeigt sieh . d ass Arbei ts lose in stärkerem Um fang cxu-eme Par teien wäh11'11 als X icht-A rbeirslosc, so hcijst di es al lerdings noch nicht , d ass Arb eitslosigkcit polit isch extremes \r ah lwrhalt l'll nerurs ucht, also ein ka usaler Zusammenhang vorliegt . \ram m'?
In Exp l'rinwlllel\ können heolmrh tl't e Unt ersehtode a u f die Illlabhäll gige \ 'ari a hll' (den St imulus) zurückgefüh rt worden . \1'piI I'S sieh um randomisione Gr uppr- n handel t und rlie una bh ä ngige Varlable der a bhä ngigen Varlublc zeitlirh vorgela gert ist . Ra nd om tslert e Gruppen untcrsrheidon sich bei Experimen ten in de r unabhä ngigen Varia ble (dem S t imu lus ) und möglieh erweise in der ab hä ngigen Variable (der Wirk ung]: sie unterscheiden sich jedoch nicht im Hinblick a uf ill llll'fI' ..d ritte" Yar lahlen. da die 7.uFallsaufteilung der Proban den eilw gleiche Verteilung d er Eigenschafte n in Experimental- und Kontroll grupp e sicherstellt. Da di e Gruppen sich nu r in de r una bhä ugigpn Variable (Stimulus) unt erscheideu. sd ll'id('ll ander e Fak to ren als Urs ache de r Unterschiede in der a hhä ltg igl'lI Variable ans . Experimente weisen daher eine hohe intcmc Validität a uf. Bei Ex- pos tfucto-Anordnungen ist da s anders. Dil' G ruppen sind nicht randomisiert , wesh alb a uch nicht mit Sicherheit ges ag t werden kan n. o b die Wi rkun g (\\'a hI extremer Par teien ] a uf d ie vertnu tot I ' Ursa rhe (A r be it »losig kci t ) zurückzuführen ist , oder oh sich d ie .Experitnetua lgr uppr" (Arbl'itslosp) in anderen :-' Il'rklllall'u (:I.. B. Schulbildung) \ '011 de r ,.hOllt rolJgfll pPP" (;'I:it:htA r lwit Hl osl~ ) unterscheidet , dh- ebenfalls einen Einfluss a uf die' d il' abhä ltgigt' Variable (wabl ex tremer Parteien] ausüben. Auch die zeitliche Rpiheufolge der Vanablon is t in Ex-post-Iacto-Anordnungen [z u Ausnahmen slr-ho A bs chni tt 2..1) häufi g unkl ar. ITIl Beis piel kann ma n d avon a usgehen, dass Arbeitslosigkeit möglicherweise das Wahlvorhalten bee influsst , während die um gekehr te \\'irkuu g:-rirhtllug llllpla llsilH:" 1 is t,
U"tcuuchunY,' lJnon/n u"y
27
Drittvaria blenkontrolle Wird bt'i einem Ex-pos t-farto- Design ein statistischer Zusammenhang ( Korrelation) vwisr-hen ZWf' i Merkmalen X und }' festgestellt. so muss deshal b kontrolliert worden . ob die Aus prägu ng H HI V ra tsächlich auf X zurückgeführt werde n kann ((I. h . •'in ka usale r Einftuss von X nalu-Iiegt ] oder ob alrcmatlvc Erklä rungen für }' exist ieren. Der Einfl uss ..d ritter(alt ernativer} Merkmale Z muss also geprüft werden. Für dieses Verfahrvn hat sich der Begriff Drit tfakto r- oder Dritt variablcnkont rollc eingehirrgert. illi t der Drittvariablenkontr olle soll als o verhinde rt werden , dass wir eine korrelati ve Beziehung (eine n statlstisr-hen Zusa mmen hang] für ein e kausal e Boziehuug ha lten. Dabol IllUSS man sich im klaren SPill, dass Kau sa lität in Ex-pos t-facto- Dosigns nicht empirisch ..bewiesen- werden kann . Allerdings kön nen die seitliche Abfolge der Variablen und die Kont roll.. von Dritt var iablen eine kausale Int erpreta tion eine , stat istischen Zusammenhangs nahelegen. Die Kontrolle von Drit tvaria ble n S('tlt voraus. dass lIypot lwsl'll ü1l!'f den Einfluss dr itter Merkmale vorhanden sin d und auch entsprechende Da u-u zu r Verfügung stehf'll. Letzu-res s tf'llt illsl11'SOI)( II')"l' bei Sekundärdatenanalysen ein P roblem da r. Es kann also nicht a usgeschlossen werden. dass releva nte Dritt variablen nicht kontrollie rt wurden. Allerdings können kausaleHypot hesen abgelehn t worden , etwa dann, wenn eine Korrola tion bei Kont rolle einer Drlt t varla blen versehwtndet (Srhrin korrelat ion ode r S rheink allsalität ). Technisch wird eine Drittvariablenkont rolle bei Xlerk m alen mit wenigen Auspriiguugeu ausgefüh rt , indem getrennt für j.'rle A usprägun g der Drittvariablen Z de r zusamuwnhaug zwis(·hell X uml ) ' ermittelt wird. Die A usp rägung der Drittvariablen wird dadu rch konstant gehalt en. In Tabelle 2.1 is t de r Zusammenhang zwischen de r Schulbildung X und einer geringfügigen neS(~h ii ft i gu n g Y (vgl. Bäcker 20( 7) wiodergegebeu. Formal höher Cebllderc si nrl prozent ual in geringerem UIII fang i n ~ Ii ni- I iI lid i-J obs tätig, wie man im oberen Teil der Tabelle sehen kan n. Der Unn-rschied beträgt .j Prozentpunkte. Spli ttet man die Tabelle nach (k m Oe-chlecht (Z ) auf, dann äntlpl"ll sich allerdings die Zusammenhänge. ßpi x tänneru (Zd iiht die Schulbildung (X) keinen Einfluss auf die Bl'srh äftigungsform (1' ) aus. Lediglich :3 % der Männer sind (unabhä ngig von der Schulblhlung] ger ingfügig erwerbst äti g. Bei Fra uen (Z2) sieh t das Bild ganz anders aus. Ein Viertel (!) der Frauen m it niedriger Sch ulbi ld ung (maximal Ha uptschulabschluss) sind geringfügig besch äftigt . während die ger ingfügige ß e.-
sehäftigllllg bei Frauen m it mit tl erer 11I)(1 höheror Bildung einen rleut hch geringeren Stellenwert einnimmt (12 % ) (a ber im mer noch vier Mal höher ist ab bei )'fii n nern) . Bei Männem gibt es dem nnrh keinen Zusammenhang zwischen X und Y, b.'i Frauen einen starken. Ta belle 2.1: Schulbildung u nd geringfügig- Bes-h äfti gu ng 2UO(l
X
Gesalllt
Y
r-.I illi· / Mid i-.Joh? nein ja
Befrag te
Zl
= Männer
Y
nein
ja Bl'fraglt'
22
= Fr aru-n
Y
nein
ja BdmgW
Schulbildung nil' dr ij!; miHd / llol"h 88 % 93 % 12 % 7% HJU ){, UI(J % 2.711(j uusz 97 % 3% 100% l.ij4 11 74 % 2ij % 100 % 1.132
97 % 3% 100 % 3.370 88 % 12 % 100 % 3.322
In dn-sem ß.>is pipl hande lt PS sieh UIlI eine 11It n nkt irm. clip immer dann vorlieg t , wenn sir-h ein Zusa m llw uhrg riii.f' (X) utn l rlen Leistungen (V) von Schülern, wie sie etwa mit rk-n PISA-Cutl'l'sudlll ngt'n erhoben werden. Oie Kiiqwrg rii k ist nicht ursärhlieh fiir d ie besseren Leist ungen. Vie lmeh r er klärt d as AItI'1" der Schüler (Drfttvariable Z ) sowo hl dere n Kiir peTg riii.t' als auch deren Leis t un gen {längere Sch ulbi ld ung ). Xach Kont ro ll!' de s A!t.,I"S müsst e der Zusammenhang zwischen der Kör p t'rgrüf,;' X un d den Leis t ungen ) ' verschwinden (Abbildung 2.3). ~ Ia n spr icht hier von einer S clieinsorrcuuiou (HI.'r b es-
ser von einer Seheinkau$alität. denn die Korrel ation zwischen X lind Y bes teht (ohne Kontrolle von Z ) ja tatsächlich. Ab bildung 1.:3: Scheinkausalit ät GröBe (X]
GröBe (Xl
Alter ( Z )
~Leist ung (Y)
Leistu ng (Y )
ohne Kontrolk-
"011
.>:
Z
mit Kontrolle
\'0 11
Z
ist a uch. das,'i X Z beeinfl usst lind Z wied erum V. X also einen indire kten Effekt a uf Y aus übt (X --- Z ....... V). Ein Beispiel ist der im sozi· alpsydlOlogisdlt'1I ~ lo,ll:'l1 des Wahlverha ltens postu lif'ftl:' Elnftuss der ab langfristig s tabil konzeptuallslerten Parteiidontifikat lon (P I) (vgl. Campbellet al. 1980). Dip Partoiidentiflkat ion dtent a ls Filter der Wahr nehmung de r Ka ndida ten (K) . Kandidaten der präferierten Par te i werde n posit iver wahrgenommen als Ka ndida te n andere r Pa rt efon. Dip Kandidat enpräferenz beeinflusst die Su mmabgabe (Wah l). Liegt eussehltejsltch ein mdtK ...... \rahl). dann verschwlndr-t auch hier der rek ter E ffek t vor (P I ursprüngliche Zusammenh an g zwischen der Par tr-iidomi fikation und der Wahb-nt-chcidung na ch Kont rolle der Kandidaten pr äferenz. "'ach dem sozialpsydlologisdll'll ~ 1()(!t'11 Ilht die Pan eiidenüfikation zudem eine n di rekt (' 11 Effekt auf die Wa hlt,ntsd wir!lIl1g aus (direkter lind indirekter Eff ekt ). Der Untersehh-d zwischen einem indirekten Etfek t und einer Scheinkurrelation läss t sich nur übr-r die zeitlichoA bfolge von .X und Z klären. Bei einer Schciuk orrelariou ist Z X un d }' kausal vorgelag ert, bei einem indirek ten Effekt ist Z uu r }' kausal vorgela gert. Von MuUikausalität ist die Red.., \\'('1111 sowoh l X ab a uch Zeinell eigenständigen Einfl uss auf die abhä ngige Variable Y ausübe n. Zwei zentrale Determ inan ten der Lohnhüll!' SilHI rlip sdl1llisdle/llf>f11l1iche Ausbildung un d d le Berufserfahrung. Schllr.slich kan n ein Zusammenhang erst bei Kom rolle oinor Dritt variablen auftauchen (,~cheinba re Nichtko rrelation, nicht abgobildet] . Die Kontrolle von Drit t variablen ist domnach auch sinnvoll. wenn keine Korrelat ton festgestellt wurde. Zur Kont rolle \ '011 Dritt variablen werde n in der Rl'ge1 TlIIII· tivanate Verfahren eillgr>sptz t. Xlultivariate Verfahren sind ; verelnfaeht ~liiglich
ausgedrückt - stat tsusche Met hoden zur Anal ysen von Zusammenhängen zwbdwil mehr a ls zwet Variablen. Indirekte Effekte lassen sich mi t Pfadmodellen quantifizieren (vgl. Reinec ke 2UIJ;:j). Einen Überblick übel" die st at istische Kontrolle \" 011 Dri ttvariableu bieten Agrost i und Finlay (20U8 , Kapit pl 10) und Bvnningha us (200j ).
Ahhil,lung 2.4: BpJit'hungell zwisdu,n drei Variablen
Scheinkausalität
Indirekt er Effekt
X-z ...... )·
"
X -
Direkter & indirekter Effekt
)'
7. /
Intera ktion
Mult ikausalität
Festst ellu ng der Kausalität existie rt in Ex-post-factoAn ord nungen ein wolter os Problem. Die G rüN> von ..Experi memal-" lind .Kontrollgruppe- kann nicht so gpziplt gesteuert worden , da im Gpgpnsatz zu Experimenten die G m pppuanf!pi!lIng erst bei der Datenauswertung erfolgt . Aus diesem Grunde kommt I' S in Ex-post-Iacto-Anordnungen vor. rias.<; Mcrkmalsa us prägu u gen. die untersucht werden sollen , zu selten auftreten. Eint' Unt e rs uchung (\1' 1" Wähln der Republi kaner mit dem Xeben der
ALLßUS \998 s,.hpitl'rt schlidlt dar a n. dass lediglich 5.'3 der .'3 .4.12 BI>Fragren eine Republi kane r-Wahlabsicht anga ben. Dieses P roblern kann al lerdings durch g riibpl"l' Stichprohen oder gpsehit htl'I.· Auswahlvorfahren (siehe Kapit el 9) gelöst werden.
Zf itdilll"lls iOfl
2.4 Zeitdim ension ll msk-htlich der Zeitdimension lassen sich FOl'sdullIgsdt'sigus danach unEf llt'I111 Ug zu ei nem Zei t punkt ( QIu:t·.~c1lr1 itldesi!Jll ) O( ler mehreren Zoupuu kten ( Liin!J$M:h n i t t de.~ i!J7I ) s ta rt findet (vgl. Bijlrveld und van der Kamp 1998), Zu den Längsschnit tdesigns zäh lt das Tren ddes i!J1I lind das Pe neldesiqn: t t'rsdll:'it lt'tl , 01)d le
• Que rsclmittdeslgu • Trenddesign • Paneldesign Bei einem Q u erschnittd esign erfolgt die Datenerhebu ng zu ein em ein zigl'1l Zeitpunkt bzw. in einem kurzen Zeit intervall. Mit Querschnittdaten sinrl die in Kapitel 2.:3 er wähn ten P robleme der Üht'f priifllng kausa ler Il ypothesen verbuudon. Ein Trenddesign lif'gt \'01' . wenn d ie$dbe71 M erkmale zu ve,..schiedenen Z eitpunkten a n unt erschiedlichen Stichprobe n gem essen werden. Ein e T rendstudie läss t sich damit ab Abfolge von meh reren Querschnitt st udien auffassen. Um einen Tr end fest stellen zu könn en . mÜSSl'1l die Suc hprob en repräscutnt lv für die gleiche Grundgesamt heir sein (vgl. Kapi tel 9). Bol den ALLßUS-Studien, den Polit baromet em der Fors chungsgruppe Wahlen. und den Eurobarometerumfragen handelt es sieh um T rends t udien (siehe da zu S.3 7), Ein Beispiel für eine T rendauswert ung cler Poli tbaromet erUmfragen de r Forsd lllugsgru ppe \rahlt'l\ ist in .-\bbil .l llllg 2.5 zu sehen. Angegeben ist dte Entwicklung de r Pa rteildentifikation zwischen Januar 1991 un d Xovembor 199.J getrennt für ost- und westdeutsehe ß ofra gte. Auf der z -Achse ist die Zeit abgetragen . a uf der y.Achse de r j,'wPiligE' Anteil der Befrag ten . die sich mi t einer P artei idenrifi viere n . D iE' Linienz üge sin d in den Monaten unu-rb nx-heu. in denen keine Politba romet er- Umfragen durchgeführt wurde n. Im Mai 199 } gaben mehr als 70 % der westdeu tsehen B,' fragl ell an. sich mit einer Partei zu ldentitizien-n . während dpl' Antei l ostdeutscher ß pfragtE'r mit Pa rteiidentifi katlon mit etwa s mehr a ls (10 % knapp 10 P rozentpun kte niedriger liegt. Bis November 1993 nimmt der Anteil der Befragten mit Parteiident ifika tion im Os ten und West en ab , UIIl dann bis Herbst 199-l wieder anzus te igen. Man sieht, da.<;s die Schwankungen des Anteils I!I'I' Personen mit Parteiident.ifiknnon im Os ten der Republik deu tlicher a usfalle n als im \ rl:'sh'1I,
Abbildu ng 2.5; Part eiident ifikation zwischen 1991 und 199.t
r-
-
-~
-
• -L • ~ ~ " " "
- ~.
... .. "" . .,"'"'".,"'
-
' _,_, ___ H
- - .~ , . _ - .- ,
- -+-_..
,. ->-----+---
~-.
.
, ~ ._, . -
~ ~ ~ - ~ ~ ~ ~ ~ -~ ~ ~~ - - _ . ~ ~ -
Q uplll'; G plll'ill14 uw l Winkk-r (19\.1 7). mOllatlkh
n ~ 1000
~ Ji t den Pelltbarometerdaten kan n nicht untersucht werd en . inwieweit m it der Fra ge zur Par teiident ifikation tutsächlich langfrist ig stabil!' Ihndungen a n eine Partei erfasst werden. wie t's das Konzep t vorsieht . Übn imlividlH'llf' Veränderungen der Parteiidentifikation im Zeitverlauf können keine Aussagen get roffen werden, da die monatJidlPII Utll f ragen a uf UI11 ersr-hiedliehen Stir-hprohen beruhen. Auf de r Basis von Trenddate n lassen sieh also Veränderungen im Aggregat (h ier \ rest bzw. Ost ) . die so gena nnt en N etio uerdnde ruuqen: feststellen. nicht aber Verän derungen lx-i einz elnen Untersuchungseinheiten ( R n tItOllCliimln'J1lgf'II, vgl. En gel und Reinecke 1!.l9.t , G).
Unter einem P a neld esign versteht man eine Erh ebu l1g rler.'wllwlI Aferkmni e zu l'erschiedenen Zeitpll1lklnl an dens elben Unl cr·.51lclllmyse inheilnl. Dip einzelnen BI{ ragungszf'ilpullk t" worden als \r "lIf'lI bezeichnet. In der Regel ha ndelt es sieh nur UIll wenige \reUel1. Eine A usnahme stellt das Soxlo-ökonomtschc Panel dar, (las bereits selt 198-1 einmal j ährlich d urchgefüh rt wird (vgl. zum Unters uchung sdes ign S.3i ).
33
Zf itdilll"lls iOfl
In Abbildu ng 2.G ist das Design einer Studio von Paul F , Lax a rsfeld. 0 ('1"na rd Bet elsou undHavel Ga1\II(,t zur US-auwrikanisdH' 1l P räsiden tscha fts wahl 1940 c1a rgl'st ell t.. d i(' in Erle-County. einem I\ Tt' js in Ohio. durchgeführt wurde (vgl. Lava rsfeld et al. 19G8). Für d ie Demokra ten tra t der Amtsinhaber Fra nkIin D. Roos evelt. an . der dip Wa hl gegen de n republlkanischen Herausforderer \\"ewll'U L. \ \"iIlkip für sich entscheiden konnt e. Im ~Ia i 19-10 wurden 3.000 Personen befragt. Von diesen Befra gten wurden ÜOO Personen fiir da s Ha upt panel (IIP) ausgewählt und zu sechs weiteren Zeltpunktenbefragt. Beim Haupt panel handelt es sic-h also um ein slolienwellig"s Panel. Zusä tzlich wurd en aus de r Gpsamt sti<:h probe dr ei wettere St ichproben ii GOO Personen gezogen [St ichproben A , 0 und C l. Dtese Pers one n wurden aus methodischen G r ünden - zur Kom rollo \'011 Paneleffekten - aub pr im ~ Iai noch zu JE' einem weiteren Zeitpunkt befrag t , die Teiln ehmer der Srichprobe A z, B. im Juli. Für Juli. August und Ok tober exixtieren somit Ergebnisse ein er Vergleichsst ichprobe.
der
Ab bild ung 2.G: Fors chun gsdesig n Choice''
:-- Iai
J uni
Untersuchung
Aug.
J uli
5 (']11.
.The
ou.
Pcopl e's
~O\..
Hauptpa nel. Il=GOO GesamtHP HP HP IIP IIP IIP 1H'fragung -,-"'-'-----::---''''---,---'' ' - - --'''----''-----'''-Komrollst ich p roben n -=300() -,--_-,-,--,------,-__
I
[
='~O() :o~Ot)
11
Il
I
__
C
==::..L 11= GOO
_
Vg1. Lasarsfeld r-t al. (1968 . 8 , 4)
In Tabelle '1 .'1 wmdt, das in der Xachwahlbefraguug (im XO\"l'llIlll'r) angegebene St immverhalten mit OE'r im Ok tober a ngi'g('ll1'IlE'1l Wa hla hsieht gekreuzt . (W if' man sieht. lagt'n die Republikaner in Erie-Countv vorne.] In der Summenspalte und Summenzolle lassen sieh die Ycränderunge u im Aggrega t , die Xeuovcrä ndcrun gcn . beobachten: Im Novem ber stimmteil \·0 11 all en -18:3 Personen -18 % (2:32) für die Republikaner. währ end dles im Ok tober -li % (229) bea bsicht igt ha t ten. Durr-h die Veränder un gen im Aggregat wird rlns Allsmab lies \\'alldl'ls a uf (11'r lndivlduellen Ebene nnt('[Schätzt ; \"I1l] den 483 P N SOI H' 1l stimmen 4 18 Persone n (215 + 144 + 59) geuau so , wie s ie ps im Oktober bt'ahskhtigt.' n; dles entspricht 8i %'. 13%
der Befragten änderten zwischen den beiden Zeitpunkten ihre P räferenz (vg l. Luxa rsfeld et 11 1. 19G8. xxi ii): diese individuellen Veränder un gen werden a uch t un lOI'er genannt. So gingen 10 Personen. die im Oktober die \ r ahl der Republika ner heabslchtlgu-n. nicht zur Wald. 11 PPThO !lP lI we-hselten d it' Pa rteipr äferenz. i von de n Demok ra ten zu de n Republika nern und .t umg ekehrt. ~ Ii t Panelda ten lassen steh als o sowohl die Veränderungen a uf der Aggregatebene [Xot tovorändorungen} als a uch die IndtvtduolII'n Veränderungen {ß ru tt ovcrän derun geu) untersuchen. Tabelle 2.2: Wah lahs ieht und Stimmabgabe in E rle-County h pi den P räsidentschaftswahlen in den USA. 19-10 St tmmabgabo Wa hlabsicht (Oktober] (I'\oH' m lll'r) RI'I). Dem. x.«. w. n . Sununo 2 15 t G 232 Republika ner 1GO Demokraten 0 12 144 Xlr-htwuh l 10 91 10 0 -18:3 Sum me 229 1Gi GG 22 Ih 'p. = Ikpuhilkam ·r.lklll. - Dcinokre tcn. N.w . - Nicht wahl. W. Il . = wl'i!> nicht Q ud lc: Laxa rsfeld et al. ( l!.ltig, S.xxiii)
,
,
'9
Von Pa nclaualvs-n s pricht 1IIau nur da nn, wenn die Ver änderungen elor ~ terkmalsa Ilsp riigll ngen von Unt prSll(:hlln~pi nheiten im Zelt verlauf IlPtracht et werden. ß priicksit htigt ma n lpd iglk h Aggtegatwrän.lentngen. da nn handelt ps s ieh um eine Trenda nalysea uf de r Basis von Pa neldaten. Wertet man wie in Ta belle 2. 1 lediglich E'im ' Wl'1 le r-inos Panels a us . da un ist I' S eine Quersch nittana lyse. Aufg ru nd der durch die untvrschiedllchen ~ [ I's,<;"l'itpl l nkt{' kla ren zeit liehen Abfolge der Varia blen eig nen sieh Pa uelanalysen Ilf's<,;t'r zur [Iberpriifuug ka usa ler zusammenhänge als Ex- postfar-ro- Designs...... uch hier ist PS jorlor-h notwendig. alter na ti ve Erklärungen d urch die Kont rolle von Drit tvaria blen auszusrhlieson. Pa nelstudien s ind mi t besonderen methodischen P roblemen kon fron t iert: der PanelmOlt ulitäl und Paneleffekten. Unter Pan el m o r tali tät wird die Tat sache verst anden, duss nich t alle Befra gt en der ersten Untersuchung a uch bei den folgenden Unt ersuchungen wieder befragt werden kÖnTWIL sei PS, wpj] s ie llI11 W' ZOgPll oder a us andere n Gründen nicht mehr erreichbar sind , die wiede rholte Teilnahme verweigern oder zwischenzeit lich verstörben sind . Auf diese Weise ver ringer t sieh <11'1' Bestand eines Pa nels s teti g.
Zfitdilll"llsiOfl
Üblicherweise kann ma ll davon a usgehen. dass de r Best und mi t jeder Folgeuutcrs uchung a bnim mt . wobei die zweite Unt ers uchu ng normalerweise die hüch s tl:'ll Best andsverlus te a ufweist . Dies kann d Teiln ehmer de r Kom rolls tichproben (vgl. La xa rsfeld et a l. HJG8, X\"). Den Designs entsprrx'hr-nd knnu mall zwischen (Jllersc!ln ittdaten , Zcitrciund Pouctaotcn unter scheiden. Eine IW S
ncnaaun
bis Will Eintritt r-iues Ereignisses. z. B. die Dauer bis zur Änderung der Parteiidentifikat ion oder di e Dauer bis zu r Aufnahme einer R,'schilft igUllg nach Arbeitslosigkeit . Verlaufsdaten werden daher auch als Ereiguisdaten bezeichnet. Aus den Daten des Soaio...ökonomischen Panels können Verlaufdaten generiert werden. Dir Dauer de r Pa rteildentiftkat lou. die im SO E P jährlk-h erfasst wird. bestimmt sieh aus dem Zeitrau m zwischen der erst maligen Angabe de r Ident ifikation mit einer bestim mt en Purn-i his zur eventuellen Aufgabe der Ident ifikation . Xoch exa ktere Angaben liefert das SO E P unte r anderem für dil' Erwerbsbiographie. DiE: Betragteu Füllen ein so genannt es Kalenda rium ans, indem fiir j"(I,,n Monat des de r Befragung vorangegangenen Kalenderj a hres rler Erwerbs sta t us rück wirkend erfasst wird. Dip Dauer der Arbeitslosigkeit kann d aher monatsgenau ermit telt werden. ?\ Iil einer Ereignis dat enanalyse (vgl. Blossfeld ('I al. 2007) der SO E P...Daten zeigen Schmitl...Bock et al. (200ü), dass die Pa rteiidentifika... tion zwischen W8-t lind 20U! nur lx-i eine m kleinen Te il der Wähler über die gesamte Periode stabil war.
Um Paneldate n od('r Ereignisdaten zu f'l" hl'lJl'n, IrIUSS ma n nicht zwangsläufig dloselben Personen mehrmals befragen. Auch mit einout Qupr.. schnittdeslgn kann man Panel... un d Ereignisdaten gewinnen: durch Fragen , die sich an f die Vergangenheit hezi..hell ( Rct m.~]Jcktit'f7YIyc1t bz w. Rccull.. Fmycn). Erheb t ma n Angaben zum aktuellen Wahlverhalten lind dem Wahlverhalten bei der vorangegangenen Wahl. dann hai man Paneldaten (siehe un ten ] erhoben. mit denen \red ISt'lwah ln- rhalten unt ersucht wer ... d('11 kann. Allerdings stellen ret rospek tive Fragen hohe Auspr üchc an die Erinnerungsfähigkeit lies Befragten. Diese wird umso besser sein. je ktlrzet- (lie Ereigl\is~E' zurikkliegE'1l und jE' wichtiger clil'se für den nl'frag tt'1l sind. Daten zur ßiograph i.. müss ten Ill'ispil'lswt'iSl' r..lat iv p räst'1l1 sein und daher auch ~ll\"t'r1ässig abgofrag t werden können. Einstellu ngen oder ~ [ t'i nungen könn en mit Retrospekti vfragen ka um zuverlässig erfusst werden. Zude m best eh t d ie Gefahr. dass Befragt e Widersprüche zwischen vt-rgnn... genen und gegenwä rtigen Einstellungen aufzulösen versuchen. in dem sie vvrgangene Einstellungen den aktuellen .anpasscu'', Auch I)pi Angaben zum \Yahh w halt ('11 bei einer früheren \\"ah l st ellt sieh also die Frage, ob dit'st' korrekt sind [vgl. Sr-hoen 2000).
Forschung sdesigns einig er sozialwissenschaftlicher Erhebungen AllBUS Die A llgem ein e
ße viilk e11171!J,~ u mf7'(Jg e der Sozi alwis,~ (:I/.~clwJt w - ALLß US - wird \ '011 der GESIS, Arbeirsboreir-h Da uerbeobachtun g (frühe r: Zent rum für Umfragen . Methoden und A nalysen, ZU:\ IA). seit 1980 d ur chgeführt. In zweijä hrigf'n Abstä nde n werden ca . 3.000 Oefrag\{' zu sozial wissensc ha ftlich int eressa nten T heme n befragt . Es handelt sk-h hh-r um eine QUPfsdlllit t bl'fragung. die sich fiir Trendstu die n eig uet , da ein Teil der FragrlJ he relts me hrmals erhoben wurde. Ein e Aus nahme vom Befragun gsrhythmus btldoto die 1991t'rhoIx-no Al.Llf Uß-Basisum frnge, wo erstmals Personen in Ost de utschla nd mit in dte ßrfragung aufgen ommen wurden (vgl. Alba et a l. :!O()(): Braun und Xloh lcr 19!J8. 1994). Eurobaromet er Das Eur oba rom et er ist ein e im Auftrag der Kommi ssion der Eur opäischen Union seit 1!Ji4 zweim al j ährl ich du rchgeführte ß p[ragun g in den Lä ndern de r Enropäisr-hen Union. Ehensu wir heim Politbaromet er UIl(1 dem ALL OUS handelt ('S sk-h hier um Q uersehntr tbefragungen. die für Trendstudien verwendet II'l'r(II>1I können. Das Eurobarometer eigne t sirh se hr gut für vergleichende Analysen. da in jedem Land mit \\'l'itgpllI'nd demselben Fragph ogf>l\ gl'a rhl'it t'l wird . :\Iit Ausnahm e Luxemburgs werden in jedem Land ca . l. ()OIl Personen befragt . Politbar ometer Das Polit ba romr-ter wird im Auft ra g rIes ZDF seit 1977 von der F O[{SCIIU:"GSGIlIJ I'P E \YA IU. F.:" in Mannlu-im durchge fü h rt . Es handelt sich IIlll eine monatliche Qu-rschnittbefragung \ '011 rn . 1.2;)0 Personen. Einz elne Ergebnisse werden einmal im ~ l ollat im ZDF verbret te t und sind über Inrernot a brufba r. Dip e rhobenen DaH'1l werde n a n das Zcnt m larcluu Jür emp iri sche S ozialJof'llch ung (ZA) in Kühl weit ergegeben, \\"0 sie a ufbereitet und für wissensc haftflehe Zwecke zur Verfügun g gestellt werden . \\",'gf'll d es inuner gleichen Desig ns und der Verwendung derselben Fragen eig net sieh das PoIitba rometcr a usge zeichnet fiir Trendst udien. SOEP DHS Soxio-ö konomischc Panel (SOEP) ist d ie umfa ng reichst e PHm-lst udic in der Bundesrepublik. Es handelt sich umeine Ha ushaltssüchprobe, lw i de r all e :\Iit glil>dl'r eines Ha ushal t es bpfragt werden, d ie im Befragungsjah r mindes tens 17 J ah re alt sind oder werden. OI>ginTlt>IHI 1984, wurden ra. 12.000 Pers enon a us G.OOO Ha ushal tcn (Stichprobe A .Dcu tschc'' und B ..Auslä nde r") einmal jäh rlich
befragt , seit 1990 auch in Os rdout schland {St ich probe C). Ei]]1' Wl 'seurlichcr \ 'erteil des SOEP ist die grobe Ausländerstichprobe (St ichprobe ß ). d ie detaillierte Analysen ermöglicht , und lHe Erfassu ng der neueren Formen von Zuwanderung (St ichp roben 0 1/ 0 2). lna wtsehen wurde das SO EP 11 m weitero Suchproben ergänz t [vgl. TaIwIle 2.3) . Dur r-h die Auffrischu ng des Panels wird d ie Pan elmortali t ät aufg efangen. Die Auffrischung dien t zudem zur Sichers tellung der .Rcp räscnta tivi r ät'' des Panel s. da d ie ursprünglichen St ichprobon zwar die Becölkemng im Jahre 19S4 repriisentieren. de r Veräude rung der Bevölkerungsst ruktur aber nicht Rech nung tragen. Tabelle 2.3: Suchprobenstruktur des Soaio..ökonomischen Panels Stichprobe A \ Vt'sld clllt
Start in 198 4 1984
4.528
C D1/ D2 E F G I1
Dstdoutsche Zuwanderer
1990
2.1 79
Erneur-ruugss th-h prubr-
1998 2000 2002 2006
!lllll)\'I\t iolisstid 'l' rolw Hocheinkommensstichprobe Auffrischung ssüchprobe
199.1/l!H};j
Jlau sl mlh'
1.393 522 IJ Hj 7 liJJ5 2
1.224 1.506
Im SO EP werden unt er anderem detaillierte Angaben zu r Domogrnphie der Befragten. zu deren sozia ler IIIllI ökonomischer Situ at ion im Haushal tskontext . zu deren Erwerbssituation und Einkonuncusverlaufen erhoben. ;\1'lwII einer Rt'illl' H ili Indikatoren. di e für sol iolog isd ll' und ükonomlsche Frages n-llnngon relevan t sind , t'nthä h da s SO EP einigt' or iginär politikwissenschaftliche Merk male, wie d ie berolts erwä hnt e Fra ge nach der Parteiidentlfikarion. ), [ i t der Dur chführung des SO EP ist eine Pro j ektgruppe am Deutschen Inst it ut für Wi rtschaftsforschung (DI\\") in Bcrlin lx-auft ragt [vgl. Hau efeld 1987; l l ulsken- Dexcw lind Frlck 2( 05).
Adressen der genannten Institutionen CSD M Center for Survev Design an d ~ Il, t h ()(l olog~' d er GESIS (früher: Zent rum für Um fragen. ~ "'t hodl' n und Anal ysen. Z U ~[:\ ) . ß 2,1 , GS159 ~ Ia ll n hf'i lll; Posl allsd lrift: Postfach 1'12155. G8U72 Ma nnheim :
Zfitdilll"llsiOfl
3D
TI'I.: 062 1/ 12.16-0. Fax: · 100. lntemet : htt p: / /www . ges is . or g/ di ens t l e i s t u ngen/ met hoden/ DIW Ol'utsdll's Inst it ut für \\"irtschaftsfonichullg: Köni gin-Luise- St r. 5. 1.1 19·) Berlin: TI'I.: 030/ 89789-0, Fax: 0:.lO/ 89789- 201l. lntemet : http: / /www .diw -berlin .de/ FD Z Inst it ut fiir Arbei tsmarkt- und Ber ufsforschun g der Bundes agentur fiir Arbeit - Forschun gsda ten zent rum -. Regensbu rgor S u-, 10-1 , 9ll.1 78 Niiml x-rg: TI'1.: 0911 / 179-1752. Fax: ll9 11j I79- 1/ 28. lnt eruet : http: / /www .fdz..iab.de / FGW Forsdlllngsgrnp pt' \\"ah1l'1I: X 7, 13-15. 68 IG1 Ma nnheun : Postauschrlft: Postfadl 101121, G8011 Xlannh eim ; Tl'l.: llG2 1! 123:J-O. Fax: llG2I ! 1233-19!l. lntemot: http: / /www .ferschungsgruppe . de / GESI S , Abteilung Datenarchiv und Datenanalyse [ früher: Zen tralerrhiv für empirische Sozialforschuug]: Bachemur Str. -10, ;i09:31 Köln: Post unschrift: Post fach u os s o, 50869 Köln: TI'I.: Un 1! .1769.1-ll. Fa x: -.1-1. Inte rnet : ht t p: / /www. gesis . erg/ dienst le istungen/ daten / StBA Statisttsches Bundesam t : C usta v-Stresemann-R mg 11, G.) 180 \ \"iI'Sbade n: Tel.: OGll / 75-1, Fax: llü l1 ! 72-100ll. Inte rnet: ht t p: / /www. de st ati s . de /
Aufgaben zu Forschungsdesigns 1. Charakterisieren Sie den Un terschied zwischen Indi vidual- und Aggre-
ganlan-n! 2. Sie haben vom Sraristischen Bundes amt in \Yips bad pll dto Wahlergehnlsse der Bundes tagswahl UHU und die Arbeitslosenquote für die Bundestags wahlkreise erhalten. In Ihrer Untersuchung stellen Sie nun einen Zus ammenhang zwische n der Höhl' der Arbeit slosenquote un d dem Anteil de r St immen für dip Republikaner fest , \ypld ll'n Ff'hlschluss kiinrU'll Sip bel Analyse der Da ten IH'gl'llt'1I und warum? 3. \\"or in unterscheldr-n sich die behandelten Längsschniuanalyson un d welche Vor- hZII", Xacht" ile haben dies e? 4. Tm ALLBUS wurden die Einstellungen zur lnnerfarnillalen Arbeitsteilung seit 1982 unter anderem mi t der Aussage •. Es ist j Ü7' alle B etei ligten viel besser, we7m der Mann voll im B cm f slcbcii ~teh t 1171d die Fron zu Hnusc bleibt u7I11 si eh um den JTau~h alt U1J d die Kinder kümmert" erfasst , In der folgerIllen Tabelle sind d ie Ant eile der westrleursr-hen Befra gten. (Jie der Aussage zustimmt en (st im UlI' \"011 lind ga nz zll/ stinlllll' eher zu ) bzw. sie abl ehnten (Iehnr- ahjlehne \·011 und ga nz ab). wiede rgegeben.
stimme zn stimme nicht
1.1I
Anxah l der Ik fragt l'll
l !.ll>2 70 % 30 % lIMJ % 2.!l1O
I !.I!)2 56 % 44 % 100% 2.325
1nsu 51 %
2UOO 50 % 500/"
4!J % lUO %
100 %
2.326
2.42fi
2004 420/" 5M% 100 %
i.uao
BI'SI·h fei!wlJ Sie d ip inhalt liehe AIIs,<.;agf' der Tabelle. \\'ir haben sich d!e Einstellungen im Zeitverlauf geändert" Ha ndelt I'S sieh um Querschnitt- un d /od er IIlll Lä ngsschnittd a ten" Begründen Sie Ihn' Ant wort ! ;,J . ~ li t welchem Untersuchun gsd esign kann ma n kausale Zusammenhä nge feststellen" G, Zählen die Volkszählungsdaten zu den Individual- oder Aggr-getdat (' II·!
3 Messen 3.1 3.2 3.3 ;U
Messon lu dor empirischen Soaialforschung Skalenniveaus Skulicrungsvcrfahrcn G ütek riterien einer /lksl<\lug
41 43 47 Ii l
3.1 Messen in der e mpirischen Sozialforschung W ie wir in Kapitel 1 erläutert haben. plltsdwiop t üb er dir Aufrer-hterhaltung oder das Verwerfon einer Theorie oder ein er Hyp othese die Konfrontation mit der Rea litä t. Da s ~ 11'ss('n sp ielt d a her eine ( W(' II II Jücht sogar die) ventrale Roll e innerhalb de r empi rischen Sozialforschung. Bevor s0ziale Phänomene S P Ill {' HM'Tl werden können , sind jedoch eine Reihe von \'orüllPrlrgun gt'1l notwendig. Ausga ngspunk t emor Untersuchung sind Theorien un d die in ihnen enthaltenou Hypot hes en . Zunächst müssen die in den Theorien bzw. llvpot hescn en th altenen Begriffe präzise definiert s ein. Bevor a lso ein Bogri ff wir.R cchtscx m-m is mus' gemessen werden kann . muss geklärt werden, was darunter versr unden wird uJI(I welche DiIlWIlSioll{!'Il) der Begriff beinhaltet. AllSl·h lieN-llll llIUSS der Begri ff operationalisiert werden. Unte r OPf>ra ttonahsterung werden alle FOl"sdlllngs\"orgän gf' (,,0 perat innen"] vers tandon , die notwendig sind, um festzustellen. ..ob lind in welchem Ausruajs der m it dem Begriff bezeich net e Sachverhalt in der Realit ät vorliegt .. (Kromrey 2UOÜ, 189) . In Kapitel I wurden die CAS ~ IT :"- I\ I a:-;:,;i n ka t i on und die Zahlder Sc huljahr!' als miiglidll' U pcr ationalisie rungen VOll Bildung eingeführt . Bild ung könnte gena u so gilt übpr einen \riSst'llsfl'st erfasst werden. Die C:\Si\II:\'Skala erfasst schulische lind herufhche Zertifikat e, ein \r iSsPllSh'st tatsächlich vorhandene Kompet enz en im g('h'sf('fl'n Boreich. Solche Kompetenx messuugen 1\"('HlpII im Ra hnu-n der P ISA- UIIle l1illchullgPII Inzwischen n-gclmäkig bei Scbülerlnncn und Schülern durchgefüh rt. \\'t'ldw Operarionalisierung angeme ssen ist . hängt von der Fra gestellung der Unt ers uch ung
ab .
\ r RHwird nun in den Sozialwissensch aften unt er ,,.\ II'SSI' Il" vers tanden" \\'i r begnügen uns im Folgenden m it einer .weicherr (und nicht gR IlZ p räzisE'II) Begriffsbes timmung dE's Xlessens. ohne auf die axiomatische ~Jesstll('ori(' zurikbugrpifpll (vgl. Krom re v 2UU(;; Orth 1974). Beim ~ 11's.~t'lI w' ht f'S - wie Stevens (1946) definiert ha t - 11m dip Zu ordnung von Zahle n (oder Sy m bole n ) zu O b jek t e n nach b e stimm t en R egeln . ,,Xaeh lx-stimnucu Regeln': sollhelsen , dass d le Zuordnung so erfolgen muss, dass die Beziehn ngeu zwischen den Zahlen tlie Beziehungen z\\" isdlf'1l den Objek ten st ru kt urt reu witlnspil>gplll [ nicht umgekehrtl]. Die Rpziphuugl'll zwisr-ln-n den Objekt eu werde n Plllpir isdws Rel a tiv gl'nanu r, die Boziehun gen zwischen den Zahlen uumertsehos Rela tiv (Beztehungen = Relat ionen}. ZUIll ~ Jpss\"Orgall g gehö ren damit drei Kompouenteu: Das e m p ir ische R e lativ , das numer ische R e la t iv und eine A b b ild ungsvo rsch ri ft , (li!' eine korrek te (st ruk rurt rouc] Zuordnung der Zahlen zu den Eigenschaften von Objektr-n ermöglicht (vgl. AbbilduugS.t ]. Diese drei Komponenten bilden eine Skala .
Abbildung 3.1;
~ 1t'SSI'1I -
Schematische Darstellu ng
....
.....
....
IIaup1S\:hule
.....-.
Real schule
Hauptschule
3 ~
GYIlHlasiurn
..
. Numer isches Relativ
.
Empirisches Relativ
Obj ekt e haben in der [{(>gr l viele Eigenschaften. anhand derer sio in 11,ziehung gesetzt werden können . Bei Personen können die.'; z. B. das Cesehll'cht , die Bildung. das Einkom men . d ie Stä r kt> des Politikinteres ses oder die \rahla hHit"ht sein. \ \'ill lllan da s Geschlecht IIl l '.sSI' Il , so könn te die
Skulc"" il'mu.s
Abbildun gs vorschrift lauten: O rdne don Merkmalsausprägun gen m ännlich und weiblich die Zahl r-n 1 und 2 W. Die konkret e Zuor dnung ist beliebig: Männlich kann 1 sein und weiblich 2 oder um gekehrt . Die Zuordnung muss ahe r innerhalb einer Untersuchung konstant I'rfolgl'll. Ülwr eine Ordnung marht dif' ohigt' .-\hbildllngsm fSehrift keine Aussa ge. da im empirischen Relativ kerne Ordnung vorliegt . Die Abbildungsvorsr-h rift für das Politiklnteresse würde dagegen la ut en: Ordne da- Za hlen so zu, dass die Rangfolge in der S tärke des Politikinteresses erhalten blei bt , also br ispil'ls\\'l'ist' be i keinem Int eres se U, schwa chem Interesse I und s ta rkem Interesse 2. Hier ist eine Ordnun g not wendig. UII1 d ie Beziehungen im empirischen Relativ struktur trr-u abzubilden. Das ht:'iM : Die Abbildungsvorschrift ist vo n d e r A rt des M er km als im empirisch e n R el ativ a b h än gig und best im mt das :\lt'Ssniwall bzw. Shaienniueau.
3.2
Skalenniveaus
In Anlehnung an SteH'IIS {19..\G) werden in den Soz la lwissons ch a ft en vier Skalenuiveaus (auch: ), lessni vr-a u ) unt erselneden:
I . Xonunalskala 2. Ordlnalskala 3. Inter valls kala -I. Ra t ioskala
Au i'>/'nll 'lll ist rlif' n/' rik ksiehtigun g einer weiteren Skal a sinnvoll: 5. Abso lutskala
Das niedrigste Xlessniveau weist die Xominulskala a uf, das höchste die Absolutskala. D ie h öhe ren Ska le n b e sitzen d ie E igen scha ften alle r n iedrige r en Skale n . Xominal- lind Ordiu alskalen werden auch als qualita.tive oder nicht-metrische Skalen bezeichnet, lnt ervall- , Ra tio- IIl1d Absolutskalen als q1j/m ti t(ll i lle oder metrieche SIvlI/'II . I . Nom inalska la . Können die .-\lIspräg uIlW'1l \'(1Il :\lt'rkmah'll )t'{liglith im Hinblk-k a uf G le ichheit oder U n g le ich heit umerschtoden werden . dan n lieg t nominales Skalenniveau \"1)1". T ypische Boispiele hierfiir si nd da s Geschlech t. die Pa rteip räferen z. die Haarfarbe oder die Rt'ligionszll gf'lliirigkr·it. \relche Zahlen welcher Aus prä gung zug-erd111' t werden. ist beliebig. sola nge fiir jode Xlerkmalsausprägung eine
eigone Zahl verwendet wird. Ob xlän ner m it I un d Fr auen mi t 2 oder erstere mit 20 und let ztere mit l i bozok-hnr-t werden. ist vollkommen unerheblich . Allerdings da rf nu r dio Ungleichheit zwisrhen den Zahlen interpretiert werden. Dip Aussagt' Frauen seien , ~ lo PIll'lt ~o g ut" wie Männe r. weil Fr ane u mit 2 und ;"lällul'r .nur- mit 1 kodiert wurden, ist sinnlos. da die Zahlenzuordnung Ill'lil'big ist. 2. O rd inalskala : \ 'OTI ordinalem Skalenniveau s pricht ma n, wenn dte Merkmalsausprägungen zllsä tz lieh zur GI"iehhl'it /Ungl"i ehllPit noch eine R e ih en folge aufweisen. Beka nnt ist 1I11r d ie Reihenfolge: ma n w('ib aber nich t . wie gro b die Ab~tä Jl(le zwischen den Merkmalsauspräguugeu sind. Es wurde be reits dle St ärke des Politikinte resse s genannt, andere ßl'ispielr für ordtualskaltorte Xler kmale stnd die Schnlbtldung und dil' Schulnot en. Die Reihenfolge der Merkmals aus prä guuge u muss sich in der Reihenfolge der Zahlen wide rs plogoln . D!c Zahlen müssen aber nich t un mittelbar aufeinander folgen. obwohl dies in der Regel wie Z. B. bei den Schulnoten - der Fa ll ist. ;3. I nt ervalls kala . Mer kmale sind intervallskalir-rt, wenn deren Aus p rägungen nicht nur eine Ra ngfolge (lind dami t auc h U u tf'l'S("hil'{lliehkeit ) aufweisen, sondern auc h Abstän d e zwischen A usp rägungen sinnvoll intorpretiert werden könnon . Typts ehe n r i ~ p i rlp stnd die Temperaturmessung in Celsius oder Fahrenheit und die Kaleuderz eit rechuung. Die Abstände zwtschcn aufetnanderfolgondon Ausprägun gen (d ie Int erva lle) s ind bei einer Inte rva llska la gleich g ro b (konsta nt) . 0 1'1' Altersuutorschied zwischen eine r Person. dir 1930 gebo ren wurde und eine r Per son. die 1929 zur \ \"dt kam, ist ge na uso g ro b wie die zwis chen d em Ocbu rtsjahrgang 19,i l und 1% 0. Interva lls kalen besitzen im Gegen-
satz zu den nachfolgend hesr-hriebenen Rat ioskalen aber keineunat ürliehen Xullpunkt , Aus diesem Grund sind \ '!:'rhält_nissE' zwisdu:'u rlen Za hlen auch nich t interprettorbar. Besonders rleurlich wird dlos an der Zeitrechnung: Als wir nach christlicher Zeitrechnun g {gregctianischer Kalender} den Jnlnrswochse l 2008 / 2009 beg angen ha ben, befanden wir uns nach jiidisehr-r Zeitrechnung mit ten im Jahr 5769 lind nach islamischer Zeit rechnung im Jahr 1430. Da s Ja hr 0 existiert zwar Ill'i allen drei Zcito-chnungcn. es sind jedoch rein de finitorische Fest legungen lind keine ,,f'("h tl' n" Xullpunkte. Der Beginn der Zeitrerhnuug ist im rhrtsrlir-hen Kale nder an der Gehu rt C h rist i orieutiert , wahrend die muslimisr-he Zeit rechnung mit der Auswanderung Mohamuuxls von Mek ka nach Xledina beginnt. K ün stliche Nullpunkte slnd leicht dar-
Skulc"" il'mu.s
an zu erkennen. d a ss das jt'lw iligl' xlor kma l negat ive A usprä gungen besitzen kan n. wie r, B . IOO() VOf' Christ us . 4. R a tios ka la : Das einfachste Erkennungszeichen ra t ioskalierrer Xlorkmale ist dle Existenz eines natürlichen (ec h t e n ) N u ll p u n k t es . ck-r erst 11('1l Vergleich von Verhält nissen zwischen Skal enwerten f'rmöglk-ht, Das Alt er (nicht Ge bn rtsj a hrl], das Einkomnu-n lind dte Temperatu rmessung in KI'I\" in (nk ht Celsius oder Faluouhett l} sind Eigenschaften au f Ra t ios kalenniveau. Hier können Vcrbältnlsso interpn-tiert werden: Ein ;jOjährigef ist doppelt so alt wie ein 2,jjährigt,r. Die Temperaturmessung nach Kel vin ist im GI'gt>nsatz zu Cel sius und Fahrenheit eine Ra tioskala . da dipS(' eine n natürlir-hen Nullpunkt hat (be i -273.15 "C}. Null Kelvin I lPi ~l : Abwesen heit non Temperatur bzw. ~ loll' klllarbe\\'l'g lln g, während 0 "Celsius l'iup de finitor ische Ff'st ll'gllllg durch den Gefri erpunkt des " 'asSl' n; ist. B..i :300 Kelvin ist es als o tatsächlich doppelt so warm wi .. hei 15(}Kelvin. Ratios kalier te Mer kmale können keine negativen Werte annehmen . Es gibt weder ein negatives Einkommen noch ein negative, Alter und auch keine neg ative Temporatur in Kelvin. R a t i l ~s kal i l'rte ~ ll'rkJnal p besitzl'll ..künstliche" Skaleneinheiten. was sieh a m Belspiel de, Elnkcuu mens gut verdeurllchen lässt , das his vor kurzem in D:'\ I und P fennig. neuerdings aher in Euro 1111d Cent gl'IHI'Ssen wird. Dies uuterschetdet Hatlos kah-n von Absolutskalen. 5 , A bsoluts kala. Absolutskalenbesi tzen zusätaltch z u den bisher rlis kuticr ten Eigenschaftell der anderen Ska len eint, n a t ürliche S kale n e inh e tt. Die Zuordnung der Zahlen ist durch die Beziehungen im empinsehen Rt'1
Bei nominal- o der ordinalskalicrten xterkmalen ha ndelt es sich im mer lllll diskret e Merkmale, während metrische Merk male diskret oder konti nuierlich sein köu uen. Von einem di" krcten MCI'klllal spricht man, wenn dieses abzählbar viele \\'I'r1e
46
gemessen werden kÜIllWII. So werden nur bestimmte Worte des Alters. r. B. ganze Jah re, gemessen: zwischen diese n gl'IlWSS"IlE'1l \\"E'I t E'1l existie ren aher unendlich viele andere Wert e. Statt von diskreten Mer kmah-n spricht man auch \ '011 kate!lorialcll ~1{'TklJlalpll. Als didwtom werde n ~ lp Tklllall' be zeichnet. dip nUT zwei Aus prä gungen annehme n können. wie das Gpschlectu. Merk male mit mehr als zwot Ausprägungen werd en häufig auc h ]JOlytom genannt. Die Einteilung in Skalenniveaus ist \"I JII besonderer Bedeut ung für die s tatistisdlf' Auswertung der Da ten. J e hö he r das Skalennlveau , umso m eh r s t a tist ische Verfah ren sind z uläss ig . So ist d!e Berechnung eines arithmetischen Mit tels bei Nominalskalen lind Ordlnalskalennlcht eTlauht , da die AhsUinde zwischen rlen vergebenen Zahlen keine Bedeutung haben . die iiber die Untersrhiodlichkeit lww. die Or dnung hinausgeht. Von diesem Standpunkt liebE' sich auch die Berechnung einer Durchsch nittsno te kritisieron. da Schulnoten nu r O rdlu als kalenntvca u aufweisen . Sie sagen ja IIIll" etwas über einen Ra ng aus. nicht a lx-r über die Abstände zwischen den Zahlen . Bei der Da tenanalyse werden ordinalskalicrte Merkmale allerdiugs llällfig wie inre rva llskalierte ~ 1t'Tklllall' behandelt , um hestimnue statistlsche Vorfahren a nwenden Zll können [vgl. dazu Allerbock 1978). ~ Ian unterstellt da nn. dass die Abstiinde der einzelneu Auspriigungen auf dPT U rdiu alskala glek h sin d . Multivarlate Analyseverfahren (vereinfacht ausgedrück t: Verfahren, mit deren Hilfe g ll' i{'h ~ p i t ig mehr a ls zwei xlorkmale analysiert werden können ] setzen häufig mindestens tntorvallskaltorto Da ten voraus - er wä hnt seien hie r stellvert ret end die l inea re Regressionsanalyse. die Fakturenanalyse und die Clusteranalvso (vgl. Back haus et al. :WO:3). In den ver gangenon Jahrzehnten wurde n st at istische Verfuhren zu r .-\na lyse nominaler lind ordinaler Daten {Wf'i tI'T)Pntwiekt'\tlllld sind heure in den g ängig en Sratistik- Paketen lmplemennert (SPSS. Stata. SAS) (\"gl. Andres et al. 1997: Long 1997: .-\ g rp~t i 199G). \\"elehes Skalenniveau eine \"ar iahlp annimmt, hä ngt neben den beobacht baren Beziehungen zwischen den Objekten von I!E'r gewählten O perat ioualisierung ab . Misst man das Alter der in ~ laillz lehrenden Professorinnen und Professoren in .lahn-n , dann er hält ma n ein ratioskalicrtes Xlcr krnal. Genauso gut kiillnte man dpllIjdn ältf'StPIl Profpssor j in d ie hikhslt' Zahl aus eiuer Ilf'lif'higell Rpihp \'011 Zahlen zuweisen. dPT/ de m ZWf'itält f'Stl'li dil' z\I"{'ithüchslp U~I\· . In diesem Fa ll hat man Alter auf U rdina lskalenniveuu gemessen . Sehli"b1ich könnte ma n das Alter noc-h nom ina l messen. indem mall nu r zwischen P rofessorinnen und P rofesso ren , dle in der Zelt
des Xanonalsozlalismus geboren wu rden , und anderen unrerschoidr-t un d den Ersteren z. B. ('iJH' L den Le tztoren eine 2 zuweist . Generell ist es sinnvoll. auf dem höchstmöglichen Skalenniveau zu messen , ll;j hiilll'f{>Skalenniveaus immer mehr l nforma tioneu e nthalten als niedrlgere. Ha t mau das Alter der P rofes sur innen un d P rofessor en in Jahren gf>IlWSSI'II , so kan n man exa kt angeben, um wle viele Ja hre Profoss oryin X ält('l" als Professor /In }' ist , während dles bei den anderen botde n :\Ipssungen nicht möglic h ist. Zudem ist eine Verminderung des Skalenntveans im Nachhinein immer möglich. nicht aber eine Erhöhung. wählt man ein nipllrigPrI's Skalen niveau als miiglir:h, da nn reduz iert sieh von Vorm-, herein die Za hl dor ~uläss igl' ll stausttsehon verfuhren . GplpgPlltlkh kann es durchaus sinnvoll sein. auf einem niedrigeren Skalenniveau zu n \(' s.<;PII: Um die Antwortbereitschaft zu erhöhen. fragt ma n in Umfragen hä utig nicht nach dom exa kten Eiu kommeu (Ra tioskala}, sondern gibt Ka tegortPli vor (weniger als j OO Euro. j OObis 1.000 Euro . ..., j.lJOO Euro und mehr; O rdinals k ala). Im Altb us wird das monatliche Xct toeinkomnu-n zunächst offen abgefragt . Befragten. die die Aus kunft verweige rn . wird dann unter ZllsidlPru llg der Anonymitä t der Befragung f'inp List!' mit Einkonuneuskat egorlen vorgelegt (vgl. G ES IS 2007, 27.l).
3.3 Skalierungsverfahr en Zur Messung komplexer Sachve rhalte werden häufig m ehrere Indika tore n herangezogen. So wird es kaum mög lich sein. Kons t rukte wie ..Hechtsextremlsmus oder .Ausländerfeiudlichkei t' iilwr einen einvigen Ind ikator ange rnessen zu erfassen. Die Verwendung meh rerer Ind ika toren zur Xlossung einer interessierenden Dimen sion ha t den Vorte il, dass die Messung zuverlässiger wird. wenn dir- :\Ies.-;fphlpr sieh ausgleichen. Stellt sich na ch einer Unter suchung lu-raus . dass ein Indikato r dCII zu messenden Sachverhalt flieht gut abbildet , dann ist das bei Verwendung mehrerer l ndikato rcn kein SlI grobes Problem . Vor all em ist lx-i Verwendung mehrerer Indik atore n de ren Zllw rläs.-;igpil und Gtil tigkeit Iwsspr pr üfbar (vgl. daz u Abschnitt 3A ). Lil'gE' Il mehrere Indikat oren vor , dann bonöngon wir vo rfahr en zur IlNstcllung emes Xlessinstr umentes. Skallcrungsverfahren sindnichts a nderes als Verfeh ren zur Hers tellung einer Skala a ns mehreren Indik a tore n. Auch mit einem I nd e x können meh rere Indika toren zusammengefasst werden.
Indizes und Skalen stellen in diesem Si nne .. zusn msnc nqesctz te M CSMJ7lgcn" da r. Technisch gosprorhen wird lx-i de r Bild ung eines Index / einer Skala aus mehreren Variablen eine neue Variable gebildet . Der Unt erschied zwiHdll'1i Skalen und Iudives besteht darin. dass Iwi Skalierungsverfahren die Dimenslonalltät d er in die Skala f'ingrl wJI(II'II Indika t oren W'prii ft wird (vg l. ~ ray nt z Pt al. 1978. ·17). Ind ikatoreu hi Idf'1I nur da IL U eine Skala. wen 11 die VorallHS('tzllngrn des Skalierungsmodells (z. ß. der Gn u man-Skala ] erfüllt si nd. Bei Pi!IPIll I n d e x werden Indikat oren llaeh einer besti mmten mathemat tsehen Anweisung zusammengefasst . \\"f'ld w marhematisclu- U pera tion zu r Berech nu ng angewendet wlrd. hängt WH! der Fragestellung a b. ~ 1f' iHlpllS werden additive Indi zes verwendet . 0 . h. die \\"f'rtP de r einzelnen Variablen werden zur Bildung des Index einfach su mmten. Ind izes worden hBulig vorwendet. wenn mehrere l nd ika ton-n. die unterschlr-dlirhe Dimensionen messen . zu einem 1)('\1('11 Inst r ument zusammengrfusst werden. So könnto der sozioöknnonusche Stnlus aus Indika toren für die drei Di mensionen Bildung. Ein kummen und Berufspre-nge berechnet wer den {vgl. Schnell et al. 2008, lG7 If.).
Bestandtolle einer Skala {bz w. ganz generell Be.taudtotle eines Fra gebegl'llS) werden als It e ms hl:'z eid uw t. Dabei kann es sieh um Statements oder Fra gen handel n. D ip verschiedenen Skalieruugsverfahren unte rscln-iden sirh vor altem danach. welche Anforderungen dip ltems er füllen miissen, lind wir dteso zu einem einzigen Skalenwert verarheiu.t werden. A II ~(' r dem können Skallcrungsverfuh ren danach unterschieden werden. ob PerS(I IWIl und /oder Var iabl en skalicrt werden . Au rliesor Stelle wollen wir uns auf die D
3.3.1 likert-Skala Liker t . .Skalen werden in de n Soxialwisscnsrhaften zu r Messung von Einst ellungpll pittg('H(,tzt . Of'ispiplp für L ikert-S kalen sind dil' FaS(;hisntlIS- , Antisemitismus- lind Et hnozentrtsnms-Skaln. d if' in der Untersuchung zu m .Autonrären Charakter- von Adcm o. Frenkel-B runswik , Levlnson lind
San ford verwan dt wurden (vgl. Adorno et al. }!)jO). XE'llllWII wir an . wir wollten ein e Likert-Skala konst ruier en, die .,A u~länd('r fpi lldlichke it .. messen soll. Zunächst müss en nun Indikatoren gefun den werden . die ausländerff'ind lkhE-' Eins tellungen me sseu. J ed er einzelne In d i kat o r so ll d iese lb e Di m ensi o n messen. hier als o Ilt'gati\"f' Einstellungen zu Aus ländern u n d m ög lich s t nicht s a n d ere s . Um die Konstru ktion einer Llker t-Sk ala zu erläutern . wird auf vier im A L L RU S 2üüü ent halteuc A ussagcn zur ~ 11'ssllllg auslä nderfeindlicher Vorurteile zllrikkgegritfell (A bbildung .1 .2). Ent wickelt man eine neue Ska la. rlann ist PS sinnvoll, deutlich mehr Iudikarorcn als im Beis piel zu verwenden. Abbildung :3.2; 1.
~ 11's~nn g
a uslä nde rfeindlicher Einstellungen
Die in Deutschland lebenden Ausländer 501lt(']] ih ren Lebenss til ein bisschon besser an de n der Deutschen a npassen .
2.
\\'I'nn ArlH'it s plätzf' knapp werden. sollt l' man dip in Deutschlan d lebenden Ausländer wil'lh'r in ihre Heint a t zur iick5C·h ill l' lJ.
;3.
~ Iall sollte den in Deut schl and lebenden Ausländern j E'III' politlsehe Betät igung in Deut schla nd untersagen . Dtc in Deut s chland leben den Ausländ er sollteil sich ihn' Ehepartner unt er ih ren eigenen Landsleuten auswählen.
.1.
RI'i der Liker t-Skalicrung wird de n Befragten die :>' lügliehkeit eingeräumt , rhe Zustimmung hzw. Ablehnung der Statement s in ab gestufter Form vorzunehmen ( Ratin g-Form al) . Im oben genan nten Bolspiel reicht da s Spektrum über sieben St ufen , von .S t imme überha upt nicht zu" bis .S t imme voll und ganz ZIJ". Häufig werden bei einer Likcrt -Skala auch fiinf Ant wort al ternativen vorgegeben: lehne stark ab . IdlJH' ab . teils/ kib. s rinuue zu . stimme stark zu.
Dip Zahlenzuordnung zu d e n A ntwort.alt.ernat.iveu erfolgt am sinnvollsten SI), dass eine stark" Ausprägun g au f O"T zu mes senden Einstelluu g einen hohen Zahlen wert erhält und umgekeh rt . .-\uslä ll/lnf"i lldlit-ln-n Einstellu ngen worden also hohe Zahlenwerte zugeordnet , bei nich ta usländcrfcindlichcn Einsrr-Ilu ngeu Jl il'dri gl'. Dip Ant wor t ...;1 imm e \"011 un d ganz zu" gi bt lwi den Ik-is piclit cms immer eine ausländerfuindlirhe Einsn-llung wieder. rl. h. d if' Fragen sltul alle in dif' glf'id lf' Ein stellungs tichtung ..gl:' polt.. (gIcichsirmig). Der Antwort .st imme \'011 lind ga nz zu" wird
'0 denn-ntsprechend Iwi allen Aussagf'll d if' Zahl 7. der Ant wort .•" Ü Ill 11 W iiberhanpt nicln zu" dif' Zah l 1 und de n dal Wisd lf'1l lif'gt'lld l'lJ Ahst ufungen d ie' Zahlen 2 b is G zugeordnet . Dip Beurteilung der Aus sagen d urch die Befragten findet sieh in Abhild ung 3,3. Der Aussage, Ausländ er sollten ihr en Lebensst il etwa s IlI'sM'r an de n der Deutschen anpassen. wurd e am stä rkst f'1l zllgf'st illlllll. K napp GO% der Befragt en stimmten de r Allssage voll und gauz Ztl (Skalenwe rt 7). Am st ärksten abgelehnt wurde d ie Aussagt>, Ausländer sollten Ihre Ehepa rtucr un ter ihren Landsleuten a uswä hlen . Mehr als ,'jü IX d er Befra gten lehnten d ie Aussagt' vollund ga nz a b . Bolde Items si nd schief ver teil t, d ie Aussag e l UT Leben ss til a npassung Iinkssrhu-f die Aussage zu Ehepar tnern rerhrsschief Abbildung 3.3: Ei nstellungen gegenüber Ausländern
,
,
,e , I,,
I:
e
, ,
•
•
Le!l en s s~ la n pass u ng
"e
"
I. e
,• •x
Ll,lrY.J:;J:;::Q
"
,
.
Ehepa nner
Skala von I , sti mme iiberhaupt nicht zu. bis l, st hnme Daten: ALLBUS 2UOG. \Ves td eut sd tc. N= 2.031l
\~ I I1 11 1l< 1
ga ul', zu
Zusti m mende Äusonmgen geben hip!" lwi al len vier Items IlPga t ivl' Einstellungcn gegenüber Ausländern wider. Es kann jedoch sinnvoll sein . posit ive
5kul i~'1I" !I.w e'f
und negative Sratomcnts zn formulieren . 1I1lI Zustimmungste udonzen kontrolliercn Z1l können. Unt er Zust immungstendenzen wird d ie Xeigung von ß f'fra gtNI verst anden. Aussa gf'll ohne ßnücbil-hti gung ihres In h al ts vuzustimmen (vgl . a uch Ka pit el 4.1). Zusttmmungsrondenzon lasseu sieh dara n erkenne n. da ss ein ß t'fragtPI" positiv wie neg.ut v formullr.rten Aussagen zustimmt , was inh alt lich nicht plausibel ist. Ein posi tives St atement Z1l Ausländern wäre e in zusätzlichen l tem wie ..Die politischen Einflussmöglichkeiteu der in Deutschla nd lebenden Aus län de r sollten gestä rkt WI'1"den". Znsrtmmnng hf'llplIlf>t hier gf'ra d t· die Abwesenheit von negativen Einst ellungen zu Ausl ände rn. Will m an positiv un d negativ formulierte Aussa gen Zll einer Ska la zusammenfassen. muss man darauf ar-luen , dass dies elbe Zah l dieselbe Einstellung n-präscntiert. Z, I3. indem ma n hei positi v formulierten Aussagen der Antwort ,.s ti mnw \·011 u nd ga nz zu" den WI>rl 1 (Abwesenheit H01l Ausländerfeindlichkei t ] und 01'1" Antwo rt .Sthutut- überhaup t nicht zu" den WI'rt 7 (Ausländerfein dlich keit] zuweis t lind die Abstufungen entsprechend rekodiert (umpolt).
Die Konstr ukt ton einer Likert -Skala läss t sich anhand der im ALLßUS 2Ull(i verwendeten Item s veranschaulichen. Zur Yen -infachnng \\"(>I"(II>u ausschlicsllch die 2.038 in \ r esld l>llts("h la nd befragten Personen bet mr-htet , die alle vier A ll s.sagen an f Iler sipbpnlil u figp\l Skala beau t wort Pt ha 11t'1l, also keinen ei nzigen fe h tonden \\'t>rt {kein e Anga be / m>ib 1l loht } aufweisen . I Bei dor Likort-Skala wird der Skalenwert au s d er Summe 1111('1" (gleich gepolten) 1t1' Ill S berechnet. Dip Addlt ion ist jedoch nur da nn gereehe fertigt. wenn die Items eine cinaigo Dimension messen. Aulrand der Item-Ana lyse wird entschieden. welche It t'11lS get'ig lle t sind und damit in d ie endgültige Skala eingehen.
Der ltem- Analyse liegen vwot Gedanken zug runde. :\1c'SSI>n die ltems dieSI'IIH' D imens ion . dann sollten sieh Unt erschiode a uf der Zll messenden Dimension auch in unterschiedlichen Antworten niodersehlugen. ZUI! I'1Il d ie Antworten der Befrag ten zu den r-inzolnen Sta teme nts dau n kons istent sein.
SlI I!It'Il
D;,o:;t.'s Yorgl'!Il'1l wird ,ulf"h
"ts list<.'llweiSf'rF;,II'Hls",·hlnss
( li.~lwj.",
'kk/im!) h.v;('i"h_
not. Der lis!('u\w ;se F;,Il"ussc:hlllSS wird in t'llIpirisdu,tI .'\lIa!ySf'1l !Iäuflg I'w ktiziprt ,
führt aber UUf unter bcsrlmmtcn ßedlugungcn zu unvor zorrt en Er!:l'hniss('H.." limlieh dann. ,,",'1111 dh kOIll [JIl'1 1C'1l FiHl l' als ";111' Zufa lisstid lp ro!J" aus allen Fäll" l1 hl'trm·htN '-'" "I"" I'Tl kÜlITlI'U (", is.•i'l.'! o " "l,/"tdy 111 m",l" m , vgJ. p;llfiihn' Tl
52
Um zu überprüfen. ob sieh Un terschiede in der zu messenden Ein stellung auch in der Bea ntwortung der einzelnen Aussegen niederschla gen . teilt mall dir Befragten in E xtrem gr u ppen auf. ZUllikhst IH' rl'duwt mau fiir je de Pers on die S UIIl IllP II"r ,rerl E' über alle Items . Im fij' ispie l ist ([1'1' niedrigste möghche \\'1'1'1 der Summe 4 (wenn bei allen vier l tems ([1>1' Wort 1 vorliegt }. der höchs te mögliche ,r"fl bet rägt 28 {wenn Iwi alle n vier Itr-ms der , rer! 7 vorliegt ]. Man wählt d un 11 diejelli gl'n 25 % der ßefragte n au s. d ie die niedrigsten Wert e über alle lt ems aufweisen und diej-mgcn 25 % der ßd'ragtl' ll mit de n höchsten ,r('r!('I1. Fü r clie vier ALLß US-It '>l1ls habe n (He 25 % der Befra gten mit rlen niedrigst en , r "rt rll Wl'rll' n visdJ l'1I 4 und 11 (Gru ppe 1). Die 25 % der Bofragten mit den höch sten Wl' rlC'1I haben werte zwischen 18 und 28 (Gruppe 2). Danach vergleicht man die Ant wort en der belden Ex tremgruppen Z!J jedem ciasetuc n UC7/!. Br auchba r s ind diejonigen Items. bei den en sieh dle Antworten der Ex tremgruppen unterscheiden. Tabelle 3. 1 heinhaltet die Durchschnit tswerte der beiden Extremg r uppen (1' 1 lind 1'2) für die einzcltu-n Items. ß l'fragle mit extrem hohen Werten a uf a llen It P II\ S (G ru ppe 2) sollten auch jedem ein zelnen Item deutllrh s tä rker zus timmen als Befragte mit ex trem niedrigen werten auf allen Items (G ru ppe I). Dies ist a uch der Fall. Am s t ärksten unterscheiden sich die beiden G ruppe n in der Beantwort ung der Frage. ob man Ausländern je{le politische Bet ätigung iu Deut schla nd untersagen sollte. Am ger ings ten ist der Unterschied in ([1'1' Beurteilung der Aussage, Ausländer sollten ihren Lebensstil besser an den der Deutschon anpassen . ßp i (IPI' ..1,nalysr beschrankt man sich nicht auf einen Vergleich der ~ [jt telwerte. Vielmeh r wird für jNl rs ItPIIl ein Trennsch ärfe-Index lx-rechnet, (1('1' dem t-tes t für ~ litt elwert uut ersd li,'(11' ent spric ht (K api t el 12.3.1). Trennschärfe-Indizes grö!;pr als LG5 gelt en als ausreichend zu r Anna hme einos Unt erschiedes in de r Beantwortung der I tem s durch die, beiden Ext rcmgruppcn . W ie ma n sieht, sind die Trennschärfe-Indizes alle deutlich grÖN.'f als L {);'). Die l rr-ms scheinen dah er ein un d clipsl'!lw D imension zu messen und zur Kon struktion einer Skal a gel'igw' L Eine au rler(' Methode der lt ellJa nalyse ist d ie Bere-hnnug von Tre n nschärfe-Ko effiziente n . Messen alle Aussagen ein und dcnselhell Sachverhalt , da nn sollten clie' l tem s hoch miteinander korreltoron. Ein Befragter. der der Aussage .Die in Deut schlundlebenden Ausländer sollten ihre n Lebensstil ein bisscheu besser a n den der Deut s chen anpassen" stark
53
5kul i~'1I" !I.w elf
Tabelle 3.1: Extremgruppenanalyse G r upp<) I
x,
Lebonsst ilaupassung
.es
·1.5
6.6
(4- 1.723)
(.~~ '"- U .884)
A r lH'itsplii tz(~
1.3
5,1
(sf -" 0 .636)
(·4= 1.6 14)
1.3
5/,
(si -" O.706)
( .~~ = 1.6()U)
Polit.ischc Jl('t äti gUllg
Ehepart ucr
Allzahl der Jll'fragl\'l\
G ru]>]>(' 2
l.l
·1.2
(si - 0 ,-178)
( s ~ = 2 . U 1)
M3
557
n ah'!. Alllms 2006 . \ \ . 'St rl( u t sd lt' . ;r
Difrpn'll~
.l'2 - ofl
,m t lllllt tl st ilt s ~ htt l l.
/· \\'\'rt
2.1
'je
3.8
51
4.2
57
3.1
as
-"
-' - \,m a llz
I<
zust immt . müss te auch da s Statement ..Man sollte d en in Deutschland
lebenden Auslä ndern j ede politische Bet ärigung in Deutschla nd umersabefürworten. Unplaust hel \Viire dagegen dle Zust im mu ng zum ersten Statement bei gleichzeitiger Ablehnung des zweiten Stntenu-uts. Treten solche inkonsistenten Antwortmus ter häufiger a uf, muss mall ver muten. dass die Sta tements Unterschiedliches nWSSPll . Dei inh altlich plausiblen Antworten ist der Zllsaul11lf'uhan g zwischen der Beantwort un g eines Items und a l1P11 anderen l tems da gogen sehr s ta rk. UIlI dte, zu über prüfen , IIPrechn et man die Stärkt' des Zusammenhan gs (vg l. Kapi tel 7.6. Pearsous r) zwischen jedem ein zelnen ltem und de m Su m I1WIl\\'I' rt über alle Items (Spalte 4). Dieses ~I ab wird als Trenn sch ürfe..Koeffizient bezeichnet . Der Treuns ch ärfe-Kocffixieru kann maximaleins WI'fl ll'n . 2 Nämlich dann , W('1l11 es eine n perfekten posi tiven Zusaulllwnhan g zwisdll'll Itemund Skala gibt, Sta tements . die nur schwach mi t den anderen Stat eme nts zusammenhängell. sind für die Skala un tauglich un d werden in der end giiltigen Skala nicht verwendet. Die Korrelatlonskoeffzienten der ltems mi t der Skala Iw\\'egell sieh ewtschon 0.55 und 0.79. Angegeben wird zud em der korrl .. gierte Tron schärfc-Kooffi zlent (S palt e 5). Dieser gibt d ir- Korn-lation eines Items mit der Summe aller restlichen Iu-ms an , Diese Kor rek t ur wird vorgenotn uu-n. weil die Korrelat ion zwischen ltem und Skala dadurch. dass das Itom auch in de r Ska la ent halten ist , künstlich überschä tzt wird. Man g l'Il';
sieht , dass die korri gierten Trennschärf... Koefftzir-nton demlieh geringer sind. Die Aussage, Auslän de r soll ten ihren Lehe nsstil bes ser a n de n der Deu tschen a npa ssen. ist weniger gut als die 1111(11'1"('11 Aussagen geeignet. utn Pers one n mit und ohne nl'ga tin' Einstellu ngen gt'ge uiiher Auslän dern zu unn-rseheiden. l n (11'r lI'tztell Spalt e ist Cronbachs n allgE'w' I)('Il. a uf dess en Berechn ung und I nterpretut lon weiter un ten eingegangen wird. Tabelle 3.2: Trennschärfe-Koeffiz ienten und Cronbachs {}
In-rn
i:
I ,d)('ll~s t ilaupassu tlg
5,i 3.1
,
0 [uhuc Itcm)
Cn lllh"dl~
0,55
0.:30
o.rs
U.56
(O.i O) (U.!J.I)
O,i9
0.5:j
(0.56)
0,71
0.-1 5
(0.62)
Pulit isl"l lt.' Bctätiguug
3 , ~{
E h" lla rt lWI"
2,:J
LW
l ,t,4
5.34
Skala
Hest-Sknlu
1,55 1.9'2 2.12
A rbeitsplätzo
KUI'H'la t ioIJ mit S ka la
0.68
arit.lnuct.ischcs Mittel. s ~ S t allda rd abwt'ld (\l ng Dah'IJ: AlIhllS 2006 . wr-stdeutscln- BE'fr a gt l', n =-2 . ()3~ .
.1:_
Rei,l" Verfah ren können zu unterschiedlieben Ergebnissen Füh ren. rla in
einem Fall .nur- dle Ext rem gruppen . im a nderen Fall alle Befra gten in die Ber echnung c'illllid,ell, Die Met hode der Ext remg ruppen ist (las ältere, die
R"l"f'ehllllllg von Trl'llnsrhärff'- Kof'flizil'ntl' 1l das neuere Verfah ren. Nachdem die In-ms fiir die endgiil tige S kala allsgeKä hlt sind, kann d('r S kale n wert für jede Person b erec h n et werden. D ips geschie ht durch Addition de r Wer te der a usgewä hlten Items. Werdon trot z des niedrigen Treueschä rf...Koefti ziout on für das lt em Leben ss til an passung alle I tems zur Bildung (11'r Skala hera ngezogen . SI ) ist der niedrigst e möglirhe \\'1'1"1 -l, der inhalt lieh der Abwesenheit vonnegativen Eins tellungen zu Ausländern entspricht, und der höchste Wert 28, der die höchstmögliche Ausp rägung nega tiver Einstellungen zu Ausländern wit'(lt'r g:i bt. Damit ist c1il' l.ikertSkala kons tr uiert und (las Messinstrument ist fert ig. Der Mit telwer t auf de r Skala Iw trägt I -t, d le Standardabweichung - ein ~ Iaf, für die Streu ung der Antworten (Ka pit el 6. l A ) - 5.3-t_ So einfach die Berechnungsanweis ung ist. so schwierig ist die Int erp retation rler Skalenwerte - z11l llilll lf'st im mittleren Ben-ic h der Skala. Dil'
5kul i~'1I" !I.welf
Posit io n eines Befr ag ten mus s a userdem rel at iv zu allen a nderen interpr otier t werden. Bei einem durrh srhni t tlichen Skalenwert W lII 14 is t lU ein nif'd rigpr Skaleuwert , Bei einem Durchschni tt swert vo n 9 ist ein Skalenwert vo n 10 da gegen rela t iv ..norma!-, Zudem muss Ilt'ri k kskhtigt worden, ob das Antwon vorhalton einer G ruppe eher ho moge ll oder hoterogen ist. 3 Auf einen Punkt muss hingewiesen werden: Um d ie Irr-manalvse durehfll hren zu köuu en. gdH'JI wir davon a ns . da ss die Abs t jind e zwischen den einzelnen Skalenpunk ten gleich grob sind . und da m it z. B. die Ext n-tua nt worten C,Stim uw überhaupt nicht zu", .Stimme vollu nd g..mz Z1I,,) gleuh weit von der ~litlp ent fernt sind . ' '' ir nehmen also a n. dass die zur Itomanalvso hera ngezogenen l tems mindestens tntorvalt skaliert si nd . Ohne dit'Sp Annahme dü rften wir arit hmetlsches )' lit lt'l. Varinnz, t-t est (Trenns chä rfeInde x] und Pea rson s r [T reunsc hä rfe-Koeffiz lcnt ] nicht lx-rechnen. O b die Abst ände zwischen den Ka u-gonen äq uidista nt sind. kann bei mehreren I tems mit Rati ngsk alen- For ma t geprüft werd e n {vgl. Rost 2004, Ka pitel 3).
111 der empirischen Sozialfo rsd l11ug werden häufig eine Rf'i!tt' \"011 Items a ls Likert-Skalen bezeirhnet , l\"Pil sit' fünfsruftge Ant wortalteruatlven hahell, Auch Sum rnr-niudizcs werden man chmal Likcn-S kak-n gena nnt . Um Llkert- Skalen handelt P S s ieh jedoch nu r dann , Wl ' lI 11 vor Addit ion de r " 'erto gt'priift wurde, oh die Skala eindimensional ist. Fak torena nal ysen sind eine alterna ti ve xl ethodo zu r P rü fung der Eindimenslonalltä t.
3.3.2 Guttman-Ska la Dip G utt man-Skala 1I 111t'r sehpillt't sich in d n Konst ruk tton llt'llt lich von der Likert-Skala. Durr-h dit' Guttman-Skalierung werden glpit"hzp itig Pt'l'so... neu und Aus....agen Jnnstchtlteh der zu messenden Dimens ion in ein e Ra ngfolgt, gebracht werden. Die Ska len für konventionelle lind unkon ventionelle Pa rti zipa tion der Politi ral Action Studie (vgl . Burnos ,'I a l. 1U7U) sind Beispiel,' für Cutunan-Skalen. Eine r Cuttman-Skala liegen Ite m s zug ru nde die hi n s k htlich der z u messende n Dime nsion im m er ext re mer werden. d. h. die Dimension 3
:'I lal1 k",lU di,' Slml,·nw,'rt(' sta",l,mlisi"r!'H , i"d"m mall "i", ' .:: -l'm Hsfon " " t i" u (vI'( I. GlpidlUlll'( 10. 13. S _ 2 ~2 ) durchführt . Dip c-wcn cgebcn dh- .-\hwt'ir hung df':; Ska !puwprh>;; pim'S B" fraK\.Pll "uno durd,sdllliu.li<.,hen Sk;,!puw"r t in Ahhiiugil/;k<"it Voll door St fellllllK d" r Sk;tlt'uw<.'rtP wi,~I" r .
56
in einer unt ersch iedlirhen Intens it ät 11W SSP ll . Als Ik-is picl werden Fra gen zu r politischen Pa r tizipa t ion a us dem ALLBüS 1998 herangezogen. Unter anderem wurde llip Rereitschuft ZIJ IJ" kolllwrttimlfller politi.ichcr Purt ieipotion gemessen. Dip Fra ge la ut e te : ,," '('Iln Sie politisch in einer Sache. dte Ihn en wicht ig ist, Ei nftuk nehmen. Ih ren Standpunk t zur Ge lt ung bringen wollten: Welch e der ~ [ üglichkt'it {'n a uf diesen Ka rten würde n Sie d ann nutze n. was davon käme für Sie in Frage?': Auf den Ka rton warm e int' Reiht' konvention eller (\ \'ühJpll. ~ Ii tarheit in einer Pa rte i usw.] IITH I u nkon ventioneller Parttxipationsfonnr-n a ngpgp!wn [vgl. Zentralarchiv für empirische Sozialfol'sdlll ng 1999 , GO G8 ). Ans den \'o rgf'geb pltt'rl l tems haben wir für da s Beispiel d re i lnd tkatoro n ausgewählt (A bhild u ng ;lA )
Abbildung 3..1: 1. 2. 3.
~ Ies.<;u!tg
llnkoll\'I'!ttiOlll'llpr poli tisdwr Pa rtizipa t iou
Teilna hme an eine r !lidlt gene hmigte n Demonstration Mitarbeit in einer Biirgf'riniti a t h'e Ha usbesetzu ng. Beset zung von Fa briken . A mt ern
Schwierig ist ein ltem rlem \\'l' nip;t' Befra g te zustimmen. Ein Item ist leich t , wenn es von vielen Befragten bejaht wird. Nach dem Schwiengkcitsgrad \\'1'1'(1(>11 die ltems in oiue Reihenfolge gt' b ra" ht. Zur Erläuterung der Logik des \ 'er fah ren » nehmen wir vore rs t a n, dass die IIPms \'(111 Bürgeri nltlat iven ü be r ungenehmigre Demonst rnt lonen zu Ha usbes et zungen imm er seh wieriger werden. D u rch die Bef ürwort ung von Ha usbes et z ungen wird also eine grü bpJ'(' Berei tsch a ft zu unkonventioneller Beteiligu ng a usgedr ückt a ls durch dip Befilrwornmg u np;" lwhmigt l'r Demons tra ti onen. uurl durch die Befürwort ung nngenehmigter Demonstra tionen etn e grö M'f{' a ls durch ß iirgeri nit ia t i H ' II, Die Antwortvo r ga ben be i den Iterus einer C unruan-Skala sind dichot o m . d. h. es werden nur zwei Ant wort möglichkeit en - Zust imm un g oder A blehnung - vorgegeben. Angenom men wird, dass b is zu ein em gcwisSI'n Schwollenwert der zu mes s enden Eigensr-haft (hier: Bofürworumg un konventioneller politisrher Pa rti zipati on ) ein Item a bgelehnt wird. Übe rSI'hrf'ih ·t llie zu messende Ein stell ung diesen Schwellenwert . d ann wird das Ite m befürwortet . ß is zu einem bestinuuten A usltlab der Befflrwortun g un kcnvcut loncller politischer Pa rt izipa tio n wird z. B. die Bet eilig ung a n einer Bürgerinit.iaf ive a bgelehnt. Ers t wen n unkonventionelle Bcu-illguugsfortuen in einem bes timmten Ausmas befü rwortet werd en . wird d ie
Boteihgnn g an einer Bür ger init ia tive bejaht. Bis zu einem bestimmt en Schwellenwert der zu messenden Eigenschaft ist die Wahrscheinlichkelt der Befürwor tung eine, Itvms null. a b diesem Schwellenwert ist die Wahrsdwill1ithkf'i t eins. \r a hrsd lf'inlk hh 'it 111'r Befürwort uug st eigt als o llt'i eine r hestimmten AUS]lrägull g de r zu messenden Eigenschaft s]lt11nghaft von null au f eins an.
m('
~[t's,'it>n dio 1t 1' Ill S eine eiuaigo Dime nsion in untorschtedlichor Inreusltät. da nn kaun angcnouuuen werden . dass eine Person . die ein bes tim mt es Item bejaht, alle weniger ext remen !I Pl1\S ebenfalls bejaht. S timmt di p olJ!'1I angeuummene Reihenfolge, dann ist anzunehmen , da ss eiu Befragter . der an ll a usbeser zun gen teilnehmen würde, ebenfalls dip Teilnahm e an IIngt'nehtni gte u Demons tr ationen und a n Bürgerinitiativen in Bet racht zieht . .Anderersotts diirfte etne PPfSOIl, dte sieh nicht. a n Bürgerlnl tlatlven betetligon möchte , keim' un gonehmigrcn Demonst rationen un ders t recht keine Ha us beset zungen erwägen. Dip l tems sollten also eine kumula tive O rdnung a ufweisen. ß f'i einer idealen Gur tman-Skala kann Il 11S der Suuuue der bejahten l tems nicht nur geschlossen werden . wie vielen. sondern auch \\"P]e!H'1l Items der ß I>fragtl' zugt'stimlllt hat: be i einem beja hten Item dem schwächston l tem . bl'i zwei hej a ht eu Items den botden schwächsten Item s usw. Ideal soll lu-isen. da ss nur modellkonforme Antwortmust er a uft re.. 11'11. Aus der Anzahl bej a ht er ltems kann dann das Antwortmus ter genau reproduziert worden.
Bei drei Item s - wie in 1l1lS1'H' 1ll ß eispi('l - existieren der zuliissige bzw. modd/konfo rme Ant wortmuster. Diese sin d in Tabelle 3.3 auf der folgenden Seite da rgestellt. + bedeutet die Zustimmung zu einer Aussage, - deren Ablehnung: Ite m 1 kennzeichnet das Sd lll"ächst p, ltem 2 das mit tlere und Item 3 das I'Xl n'IIlSIf' l tem. Das erste Antwortmuster ( - - - ) kenn-eich1H'1 die Ablehnung aller I tems . Das zweite Antwortmuster (+ - - ) gibt an , dass dem sehwäehst en Itr-m {Item 1) zugest im mt . dit' boiden extremeren Itcms {ltcm 2 und Item :3) da gegen ablehnt wurden. D I'r Skalenwert entspricht der Za hl dt'S .x-xtremsteu" Items. lIas bejaht wur de. Im drit ten Ant wor tmuster ist dies da... zweit!' lt om: für dieses A ntwort mus tor wird also der Skalenwert ..? ver geb en. ü b die Items 1I1111 l'illl' Gunman-Skala bilden. lässt sich daranablesen. wie gut dte Antworunust cr aus rlor An zahl bejahter Items reproduziert werden können. Die in Tabelle 3A a uf der nächsten Seite dargestellten Ant wort muster ent sprechen nicht de n Anforderungen de r G unman-S kala. Bet die-
Tabelle 3.3: Mode llkonforme Ant wortmust er be i der Gultma n-Ska la l tem 1
Item 2
I tem 3
+ + +
-
-
+ +
Skalenwert 0
I
2 3
+
sen Antwortmus rem Hisst sich aus der Anzahl bejaht er Iu-ms nicht mehr ablesen, wek-he ltems hejaht wurden. ßI'I nur einein hejahten Itetu muss man na ch der Logik de r Gunman-Skala eigent lich davon ans gehen. (lass l tetn 1 (das am wenigsten extrem e Item] bt~<'Iht und die bpirlt'll extremen 'n l rems verneint wurden [Antwortmusror: + - - ). Ta tsächlich wurde im erst en A nt wort mus tor [edor-h nur d as zw-tto Item bej aln (Antwcr t muster: - + - ), Wenn man aus der Anzahl beja hter Items d as Antwortmuster a l.... leitet . begeht man a lso zWl'i Fehler: Die Beantwortung des ersten Itoms ( st att + ) und des zweit en Items (+ sta tt - ) werden falsch eingpschiHzt. 4 :\If'ssl'n dlt' Items eine Dimension in l111 te rsehil'dlidu' r l ut eusit ät , d a n n kann es eigent lich nicht sein. dass dem ext rems ten 1tf'1I1 zugestimmt wird , die Ix-iden weniger extremen 1t 1' 11lS jedoch abgeleh nt werden (- - + ).
Tabelle 3,.t: Kieht modellkonforme Antwortmuster Ilpi der (hutma nSkala Itom 1
-
+
Item 2
+
-
+ -
Itom 3
,,"prt I
+ + +
1 2 2
Fl'hl er 2 2 2 2
:\lit der Skalo gcarum -A nalyse wird a nhand der Ant wor tmust er geprüft , ob die Irr-ms zur Bild ung einer Gunman-Skala geeig ne t sind , JE' höher der Ant cilunx uläe-i gcr ..... ut wortmus ter, UI1lS0 un geeigneter sind die It P11ls. 1 Zur lb-rvcbuuug der Ft>hlpr existieren mehrere Verfahren. Hier werden d ip Fehlor ,,1~ Abw"i"ltung n lll' i
59
5kul i~'1I" !I.welf
Das Verfahren so ll a n den a usgewä hlt en Items zur politischen ß cteilig ung demons triert werden. Zun ät:hst müssen wir fesrvtr-llen. wr k hf> ltems extremer lind wf>kht' weniger exr rom sind. OiI'SI' Entscheidung fäll t nicht aufgr und vorhe riger Ühl' fleg ung en [auch wenn man sich schon Iwi der Formu lier ung rlcr Fragen Ge da nken üb er deren Intensitä t mach t ]. sondern aufgrund der Antworten de r Befragten. Die R eihen folge d er Sta te men t s ist a lso ein e em p irische Frage. Die lterns werden also zunä chst nach der H ä u figkei t d e r Z ustimmu ngen geor d net . Von dl' n '2 .117 west deursche n ß pfragton im ALLß US 1998 gaben ca. 30 0/. (G.!G) a n, dass ste gegt'Ilt'IIf>nfalis a n einer Bhrgerinir.iative mi ta rbeiten würden, kna pp lll % (20'2) zogen d il' ß ptpiligUllg a n einer ungenehmlgren Demonstratlon in ß l'l rad lt , währ end ll'diglk h :J % (7G) der ßI'fragll' 1l zur ß f'se tnlll g von I1ä USf'fIl bereit wären. Die Rei hen folge (]I'I" It em s ist als o: Biirger initia tive. ungenohmigte Demonut ra tion. 11a usbesetzung. :\1111 IllUSS ermittelt werden. wie viele der Antwort en nicht dl'lIl idealen Muster entspre chen . In dl' r ersten Spalte von Tabelle 3.0 sin d im O!ll'fl'll Teil die modellkonfomion und. im unt eren Tell. d ie nicht- modellkonformen Ant wort mus tor angegeben. Im Kopf de r ersten Spalte Hndou sieh die drei Items. geordnet nach dere n Schwierigkeit , die d urch d ie pro;o:ellt ualt' 7.1l~ sttmmung ernut telt wur de. In der zweit en S palte ist di e Za hl der bej ah ten Items. in der d ritten d ir Zah l de r Feh ler pro Ant wortmuste r wiedergogelx-n. Die Frage ist nun . wie viel" der Befragten modellkonform a ntw ortet en und wie viele nicht . \Yil' man in der viert en Spalt I' seIWIl ka 1lI1, ant wort e(1' 11 2.02G Befragte (1.:38\) + 505 + !JO+ 4 1) modcllkouform: 92 (57+ 11+ 14+ 10) ß l'fragt f' ant worteten nicht im Sinne des :\!OIlplls. Insgesamt (vgl. die letzte S pa lte (11'r Tabelle} werden Iwi der YorlH'fsagf> des Ant wor tmus ters aus der Za hl bejahter Items 18.! Fehler gemacht . ßoi ein er ide alen Gnlt ma n-Ska la würden keine Fehtor auft ret en und unscre Vorhersagegenauigkeit botrüge IOU %. Der Anteil modellkonformer Antworten (= die 1.uliissigell Antwort mus ter] an allen Antworten wird als Rrprod llzierbark ritskorffi zieflt bezeich net. .
Rl'p.
I -
Anzahl de r Fehler :.:::c,:::.:;.;;:.::::.:::::..:. alle A ntworten
Tabelle ;3.:"): G ur tma n Ska la - P olirisr-h e Bet eil igung 1998
nr
UD 1111
' Y{'fl
Fphl('f Befragte
S umme der Fehler
Zllst illllllllllg
:lO % 10% :l %
-
-
+ + +
+ +
+
-
+
-
-
-
+
-
+ -
+ + +
II 1
1 ;j
1 1 2 2
II II II II
,, ,,
1;189 5tl5 Oll 4\
57
11 14 III
57 x 2
+ 11 x 2 + 14 x 2 + 10 x 2 _ 181
B[: Bü rgerinitiative; UI): ungenclnnigte Demons t rat ion: I{B; lI a ushl'sd t,lIlll!:. Bl'l';d zllug: von Fabri ken lind Ämt ern A L LIl US 19!.18. W( 'Str!{'t1tsdw BE'frag\('
Q tld lE ~ :
Anzah l der Fehler Rep. = 1 - -':::::C;;;-,;-::::ii:"",-:;::::-"",-:;-';:,",;:::,,::::::: Anzahl (Irr Br fragtt ·u x Anzahl dn Items Der lb-produvicrbar keirskocftixicnt ist also ein ;" Iab für die Güt e der Skala. Ein nhjektives Kriterium für d it, nOlwendige G rök dip s!'s Koeffizient en existiert nicht. Als Faus t regel hat sich ein Wert von 0.9 - also eine " 0 1'hersag ogen auigkoit von mindestens 90 % - ('ingt' bürw'r t. In unserem Beispiel ergibt steh:
18·1 Rep. = 1 - 211 7 x 3 = 0, 97 Odor a nders ausgedrückt: Im Beispiel lassen sieh 97 % de r Antworren au fgr und der Skalenwer te richtig vorhersagen. Die d rei verwendeten Items sind nach diesem ~ I
Sirul d ie ltems geeigl\1't, da nn wird für jNIt'1l Befragten rler Skalenwert berechnet . Beim hier gewä hlten Verfahr en (!\Id w f und Ca nmnes 1982,
61
51 L) ergibt sieh der Skalenwert ans der Anzah l bejahter Items. \Yif (' 1"halten eine s tark schiefe Verteilung de r Skalenwer te. da ein erheblicher Prozentsa tz der ß "fragt l'll ii1l1'r hall pt kelne der \'or gl:'gt'lwlwlJ unkonvent.ionellen Bote illgungsforuu- n in Betracht zieht . Dir Gn uman-Skala misst auf o rd i nalem N iv ea u . da keine Annahmt' übo r d ir- Skalenabstände gemacht werden. Zur Vereinfachung der Darstellung wurden lediglich drei Itr-ms be tr achtet. In wissensch aftlichen Anal vsen sollten - wenn möglich - mehr Indik at oren hera ngezogen werden. ßt'aeht et werden muss . dass dle- Skallerbarkeit eine t'lll pi risdll' Frage ist und dami t von der jl'\wiligt'1l Diltf'lI basis ab hängt. Es ist miiglkh, dass dieselben Items in einer Umfrage eine Llkert- j Gut t ma n- Skala bilden, während sil' in einer anderen Umfra ge dip Skalenvorausset zungen nich t orfüllen. Bei international od er interkulturell vergleichenden Analysen lIa rkne,s ct a l. (20U:3) 1;O]]t(' r!i l' Skalicrbar keit fiir jede Grupp!' getrennt 11Ilters uclu werden.
3.4 Gütekrit erien einer M essung Als Anh alt sp unkte fiir d ie Qualität einer Xlessung werden deren Rcliabi litiit und Validität hera ngezogen (vgl. Cannines und Zellcr 19,9 ). Unter R elia bi lit ät wird die Zuverlässigkeit einer Messung verst anden. Ein :\ le1;s ill.~trll llwllt ist UlnSO zuver lässiger , je kleiner der Messfehl er ist. :\Iit Valid it ät bezeichnet man die Giiltigkeit einer Messung. Hier geht (' S da rum. ob tatsachlich das gl'IlWSS('1\ wurde, was g('IllPSSI'1I werden SIlIhp, IIl1d nicht irgendetwas an deres.
3.4.1 Reliabilität \\'as Relia bili t ät eines Messinst rumentes bedeutet , kann ma n sich an fol-
gendem ßpis pit'! deutlich machen: Nehmen wir a n, wir \\'0111'11 dip Tempora tur 1Il''SSI'Il. Wenn wir zwei ~1t'Ssins trllnwll t l' haben. d ie die Tem perat ur messen - z. n. ein T hermomete r lind ein Bimetall . (Las sich Iwi \\'iirn H' ausde hnt und h('i l\:ältl' zusamlllpnziphl - . sollten :\IPSSllllgPll mit dle sen Instrumom en zu rlomselbon Ergebn is kommen. :\lil dem Thermometer messen wir eine Temperat ur von 2-1 "C . Eine pa rallel durchgeführte xlossung mit dem Bimet al l ergibt eine Temperatur \'011 21 "C. \Yel111 sidlt'rgl'1;t(,111 ist , da'is die unterschiedlichen Messergelmisse nicht andere Crüude haben (Sounenelnsr.rahlung. \Yind nsw.}. dann muss man davon a usgd lf'lI,
62
d ass eine der Messungen hzw. eines der xlessinsr rumcnto nich t besonders zllwrliissig d ie Tem pera tu r misst. eventuell soga r beide. D ie Messmstrumente lJIci.~fII tzeine hohe Rd ifJll ilit ii t (Illf. \rir könnten auch nur mit einem Instrument . z. B. einem T hermomet er, arbeiten, un d kurz na ch lI11Sl' fI'r ersten " Ipssllng eine zweite du rchführen. \ r ellll die Temperatur sieh zwischen den belden Zeit punkren nicht geä neh-rt ha t , z. ß . wei l d er eehhche Abst an d zwischen den Mess ung en sehr geri ng is t, lIas T her mometer abe r t rotzdem unterschiedliche \rerll- a nzeig t , ka1I1l ma ll auch hier d an m ansgehen. dass d as IIlS1 nuuent 11 ir-ht H-I ia In>1ist, "Iit diesem T her mometer er hält ma n keine zuverlässige n :i\ tess wt'rtf' . n l'id l' Uberpnifungsmethodr-n werden a uch im sozlalwlssenschaftlichen Bereich angewendet . zudem ka nn die inte rne Kon sist enz ein es " Ipssinsiru llll'ut ps gf'prii ft werden (vgl. auc h zu neueren " It,t hotlt'n Ros t 2004. 3 76-380 ): • Pa rallelt es t verfah ren • Test-Re test -Verfa h ren
• Interne Konsistenz Belm Paralleltestverfahren wird die Zll \"t'rläs,"iigkl'it d ur ch z\l't'i verschiedcne Messinstr umente gep rüft , d ie d asselbe messen sollen. Je stärke r Iwidl' :i\ leSSlll1gt'n nur einander kor relie ren (\'gl. Ka pite l 7). umsn höher ist dir- Reliabilit ät der :\l pssllngPll. \r pit·ht,u dle E rgl'llllisSf' stark voueinauder a b. dann sind die :1\lt'ssinstHIIIlt'u te nicht roltabol. A llerdings existieren nur s elten vergleichba re (= para llele] :1\ lt'Ssinstrtullt'ut e , Ei n T hermomet er ka nn andere :1\ lpssl' rgt'hn issp produzieren als ein Bim e tall. zumin dest ge.. nauere. BI'i soz ial wisst'lIst"haftlidw ll Fra gest ellungen s tellt sk-h di!'st's Pro... hlem 110ch viel g ra vierende r. So ka nn zum BI'ispit'1 ein Messinst rument fiir ..Xationalstolz- die Fra gt' sein: .Bind Sie stolz. Deutschor zu sein?". Ein a nderes Inst rument könnt e d ip Fra gt> sein: .Slnd Si!' st olz a uf Deut schlan d '!". Die unt erschiedlichen Fra geformulierungen könnten d er Gru nd für unt erschiedliche E rgeb nisse sein. :1\ la n ka n n anz weifel n, on die beiden Fra geu wir klich dasselbe lIH'SSt'tL selbs t wenn man davon a usgeht , dass Iwide
Fragen .Xationalstolz- erfassen. " fit dem Test -Retest- Verfahren wird d it' Reliahlht ä t durch die wiederhol te Anwe ndung d es Xlessiustr uments ge p riift. Führen z\\"l' i na cheinander erfolgte xlessu ngen mit demselben Inst ru men t zu untorsch todlichon E rgeh.. nissen. d an n misst da s xlessinsuumcnt nich t zllH' rlä~ig . Allerdings m uss
63
mall von der Stabilität des wahren I rfft e,~ (i m ehigen Beis piel die Tempera tu r) zwischen den zwei :\lt'ss zeit pullk t\'lI ausgehen . u m untcrschicdficbe ~ [\'SSt'tgf'bll isst' auf cHI' man gt' hul e Rr liah ilität de s lns t ruun-nn -s zurückführen zu könn en. Auf rlas ß l'ispi r l der :\!\,s,s ung von ,S a tio na lstoll' angrwendet, h i .,~p d n-s. dass die Fra ge .Sind S ie slolz, Deut scher zu soin" reliabel misst, wenn die An two rt en ZII unt orschiedllchen Zeitpunkten be i densel hcn Befragt en hoch miteinander kor relieren. Yo rall sgese tzt. der Nationalstolz hat sich zwischen boiden Zeit punkte n nich t ver ändert . UIIl dies zu ge wä hrlf'b l en, kan n ma n clie lwiclpil :\[f's,s llIlgpn Illiiglk hst z!'it llah durchfuhren. Erinnern sk-h d ie Befragten an ihr!' erxte Antwort und versuchen sie, mög lichst iiborelnsrimmond 7.1I a nt worten, dann wird d ie Hplia], ilitä t dos Inst rumen ts a llerdin gs überschätzt. Am IWSt1'll lässt s ieh die Reliabili t ät iihrrpriif(' ll. wen nein Messinst rumen t a us meh reren l ndik a tou-n besteht , die alle dieselbe Dimension messen solle n - SI) wie PS beis piels weise bei den oben genannte n vier l ndika tnreu zur ~ !1'S.HlIlIg ansländerfeindlicher Eiust cllungen a ns dem ALLßUS 200ü der Fall iSI. ß esteh t das Instrument aus meh reren Ind ika to ren , dan n ka nn die in t e r n e Ko n s is te nz der Ein zelmessungen iihprpriift worde n. Zur Ülwrpriifung der internon Konsist enz wird meistens Cronbachs (l verwendet , dessen Berechnung aber ebenfa lls intervallskaliorte hulikato ren vorausSI, tZ !. Der " 'f'rt von (l is t abhä ng ig von der mir tleren l ntor korrolatto» der Item s und der Za hl der Items. Je mehr ltems in die ß cn-chncn g t'inHieN'lI, umso höher ist Crouha ehs (l bei gleicher mittlen-r Inte r korrelat to n. Cronbachs (l so llt e gröjcr als 0,8 sein , in empirischen Analysen werden aber a uch geringere " 'erle akz ept iert (vgl. die Beispieh- bei Diek man n 2008,
2G4). Cronbachs 0 b\'t rä gt lär die vier ALLß US- h (' IllS O,Ü8 (Tabelle 3,2)." 111 rlen Zeilen der Ein velitems finden sich vurlom 1I0d l die \\'('rlE' von Cronbachs 0 , we nn das jeweilige Itr-m nicht in die Berechnung der Ska la eingingt', Xlan sieht , da ss die Relia bilitä t ein Skala ohne das l tem Lebensstila npassung
5
m- Formel zu r Hcrochuuug laut et : n =
--s- (1 I'
,
~ ) , P ist di<' Z" hl dc'r ln-ms. ' .." .
Im Zälrlor '.h'S zweiten Bru chs steht die Summe der Variauzen der Eill7.('liwms , im .\puut'r dfo YafÜlI11 d"f 5k"I", J ,) stilrkpf die It" TlI s 7.\lS;lIIll1Wll hä"KPu , llll)S<) Kr;:'" t<ef wird s;k~la illl \ "'fll:l,'i" h 7.U Ist cl"f ZUS"HllI",uloallll: 7.wisdl('lJ dC'Tl hc'rns null. c!lllm l'nt bprieht ,1iC' \ 'a ria nz ,] ('1' Skala der SUlIllllC' ,IN Yariuux eu
E>;,
_ -'- (1_ u ....," + 1.~2 ' + 2 _ 1 2' + I.~"' ) _" ,. " - .
(\ -
4 _)
'L.l~ '
'c> ,
etwas höh er ausfallen würde. jedoch deu tlich schlechter wäre, wenn die Ind ika toren Arbeitsplätze od er poli t ische Bet ätigung nicht in der Skala ent halten wän-n.
Fest zuhalten hleibt . rlass die Ül wrpl'üfullg der R r JiabiJitiit nicht einfach is t. Belm Paralleltestverfa hren müssen vl'l'glpit hhan' ~k~sin st rnll w n l l' VI'I'1\"(>I\(!Pt werden , heim Tes t- Retest- Verfah re n muss stehe-rgeste llt sein, dass der wah re \ \,pr t unverändert gehlleben ist. Zur Überprüfung der internen Kons isten z benötig t ma n keim' der beiden A n nahmen . Dips ist einer der ll aupt corteile, die flip ~ 1f'Ssll ng einer Dimension durc h mehrere Indi ka roren mit sich bringt.
3. 4.2 Validität \riillrPlIfj si<:h Rpliabilität a uf 11f>1I technischen Aspek t etuer zieht, Iw t rilft dir Validität den inhaltlirhen Aspekt.
~ I pssun g
b('-
Am Beis piel d er P arteiident ifika t ion soll die Validität einer :\fr>ssllng \"('1'deu tficht werden (vgl. bereits Falter l !Jii), Unter der P arteiideutifikation wird in der \rahl fol'SchulIg eine la ngfristig stabile, p.~yd lOl ogi sdlt' Bindung a n eine Part pi verstanden (vgl. Campbell I't aI. 1980, 121), Die Par telidentiti kation wird in der Bundesrepublik d urch folgende Fra ge gemessen: ,,\ 'if>ll' Leute 1lI'ig\'11 in 111' 1' Bundesrepublik längere Zl it einer lx-st immten Pa rtei zu. obwohl sif> a uch a b u nd zu eine a ndere Part ..i \\'äh ll'lI, \\'il' ist da s bei I1l1l1'n : I\'pigpn Sie - ga nz allgemein gpsp rod H'1l - et nor bosr immteu Partot zu'! W"nn j a, welcher?-. Diese Frage so l1 la ngfrist igp Bindungen i111 eine Pa rtei messen, nicht a ber dio \\'i1hlabsicht . was in der Fra gt>durch den Zusat z "ohwohl sie a uch a b lind zu eine a ndere Pa rtei wählen- verdeutlicht wird , .\nd l'rIJ s ieh die An ga be n zur Fra ge d er Pa r teiidemifika rion hä ufig, dan n t1lPSSl'lI wir nicht mehr nur da s , was wir mes sen wollt e n (Iangfris tig l' Bindungen ], MJIld\'1"II zusä t zlich etwas anderes (k urzfris t ige P rä fere nzen ]. Nimmt IJ\'ispif>1s\I'pisp der Antei l de r Befragt en mit Pa rtettdenuftka uon in Wahljahren deutlich zu, da nn is t dles " in Ind iz d a fü r, d a ss mit di t's\'r Fra ge au ch kurzfris tige P räferenzen g\'nWSSI'Il worden . d a in \\'a hlk1l.lllpfzpit pll d i\' politische Mobilisierung de r Bürger steig t . Zu r Übe rprüfun g der Stabili tä t de I' Part eiidenti fikat ion sind Informat ionen über individuelle Ver änder ungell llotw{'u d ig. d .11. ma n benötigt Pa m-l- oder Ereignisda ten (l\a pit l'l 2...l ), 111 Deutschl and wird die Pa rteiident if ikation im Sozio-ö konomisrhen Panel erhoben. Die Analyse \'( J11 Schmit t- Beck Pt al. (200G) deutet a uf erhebliehe
Flukt ua t ionen in de n Pa rteiidon tlfikarkmen der Befragten übe r einen Zeitraum von 18 Jahren hi n. Mit dem SOEP lässt sich leider nicht prüfe n, ob die Pa rteiid ent ifikation - wie theorerisrh erwartet werden kann - st abiler ist als die Wahlabsicht und d ieser ta tsächlich zeitlich vora usgeht . woil dte Wahlabsteht nicht erhoben wird . An dk-sem Betspiel lässt sleh auch zeigen. dass die Validit ä t VO ll d e r R eliabili t ä t a bhängt , n icht j edo ch u m gekehr t d ie R eliabilit ät von d e r Va lid ität. Unsere :\1f'SSllng kann nämlich seh r zuwrlässig sein . wenn etwa kurzfrist ige Schwankungen in den Pa rteiprä ferenzen durch die Fragl' der Pa rteiidou ti fikation exa kt reg tstrtert lind
titi
Kr it er ium svali dität liegt dann vor, wenn das zu m essende Konst rukt anband eines ext ernen Kr iteri ums übe rp rüft werden kann . "Extern" I){'rleutet., dass (las Kriteri um nicht mit de r ~ ! l:'SS n ll g des Konst ruk tes im 7:usammouhnng st ehen darf. Beis piel: \\'ir fragen nach d er Wahlabslclu Iw i der uächs te n Bundesrags wahlund überprüfen unse re :\!t'SSlIllg anhaud dos r atsächllchon Wahll'rgphllisses. Das P roble m bestehr d arin. dass das K rfteduni nur selten so exakt bes tim mt werden kan n, wie in diesem ß r ispi(' I. \\'en ll lOS um die Messung solcher Ta tbest ände wie .Re-htsext rcmismus' odpr . ~\lls lä ndl' r fpi nd lid l k(' it." geht . ist f'S SI:hwiprig, ein ex ternes Kriterium Z1I finden . anhan d (ll'sSPIJ die ~ !l'SS ll ng iihn prii ft \l"pnll'n kan n. Anb-rde m gibt. t's P robleme, wenn die Feststellung des Krtter tum s nur auf einer emz tgen :\h'SSl1Ug beruht. Es ist wenig a ufschluss reich , eine in Zweifel stehende ~ 1 l'SS ll llg anhand eines Kriteriums validie ren zu wollen . d t>SSI'1l Validl tä t nicht erwiesen ist. Das obige Beis piel ist deshalb unrypisch : Xtcht imm er hat ma n die Celegcnln-ir, eine zeitlich frühere Messun g (\\'ahlabsidll bei de r nächs ten Bundes tagswahl ) a nha nd eines spä ter sehr g (' IlII U feststellbaren Kriteriums (Wahh'rgf'bnis) iibl'fJu·üfpli 711 können. ßp i der Krit erlums vahdi rät worden oft ma ls priidiktive un d gleich zeitigc Validitä t un terschieden (pretlirt illc und concurrcni tmlidity) . Belde unter scheiden sich lf'Cliglich da rin. o b ,las externe Kriterium spät er erhoben wird , lind slr-h die Validi tä t de men tsprechend in der Vorhers ago erweist ( predirtillc ), oder ob das Kriter ium glelchzeitlg m it de r Messung erhoben wird , un d sich die Validitä t in ein er Ubor eins rinuuung zwischen d iesen beiden zeigt (conCu rTCllt). Ein Beispiel für pr ädikt ive Validit ät ha b en wir bereits oben anges prochen {wahlab-icht -> Wahlcrgcbnis). Ein Beispiel für glf'iehlt'itige \'aliditiit wä rf' etwa d ip ;" lps.-;llng von .Svmpat bie für eine Pa rte i" un d die Fes tstellung. ob de r Befragt e :\Iitg li('d dies er Pa rtei ist. \\'('nll ..Parteisymparhie'' valid e gemc sv'n wird. sollte sie bot Xlitgliedc m höh er ausfallen als bei Nichtm itgliedern. Dieses Verfuh ren wird a uch als .~\ kthode der lx-kannten Gru pp en" b" zt'iehllf't [vgl. Schnell et al. 2008 . 1.'j9).
Der Übe rprüfung de r K o n struktvalid ität liegt (Ir r Gedanke zug mucle. dass sir-h aus de n t heoret isrh Iwgrii ndha ren ß pzil'hn nw' n des ~ 11 messenrlen Konstruk ts zn anderen Kons truk te n Hypot hesen ableit en lassen. die empir isch geprüft. worden könn en. Wenn man giiltig miss t, müsst en sieh d ie durch die Hyp ot hesen be hauptet en Zusa mmenh änge erupirisr-h feststellen lassen. Aus de r Recht sext remisruusfors rhun g wissen wir , llass Rechtsexrn-mis mus mit. Auslän derfeindl ichkeit und Na t ionalismus einhergeht . Ist
67
die Xlcssung von Rocht scx tn-m lsmus valide, dann müss te sieh ein positiver Zusa mmenhan g zwischen Rech tsext remismus und Anslä nde rfeindlichkeit und Rccht sexr remisr uus lind Xacionalismus zeigen . Zeigpll sich die vermuteten ZIlSamllH'tlhällgf', dann deun -t dles darau f hin. dass die :-' IPSSlI llg valide ist. Zf'igf'1l sk-h die erwarte ten Zusllmllw llhä nge allt>rclings nicht , so kann dies mehrere Ursachen haben : unter a nde rem die, da ss eines der Konstrukte nicht valide gemosseu wurde Olle]" d ie Hypothes en fulsr-h sind . Das ,,:\Ju lt it r1I eines Konst ruk ts vcrstnndon: unter Disk rimh llm zllaliditiit die St ärke des Zusammenhangs zwischen de n mi t denselben Xlethodou durchgeführten :-. ressllug('U verschiedener Konstruk te. Liegt Konst rukt validi t ät vor. dann sollt t' d ie 1\001\'e rgp/ln"alidität höher ausfallen a ls die Diskrimina nz\'a lid itä L
In der P ra xis wird da s ..:-' llIlt itrait·:-'lllltillH'thotl"-' "erfahn·1I in dieser Form nu I' sel t (' li d urchgcfü hrt , weil in der [{t>gd keine a uf vorsch lodenen :-' 1('1hoden beruhenden Xlcs sungen vorliegen. Sta tt OPSS f' lI kann man da s Vcrfuhren so abwandeln. dass zur :-' k ssu llg der Konst rukt e verschiedene Indikatoren. die durch eine :-'h,thode erhoben wurden. hera ngezogen werden (vgl. Schnell e t al. 2UU8, 158 It ).
Aufgaben zu Messen l. Was ht'{\1'1l11't ,,:-' lt'SsPIl"'! 2. Xennen Ste cli!' \'f'rs<:hit'c\Pllt'1l Skalenniveaus lind die Eigenschaften, durch d it' d ips<' charak tonstort werden.
:3. Im ALLOUS Emu wurd en unter ande rem die unt en an gegolx-non Merkmale (in K la mmern: :-' l{'fk tlm\s allsprä gungt' tl) erfasst. Ik-s timruen Sie hirt e das Skalenniveau . • Geschl echt. (m ännlich - weiblich ) • Sind Gewerkschaften für unser Land "..'! {hervorragend - seh r gut - gut - nicht besonders gut - überha upt nicht gut ) • Alter (in Jahren ) • Ein kommen (in D~ I ) • wahlabsieht (e n D - SP D - FD P - Bündnis gO/ Die G rünen - Die Linkt' - Sonstige) • Einkommen (unter :.2000 0 :-' 1 - 2001 bi s ;j OOO n :-' l - mehr als 5000 m l) • Polit isches Interesse [sehr stark - stark - mit tel - wenig - üborhaupr nicht st a r k)
• Religionssugchöngkcit [kat holisch - evangelisch - a ndere ) • Geburtsjahr -I. \rt,ldw der folgenden Ant worten ist falsch '! \r a rn m '!
a) b) c] d)
Intervallskale n haben die Eigens chuften von Xoruinalskalen. Raueskalen ha be n die Eigenschaften VOll Ordinalskalcn . Ordinalskalen haben die Eig"lLsehaft el\ von Int ervallskalen. Ordtnalskalon ha ben die Eigenschaften von Xomiualskalon.
5. Beschreiben Sie mi t eigenen Worten. was Skahcrungsver fahren sind . \ r eldw Vorteile hauen Skalen im Vergleich Zlt einem xlcssinst rumeut aus einem Indikat o r'! G. ß t'sr hreilwl1 Sie die Konstruktion der behandelten Skalb-rungsverfahren. lind nennen Sie die \\"t'st'n t lidlt'1I Vor- lind l'\a dttl2'ilt>, 7. \ras bedeuten die ß f'gr ilfl> Rf'IItY/(l lltierblH"kei l sl.:oejfizi ell t und ltetnA nal Y8e, lind in welchem Zusammenhang werden dic~c' gebraucht?
AuJ!J" oclI
ti!l
8. SiE' haben elnnoues Messinstrument zur Me-sung von Aus länderfei ndlichkeit entwickelt . Dieses führt bei wiederholtet Anwendung zu stahilen Ergehnissen. Zudem korreliert das IIt'lI I'lltwi(:kl'ltf' ~ Il'ssinstrn ment stark mi t ein er - bereits bewährten - Skala zur ~kSSllllg nlll Ausländerfeiudlh-hkeit. Deutr-n diPSE' Hesultate darauf hin. dass Ihr Messinstrument n-lialu-l. valide oller beides ist'? Begründ en Sie Ihre Antwort.
4 Erhebungsmethoden 4. 1 Befragung 4.2 Beobachtung 4.3 lnhaltsaualyse
71 91 96
In diesem Ka pite l gebt es darum . au f welche Ar t und \rpist' milli sich Infonuattonon über einen Ausschnitt der sozialen Hpa lil ä t beschaffen kann. \ \'0111'11 wir beis pir.lsweise wissen, wir' stark Fremdenfeindliche Tondonzen in der Polizei vertreten sind. so könnten wir Polizi st en befragen [vgl. Mletzko lind \ \'('ins 1999 ), wir könnten ab er auc h das vcrbulton von Polizisten gegenüber Ausländern un d Deutscheu in verschiedeneu Situationen (7. R bei Demonst ra t ionen] beobachten und darans Riicks<:hliissf' ziehe n. Ebenso könnten S trufanzotgon oder Dteus taufsn-lusb esehwerdon gPgPII Polizi sten auf ihre Ursache (z. B. Diskr iminierung von Ausländer n] untersuchen. Dami t sind die drei zent ralen Instrumente der De rengewinnung. die auch als P-rlw bullfl$/erhn ikeu «der P-rh ebuufl.mtethodeu bezeichnet werden. bereits u m n sscn:
1. Befragung 2. Beobacht un g 3. Inhaltsa na lyse Mit jedem de r genannt en Erhebungsinstrumente sind bestimmte Vor-, a ber auch Nachteile verbunden. ß!:'i einer ßr[ragutl g von Poliz isten Zll ihren fremdenfeindliche n Einstellungr-n kann ma n nicht sidwl" sein. oh rlie Polizisten Ihre tatsiichllchen Ein stellungen berichten od er oh sie dirsr, z. ß . aus Angst vor Sanktionen. lieber verschweigen. Dir-ses Problern ta ucht bei einer Beobacht un g des Vc rh altc n.~ von Polizisten (z. n. hei Grot,piusiitZI'II ) nich t auf. Allerdings steht hier der Beobachter vor der schwierigen Aufga be . allo rolevanrr-n Ereignisse gb-ich xcit ig er fassen und einordnen ZII müss en.
Insbes ondere Politikwissenschaftler und Soziologt'lI stützen sieh vorwiegond au f Umfragoda ten, weshalb die Befragung im Mit telpunkt dieses Ka pitels steht. Die Inha ltsanalyse ist immer noch eine Domäne der P ublizistik, da sie sich besonders gut zur An alyse von :\Ipdien eignet . während die Beobacht u ng ehe r in 111'" Psychologie zu finden ist.
lk f rugu H.'I
7I
4 .1 Befragung \\'('(II'r für den Befra gten no ch für den Interviewer stellt, die Befragun g eine natürliche, alhäglid lt> Situation da r. VOII I'ÜWIll altt äglkheu Gl'Sprä rh 1111torscheidet sich ein Inte rview dadurch. da ss eine Pers ou {der Interviewe r] nur fragt , während die andere Perso n - einmal ab gesehen von Verständnisfragen - nu r an tworte t. Das ..Ges präch' hat da mit einen stark asym merrlsehen Charakter, Zudem soll die Befragun gsperson einem völlig fremden Menschen zum Teil sehr pl'rsüll lk hl' Oillgp IU"pisgl'lll'll . D ip Antworten sind also kt'ilu' an s ieh schon vorhandenen lnfonuationeu. sondern werden du rch da s Int erview ers t erzeugt. Aus diesem Grund wird d ie Bofragungsslt uati on auch als Stimulus-Response - oder Iiciz-Reattians-Schcma bezeichnet: Dip Fra ge ist der (kiinstl id lt') Rc'iz, di(' Antwort d ie (küns tliche] Rea ktion. Daher ist die Befragun g auch ein reaktives Xlessver fahren . d. h. die Da te n werden durch da s xlossinstrumcnt - die Befragun g - beein flusst . :\[it der Reaktivit ät von Befragungen sind vor allem zwei methodische P robleme verbunden: d if' Tendenz von Befragten. sozial erwtlnsr-ht zu a ntworten. und d ip Tendenz, Anssagen ullahhän gig von ihrem Inhalt zuzustimmen. Sozial erwünscht es Antwort verhalten (,;;oC"i al desirabilit y''] lit'gt vot , wenn die An twor t in Richtung der vermeint lieh vorn Interviewer IlZW " der Gr-e-llscha ft als posit iv b('wprl pll'n Antwort (dem Ort snziulcr Erwiillsrhtheit ) verzerrt ist. Dips wäre r, ß . der Fall, wenn ein Befragter vorhandene Irerndenfeindliche Eins tell un gen nicht ä ll ~(']"t oder abschwächt . weil r-r solehe Eins tellungen als unerwünscht an sieht. Eine Erklä rung sieht (li!' Ursache im Streben von Befragten nach sozial!'r Anerkennung. Bei einr-r wahre n (sozia l unerwiinxr-ht en] Antwor t entstehen für den Befragten durch den \ 'erzk-ht auf sozia[1' Anerkennung Kosten. die er durch so zial als erwünselu a ngt's;>hl' llf' Antworten vermeiden kann (vgl. Reinecke 1991)" Ant wortverzer rungen durch Soz iale Erw ünscht h eit sollte n vor allem lx-i sensiblen Fragen - Fragen, die dem Befragt en un an genehm sin d - und bei Pcrs oneu mit einem hohen Bed ürfnis nac h sozi aler Anerke nnun g sta rk ausgepr ägt sr-i n. Die gesa mte Vorurt eilsforschung ist mi t de m P roblem soxialcr Erwünschtheit konfrontiert . So wurden in den USA Zweifel a n der in Umfragen gemessenen Abnahme VOl l Vorurteilen gegPlliiht>r de r schwarZl'll ßI'\"ülkl'l"lIn g nach dem ZWl'itf' lI \r('ltkril'g lall t. Vermutet wurde. dass nicht die Vorurteile abgenom men ha tten, sondern led iglic h die Au~p run g von Vorur te ilen zurückgega ngen soi. weil die Akzept a nz von Vorurteilen
gegenüber der srhwarzon Bevölker un g ger inger sE'i als noch einige .Iahrzehnte zuvor (vgl. Dovidio lind C aert ner 19SG). Zur Vermeid ung oder Ab-chwächung soz ial erwünschten Antwortverbalsollten diE' FIngen möglichs t Tl ellt7l11 formuliert sein. Dami t versucht man die Rmktivitiit rle,~ Messinst ,.mn wtc.~ abzusr-hwärhen. In den USA wurden zusätzlk-h Zll den traditionellen Skalen zur ~lpssllll g vrm offenen Vorurteilr-n (hlatant prejudicu] Skalen en twk-kelt, dle wen iger reaktiv sei n sollen und auch subtilere Vorur teile er fass en (s ubtil' prt·j llf!ic('). Eint, andere St rategie besteht darin. die Anonymi tät der ß efru gun gssituat .i on zu erhöhen. Im ALLOUS 200G wurde ditoAnotlymitä t de r Befragung IlI'ipinigl'll Itoms zur Einstellung gegenübe r Ausländern (vgl. Abbildung 3.2, S. .19 ) für eine n zufällig ansgewählten TI'i! der Befragten erhöht. Dip Antworten wurden bei diesen Befragten nicht vom Interviewer erhoben. Vielmehr haben die Befragten ihre Antwort ru selbst (und für den ln rervlowe r nicht kontrollierba r] im Co mputer eingegeben (CASI-Sp[it, vgl. S. 23). Xlan sollte erwarten, dass sozia le Erwünschtheu hpi eigener Eiugube der Ant werten eine geri ngere Rolle s pielt als bei Abfr age dur ch den I nter viewer . Ankerdem k:lUII man sozial" Erwüuschthelt direkt ülu-r Sk:l11'1l erfassen (vgl. Rotnecke 1991). Dip Skalen beruhen auf der Annahme, dass sozial erwünschtes Antwortverhalten a us dem Bedürfnis der Befru gt eu nach sozial pr Anerkennung res ultiert . Im ALLOUS ZOOG wurde eine Kurzfo rm der deutschen Fassung der Marlowo-Crowne-Skala mi t zehn Items verwendet. OE'!· Elnffuss des Bedür fntssos nach sozialer Anerkennung a uf das Antwortvorhalten kann mit diesen Skalen direk t geprüft IW'H!en . t l'IIS
:\Iit z ustt m m uu gst e udena [Akquicsscux} ode r ..Ja-Sage- Tendenz- wird ein Verhalten von Befragten IWSl·hril'lwn, einer Frage unabhängig von ihrem Inhalt zuzustimmen. Zusthntuungsteudenzen lassen sich prüfen. wenn mehrere, negativ und posit iv for mulierte l t ems zur Mess ung einer Dirnensicn ver wand t I\"('H!('II. Befragt e, die negativ formulierten Items zustlmmen . sollten positiv fonnulk-r tc Itcms ablohnen und umgekehrt. ß -fragte, die s ieh unabhä ngig von de r Polung der Fra gt' immer zustimmend äubt'rtI. a nt wor ten unplausilx-l und können gegeb enenfalls aus der Alla lys!' ausgeschlossen \1·t' rIII'H , Die Zuxti uunungstendenz ist ein S pl'z ialfa ll eines response rezs. Rl'pollse s rt,~ hezeichnen allgemein die Xeignug von Befragten , Ite tns unabhä ngig von EI.'r zu IIwssl'udl'n Dimension in einer \lI'stillltll lt'n Art und \ \,pist' zu beantworten. Dazu zählen die Bevorzug ung oOP]" \ 'prnu-idung der Mit telkategorie 1'\)('IIS0 wie eine Prä ferenz für die Extremka-
lk f rugu H.'I
tcgoricn. Zur Kontrolle von Res ponse- Sets können in einem ersten Schritt die Ant wor t muste r der Befragt en ausgewertet werden. Selbst wenn de r ß efm gH' gewillt is t, korrekt Auskunft zu geben. lassen sich ~t l'ssfl' h l er nicht gällidi l"h vermeiden . "I. ß . aufg ruud von Erinnerungsfeblem. Allgotuvin kann mall rlavon ausgehen. dass Fragen zu demograph isrh en und biog raph ischen Mer km alen (Goschlochr , Ausbildung, Eintritt in eine Pa r tei. llei mt USII" . ) korrekter beantwortet 1I"1'[(I('n als Fragen zu m Verhalten {z. B. Teilnahme an Demcnst rationeu] lind diese wich-rum
korrekter als Fragen zn Einsu' Hungen ( ~ It'illll n g 1111ll Se-hwangerschafrsabbrurh. Parteildent ifi kat ion nsw.). wpi! demographische uud hiog rap hisdlf' Faktr-n dem Befragten st'lbst eher bp\\'llss t und \\"I'lligpr Hilchtig sind als \ e rhalteil und vor allem Einstellu ngen. Eine rotrospekt iw Frage nar-h III'Ill J ahr der EhpS('hlil'bung dürften die morsten Verheira t eren eiulgermaken korrekt beantworten. Es ist dahor nicht sinnvoll, weit zu riid di l'g{'lIClt, Einstellunge n mi t retrospektiven Fra ge n zu erfassen.
4.1.1 Formen de r Befragun g \ '011 ß efraguug sprechen. meinen wir in (Irr Rpgpl dip ntandardisierte bxw. quantit ativ e ß efmg ullg. 111 ihr ist der Verlauf dos Interviews du rch d ie exak te Formulierun g un d gena ue Abfolge der Fragen fcstg eleg t ., Ab\\'I'id l1lngf'1l davon sind nich t zulässig . Sind die Fra gen und / od er der Ahlanf der ß pfragllllg nicht fixiert . dann spricht mall von einer nicht standardisicrteti bzw. qualitativen fl rf m gung (vgl . Bortz und Dönng 20tlG. J()8- 321). Dip Grenzen zwischen beiden Fennr-n sind fli('h(>ml. Es kan n sieh bei eine r nicht-standardisierten Befrag un g z. n. II Ill ein Lcitfadellge'~lm"ich han deln . lwi dem der Interviewer nur eine Liste WlII T hemen hat , die er in beliebiger Reihenfelge a barbeit en k
\ r etlu wir
Eint' Befra gung kann per sönlich. sr-hriftlir-h, telefon isch und tnt emet gest ütz t erfol gen. Bei der per,~ölllichen ß ef m gllng besuc-ht ein Inter viewer die Befragungsp ersou und fiihr t mit d ieser da s Interview dur ch. Der Interviewcr liest der Ib-fruguugsp-rson dil' Fragen aus dem Fr agebogen vor lind notiert die Antworten. ~ [ it Ausnahmt' von K ärtchen und anderen visuellen Hilfen. die der Ver
74
wird der Befragungsperson ein Fragebogen zum Selbstausfüllen überreicht oder zugestellt. Cb lidwflwisl' so ll die Befragungsperson den Fragebogen zurücksenden. in Ausnahmefällen wird r!PI" Bogen auch a bgeholt . Befragt man ganze Schul klassen in Klassenr äumen. dann können die ßilgt'1I d irek t übe rreicht lind auch unmit telbar lIad l der Bea nt wort ung der Fragen wieder pingpSrga ng('nrn zehn J ahren ctngehilbt. Auch schri ft liche Befragun gen sind hier seit IUUO deutlich zurückgega ngcu [Ta belle -t.t ). I Telefon umfragen (vgt . Frov ct al. 1990 ; Fuchs 199-1 ) sind inzwis chen a m weitesten verbreitot . Besonders dyn amisch entwi ckeln sieh Onlim-I nterviews. d ir vor zehn Jahren noch kein!' Bedr-utung halten , Inzwischen aher fast ein Dritu-l aller Interviews der :\[itglit'lll'rills titul t> rles AD:\I ausmachen. Bortlr-kslchtigt mu ss bei dteson Angaben allerdings. dass O nlme-S nrvcvs vor allem in der Markt forschung eing eset zt werden.
TaIwlle 4.1; Fom ren ein Befragung i Il der :\ fark t- lind
Pers önlich e Inte rviews Telefuninrerviews Sr hriftlirhe Inte rviews ü nli IIE'-t nt erviews
~ leiuuugsforsrhung
WUO 199;) :WOO 200;} G;) % GO % 3-1 % 24 % 22 7(, 30 l)[, -1 1 IX:, 4;) % 13 % 10 % 22 % 9% - 3 'j( , 22 %
200i 20 % -11 % G% 2i %
Qm'llt,; A rbeits kreis Deutscher Markt- und Soxialforschuugsinstitnte c. V. (20IKi . 16) und www. a dm-e v . de Ein Grund für d i" SI' Entwicklung ist in der Kostenstruk t ur zu sehen. Porsiinlidl(' Int erviews sind deu tlich teuror als telefonische Befra gungen . weil die Interviewer vor Or t die Inter views du rchführen. wodurch Ii r-isckosten usw. a nfallen. Telefoninterviews können dagegen zen tral in einem TI'lefonlubor durchgeführt werden. Dur..h die 1998 erfolgte Liberalisierung Aufgrund von Veräuderungeubel de n Mitgliedsinsrituten 111"; . \ Il:\ 1 sind die Zahlen über die J ahre uirht UlllllitwllJilf vl>q.\ Io'i ..!Ilmr .
lkfruguH.'I
des Tolekommuuikarionsma rkt r-s sind d ie Kosten fiir Telefonate im FestIIl'tZ und m it dem Han dy zudem dra matisch gesunken. Die dynamische Entwicklung lx-i Online-Intervicws wurde erst durch die Verbreitung von Computern und Internet anschlüssen in pr ivaten Haush alten miiglirh. Die abnehmende Bedeut ung sehriftlie he r Befragungen wi rd auf eine Ers-tzu ng durch O nline-Erholnmge u zurückgi-fllhrt (vgl. Ar beitskreis Deut sche r Markt- und Sozlalforschungslnstitute ('. Y. :WOG). Der Reiz internetbasierter Umfragen lieg t H II" a111'1Il in den geringen Kos \('11 und der schnellen \ 'I'lt iigha rkl'it {11'r Daten. Im Gpgeusatl lll telefoulsehen Inter views kiinllPIl visuelle Hilfen jt'llpr Art (auch Fihue] verwendet werden. Inrer net baslene Umfragen sind jPl!l)(:h mit besondereu Prohlemen behaftet (vgl. fur eine kritische Einschätzung Schnell Pt <11. :W08, J'j9 f.). O Internemut ver \'0 11 den NichtNutzorn in wesentbchon Merk malen unt orschetden - sie sind Iwisp iplslI"'iso j ünge r. Fü r lx-stimmt e Fragestellungen lind Zielpopulation en können Internet -B efragungen jedoch sinnvoll sein. Die technologische Revolution durch Mikrocomputer hat a uch telcfon isehe un d mündliche Befragungen erfasst. In computergestüt zten Telefonbefragungi-n (CAT T - Computer Assis ted Telephone h ltenJiew ) wird rief Fragebogen progranunier t. O P f I nt erviewer liest d ie Fra ge n während des Interviews vom Bilds chirm <11> und gibt die .Aruwor ten der Befragt en direkt in den Crunputer ein. Automansch wird da nn zur nächst en Fragt' sr'"" sprungen. wobei das Progra mm automansch fiir die rtcht lgr- Filterführung sorgt . Aur-h mündliche Befragungen können so durchgeführt werden (CAP l - Computer Assistrd PCI'sOfw I 17ltrroirw ). Die Inter viewer müssen dazu mi t einem tragban-n Com puter ausgestattet werden. Die Verwend ung von Courpurern ln-i der Dat enerhebung biet et unbestreitbare Vorteile. Es können beispielsweise komplexe Filter führ ungen (siehe- unte n) eiu ges('tzt werden. lI'f'il der Comput er aut omat isch zur nächsten Frage springt. Eine vom Interview getrennt e Erfassung der Da ten entfällt , weil d ie Da tenl'in gabl' wäh rend des Int erviews s tatt findet. CAT I und CAPI sind mehr als program mie rba re Fragebögen. Ca'Fl-Systemc verwalten lwispit'lsweisl' Telefonnummern und führen dl o Anruft' (zur gewünschten Zeit ] aus. Te-
lefonisrhe Erheb un gen werden inzwischen weitgehend romputergest utz t d urch geführt. Der Anteil der romputergest ützten persönlichen Bofrag unge ll (e API) ha t sich zwischen 2UOO und :WOG bei den Mirgliedsinstituten des A D~ I von ca . einem Vierte l auf kna pp die ll älfte verrloppelt (vgl. ..\ rheirsk reis Deutsche r Ma rkt- und S ozia lforsdl\m g~illsti ll1 tf' e. V. 2006. 15: Arbeit skreis Deut scher Markt- lind Soz ial forschungsinstltute P . V. 2()O(). 10). Unabhängig \"(1II der Form der Befragung müssen besriumue Grnnd prinzipi t'1l beachtet wprdl'!l. Im schlhnmsten Fall w>rgissl man eme Fragt' zu st ellen. rlil' für den Untersur-lnmgszweck relevant ist. Xathträglieh kann ein solcher Fehler nicht mehr behoben werden. :\lan sollte s ieh deshal b vor der Entwicklung des Fragebogens nicht nur da rüber im Klaren sein. was ma n erklären will (z. B. fromdoufetndt fcho Etnstellungon \ '011 Polizisten), soudem s ich auc h gena u üborlegcu. welche Faktoren die abhä ngige Vari abl e beeinflussen könnt en (z. n. dieusülche Bolast unge n. da s Einxatzgohiet . die polirische Einst ellung. (!as Alter Oller da s Ocschlecht der Polixcibcamu-n ). \ reib man , welche Aspekt e er fasst werden solle n, SlI kau n man sich a n die Formulierung rler Fragen wagen un d schlil' b1i("h de n Fragebogen zusammonstollen. Boi der Formulierung der Frage n sollte ma n dip im Folgenden gen a nnt en As pek te herürksichtigeu (vgl. CIl[I\'I'(1;e lind Presser 1986: Sudman 1982).
4.1.2 Die Fragen Dip A 'ugejormlllienmg(,1! und die A ntw07t m iigli('hkcit cn prä gen da s Antwortverhalten der Befragten entscheidend {vgl. Sehnman und P resser 199ü). Aus diesem G rund sollte ma ll sieh bei der l nrer pn-ta tion von Umfrageer gebn iSSl'1I nicht 11m d ie \ 'cr tei Inng de r Ant wonen. sondern alieh d ie gt>stf'llten Fragen gerrau a nschauen. So stimmten in einer im Herbst 1995 durchgeführten Umfrage unter den Mltgliedem der rheinland-pfälzischen SPD erstaunliehe 7.t % der Befragten einem La usehang riff zu (Ka teg orien .•stimme HIli lind ga n z zu" 11m! .stimme eher zu"}, wie m a ll einer Er gcbni-dokumcntutk.n 1' IJIIH'h nw!l kan n. Dieses Ergebnis ist weit weniger erstaunlich. wenn man d ie - in der erwähnten Ergebnisdokr uuentution nicht berichtete - Frageformulierung berücksichtigt . Si!' la utete: .Bei der Verfolgung besonders sehwerer Straftaten soll das rechtsstaatlich gerege!to Abhören des gesproe!wlJ('lI \ rort l's zu Beweiszwecken verwenrk-t werrlon dürfen {sog . Lanschangr ttt ).': Dte Einschränkung au f .hesonders schwere
lkfruguH.'I
77
St raftaten' und der verweis a uf dio Recht sst aa tlu-hkeit des Verfa hren s trug sicher zu dieser ho hen Zust immung bei. I1I' i den meis ten Fr agen kann man die Antworten in eine WiE' a uch immer gpwünschtp Richtung beeinflussen. In manchen F älle n scheinen di p .Frager ' \\'Plligpr a n den tat sächlichen Meinungen. Einstellungen oder \ 'I'rha ltens -veisen der befrag te n P P I"SO UP ll interessiert zu soln als an einer 11estä ngung besti mmt er Posit ionen. Die Ergebnisse einer Umfrage könn en da nn x. B. in der politisrhen Ausein auderset zuug ZU I" Stützu ng d(~ cigc111'11 Sta ndpun ktes herangezogen werden (vgl. Dick ma nn 2008 , 4G8f. ). Regeln zur Frageformulierung
In wissenschafrlk-ln-n Umfragen spipl!:' n lJ(-'wus.~tp :-'lalli pll latiOllPn (in de r Regel) keine Rolle. ß l>i 11"1" P uhllka tion wissens chafthcher El"gel lllissp auf Basis von Umfragedat en worrlon d!e Formulierungen der Fragen hä utig m it veröffentlicht . Durch off unslehr llch oinseitig gestell t t' Fragen würde der \r issPJlsehaft1t'r die Glau bwürdigkeit seiner Erge bnisse von Vorn herr-in in Fra ge 1:;(('111'11. Unbeabsichtigt schleichen sieh da gegeu in jeder Umfrage Fonnullerungen ein. d ip sich au f das Antwo rtve rhalt en a uswirken. IIält ma n sieh an einige G rund regeln. kann man jedorh schwerwiegende Fehler vermeiden. Gene rell sollten die Fragen so formuliert sein. dass sil' den Befragten nicht ühe rfordem. Das l)('ibt : • kurze Fragen s tellen . • einfache und allgonn-invcrst äud hche ß cgriffo und Formul ier ungen ver.. wenden. • konk rete Dinge an sprechen. • eindeuüge Begr iffe henntzcn , • (doppelte) Vememungen (l\" pga t ioIlPn) verm eid en . • keine Suggestivfrage n st ellen. lind • keine mohrdimensionalen Fragen vorwenden. In der Frage sollten - wen n möglich - bereits all e Autwort aln-ma riven ..ausformuliert- sein, dami t keine Antwortalternative d ur ch dip XPIIIl1Ing in de r Fragt' bevorzugt wird. Soldll' Fr agen \\"(']"(1('11 a uch als "lmla lll·jn !t"·
Fragen bez eichnet. Es lässt sieh nä mlich zeigen, dass die Antwortalt emat tvo, die in der Fra gt' en th alten iSI, de ut lich meh r Zustimmung er häl t als r-iungenannte Anrwortalremative (vgl. die Beispiele bei Xocllc-Xeumann und Pet ersen 19%. 1:31 f. und 19,)1f.). Balanciert e Fragen sind natürlich nur he-i einer gl'ringt'tl Zah l VOll Aurworralternativen llIüAlic:h. Will man die Zustimmung oder A blehnung zu einer Posit ion messen. wie ps r. ß. bei Likert-Skalen der Fall ist, dann können keine "lmla udprten" Fonnulle-
1]('
rungen verwendet werden.
Man kan n vermuten. dass dip nhen genannten Antwor ten rler rheinlandpfälz isdwlI SP O-:-'litglil'{ll'r zum "g rok n La uschangriff" anders ausgefalII'n wären, wenn eiue ba hm t:ir rtf' Frage formuliert worden wäre. t>twa in dpr Art: ..Sind Sie der :-' Ieinung, dass bei der Verfolgung Iwso ndl' rs Sd lWPrer St raftat en das Abhören c\1'S gpsprodl('llrll \r ort l';; zu Bowetszweckou verwendet werden da rf oder sind Si!' der Xleinung, d ass bei der Verfotgung lx-sonders schwerer Straft at eu das Abhören des gesprochenen We rt os n icht verwendet werden darf". Als Antwortka tegorien könnt e man vorgeIWII ••sollt e nicht verwendet werden" und .•soll te ver wendet wr-rdr-n". Eine Skala von .•stimme stark zu" bis .Ielme stark ah- ist hier nicht mehr möglich, da die Frage ja mehrere Pos it ione n e nthält . Da rau f, dass die Schärfe der Formulierung ("b,'Sollllt'Th schwere Straftaten"] das Antwortverhalten hl'{';nlillssl, wnnle hnt'ils hingewiesen. G"llerpll gilt, dass dir- Fra ge n so kurz wie möglic h sein sollten. dami t der Befra gt e a m Ende des Satzes a uch noch weib. worum es geht. Dies ist bei mündl iche n un d telefonisch durchgefüh rten Int erviews wichtiger ab bei sch riftlichen Befragungen. in denen der Befragt e d ie :\Iög lichkt'it ha t, sich die Frage mehrmals d urchzulesen. \r icht ig ist Iwi bevölkerungsweiten Umfragen aurh , dass mall einfache und allgem ein ncrstiir ullichc ß egriffe vorwendet lind Fre md wörte r vermeidot , da man nicht bei allen Befragten von einem gtetch groson Wor tschatz ausgehen kann: Statt ..pa rt toll- schreibt man also besxer .jeilweiso'', und vers t ändlicher als , ~-\pplikatio ll" ist sieher .An wondung- . Versteht ein Befrng tor die Fra gt' nit-ht. , so besteht die Gefah r, dass er einfach irgendetwas ankreuzt oder die Antwort verweigert . Vor dieser Unannehmlichkeit kann man d if' Befragten in der Rpgt'1 uhuf' griii.t'rt> Probleme lx-wahr en. Die Sprache sollte der Ziplgruppt' der Unters uchung an ge messe n sein. Schon schwieriger ist die' Forderun g. nur nach konkret en Dingen zu fragen. d . h. abs trakte ßl'grifft' zu vormetden. In Umfragen findet sich z. ß .
lk f rugu H.'I
79
häufig die Fra gt' ..W it, zufrieden sind Sie mit der Demokratie?". Hier kann ma n den Antworten nich t viel abgewinnen . d a man nicht so gcnau \\"{'ii.. W
S Uyy cBtivfm !Jcn, d. h. Fra gen. du rch deren For mulier un g den Befragten t'ine bestimmte Antwort na!wgrlpg t wird, gl'hÖfl'lI in den Bereich der Xlanipulatlon und sind schlicht unzulässig. Eine Suggestivfrag e wär e et wa .Stnd Sie auch der Meinung . d a ss die Ausga ben für B.-\fiiG viel 711 hoch sind?". Die Fra g!' .Bind Sit' für di e \ 't'r rin grrullg \"11\1 Trf'ib hausgaSl'lJ und eine Iängere Laufzeit von Acuukraftwerken" ist aus einem a nderen Grund falsch. l lier handelt es sieh IIlll eine m ehrdim ensionale Frage, rl. h. eine Frage. die verschiedene Aspekte bolnhnltet. Dies e verschiedenen Aspekte können nich t get renn t beantwortet werden. weil sto in einer Frage zusa mmenge.... fasst s ind, Im Beis piel zwingen wir den Befragten. entweder die Red ukt io n \"IlU Treibhausgase n lind lä ngr re La uft l'ih ' t1 zubeftirworten ode r bl' idl's al,.. vulehnen. Dem Befragten wird dami t clip :-' liiglirhkl'i t genommen. sir -hfü r rlie Klim aziele unrl grg r n längere La ufzeit en zu äll~i'rn un d um gekeh rt. Zwei Dimensionr-n in einer Fra ge sind deshalb unbedin gt zu vormolden. Ant wortformat e
Ents cheidend für die Ergebnisse einer Umfrage ist au ch . ob A' I/wor/ alt ernativen vorgegeben worden (gcsc hlo$$cne Frayc7l ) oder die Befragt en in einem dafü r \"Orgf'SI'!Il'\Iell freien Feld e int' A ntwort nied e rschreila-u künnen (offC7le Fra!JC7l ).
Üblicherweise wird man geschlossene Fra gen dort einsetzen. wo die Antwortmöglichkeiten bekallnt und begrellzt sin d. Um geschlos sene Ka tegorten vorzugf'l H'Il. IiIUSS ma n 1ilso schon wissen . welche A nt worten gl'ge bl' lI werden kö nne n. Das einfachste Boispiel ist hier d as Merk mal Cesehleclu mi t de n Auspr ägungen mä nnlich und wetbltch . Offene Fragen gibt ma n den Vorz ug . wenn ma n noch keim' Vors tellung davon ha t , was die Bcfrag1l'1I a ntworten werden: die Kenumis HIwI' den U nt ersuch un gsgeg en st and a lso noch ziemlich gering ist. Offene Fragen sind a uch dann gl't'igm'tl' r a ls geschlossf'll<', wr-nn dip Antwortmögllchkeiu-n 1tllhf'g rf'llzt oder zumindest sehr dl'l fält ig sind. Um Iwispi elswPiS(' das Elnk om men oder (las Alt er hinreichund gerta u '1. \1 erfassen. müss ten se hr viele Ka tegorien verwe ndet werden . wäh ren d bei ein er offenen Fragt' nu r ein Feld notwendig ist. Auch bei a nderen Fra gen. wie et wa nach der Za hl de r a m \"0 1'tag gera ucht en Zigaretten , sollte ma n sielt üb er leg en . ob m all nicht die gen aue Zah loffell erfa sst . Dip Kat egurisieruug selbst IW1'inHusst nämlich das Aut wort vorhalten. Bei nied rigen Antwortvorgaben [0 I 1- 4 I 5-9 I 10- 19 I 20 un d mehr] wird man wahrscheinlich einen nipdrige rell Zigarettenkonsum ermi t teln als bei hohen Antwort vorga ben [0 I 1- 19 I 20 -29 I 30 -39 I 40 und mehr]. weil die K a t p~ gorlsiernng An haltspunkte fiir die Einschät zung des l'igf'IlP ll Verha ltens liefert {vg l. Schwarz 1'1 a l. 198Zi) . Auch die Reihen folge der Ant wortvorgaben und deren Visualtsierung kann da s Antwortverhalt en lx-eiuftussen (Beispiele finden sich bei XoclleNeumann lind P ct ors eu 199ü, 191 "20 7). Reihenfolgeeffekte la ssen sich kontrollieren. in 111'1ll die Ab folge der A nt wort kat egorien zufällig variiert wird. Dies ist nat ürlich nur bei Il1lymrrilletCtl Antwortkategorien {nominale Xlerkmale) sinnvoll. Einen Kompromiss zwischen gesr-hlosscnor lind offener Frage stell t die Hybrid/ m ge da r. Hier hat der Befra gte die Möglichkeit , eine vorgegebe11\' Kategorio a nzuk reuzen. Tr ifft keine dieser Kat egor ien zu. so kann de r Befr ag te in einem Feld .S onst igos" offen ant worten. Die f rage nach der \ \'ahl al lSirh t , eufgrund der üblicherweise WfI\,t'IIlI('\ I'n For mulierun g a uch .,SOll1lt1igsfragl'" gen a nnt , ist ein Beispie l fiir eine Hyb r hlfr a ge (vgl. Abbildung -t.t ). Die Antwort möglichkeit en bei der Wahlabsiclu sind lll'gn'llzt und bek annt - nämlich d!o kandidierenden Pa rteien. Da bei einer ßUIIdcsta gswah l a ber schon einmal :10 oder meh r Purteieu antreten. wäre es Ilbr-rtr leben. alle a ufzulisten . zuma l manche Pa rteien selte n oder nie ge-
Befmyull.'l
nannt würden. :\11111 gibt also nur dir- Pa rteien vor, die ITH'iH h 'IlS genannt werden und lässt di e :\liigliehkeit zu. neben dem Feld ..a nd ere Pa rte i" ei ne nicht aufgefüh rte Partr-i zu nennen.
Abbildu ng 4. 1: Sonntagsfrage im ALLß US isso
".
__ ._,
I .- ~-~
I
__., _ ..... . -_ . - __ s.. ........... .....
Samu9~
1- e __ m6fIIcI" I
COU b. .. csu
-------
... .......... 0.. ...... ...... 0 ~0-.-I---~ ... .. ~
.-
I_
~s
__
.., _
Abgeoo
I
Sonroeg WoIJl ...... _
_
.___
s.. ....... ...._ _ _ ...-1 I - !!!!! -- ~I
-
..... .... .. ... . 0"
... - .. . .... .... .... . . 0" r .D,p. ... . ..... , ..... 0" ... ... .. .. ....... 0 ~.. ......... .... ........ 0 " ~
,
'"
.. .. .... 0..... . ...... 0" .... .... 0 -
--
cou bI'w. CSU .. .. . ..... ... 0" seo .. .... .... .. . 0r ,D.p,
.... ........ ... . - ... . 0-
--""l_ .. ....... sew ........ ... .. ......
0 0 .. .. ... . .... 0 ~_P-(- -~ ... " 0
------
" -
.. .. ... .... . 0 .. . .... ..... . 0 " .. ....... .... ... 0 -
-
Gpschlos.<;('nl' Fragen haben ganz allgem ein den Vortell. dass d urc h dip Sta ndardisierung der Aur wortcn di « Aus wert ung der Fra gen erlr-iehtert wird. Die offenen An tworten müssen zunächst alle erhoben werden . bevor ä hnl iche Antworten zu G ruppen zusa mnu-n gefasst werden können . Ers t nach diesem Prozl's.~ der K(l tc!lori.~ iel'1m!J kann dip Aus wertung ls-giuncn. Dies ist ein zeit- und kostena ufwändiges Verfuhren. vor allem bei groj,e ll Umfragen. Zudem ist die \ 'prglf'ir-h har kpit der Ant wort en Ilt'i gf'S{·hlosSl'.
neu Fragen höher als bei offenen. ~ I it dem Verzicht a u f otfono Fra gen ist allerdings imm er ein Informa tions verlust verbunden. E ll t~r1 11'i ( lp t
ma n sich für gpsdl losSplW Fragen. so llIUSS ma n
?\W' i
Dinge
heaehten: Die Antwortkategorien müssen dit' Bandbre ite /Ilöylichrr AlIluiarten ersrhöP!clill abdecke'l . Zudem müssen sieh die i' i n ~plt u' ll Antwo rtmöglichkeiten ge9en.~eiti9 (w.~ ,~ chließen. Die erste Forderung nach Vollst änd igkeit kan n mall orfällen. indem ma n im Zweifelsfall eine Rest kategoric .S cnstigee'. ".-\m]ere" etc. vorgibt. Ebenso iSI die Forderung nach Allssd llip!-lk hkeil SI'[bs t \"t'Tstä ndlieh: Ein ßt >fragt pr da rf sich 1I11l' in einer dpr vorgegf'lw tWII Ka tf'goril'lI wirxlerfimlen , d. h. die Ant wort möglichkeiten dürfen sich nir-ht überlappen. Bei IIfcJl,j arhalllwOIt ell wird den Befrngt en die ~ liigl kh kp il eingeräumt . mehrere Ka tegorien a nzuk reuz en . Dips steht nur sch einbar im ,r idt'fspnu-h zum P rinzip. dass sich die Ant wor talt cruat lven gegenseitig aussch lieN.'1I müssen. da hier mehrere Fra gen in einer Frage ( llJ(' i~ t a us Pl a tzgründen] zllsa mllll' llgpfilss t werden. ;"I it der in A bbildung 4. 2 da rgest plltPII Frage werrh-n ? B. Vereiusnutgtiedsrhaften ermit telt . Hier sind mehrore Nennungen möglich . Kreuzt ein Befragter ein Kästeheu a n, dan n 1)('deutet dies, da ss er ..~ li tglit'(I·· in einem bestlnuun-m Vereins typ iSI; wird nicht s a ngl:' krt' uzt . heil.t d it's, der Befragte ist .kein ~ litgli l'( I " . Diese Iwide n Antwort möglic hkeit en für jeden genan nten P unkt [hier: \ 'p rPi n ~l y p ) sehliPN' n s ieh als o gegenseitig a us. Dip ein zelnen Ant werten mÜSS1'1l jeweils als l'igPIlI' Ve rf able kodie rt werden. Als Ergebn is dies er Fra ge erh ält mall fiinf Variablen m it jeweils zwei Antworunö gfichkeitcn. Schnell 1'1 al. (20U8. :33:3 f.) sehl agpn zu r Feh le tvermeid ung vor, j ewei ls beide .-\ntwort mögl ichketten vor zugeben. In Abbildung 4.2 mü sst en pro Verein also j ('\\'Pi!s zwei Kästchen \'orgpgt'lwil werden , die mit ,, ~ li t gli l'( l" hzw. .kein ;"litglil'(I" 1)('schrtftet werden müssten.
Ein e besondere Form gesr-hlossencr Antwortkategorien sind Rat ing. For ma te, wie sie auch für die berei ts mehrfach verwendeten Aussagen zur ~ fpsSU llg ausländerfeindlicher Ei nstellungen im A LLß US 200ü verwendet wur den (Abbild ung ·C 3). Bei Rat ing-Formaten kön nen ßeffllgte lhre Beurteilung in a hgest ufte r For m vor nehmen (YnJ nlTlde Anrwor talteruar iven]. ßei den Al. Lß lj g- It ems wurde olne siPi,,'nstufigt', bi ,JO[lIre S ka la von stimme iiberh lJll1Jt nicht zu - 1 - bis sti m me voll und ganz zu - i - verwendet . ~ I i t der Zuord nun g de r Zah len wird hezweckt , dass die Abst ände zwischen den Skalenpun kten von den Befra gten als gleich
Befmyull.'l
Abbildung 4 2: Frage mit Mehrfachantworte n Sind Sie Mitg lied eines Vere ins? (Mehrfa chnennun gen möglich) 0 0 0 0 0
Gesa ngverein Sportverein Heimatverein Caritativer Verein Ande rer Verein
interpret iert werden und die Itoms da mit a uf Int ervn llskaleu niveau mesSI'II, Oil'se Ann ahme ist prüfba r {vgl. Rost 2UU4 ). Häu tig werden auc h fün fstufig e Antwortalternativeu verwendet . Die Za hl de r Antwort s tufen hängt davon ab , in welcln-r Differeuziertl u-it ma ll \'011 den Befragten eine Beurteilung erwarten kann. Die vorhandene Präfe re nz für Ra uug-For ma tc in Umfragen hän gt a uch da mi t zusammen. dass m it der Unt ers tellung gleicher Abstä nde vwische u den Skalenpun kten die Auswertung der Da ten vereinfacht wird. Abblldung 4.:3: Rating- For mat mi t sil'lH'lI Stufen Stim me Oberhau pt nic ht zu
,
St imme
,
1 2
, 3
~
vo ll und ga nz zu
,
;
,
6
7
Diskur ier t wird , oh mall eine gerad e oder - wir' im Ol'is pil:'l - ungeralle Za hl von Alltwort katf'gorie ll vorgibr . Bei gerader Zahl der Ka tegor t-u existiert h'ifll' mittlere Positio n; wodurch die Of'fragt f'll Zl1 einer Poslt ionierung in Hk-htung einer der beirlon Enden der S kala gezwungen werden. Für d ie Vorgabo eln or mlttb-ron Ka tegorie spr icht, dass man kognitiv sehr wohl " im' neu t ral e Position einnehmen kann. Xachtcilig wirkt ex sich allerd i ngs a us. wen Tl Befra gt r- d i(' mi tt IN!' 1\ategorie \\"iihlen, um 11usz udtücken , rlass sie keine Posi tio n zu rliescm ltem einnehmen. 111 diesem Fall miss t mall Pse udo..Metnungen ( Jlsewlo- opinio 71.~) . Durch die explizite Vorga be etnor ,,\Ye ib- nicht "- Ka tl'gor ip (vg l. das Bl'i spit'1 in A bbildung 4 .1) fü r ~l l'i-
nungslcsigkcit (non-attitude ), kann man dies verhindern. Dto ,.\\"eib-llicht"Ka te gorie sollte bei mehreren geordneten Anrwortnlrcrnarivon auf kein en Fa ll als Mittelkategorie verwendet werden. Ohne get re nnte Er fassung der ..\ \"t'il>-nidl t"-Ant \\"ort l'n kann man bpi der Auswertu ng de r Daten auch nicht mehr feststelh-n, ob t'i ue fehlende iII halt 1k-he Auga1)1' a 11 f ~ [ei unugslosigkolt (n on-atti tIJde ) ode r Antwortvorweige run g ( item-,w ll- f"esl'm~~e) 1)('ru ht. Es ist natürlich auch möglich. Befra gte ohne ~I "i llun g zu filtern. Zunächst wird dann gefrag t , ob eine ~kinung zu einem konkret en T I\{'um vorhanden ist. Ledi glich den Befra gten mi t eine r ~ Ie illlln g werden die Antworten vorgelegt . Eine Filte rführung für xlcinungslosigkeit zeig t den ß E'frag tell d ie {,l>git il1lilä t e iner solchen ß t'a utwort llug noch (It'lltlidwl" als eine Antwortkategorie "weil> nicht" (vgl. Sehnoll 1'1 al. 2008. 337). Andererseits InUS." be fürchtet werden. dass ~fpi llu1Jgsl osiv;k"i t durch einen Filter üherschä t at wird . Dor Fi lter s" IIJS t mag als Hin wels auf ein e S(·hwit'rigl' folgende Fra gt' interpretiert worden und auch ßt'frag tl>, Ilil' eine l\ll'iuuug haben. zu einer ,.\ \""ib-uieht"- Ant wor t lx-wegen. Die wahl der Antwortkategorien bestimmt das Mess niwe u lind damit die 7llIäs."i gl'lI Auswertungsverfahren. Gibt ma n a uf dip Frage .Sollte man Ihr er Melnung nach d ir- doPW111' St aatsbürgerschaft e rla uben oder solltc ma n die doppelte St ua tsbiirgerschaft nicht erlauben?' die Antwortaltemativen ,.';ol1te mall e rla ub r-n-, .sollte man nicht erlauben- und .,weit nicht" vor. da nu ist die Variable nominal skaliert , Ma n hä tt e aber auc h eine fünfstufige Antwortskala von .st imme \"011 und ga ll1. zu" bis .Iohne \·011 und ga nz ab- ab Antwortalternative wählen können. wobe i die Fra ge dann nur noch eine der beiden Positionen enthalten kann . etwa: .Dio doppelte Staat sbürgerschaft sollte erla ubt werden". Dieses Merk ma l wäre
ordlnal skaliert. 4.1.3 Der Frageb ogen Xach der Formulierung 11t'1" einzelnen Fragen muss iiJlt'r deren Anordnung im Fra gebogen nach gedach t werden. Nich t S,,!t I' 1I \1"('f<1I'11 Int er views von Befra gt en abgebrochen. weil sie sieh scheinbar endlos hi nziehe n oder zuviel Konzentration erfordern. Die ßpfragun g wird nu-is t du rch so genannt e A.u{ wär mj ra!fC7I eingelei te t , mit denen man ditOXeu gin und das Interesse dl's ß efragtl'n für d
Befmyu ll.'l
Befr agung ges tellt. Stellt man demographische Anga ben a n den Anfang. dan n riskier t man bei Befragten, die an der Anonymität ih rer Anga ben zweifeln . eine \ '('rwt'igt'run g des Int ervie ws. Durch dle Fr age n 1.lI ih re r Pt'rson können dies e in (Irr ß r fiircht llng lx-stärk t werden. dass sie tdomtftz k-rt werden könnt en . Es kann jedoch auch sinnvoll sein , die Fra gen zum eigent liehe n Untersuchungsgegenst and nicht zu Beginn eines lnterviows zu stellen. wenn diese un a ngenehme oder schwierige Sachverhalte bet reff en. In diesem Fall kann man mit einer anderen. einfachen inhal tlichen Frage beginnen. Zu Anfa ng (11'1" n" rra gullg gilt rs . (11" 11 Befrugteu nir das lutervlew Zl1 gewinne n. 11'01)t'i die erst e Fragt' I-Oll a ussch laggt,llI'lIdl'l" Heden t ung sein kann. Eine Grund regel für dip Fragen anordn un g bei Xlehnhomonumfragen h p.. st eht darin . Fragen zu einem Thcm cnko mptea: zusamm enhän gend zu s telleu. Auch die Fragen zur Demog raphie können in einem Block tueist am Ende (II'S Interviews - gestellt werden . Celegeut.lich ist die Trennu ng von Fragen ZUIll selllPll T hema sinnvoll. um llalo-EjJrkte zu vermeiden . Da nmt er wird dit' unerwtlnsrlue Auss trahlu ng eiuo r Frage auf die nachfolgende Frage vorstanden. So kön nte z. ß . die Frage, ob man für die Todess trafe sei. nach mehreren Fragen zur Kriminalitftt in der Ge sellschaft höhere Zust lrnmnngswerte liefern, als \\'1'1111 IHe Fragt' davor gestellt wird. Im ALLßDS 19f1O wurde rlio Reihr nfolgl' der T hom enblöcko so fest gelegt : Poliuk/Cesellschaft . AIDS, Soziale Nonnen . Dout scho Einheit , Domographie. Cosellsch aft und zuletzt noch ein paar stat ist ische Angaben zum In ter view. unt er die die Sonntagsfra ge gem isch t wurde. Die Wahlabsichtsfrage wur de aus dem Themenblock Ccs-llschalt / Politik herausgenommen. um eine Bl't'in tlusslln g dur ch zuvor gt'stelltp Fragt'll llliig1ichsl gering zu halt en . Ebe nso sollten s chwierig zu beantwortende Passagen mi t ein fachen Passagen abwechseln. U lll die Konzent ra t ionsfä hig keit der Befr agt en nic-ht zu sohr zu strapazieren . ..... ux diesem G rund sollte da s Interview auch nicht zu la ng sein. Allerdin gs können lc-iue einheitlichen Anga ben zur vert retba ren Ui"y p ci"c,~ lntcmicun gemacht werden. Die verr rethare Da uer des Interviews hängt von der Rt'lt'\"anz der abgefra gt en Themen für die ßt'Fragt r-n lind der Zit'JgrupJll' der Befragung ab. Xach Angaben von Ha uefeld (1987, 23:J2;3S) wur den bei de r ersten \\'('111' des SOEP in der Stichprobe A .Dcut schc- zur Beantwort un g des Hausha ltsfragebogens durchschni tt lich knap p 20 Minu te n und zur Beantwort ung des Pe-rsom-nfragebcgeu s durchschn ittlich rund 30 Xlinut en benöt igt . l n Tabelle 4,2 ist die Inter-
vicwdauer für den ALLBDS lUg..! und den ALLOUS 1998 wiedergegeben. Mehr als 35 % der Interviews dauerten jeweils länger a ls eine St unde, Tabt>llf' ..\.2: Interviewdauer hl'i AL LBUS- Umfragt'lI ~ li ll llten
20 bis 39 40 his 59 GO bis 74 75 his 99 mehr als 100 keine Angabe
(Befragte]
199..\
li %
..\-t % 22 % 12 %
2% 4% 1UU% (3..\50)
1998
9% 5..\ % 25 % 9%
1%
2% 10U %
(32341
Filtcrfruy cli dieneu dazu . das Interview ahzukflrzen. wenn auf den BI'fragten bes timmte Fragen nicht zutreffen. Fragen zum Ehepart ner kÖlIIlI'lI Iwispielswrisf' übersprungen worden , IH'Hn der Befra gt e nicht verheiratet ist. Ein Beis pie l für eim- Filter frage ist die Pa rteiident ifikation (vgl. ..-\Ir hilelling ..\A ). mit der eine la ngfrist ig st a bile psyd lOlogisd lt' Bind ung a n eine Pa rt ei gelllcsSI'n werden soll. Der Befragte soll zunächs t augobon, o b er überhaupt einer Pa rtr i zuneigt (Fr a ge 3D in Abbildung 4...\) . W it' man an hand der Angaben für den l ntervlowor am recht en Ra nd des Fragebegens sehen kann . geht de r Befragte bei ein er "Ja"-Ant wor t auf Fragt' 31. wo er die Pa rtpi angeben soll. verneint er die Fragt' :.m. sp ringt er da gcgcu au f Frag!' 32. In mün dlich en lind tel efonischen Befragungen lassen skh meh r und komph-xcre Filter einsetzen , da dioso Befragungen von In tervie we rn du rchgeführt werden, die dafür gesch ult sind. In SI'hriftlidl('1I Umfragen sollte dagegen mit F iltern sparsam umgegan gen werden. SiE' sollte n d un-h den Befr agten leicht ua chvolb-iehbar sein un d du rch ein enrspn-chendes Layou t des Fragebogens un ters tützt werde n. Der ALLOUS 1!)!)O, dem wir 11ll Sl ' H ' Bl'ispil'll' ent nommenhaben. wurde mündlich du rchg eführ t. Computergestützt f' ß pfragulIgPIl (a uch \\"eh-Sllr\"pYs ) erla uben den Einsatz komplexer Filter , weil d ie Software die Filterführung übernimmt. Vor
"
lkfruguH.'I
Ab bildung 4.4: Pa rn-iidentifikat ionsfrage im AI.Lß US 1990
30
..,...."-- "' ... _ ... . . . - _ 1AnQoo<&ZM _ _........... poMIoc/lIIfo
'u._ ... _ ..aN&n_ W... ... dao b&<
_ ~~"""'.u
" - ' Soll - gan.- .......-. _ I>&stwnml.... _ ....1
31 .
--
. . . _...-.
p."",
Noon •. , ... ,
,.,...
h>om;
_<>t/'>60 -
.
s-o Soll ..... 1>01I&"""'" "OCh, "_ p...... _; , 1~·",
••-!!.0' ' 000" .-.".-.-.-. -. ~ c c , o o, o " , . Q : :~ . !~ _
__ .·no".&8
... .. . 0·
.-
0"
couw.._csu
00-
,~
F_DP _
m>o
0"
. • • . . , .• ,
0-
~.
D;oGo-..-
'"
_ _ . .. . . • . • • .
.
~
SEW .. .. . .•.•••.•..•
-
D;o!'lopullllk_
. . . . .• , _
_ . _.und """
32 _
'lun '" """'"'~,...-...Thoomo
_s;,, _ _ """ ... "' ..........
D'
0-
00-
O·
~-,
gf>ns wichtig. Eine ülwrsithtli d w Gl'stalt llllg erleieluer t das Ausfüllen rles Fra gplmgf'lIs. Bei der PI'fSiilllichl'1l uurl telefonischen Befragun g spil'lt das Layo ut dagegen keine so grob!> Rolle, da (Ir r Inte rviewe r sich '·0 1" dor Befragung mi t rlem Pra gl'ho gl'll (in gedruckt er oder ele ktronischer Form) vert raut machen kann.
O b d ie Befra gten m it den Fragen un d dem Fragebogen zun-rht konmn-n. wird mi t Pn:te.~t<~ iiberprüft , ß f'i einem Pretest wird der Fragebogen und gf>W, llI'lIl'ufalls einzelne Fragen llor der f> igf>lItlidlf>1l ß efra gung an einer Stiehprohe a us der Zielpopulation getestet . P u-tes ts geben unter anderem Aufschluss ülu-r P robleme im \ 'I'rstäncillis OII"r der Anordnung von
Fra gen. über das Antwor tvor halt en . über den zeit liehen Umfang der Befragung. über Abbruchquoten etc. Für P ret ests wurden verschiedeue Tech ulken ent wickelt . Zur Ülll'rpriifung des Verst ändnisses einze lner Fragen bieten s ich kognltlve P u-tests an . Dabei werden di r gegebenen Ant wort en hinterfrag t . die Befragten werden aufgefordert, den Antwortprozess lau t zu art ikulieren oder die Frage mit eigenen wert en zu wiederholen (vgt. die Anwendung dieser Teehulken bei Kur z et al. HHl9), Eine qnami tat iv or tentierte ),, (plhode Will P re test vou Ca'J'l-Inu-r vicws timid sieh lx-i Faulbaum I't al. (2UO:l). Bevor d ie Umfrage ins Feld geht, mus s in jedem Fall der kompll'tlf' Fragf'hogt>n gl'tf'slf't werden. Dab f'i zeigt sich. oll tlie Filterflihrung und Kodierung der Variablen Iunk t ionlort , wolcho Fragon Xachfragen der Befragten verursachen, wie hoch die Antwortverweigerung ist , ob die Ant wer ten der Befragten variieren US\\', Die Süchprol»- sollte a us reh-hond grob sein. u m solche Probleme ft'StwSIt' I\<'II,
4 ,1.4 Der Abl auf der Befra g ung Xach de r Entwicklung des Fra gebogens werden zunächs t d ie Befragten aus gewählt. \rit' dles gpschipht undwas dalll'i zubeacht en ist, Wt'l'clP ll wir in Kapitel 9 behandeln.
Die A nkiindiYIl Tl[J siee h ltc"vicws soll auf den Besuch de s lnn-rviewer s lind das T hema rler ßl 'fraguug vorbe reiten. Der Inter viewer kann da nn hl'i seinem Besuch noch einmal Xiilll'rrs zur Fragestellung erläutern. Sehnft liehe lind telefonische Int er views werden in der Regel nicht angekü ndigt , auch wenn dies möglich wäre. In einer schrift lichen Befragung wird im A'k~ ch rc iben ,hf' Fra gestellung der Unters uchung erklärt. in welchem Auftrag tHe Unt ersuchung du rchgefüh rt wird usw. Dieses A nschreibe n ist für (Hf' Teilnalunebereit schaft eine r ausgewählten Person von ßl' dl'll tllu g, ..... m sd l\rlt'r igsten ist es sicher, einen Befragten a m Telefon zur Teilnahmebereitschaft zu be wogen. Die Heuuuschwelle. hier einfach aufzulegen, ist nicht besonders hoch. Der nächste P unkt ist d ie Zu,~ i chenmg VOll A nonym ität , G ru ndsätzlich gilt für die Dur chführu ng seriöser Umfragen, dass Elie Angaben der Bl'Fragten vertraulich beh amlelt werden. Adress en usw. soll ten getrenn t von de n Antworten aufbewahrt lind spä tt'r vernichtet wer-den. Es darf keine Ident ifizierung. t'lnt' verknüpfung der Daten m it anderen Infonuattonen oder eine Weitergabe der Daten ohne vorheri ge Anony misicrung erfolgen.
HefmY1JIlY
Dips sollte a uch dem Befragten kla r gcmneht werden . Ob die Anonymität de r Befra gun g tatsä chlich gewährleis tet ist . kan n von den Befr ag ten a llpn1ings nicht kont rolliert. werden. Rl'i der mtindllrhen und te lefonischen Umfrage. lx-t denen die Ad l"(,sst' bzw. Telofon mnnm er Ot'S Befra gten dem Interviewer bekannt si nd. sollte rlem Befra gten deshalb gla ub haft verslchr-rt worden. dass seine Anga ben vert raulieb behandelt werden . Br-i de r schriftlirhr-n Befrag ung ist die se Zusicherung für den Befragten leichter na chvollziehbar, wr-nn de r Fragebogen ohne Angabe e ines Absenders zurückgesende t werden so ll. Allerdings is t eine schriftlich!' ß t'fra gu ng nur dan n ano nym , wenn die Fragf'hi\ gt'lI nicht mit einem eindeutigen Code gt'kt'llnzPichnt't s ind . der die Zuordnun g zum Befra gt en ermöglicht. EiIU' Ken nzeichnung der Fra gebö gen erfolgt häufig. um diejenigen Personen . die nach einer \\"I'il(' noch kotnon Fra gebogen zu rüekgesan.h haben, erneut anzuschreib en und um Bea nt wortun g zu bitten. \\" ähn'lld ,11'r Befr ag ung sollte der Befr agte m it dem Int er viewe r alleine sein und sieh ga nz a uf dip ß pfra gull g konz ent rieren künnen. Ankerdem sollte die ß l'fr aguligspl' rSilti nicht durch andere EilllHissf' gpstört worden. Solche UlJlgcb1J71g.~bcdingungcn lassen sieh kontrollieren, ludom s lo vom Interviewer erfass t werden nnd dami t für die Auswer t ung der Da te n verfüg bar sin d, Dies ist allerdings nur bei rler mündlichen Befragung gilt prnktizierbar, wäh rend beim Tclefoniutervtow externe Einflüsse meis t nur era hnt werden köuueu. Beim schriftliche n Intervi ew ist eine Infor ma t ion üb er d ie Befr ag ungssitua tion völlig unmöglich , Zu den Umgeb ungsbedingungen gehören auch bewusste lind unbewusste Beeinflussu ngen durch ,11'11 Interviewer. Unbewusste lnterviewcreffcklc t reten IJI' i mündlichen un d tclefonischen ß pfra gu ngen Im mer auf {vgl. Korh 199 1; Rpinpekp 1991). Fiir das Antwort verhalten maneher Befra gte r spielt es ehen eine Rolle, 11'1'1ehern l nter vtewer ma n gogenübor s itzt (ju ng oder a lt . Man n oder Frau us w.). Au ch am Telefon kann ein solch er Effekt d ur ch die Sthn me oder den Dialekt des I nterviewers verursacht werden. Das folgende Beispiel für einen Interviewereffekt basiert a uf Da ten '[I'S ALLßUS 1990, Dort wurd e mit meh re ren Statements verxucht , a bweid Wlldl's Verhalt en ZIl erfa ssen . Der Fraget ext laut et e: ..Bitt e sagPlI Sip mir j p\\,pils 1lI i t 11 llft' dieser List 1', oh Sie persönlich das besch rlebene \ e rha 11 P Il für seh r schlimm. zir mlieh schlimm, wenig er schlimm OIIE'r für überhau pt nicht schlimm halten.' Eines der Statemen ts auf der Liste la utete: ..Ein ~ Ia n n zwing t seine Ehefra u Will Ceschlerhrsverkeh r,' Wie man tlel' nachfelg enden Tabelle -t;3 ent neh men kann. unterscheidet s ieh das Antwort-
vorhalten der Männer danach. ob sio von einem Ma n n od er einer Frau interviewt werden. \rähH'nd das C cschlcchr d e~ Interviewer s das Ant wortverhalten der weibllrhen ß t'fr
Tabelle --l.3: Interviewere ffekt (Spal t enprozcnte)
Antwort Sehr s chlimm Ziemlich schlimm \ Vl'llil!;l'r schlinuu Gar nicht schlimm Ikfragtc
Ilt'i
mlindlicben
Münnlk-he ßefrag tt' Miill UI. Iut, Wdbl. lnt ,
62), %
W.9 %
29.1 % 6.7 % 1,8 % 506
2.'3.0 % 5.6 % 1.5 %
196
ßt>fragullg
\Vt'i Llkhe ß I,fIa gtl' Männl. Int. Weib!. Int . 71,1 % 70.7 % 2-1,-1 % 25.0 % :3,U% 2,9 % 0.6 % 0.8 %
492
242
QUl'lIp: AL LBl,;S 1990
DeI" Inter viewer kan n aut-h bewusst eine Befr ag ung beeinflussen oder sogar insgesamt fälschen (vgl. Derroch 1!.l!.l4: Koc h 19%; Schnell 199 1) . Solche FOf!IlI'1l von Bet rug gibt ("~ inunor wieller. vor allemhei mündlichen ßp fragungr-n, wo der Int er viewer das Int er view weitgl'llt'nd sel bs t in der Ha nd haI. Er k ann zum ßl'i~ piei a bsiehtlieh eine falsche Fth erführung auwenden. um das Int erview abzukürzen. Oder er füllt gleich den ganzen Fragebogen selbst aus. Solchen Interviewerfälschungen kom mt man a uf die S PU l', indem ma n die für das Int erview ausgewählt en P{' n;OJl('1l anruft li n d nachfragt, ob auch tutsäeblich ein Interview stattgefunden hat. Xlit dieser :\adlfl"age kann ma n allerdings nicht kontrollieren , oh ein Int erviewer II'dig!ich ei nen Teil 111''' Int ervie ws ord llll"g~gt'llIä b durchgeführt ha t un d den .Hesr" des Fragebogens st'lhst f'rgälLzl hat. Telt>fonisdlt' Umfragen hieton dagegen emo umfassende Kontrotlrnöglichkeit der Iutervlo wer. wenn slo in einem Telefonst udio d urchgeführt worden, \\"0 rin ..Supervlsor- d ie Dur chführun g der Inter views überwachen kann. Auch computergest üt zte persönliche Befrag ungen sind schwerer zu fä lschen.
4 .2 Beobachtung Die ß I'ohadllllng [vgl. G rtlmer 1974: Friedrichs lind Lüdt ke 19(7) wird in den Soz ialwi sSl' llsehafh'lI ehe r s!i pflllütt l' r!ieh be ha nd elt , o bwohl sie für einen Tell der Fragestellungen durchaus sinnvoll vorwendet werden könnre. Als eines der wenigen politikwissenschaftlichen ß l'ispi pll' ka nn hier die von Raschke ( I!.l!)l) durchgeführt e Beobacht ung einer Bunde-delegiert enversa mmlnng der GRÜKE:\ gena nnt werden.
Wi ssl'llsr ha ftJidlP n m had ltllngl'll unt erscheiden sich Will ßl'obaeh t ungl'll im Alltag \"01" al lem d ur ch svs te ma ttsches und a n Hypot hes en orientiert es Vorgehen . Ziel der Beoba ch t un g ist da s ,.EffasSI'1I von Ablauf und Bedcutung einzelner Ha nd lungen lind Ha ndlungs-usa mmcnhäuge' (Kromrey :WllG, 34G). Im Yt'fglt'ieh zur Befragu ng. wo über verhalten lediglich Aussagen gewonnen werden. richtet sieh die Beobacht ung direk t a uf (las Vel"lwlt w der Subjekte. Eine besondere Schwierig keit bei rlor Durchführun g einer Beobachtun g best eht darin . alle Ereignisse ein er sich st ä ndig verändernden Sit ua ti on wahrzuneh men. Welche Ereignisse registriert werden , h än gt stark von der selek tiven Wahrnehuumg des Boobarhrers ab . Aus diesem Grund isl dip Beobachtung ein relativ s ubjektives Vorfahren. Eine Kont rolle, oh der Beobar-hter die für di e Untersuchung bedeutsamen Ereignis se erfasst ha t , is t normalerweis e nicht möglich. es sl'i denn . die Beobacht un g wird mit technischen Hilfsmitteln , also r. B. Film- oder Videokamera. aufgczeichnet . Auch Film a ufnah men sind jedoch selekt iv un d liefer n keine .objektiven- lnformatiouen. \rie bei der ß!' fragllllg der Interviewer. stellt Iwi der Boobaehtung der Beobachter a lso eine möglteho Fe hlerquelle dar , d ie zu einer Versenung de r Res ult a te führen kann. Die r-inaige :-' Iijglkhkpil , solche Fehler zu minimieren. bes teht in der Schulung de r Beobacht er. Xach Ftiedrichs (1!.l9U) lassen s ieh Beobacht un gen dan ach unt erscheiden.
nh sip ven/ a kt oder offen. teimehmaui oder nicht teilnehmend. ;;t/'Uktnri eri O(II'r unstrukturieri. in kiiTl.~ tIifh ell oder 1ud iid ichcll Slt uat lonen sta t tfinden. • Bei einer verdecktcn Beobacht ung neh men rlle Beobachteten den Beobuchter nicht wahr. während bei einer offenen Beo ba cht ung - z. B. der oben erwähnten Aualyse des Verhaltens der Pa rteit agsdelegierteu
- (11'r Beobachter a b solcher a uch a uft rit t.
Ein e verdeckte Beobacht un g wird da nn notwendi g, wen n a nsonsten überhaupt kein e Boobaeh tnn g s ta ttfinden könn te Interes siert mau sich für int erne St rukt ur en emer ver bot enen pnlitischen \ 'l'rl'inigu ng, S ll ist eine offene Beobaehrung wabrschetnltch nicht möglich. Ethisch be... denklieh s ind verde ckte Bcohacht un geu immer. wenn man davo n a usgehen kann , dass die Beobachteten Einwände gege n die ßcobacluuug haben. In einem solchen Fall mu ss ma n schon gewicht ige Gründe ins FI:'I(I füh ren, U TIl die Beobacht ung zu rechtfer t igen. Verdeckte ßI'oha d ltuugl'll IwsitzPIi gpgr niibe r ojfpllr ll ßf'obarh tll llgsforme n allenlings den Vorteil. das..; sie d i., zu Iwohadlt plldl'li Er eign isSf' nicht beeinflussen. also ein nicht reak t.ivos Messverfahren da rstellen . • Boi eine r tednehmenden Beobachtung ist der Beobachter a ktiv ins Ge... schelu-n einlwzogE'n , während r-r bot einer nk-ht tet lnohnwndcn rk ohacht ung a uf d ie Beobachtung besch rän kt blei bt. Bei der ni cht tcilnclimendcn Beo bach t ung eines Pa rtei tages 7.. ß . kommt dem Beobac hter ein reiner Beob acht un gssta t us zu. Eine teiln ehmende Beobacht ung lägt' dann vor , wenn der ß t'{ lhad ltpl" glpirhzritig Part eitagsdelegiert er
wäre. Bot etner teilnehmenden ß t'{)had lt un g werden d ir E relgnlsse. die beobachtet werden sollen . durch da s ltonaoln des Beobachters beeinflusst . Zudem II!'Stl:' ht d ir Gefa hr. dass rler Beobachter du rch spill\' a kti ve Rolle die Dist anz zum soz taleu GpS('lwhpu verliert und dadu rch dirPerspektive der zu Beobacht enden - z. ß . der Pa rt eu agsdeleg jerten a nuirnmt. Aus erdern könnte de r Beobachter au ch einfach über fordert sein , den n schliehlich verlangt eine teilnelnnr-nde Beobachtun g nicht nur d it' so rgfälti g!' waluuehmung der Sit ua tion, sondern gleidlZl' itig a uch noch akt ives Ha ndeln. • Einer .~trllkt!J riertCII Beobacht ung liegt ein zuvor entwickeltes rlerailliertes Ka tegorienschema zugrunde, in das d ie Beohar-ht un geu etngetragen werden. Bei unst rukt urierten Bcobacln ungcn ist d lo Br-obacht ung in einem erheblich geringeren Um fang durch vorherige FI'St l('gungen geprägt. Unstrutiuriert e Beobachtungen sind vnr allr-m lH'i geringen Kennmissen iilll'f d ir zu bl'Ohac htt' IUlr Situa tion sinnvoll. In 1!iI'SPI\l Fall hat dip ß l,{lbaehtung zlllläcllst einmal l'xplorat in'n Chara kter. • Künstlich ist eine Beobacht un g dann, \l" 1' IIU die Beobacht un g in einer Laborsit ua tion sta t tfindet, d. h. die Um geb ungsb eding ungen gpzit'lt he rgest ellt un d verändert werden kÜIlII{'Jl . Selche ..Experimente- hab en deu entscheidenden Vorteil. dass man Ka usalitä t nachprüfen kan n.
Durch die Kont rollg ruppen und ges teuerten Versuchsbedingungen ist die int erne Validitä t da Laborbeobachtung sehr hoch, W ie ben-it s in Kapite l 2 deutlir-h wurde, sind jedoch nicht alle Fragl'H tl'llullgl'lI für Experuuente gt'f'igll('\ . \ '0\" allem die man gelnde [Ibortragh arkoit a uf natürliche Umgobungen spricht gt'g,>n ktlnst.lk-he Beobachtungen. d. h. Hit, weisen nur eine geringe externe Validitä t auf. Dies e Unt ersdlt'id ungHkr it t'ri pnl aH,>wn sieh nun au f vielfältige Ar t lind \ \'t' izu unterschiedlichen TYIH>n \'011 ß ,>ollacht ll11gt'll kruubiuiereu. In de r P ra xis sind allerdings nur einige wenige Kombinar ionen von Interesse. Für Poli ti kwlssen schaftler komnu-n vor allem offene, svstematische Boobachtungen in nat ürlichen Umgcbungen in Fra g" . Möch te man Entscheidungsst ruk tun-n a uf Pa rn-ita gen ,IN unterschiedlichen Pa rt eien untersuchen. so ist es beispielsweise nicht notwendig. vordeck t zu ar beiten. Im folgenden werden wir uns - wie schon bei (11'r ß -fra gnu g - auf "im' strukturierte Er hebungsform lx-schr änk en.
Hf'
4,2,1 Kat egorienentwicklung \\'ä hrpnd d ip Messinstrumente bei oinor Befra gun g aus einer oder mehreren Fra gen ln-stehen, st ell t dip neolJ(lchtlJ719.~klltcg(Jri c das Xlessinstrument bei der Beoba cht un g da r. Als Xlessinsrrumout fiir dto Bet eilig ung \'011 Delegierten lind Vorst andsmitg liedern an einem Parteit ag könnten v, ß . die Beobacht ungska tegorien .Aueahl der Rede bott r äge \'Oll Deleg ier ten' lind .A nxahl der Redobeit räge VOll Vors tandsmitgliedern' hera ngezogen werden . Die Merkmalsausp räg ungen si nd bei diesen beiden Varia blen die lI ä ufigkeit . Zudem könnte die "Redelä ng(''' oder die .Reaktion de r Deleg iert en' erfasst werden. Die ~ I<>rkmalsa\lspräg\lllgen könnte n hipr r, d ie Länge in Xlinut en 1IzlI'. die Klassifizierun gen .zurückhaltend-...en t hus lasttsch- llS\\', Hein. F iir die Beobacht ungskat egonen gil t dasselbe wle für die Auewortvorga ben bei einer Befra gun g: Sie miissen sich gegenseitig ausschliescn lind vollstä ndig sein.
n.
Nehmen wir a n. wir interessieren uns dafür. oh sich d ip Bet eiligung von und Frauen im Seudlerendenparlament (i m folgt>IUII'1l Stu Pa ) nnt ersrheidet . Unter •.ß l'tPiligullg"' können wir die Anwesenheit. Rl'rlt,!>piträge nnd Zwtschenrufe in St ul'a-Sn-ungen verstehen. Da mit haben wir a lso drei abhäng ige Varia blen, die a ls Ind ikator für polit isch!' ß t>tt'iligllng im Stu Pa dienen. Als unab hängige Variable müs sen wir auf jeden Fa ll das ~ lällllPrn
tl4
Gp~ehlpcht heranziehen. Au ch hier ist nat ürlich wichtig. dass keine Beobachtungskatogorio (dies entspricht einer Frage im Fragebogen} vergessen wird. E~ könnt e ja sein . dass die Anwesenheit nich t nur vom Geschlecht , sondern au eh VOlt rler po l it i ~dH' ll Einordnung ah hängt . \ r ir köuuten r, B. vermuten. ,111.."-'; die ~lit g li etl"r der O ppo~ i t i on im Stuf'a in einem genngeren Um fang ihr :\Ian dat. wah rnehmen als die rogierendon Parteien . Wtr müssen also b{'i jf'dt' r lind jedem Anwesendon vermer kou. ob ps sich Uill eine Fra u oder einen Xla nu. ein :\Iit glit'l:i der Oppo sit ion oder der Koalit ion handel t . Auc h de r zweite Indika tor für poli tische Ik-t eifigu ng, die Redcbeit räge, könnten a uf diese Art und \reist, operatioualisiert werden . Zusätzlic h kiillltll'n wir hier Ilo("h die Lä ngt' für relevant erachten. \'il'lleicht gibt I' S zwar nicht mehr Rl'd plwit rägp von Männem als von Fra uen , Männer un d Frauen kiinn tpll sk-h jedorh in de r Da uer ihrer Rt'(lt>lwiträgl' unterscheiden. Ebenso wie die A nwesenholt und die Rf'dl'iJl'iträgl' könnten wir noch die Zwischenrufe na ch dem G I'Sl:ht('(~ht noticren.
Bereits die wenigen hier verwenden-n Ka tegor ien werde-n die A ufmerksamkeit des Beobachters in vollem Umfa ng in Anspruch nehmen. Zudem wird vorausgesetzt, dass Pr sich mit der Situation relat iv gilt auskennt . Um die politische Richt ung 7.U not ieren , muss der Beobacht er a lle im StuPa anwesenden ~[itglit'tll'r einordnen können. Sind im St u l'a viele Cruppierungen ver treten. so wird d iPS{' Einordnung sdlOn ziemlich schwierig, Dip gll'id l7.l'it igl' Erfass ung von Red ebeirrägon und Zwischenrufen ist für einen ('itl7.igt' tI Beobacht er alleine wohl nicht mehr durchfüh rba r. Schon a n diesem kleinen Beispiel wird deutlich, wartun ein Beobachtu ngsschema in der Regel weniger Ka tegorien cnt hält als ein Fragebogen Fra gen beinhaltet: Die Aufmerksamkeit tlf's Beobachters ka nn sieh immer nu r auf einige \H'lligl' Merkmale richten.
4.2.2 Beo bachtungssc hema .-\1l1' Beobacht un gs ka rogonen worden in einem ß robarh tlHlgS$chcm a bzw. Booba rht ungsprot okoll zusammengefasst . DI'Ill 0 1'0 bach tungs protokoll entspricht bei der Befragun g der Fragebogen. Anband dieses Beobachtun gsprot okolls wird die Beobacht un g durchgeführt,
Die Zusammenfassung der Beoll
und allo rele van te n Ka regorio n erfass t wu rden. kann in eine r Testbeobuchtung geprüft werd en. Ein fiktives Beobachtun gsschema für die AlI\n'S;' IIheit 1]1)(1 die Reclpllt' iträ gp in Stu l'a-Sitzungeu ist in Abbildung " .G zn S;'hen: Zunächs t t rägt de r Beobachter ein en Xame u, rlas Da t um der Sitzung und dir- Uh rzelt ein. Danach folgt eme Tabelle, in der für jedes i\ IlWPSPIIde Stul'a-Mitglic d eine Zeile vorgesehen sr-in mu ss. in die da s Ge schlecht und die poli rische Zugehörigkeit einzu tr agen ist (maximal sind hier also so vieh- Zeilen wie Ma nda ts trä ger notwendig]. Auf cinem /nu-hn-r--n 11 1'11en Blätt ern können dann die Recl,'ht,it räge ft'S tgehaltt'n werden. Bei der Int erpn-t at .inn de r Daten IllUSS man bea chten. dass das eine ;"Ial Xlerkmale von Personen. das andere Ma l Merkmale von f{p(k lwiträg('n er hoben werden.
4.2.3 Ablauf einer Beobachtung Zunächst müssen die Situationen festgeleg t werden. dlo beobachtet werden sollen. ' YoJ)" lI wir die Hypothese untersuchen, dass sich die En tsche idu ngsstrukt uren auf den Pa rt eit agen zwischen de n einzolm-n Pa rteien unterscheiden, da nn sin d die relevanten Situationen Pa rtei ta ge. Zud em müssen wir den Untersuchungszeit ra um festlegen lind I'illt' räumliche Abgrenzung vornehmen. Im genannte n ß f'ispi,'1 kiinntPJl d it's d i., Pa rteirage innerhalb eines Jah res in der Bundesrepublik Deut sch land sein. Ebenso wichtig wie die Schulung \ '011 Interviewern ist dip Schulu ng der Beoba r-btor. Aufgrund der Selektivit ät de r Wahrnehmung werden unt erschiedliche Beobachter zu unterschledllchen Ergebnissen gela ngen . Das A usmu s . in dem verscbiedcue ß ..obachter dieselben Dinge wahrnehmen. wird Inter-Goder-Relillbilit ät genannt . Durch gt"' ll a ll;> .Anweisungen und ß t'ispielf' kann dip lnt..r-Coder-Reliabilit ät er höht \\"('1"(1('11 . Dam'IH'1l kann t's im Verlauf einer Beoba chtung rlaz u kommen. dass der Beob a chter ~ z. B. durch einen Lernprozess - dteselbon Eretg nisso unters ch tedbch einordnet. Dip S tabilität .11'1' Ei nordnung ders elben Beobachtungsi nhalt e du rch einen Beobacht er wird Intra-Goder-Reliabilität gena nnt. Das A usm a], der 111\;'1'Coder-Rolia bilitüt und der l nt ra-Coder-Reliabilitfit ist ein :\Iab für die Q Uillitiit der Beobachtun g. ;"liiglidH'nn'isr ist es - wie erwähnt - sjnnvoll. das ß ;>u haehtll tlgssd lt'llla vora b auf Pra kti kabili rät zu testen. Be! manc hen offenen Beobachtun gr-n wie de n Pa rteit agen od er den St uf'a-Sitzungen bietet es sieh a n. d ie Beoba r ht un g vorher anzukündigen.
!Hi
AIlbihlllllg.t:;· Fi ktive s Beobachtungsprotokoll einer Stul'a-Sttaung 1l.l.0EllEl lIE . OG. . . .
1.....-"" n.""m
L'h<"'; , 10. ";' 0 ,mol E..Io),
.,,
.~~
......",.
G.. d le<~'
" '.",h
, •• ,• ,•
..•...
..,,
... lI ' ..e" 6......... .
.,.,""
Ko.ol """,
, ..".• .,nuOE G . >< ~l ., "
• • ,.h e.
_ H eh
.."".>
h a U" ..
,,''''' ~~
•• • ,• ••
0 .•. • .
4.3 In haltsanalyse Bei der Inhal tsa nalyse gewinnt mau lnfonuationen iibN rlie sozial!' \Yirklichkr-it rlurch rlie Analyse von .Jnhalten". Inhalt e können Teste, Filme, Bilder o. ,~ . setn. Das Ziel dor lnha ltxanalyse kann ma n auf den Xenner bringen: ,,\ rpr sagt was 1.11 IWIll . wie, warum lind mit welchem Etfpkt't' (Friodrichs H190, 319). Dip Anwendung der Inh altsanal yse (vgl. Früh 2007; Merten 199;): Weber H190) erfolgt vor allem im Bereich dor :>' Iassenkom-
munikatio n und hat deshalb innerhalb der P ublizist ik einen hohen Su-lleuwert. ln
J""all~a,,aly~e
möglichkeiten wie die ..... nalyse HlI\ Pa rteiprogra mmen. politischen Reden . Flugblä tter n und Wahlplakaten an (vgl. Rurh t et al. 1993). Der wesentliche Vorteil der Ilihalt~arl(llY$ e best ehr da ri u, d
Zunächst IIlUSS festgelegt werd en. was überha upt a nalysiert 1\'1' 1'(11'11 so ll. \rOI1Pll wir z. n. di p inhal tliche n Schwerpun kte der Pa rtelen nac h Polltikberulr-hen unters uchen, d a n n könnten die P a r teiprogramm e d ie Textgrundlage e-in. F ür diese Texte mu], rler Merk malsträ ger . (I. h. d iE' Ziihlrinheit 1)('~ tiI11T1lt werden. Als Zähleinheit könnt en wir z. [3, d ie Sätze der Pa rteiprogratntne ver wende n. Ebenso gut könnten alu-r a uch kleinere Einheiten (z. B. einzelne Wö rn-r} odE'r grö!>Pre Einheiten (z. [3, Absii tzl' oder einz elne Abschnit te des Pa rteiprogra m ms ] ausgewä hlt werden. 0 ('11 Zähl einheit en entsprechen Ilf'i der Beobacht ung d ie Situationen. bei de r Befragung d ie Befragt en .
0 1'1' sdlWif'rigs tf' Toileiner 1nhahsanalyse Ilf'steh t d a rin, Kategorien zu entwickeln. di l' dip tllt'Ofetisdll'I1 nr' gri tfp m (';; SI'Il . An das f(lll rgm'iCll$ch emli sin d hie r die gletchon Anforde rung en zu stellen wie IIPi der Beo bacht ung : Sie müssen sich gegenseitig e usschlie jcn u nd vollstä ndig sein. Ka tegonen für de n Umersuchungsgeg enstand .Poli rikbor oiche- könnt en z, ß .. .Innenpolir ik'', ..A us r-npoliti k.., "Wir tsc ha fts politik'" Il S W . sein. Auch hier kan n eine Ka tegorie .Sonstigos' für nich t explizit gone nut e Ka tegorien sinnvoll v-in. O11 n l·ispil'1. Aus dif's"1ll G r und ist PS sinnvoll. erst " illln
Die Kodierung ist d ip Zuordnun g der Zähleinholren zu den Ka teg or ien. Die Inhaltsanalyse ist abgeschlossen. wenn all e Analvscci nhcitcn kodiert sind. 1m vorliegenden Beispiel könnt e man z. B. d ie Allab'S!'I'illhe iten der I'illzein en Pa rteiprogra m me zusamme nfassen. Für jedes P rogram m könnt en wir dann sage n, wie h äufig auf die W irtschaftspolit ik. Sozial po litik usw. Bezug genom nu-n wurde. 'Yt'nn ma n davon a usgeht. (lass an s der Hä ufigkcit einer Kategorie auf die Bedeutung eines Poli tikber eiches für ein e Pa rtei geschlossen werden kann . könn t;' das Ergebnis ei ner Inhal tsa na lyse sein. dass das SPD-Prograllllll st ärkt't sozialpolitisch bes t hmnt wird als das Clrü-Prograuun. der Schwerpunkt dl:'s FDP-Programllls dagegt'1l auf (11'r 'Yir tschaftspolit ik liegt nSI\".
Einfache l nhalr sanalvsen begnügen sirh damit . (Iie Häufigkeit des Vorkornmens der einzelnen Ka tegorien auszuwerte n ("Fn>f[ut'nz a nalySt,,"). " 'pih 'rgehende inh altsa nalyt ische Ansätze berür-ksk-htlgen zudem Bewert ungen (..Bewe rt llngsa nalyse') oder Zus ammenhänge zwischen Ka tegorien (" Kontiu genzanalvse"] , d. h. wir' hä ufig tauchen die einzelnen Kategorien im Zusammenhang mit anderen Kategorien a uf. ß I>i einer Bewertungsanalvso der Pa rteiprogra mm a r.ik würde man a lso nicht nu r otne Aussage zur Gowerbea eucr als Aussago Will Politikbereich Wirtschaft kennzeichnen , sondern beriic ksichtigen, ob diese negativ Oller positiv bewert et wird . Dip Zuverlässigkeit de r Inhaltsa nalyse beinhaltet a uch hier wieder zwei As pl:'k ti': Dto l nlcr-Codcr-Rclillbilitiit ist hoch, wenn verschiedene "e rcodor d ieselben Analyseeinheiten in dieselben Ka tegor ien einordnen. Die llltm -Coder- Rcliubilität ist hoch , \I'{'I1 11 die Zuord nun g einer Analyseeinheit zu einer Kat egorie durch einen einxig-n Verrodcr s ta bil ist. Die InterCoder-Reliabilit ät lä s.<;t sieh hin seh r einfach überpr üfen. indem man uutersr-hiedllch en Codiorem dieselben Texte vorlogt . Stellt man fest , dass das Kategorienschema nicht ungemessen war. also z, B. wesentliche Dimensionen fehlt en . da nn kann man die Inhalte problemlos erneut auswerten. Ditos ist r-in wesentbcher Vor teil der Inhal tsa nnlvs- gegenüber der Beobachtung.
uu
AuJ!J" oclI
Aufgab en zu Erhebungsmethod en 1. St ud ierende der Politikwissenschaft sollen zu ihre m Studium befragt werden. \ r as ist an den ..inzehu-n Fra gen .faul-" W ie könn en dies e besser formuliert werde n? a) Wie hoch schä tzen Sie die durchschn ittlichen Kosten eines Hochschulst udiums e in? ______ Euro b) Sind Sie für eine Straffung des Studiums und d ie Einführung von Studiengebühren für Langleitstudierende?
J,
............. 0 ............ ................ 0
Nein c) W ie häufig essen Sie in der Mensa? Tä glich _ . Z_ i- bis dreima l wöchentlich Mehr als e inmal wöchentlich Se ltene r Nie nicht
. .. . . .. 0 . 0 .. 0 ... . ..... 0
.
.
w-n
0
.D
d) We!che Gründe waren ausschlaggebend für die Wah l ihres Studie nfachs? ( Meh rfachnennun gen möglich I) ... .... . 0 Gute Berufsperspektiven ....... . ... ... 0 . Der St udienort Selbstverwirkhebung . . .D o kh möchte in die Politi k . e) Sind Sie nicht der Meinung. dass der ASt A nicht die Interessen der Studiere nden vert ritt?
J,
... .... . 0
Weiß nicht Nein
..... ... 0
... . ......... ....... 0
f) Ha lten Sie es für ang emessen . dass St udierende , die von der Nutzung öffent licher Verkehrsmi ttel , d ie im Ra hmen de r biannu .-.I anfalle nden Semesterbeit räge bereits vorlin.-.nzie rt wurde . abse hen, eine redu zierte Studiengebühr entrichten ?
J.-.
•.. . ... . ...•• •
Nein
w-u nicht
. .• ....• 0 .
g) In welchem Fachsemester studieren Sie?
2.
wann
bieten s ich geschlos sene Fra gi-n a n, wann offene?
.
0 0
5 Tabellen und Graphiken 5.1 'Iulx-llr-n 5.2 Gral'hik('n
. . ... 100 ...... ... .. ......... . . . . . . . . ........ . . . 110
Soba ld die Da tenerhebung ab geschlossen ist, kann m it der A USIH'ft uUg begonnen werden. In der Regel werden die Daten zuniidn;t in maschinenlesbare Form gf'bracht, um si!' da nn mit Hilfe emes St ansük-Progrannns wir r, n. SPSS. SAS Oller Stata auswerten zu können. Dies ist je doch nicht Immer notwe ndi g. Einfache Anal ysen können - wenn a uch mit ein om erheblieh böhor en Zeit aufwand - m it de r Han d bzw. dem Taschenrech ner durchgeführt werden.
Man kann sieh leicht vorstell en. das s schon in einer Um frage mit wenigen n rrraglf'1l de r Ühf'rhlick iibt'f d il' An two rten zur ,.\ r ahlso lllllagsfrage", diE' die \\"ah l a b.~ icht der Befragten misst , oh ne eine Zusanunoufassung der Xennungon für die versr-hlodenen Partoten verloren gebt. In der RE'gt'1 beginnt deshalb jt'd e Analyse mit einer H äufigkeitsa uszäh lung dor Intcressierenden :\It>rkmaba usprä gun gell, die da nn ta bellarisch oder graphisch da rgestellt werden . Unters ucht ma n die Verteilung eines einzigen Xh-rkmals , dann spricht ma ll von ,m illlwiatcr Analvse. Betracht et man llagPgf>n lHf' gemeinsa me \'f' rt f'i1un g von zwei oder meh r Merkmalen . dann s pricht man von biooriater hzw. mu itincria ter Anal yse.
5.1 Tabellen 5.1.1 Tabellarische Darstellung eines Merkmals ZUlIäehst will man in der Rl'gf'l wissen , wu- st a rk dif' einzelnen Auspräguug en einer Var iable' beset zt sind. \ \"if' viele Befragt e gobon z. ß . a n, a m nächsten Sonn tag die cnu . SPD us w. zu wähll'n '! Um dies herauszufindeu , führt ma n eine fl(j1l} igkci tsall szähI1l7lg der ein zelnen Ka te gorien durch. Als Rf'slIlt a t e rhält man eine fl(juJigkci tW C7'le i I1l1lg.
Übliche rweise wird ein xlerkrnal bzw. eine Varia ble mit einem gro!>en latoinischen Buchstaben bozek-hn et. llpispit'!s\\'piSl' soll es UIlI die \\"ahlabskht gehen . Dies e wird da nn a ls X bezeichnet. Dieses Slcrkmal X kann ga nz bes timmte :\Ierkmalsaus prägu llgt'll annehmen ("Cnu/ c su", ,,SPD" etc.] . Die Xlcrkmalsauspräguug-u werden als X k lu-zeichnet. wobei der JIlIIt'X k
IU I
eine fort laufende Xunuuerieruug der Mer kmalsausprä gungen (Ka tegorien) meint lind dementsprechend HlII I his zur max imalen Merkmalsausprägung 1Il lä uft . ~. wird deshalb als Laufvariable oder Laufindex hpzpidllwt und tlef ges tellt (vgl. Tabolle ö.t ). Talx-lle G,I : Not a t ion bei H äufigkeitsa us z ählungen
Ka tegor ie ( ~ It>rk m a !sa Ilspräg u ng)
ß pze it:h nun g
CD U/CSU
Il
SP D FDr
X2 ,I":j
;';PD rr gO/ GRÜN e
1'5
REr
.r6
And ere Partei \r ä hl t> nicht
J:i
\ 'p r\I'p i g p r t
.r9
\\"f' i ~ nicht Keine Angabo
I 4
XB
l"1O III
A b solu t e H ä u figke it en gt,bplI die A nz ah l der Xlerkmalsträ gcr wieder, rhe eine hest mimt e :\lerkmalsauspriiguug lIufwf'isen . .-\1 .solute Ilänbgkei! PII einer Xlerk malsausprä gung s ind oh ne r-ine Berücksich t igung der Cf'samtzahl de r Merkmals träger ulcht inter pr ct iorba r. Wcnu WO Befragte enu wäh len wollen. sagt das ga r nicht s über die Chancen der enu aus , wenn man nicht weib. wie viele Befragte ili$ycs(l7IIl eint' Wa hlabsicht gcä uMon ha ben. ~ Ia ll muss also wissen, welchen Anteil eine a bsolu te Häufigkeit a n allen Häufi gkeit en hat. Relative Häufigkeiten (Anteil der Mcd;mlll.~trii!ler in eine r hestlmmten Ka tegori e] oder Prozentwerte (rela rive H äufig keit x 1(0 ) werrlon berechnet. Indem dte absolute lI älltigkl'it einer Ka tt'go!"ie ins Verhält nis zur Cesamtzah l rlor Mer kmals trä ger 11 gesotzt wird. Xlerkmalsträgor werde n a uch als F ä lle bez eichne t . Absolute ll äufigkoitcn werden als !"'k bezeichnet (J steht für cngl. [mquency = Häufigkeit ]. F ür relative H äufigkeiu-n gibt es keine eigem- Notation . Prozent werte werden durch da s nach gestellte P rozt'lIt zf'id u' lI (W) kennt lieh gerua..ht.
1U2
Absolute lIiillfigkl'il =
f"
Prozentwert = Relatiw' Uä ufigkl'it x 100
Absolut e Häufigkelten können Werte zwischen 0 und -e co annehmen . DMa us folgt , dass relat ive Hä ufigkciten immer einen Bruch zwischen zwei positiven Zahlen darst ellen. \\'o !ll>i der Nenner imme r griiN'r 0111>1'gleich dem Zäh l!'r ist, da d if' a bsohue ll äufigkelt einer einzelnen :\lt'r kma lsr als dil' Gesamtzahl rk-r :\k r klllit mi t l(JO dars tellt, können Prozentwo rte nur im Bereic h von 0 % bis 100 %, llogen. In Tabelle 5.2 a uf der gf'gpuülwrlil'g" lld t'1l Spil l' ist eme Häufigkeitsauszäh lu ng der "Wa hlso n ntagsfragt>" a us dem ALLOUS 1994 dargesrellr. ' GD2 Befragte gaben a n. C DU/ CSU zu wä hlen , wenn am nächs ten Sonntag Wahl pll stat tfä nden. Ohne die Gesa mt za hl der Befrag ten (2.298) zu hertlcksichtlgen. ist dil's('f \Yer! nicht sehr a ussagf'kriiftig. Ans 1!iI' SP Ill G rund s ind in den beiden dara uffolge nden Spalten die relati ven Häufi gkeit en lind die Prozen twerte a ngegeben. Dem nach würden sieh 30,1 % der Befragten für die C DU/CSU ontscbctdcn. Da relati ve Ihiufi gkcltcnund P rozentwerte dieselben Inform a tione n liefer n. gibt man in Tabellen nur eiur-n der Ix-iden werte - in de r RI'gpl die Pro-entwerte - a n. P rozent za hlen s ind na türlich nur dann sinnvoll lnterpreriorbar. wenn d ir G röße d er Prozent ui er uu gsb a sts bekannt ist. Es ma cht nä mlich für die Bede ut ung des \ Y"rl ps einen Unt r-rxchied. oh 75 % der Befragt en. die ein bcs t bu mt os \Yasdllllitlt'1 favorisieren. 3 von insg esa m t 4 befragten PerSO IlE' ll oder 3.000 VOll 4.000 sind. Im ers ten f a ll würde der \ Yt'chst'l ein er Pers on in das .andt-n- Lager" gleich da s Verhältnis au f 100 % bzw. ;:'0 % \'.' rän d prtl . Im letzten Fall würde sich der \Ypchsl'J einer Person lwliglidl in einer \'f' rst:hiphllng auf 75,U25 % bzw. /.t .D' 5 % aus drücken .
r11 der 51ichprobe sind Ostde utsche überrep räsent ir-rt (ca . 31 '!<' OSI- uml 68 ','{. Wl'SID" I'S ,"orliiufig um dil' B''Srhn.,jhUllg '"Oll 5t ichl'fUb"udilll 'll gpht , Iwl" '11 wir " uf ('im' 1 "'r~OIll'lIh,'zog" I1l' O ~t, \\ ·' '''1_G" wir ht uug ' ·"fz il"hll'l ,
1U3
Tabelle 5.2: Häufi gkeit sa uszählun g der wahlabslcbt im A LLßUS l!)!)-t Wahlabsicht
"CDU/CSU
absolute Häufigkeit
Prozente
U.3UI 0.372
30.1 37.2
%
/"
692
SI' D
sno
1"01' Bündn is 9t1i G I'ÜlII'
2UU 316
Itepuhlika uer PDS
Andere Partei Summe
relative H'tuflgkcit
O.UIS7
8,7
n
0.138
13,8
O.U3 1
:U
120
O.U52
.'}.2
1.000
1,8 100.0
42 2298
o.ois
Ocna uso bedeutend wie die GrüN.' der P rozvntuieruu gbasis ist die Art
de r Proae nt uierungsb asls. Als ßeispiel soll wiederum dir Wa hla!Jsk lJt dienen. Dazu bet rachten wir Tab..lle 5.3 auf der folgenden Srit('. In dor Spalte "abs . 11 ." worden d ie aheolutcn lläufigkeiten, in de r Spalte .. %" d ie Prozpnlwf'rt e wiedrl"geg:r!Jrll. Unter der S pal te ".-\lIr'· we-rden dip a h..oluten llä nfigk.. iten aller Ka t..gotien aufgelistet. VOll all en 3.4:)0 Befra gt en in dies er Umfrage ga ben 692 an, CDU/CS U wähl.. ll zu wollen. 856 die SPO usw. 5iU Befragt e wussten 110('h nicht . was sie wä hton wollen. In der dritten und vier ten Spa lte der Ta belle wurden nur d ie Befragten Iwrückskhtigl , die eme Pa rlei au gegl'lH'1l haben: lwi einer Wa hl wären dies die gtiltigen Stimmen. Die Prozelltll'f'rlt· der vierten Spalte gplJI'u daher dio Allteile der Part eien an den "gültigen Sti mmen" wieder. III der fünften und sechst en Spa lte der Tabelle wurden dagegen die Ant worten aller wahlbr-rer-htigren Befragten bet rachtet. Dip P rozr-ntwort e der sechs ten Spal te können da her als A nteil deI' Parteien an deli Wahlbenx htigten bezeichnet werden. \\'i(' ma ll leicht feststellen kann , un ter scheiden sich die Prozen tanga ben der vierten und sechs ten Spalte bet rädnlich . ß(>i P rozent angaben ist a U!,l'l'l!elll ZII beachten. oh es sich h!'i l!i t>St>t1 tats ächlich 11m rel a t tvo Hä uf i gkott en ( x 100) oder 1I lIl An ga ben der Gri)!'Pll verü ndc71m g handelt . Angaben der Grii!'PIln'l"ändt'rung lassen sieh nä mlich als Steigeru ngsrate oder als Differenz zwr-ier P roz entanga ben a usdrücken. So haben v, B. Bündnis 90/ G rüne bei der Bundest ags wahl 1990
1U4
1'"II..tI" " u nd Gmphi kell
Tabelle 5.3: llä ufi gkettsaus aählung der Wahlabsteht mit unterschiedltchcr Prozentuiorungsb asis Art der P Wl.t'nt uil' ru llh'S!Jasis
Wah la l",id ,t CDU-eS U SI'D FDP Hündnis OO/ Griilll' 1t"l'u hlikm "'f P DS
.-\JI(!t'rl' Partei W ürdl' uid" wählt'lI Y,'r wPig,>rt
\\ 'pi" lIit'lIt I\('i ll(' A ngabe
:'\id ,t w" lilh'wchtigl Summe
.-\1If' "bs . 11. G02 856 ZOO 316 72 120 42 ZI!'> . -li:> 570 36
156 3150
AbK. g ül t ig p Smnun-u llbs. lI. :IU.\ 602
"
8.';6 20U
:17.2 1'(7
316
\: U' :\.1
120 42
"" .2
za -
1.<
-
-
-
-
-
2298
W(Ul
Wah Uwrt'c:ht il!;tt' a hs. lI. 21.11 G02 2fi.1J 856 1L 1 20U !J.(; 316 72 2.2 :I .f i 120 12 l.:l 7.,1 2 1ä
••
11'
,1..1
570 36
17.:1 1.1
329 1
100,0
-
-
zus amme n e ine n Anteil vou 5.0::>% der Zwoltstt m mon " l"z iplt. 2 Bot ([1'1" Bundes tagswahl lU9.t lag der Stimmanteil bei 7,3 % der Zwoitsununen. Dips kan n man einma l als Steigeru ng \"011 2.25 Prozentpunkten (i ,3· 5.05) ansdrücken oder als St eigcrungs m ee von ..\.J.6 Prozent, um die de r Ant eil 199..\ höher ausgefallen ist als 1990 [(7.:3 . 5.0;J)j5.0i:i x 1001 .
5. 1.2 Kreuzt ab ellen :>. Iil Hilfe von Kn'uz !;lI)('1!I'!1 wird die .qemein.~a m e Vc,.teilllll,lj lIon zwei J fcrh na lr tl ;lbgf'bildt' l. Da mit Hilfe von K reuz t ubellen ein Zusammenhang zwischen Xlerkmalen festgestellt werden kann . spricht man nut'h von Kolltingcnztabdlen oder Kontmyrnztnjrm.
2
Di,' Gr ünen und , la.~ Biilld uis '00 traten zur Wa hl 1990 noch nk-ht "ls \'PI"l'i!It<' Pmt ,·; "'I. Da d il' 5 '7<··K lans,,1 ,mf dil' \\'" lllgd ,i,'l<' \\','st "",I O,t g,·tn'nut "lIg'~ wandt wllrd". konnte das Bündni s 90 IHit 6.0S ?;. im Wa h l~d )il't OSI dir 5 %- lIiir
Unabhängige und abhängige Variable n ß et bi- und multivariaten Anal ysen wird häufig xwisehou abhängigen un d u7wbhällgigen Variablen umerschleden. Als abhäng ig werden d ie Var!ableu bezeichnet . die erklärt werden SO I\ P II . weshalb dies!' auch Z11 erklii rcndc Variablen gena nnt werden. Ab u n a bhängi g werden die Variableu bctrucht ct , die (vermu t I ich) r-i uen Einfluss au f d i l' (I bhä ngige \ '(1 ria ble a usüben. Oie nnabh äng jgon Varia blen werden auch c7"kliin:wlc Variablrll gl:'nanut , Zum Beispiel könnn- die \rahlahsicht ab abhängige und die ßild uug als unabhängige Variable betrachtet werden. \Vir vermut en als o. da ss dip Wahlabsieht vom Bildungsniveau beeinfl usst wird . Zur Kennz eichnung der Richt ung des Zusammenhangs wurde im folgenden Schaubild ein Pfeil verwr-nrk-t , dessen Spitze au f d ir abh ängige Variable ger u-ht et ist.
Bildung
~ Iit
=
\ VahlalJl>ieht
Unabhä ngigc Variablc
A bhäugige Vari able
Erklä rend e VariablI:
Z u erkliircnsle Variable
d..r Unterscheidung von llllabhHllgigl'r und ahhHngigrr Yariabl e wird
ein ka usaler Einflns s der unabhä ugtgon a uf d ip abhä ngige variable JJIltcrs/elll : im Beispiel also, dass verschiedene Bildungsabsch lüsse ein un -
terschiedlichcs Wahlverhalten verursachen. In Ex-Post -Facto- Designs soll durch d ie Kontro lle Will Dritt variablen sicherges tellt werden. tim;.<. ; ein s tatislisrhp r Znsamnn-nhang nicht für rillt> kausale ß pziph uu g gehalten wird (vg l. Ka pitel 1.3 ). Doshalb muss man sieh vor der Durchführung eine r Unt ersuchung. spiHestl'll s [edorh vor der Anal ysl:' bi- oder nurhlva ria ter Zusam menhän ge. Gedanken um miiglidlP .rl rin e' Elnfiussfaktoren auf dir zu erklärende Variable machen . O b eine bestimmte Variable als abhängig od er una bhängig betrachte t wird . kann \"011 Unters uchung ~11 Unt ers uchung und sel bs t in nerha lb ein er Unt ersuchung \\·J'I·hseln . Der eine Forscher miil"h lp die Wahlahsk ht durch die Bildung erklären (also: Rild lHlY -> Wahl(J b.~ i ch t ) , ein ande rer die Bildun g durch dplI sozial t'lI St at us des Elternhauses (al so: .~ozi (Jle7" Sta tus der
106
Eltern -. Bild ung ). Die Best immung dor abhän gigen Var iable resultier t a us dem Uutvr suchungsint eressc, die Best immung der una bhängigen Varia hlt'(ll) a us de r zngru lldp gplf'gtl'1l T heorie bzw. den Hypothesen . In emer 1\l"l'l1 zta lwlll' werden alle Kombinationen de r Merkmalsa uspräguugen zwotor Variablen a usge zählt. Es entste hen so Zeilen lind Spalten ein er Tu belle. In den deu tschen Sozlalwlsseuscha ftcn wird dle uu a bh ängige Variable no rmalerweise in den Spa lt en und die a bhängige Variable in d" 11 Zeilen ebget rug-n. Geradl' in St utist ikbüchcru (vgl. z. B. Agn-s ti lind Fiulay 20( 8) i ~1 alle rdings auch häufig!'r die ah hä ngigt· Variable in d" 11 Spalten und die un abhä ng ige in de n ZE'il,'1I zu finden. \richt ig ist . dass die zur Beantwort ung der Fragestellung richtigo P rozen t ulerung lx-rochuet wi rd. In Tabelle jA auf der gcgenüberhcg endeu Seih' ist ein e Kreua tubellierung de r Merk male Schul a bschluss (a b Ind ikato r fiir Blklung) lind \ra hlah.. sieht darges tell t . :3G7 Personen mit Haupt sr hulu bschluss (HS) wollen die CDU/CSU wä hleIl, ..j,.j3 d ie SP D IIS \\ ' . \ '011 den Befrag tenruit RealsrilUlahsehl"ss (RS ) II"Olll'll 182 di e CDU / CSU wählenund von den Befragte u tult Abit ur IIZW. Fachhochschulreife (Abit ur) äu sem 119 uine P räferonz für d ie C DU, Am Ende jeder Z.'iIE· und j l'der Spa lte ist die S umme dies er Zeile bz w. Spa lte wiedergegeben. Die Spa lte, die mit .S uu uue' äborsch rlebon is t, giht die llä uf i gkottsvorteiluug der a bh äng igen Vari a ble an ; rlies e wird a uch a b RandverteilulIg der abhängigen Variable bezeichnet . Die Ra ndver.. teilung der unabhängigen Variable findet s ieh in der let zten . mi t .S ummebesch riebenen Zt'ile, In der Ecke unten recht s s teht di e C osamtsmnme der Merkmalsträger. d ie in die Ta belle eingehen (2,218) , Hier sind ( OS die Befragten . die .' iIW Partei genannt haben und für die der Schula bschluss bekannt ist. Die a bsolut en Hä ufigkelten lassr-n s ieh a ber st' blech t vergleichen. Absolut gesehen. wollen zwar erheblieh mehr Befragte mi t Haupt schulabschluss Chris tdemokra ten und C hristsoz iale wählen (3G7) als Befragte mi t Realschulabsrhluss (182) bzw. Abit ur (119) . Allerdings gibt ( OS a uch wesent lich mehr Befragt e m it Ha up tschulabschluss (108G) als Befragte m it Realschulabsr-hluss (GGj ) hzw. ßl'fraglf' mit Abitur (-tG/) .
Übt die un abhän gige Variable einen Elnß uss auf die ahhängigl' Variable a us , dan n unterscheidet sich die pm zetllufl le Ver/eilung de r a bhängigen Variablen für j ede Ausprägun g der unabhän gi gen Variablen.
107
Tabel/e"
Tabelle 5.4: Kreuz tabelle der \ r ahlahsicht mit dem Schulabschluss - ah... solute Il äufigkciu-n Schlllab~,IIIIISS
Wahlahsicht CDU/ CSU SPD FDI' Biindnis 90 ,/ Griine Rr-pu blikancr
PDS Andere Partei Summe
HS 367 453 77 '9
"S
18'
244
Abitu r
SUlJll\I('
1I!) 131
Iili8
71
49
!.lU
125
'"
197 304
4:.\ 42 15
2(1
a
42
32
15
9
117 39
1086
6ü5
467
2218
1i5
S palte n-, Zeilen.. und Totalprozent e Man muss also auch hie r wieder die rela tiven Häuligkeiten hzw. P rozent . . WI'l" It, au gebeu. Dabei muss ma ll beachten. dass sich in einer Krt>llzlalwl1e
immer drei verschiedene Prozent mcrtc berechnen lassen : Zeilen- , Spalt en.. und To talpro:l(>ult'. Zur Berechnung VO ll Zeilen p r o ze n t en wird dit' Zt'ileusumme als P rozent ulerungshasls ( = 100 %) genommen; bei S pa lt e np ro ze nt en die S paltensumme (= 100 %). Schliesltch kann man die Hä ufigkeiten auf Basis der C esa mts umme prozr-ntuieren (T ot a lp r oz ente ). Dami t sind drei lnhalrlirh viillig verschiedene Allssa~wn verbunden. \ 't'rwendet man die Zeilens umme als P rozentuierungsba sis, bezeioluu-t der P roer-nt wert einen Anteil an de r Ausp rägung d,'s Merkmals in der Zeile. Vorwendet mim dir- Spa ltens umm e. bezeichnet der Pro zentwert einen Anteil a n der Aus pr ägung des Merkmals in de r Spa lt e. Y(,fI\"en rlel ma n d ie Gesamts um me, bezeichnet der P rozent wert einen Ante il a n allen Fällen. die in die Tabelle eingega ngen sind , In Tllbe1J(· ;jA lid,p sich der Antril der Bef ragten mit Haup tsehuiabechluss an fi liert potenticiicn CnUjCSU- It'iihlr m m it :lG7/üü8 x 100 = 3-t, 9 % I){'~ rechnen [Zeile np rozenre]. Der An /eil der /lfJtentie llclI cnu/ csu.. Wühler an allen Befm gtrn m it lla JJp / seh lllab$ rh lus.~ b-rechuot sich da gegen mit :.167/ 1086 x 100 = 33.8% (Spalte nproz ent e]. \'0 11 de n Befragten m it Hauptschulabschlus s wellen also 33 .8 % die cnu j CSU wäh len. 5.1.9 % der Befr agten mit einer CDU/CS U· Wa hlahsk ht haben einen Hauptsehnlab...
'"' schluss. Toralprozenre \1"('1"(\ (' 11 nicht so häu fig benöti gt ; von allen Bcfrn gtcn haben W'Il
HS
115
\\"a h l a l~~i d,t
367 ·153
.." 89 13
·12
15 1086
33.8 41.7 7.1 8.2 ' .0 3.9
1.' 100,0
182 2-11
7'
90 20
"
15
665
27·4 36.7 10.7 13.5 3.0 6.5
2.3 100.0
Ahit llT 25,5 131 28,1
" 9
19 125 2
32 9 -lG i
10,5 26.8
06.9.'
1,9 100.0
Sllmllll' WB 30. 1 828 37.3
197 30-1 65 117 39 22 18
8.9 /.1.7 ' .9 5,3
I.'
100.0
P rozent utert man spalu-nwets e. da nn 1ll11S."; mall zpill' nwl'ise int er pretieren: " ' il' mall a nhand der Spa lten prozentwe rte in dr r Tabelle G.G sieht, \\"011"11 :n.8 % der Befra gten mit Ha up tschulabs chluss e DU / CSU wähle n. a ber nu r 2;j .5 % der Befragten mit Abit ur. Bündnis 9 0 / G rü n e wollen :16,8 % der Befragten mit Abit ur wählen. a ber nur 8.2 % der Befragt en mit Ha uptsd l1l!abs('hluss und }:3.3 'X de r Befra gt en mit Realschulabschluss. De r P ro3
DiePro zentwerte lIH!l'n;d,dd,'u slrh \"01' d"11 in TalJl'l!<~ ;;.2 a uf Spil l' 1031l111'\"I!:,·b..neu, weilwir \"01' den 2.298 Helra gten. ..E c eiue Walola b,;id ,t ml~pl!:f'b"1l haben, nur vou 2.2 18 Personen (["11 SdlUh,b,d,lll" k"lllll'll .
1U!l
zcn rsatz der Befragten mit Abit ur , die Bündnis 90iGrtillP angeben. ist als o verglichen mi t dem Anteil. den die Grünen bei all1'11 Befragten erznleu (13.7%). ilherdurr-hschnit thrh hot-h. Gpl'arlf' umgl'kphrt f' VerhältnisSt' zeigt die Wahlabsteht zugunsren der Republik aner. .t % der Befragten mit Ha upt schulabsc hl us s \\'0111'11 dipsp P a rto t wählen, aber nur 0,4 % der Befragt e n mit Abitur , wobei die Republika ner bei allen Bcfrugteu 2.!J% erzielen. Be i zeilenweiser Prozen tuierung wir d spaltenweise iuterpretb-rt : Dt,1' SumIllPIl /Pilf' von Tabelle 5.u kann ma n eutneh nn-n, (lass insgesamt 49 % rler Befragten einen Haupt schulabs chluss ha ben. :30 % einen Realschulabsr-hluss lind 21,1 % Abitur. Ha uptschüler sin d unter den W ähler n der C DU/CS U (54,9 %). der SPD (54.7%) und der Republi kaner (66.2 %) üherproportkmal vertreten. Dip \rä hlt'n>rh al't der Grünen weist dagegen mit 41.1 % einen sta rk überdurchsclml rtlichen Anteil an Befragten mit Abitur a uf.
Tabelle 5.u: Kreuztabelle der \Yahlah.<.;irht mit dem Sehnlabschluss - absohl te Häuf i g kelten und Zellenprozente Schulabs chluss
CDUjCSU
srn
FDl' Biillduis !l0iGriill{' Republikaner
PilS Allt!"r{' Pa ('1.·i 5'1l11111{'
115
115
\\'ahlaLsicht
36 7
5~ .9
~ 53
5.;,7 39.J 29.3 66.2 35.9 38.5
77 S2 13
"
15
1086
ss.o
1S2 1H
öl ~I
2G 13 15
%5
2 1.2 29.5 36.0 29.6 30.8 .16.8 .18.5 30.0
Abitu r 110 17.8 131 15.8 24 .9 115 2 3.1 32 27.4 e 23. 1 16i 21, 1
"
u. t
Summe 668 100.0 818 100.0 \9 7 100.0 30 1 100.0 es 100.0 117 100,0 30 1110.0 2118 100,0
Zur P räsent a tiun von Tabollen giht es keine r-inheitllr-hen Regeln. Das Layou t der Tabelle sollt e so gehalt en sein. dass im Tabellenkopf die Spalten bezeichnet werden und am linken Tabellenrand die Zeilen. Je nac h inhalt licher Inter pret a tion werden Zeilen - oder Spaltenprozente angegeben. ~[iidlte man Iw ill!' verwenden. so hietet es sich an , nur eine Ta belle zu erstellen, in der sowoh l die a bso luten Häufi gkeiten als auch Zeilen- und Spaltenprozente stehen. Aus der Tabelle muss zudem die GrÜbc' und die Art der Prozentuicrungsbasis hervorgeh en.
1lU
5.2 Graphiken 5.2. 1 Un terschiedliche Art en graphischer D arst ellungen S ä ule n- und Balkendiagramme
Bei einem Säulendiagram m werden die Dat en d urch ver t ikale (stehende) Rl'dl( 'rkf' (,$ äll [('n") wl('(It>rgf'gl'lwlI. heim Balkendiagram m durch horizontale (lif'gl'ndl') Recht ecke (..Balken"). Bot einem Balk endiagramm worden dip Ausprä gungen dos ~[('f kmals auf der vertikalen Achse abget ragen. Die Lä ngt' der mittig über den Kat egorten eingezeich nete n Balk en ents pricht den absoluten Häufigl e-iten {n-lariven ll äufigkeiten oder P rozcnt werten ] der Mcrk malsausprjigungcn. Zwischen t!1'1I Balke n hlt>iht Plat z. In Ahhlldung ;j.1 wurde die se-hou bekannte Fragt' nach der \r a hlnbsif"llt als Balkendiagramm dar gestellt . Die Länge der Bnlkenentsprh-ht 111'11 proventnalen Anteilen der r-inzehn-n Parteien. Da es sieh hier um ein nominal skalie rtes Merkmal handelt. ist d ip Anordnung der Balken Iwlit'big. Abbildung ;).1: Bal kt'ndia gralll lll
.. u
ti P I"
Wahlabsicht
,
ro % gulligo Slimmen
Q ut' lIt·: ..\ LI.Hl"S 19!).1 .
n = 2.29~
Anstelle von Balkendiagrammen kann man ebenso gnt Säulendlagranune verwenden. Ein Säulendiagra mm der \\"ahl absicht ist in Abbildung :).2 auf rlr-r uächsten Sotto wieder gegeben . Hier werden die Aus prägungen auf rlr-r horiz ontalen Achse ab get ragen .
11 1
Gmpllikeu
Abbllduug 5. 2: Sä ulf'IIlJiagrallllll der , rahla bskht ~ .,-----------,
P. rt~i
Q ud le' ALl.Hl·S 19')-1 .
n =2 _2') ~
Balken- IIlId Sä ulendiagra mme sind vor allem zur Darstellung nominalund ordinal skalierter Variableu gf'f'iglw t. ßf'i ordinal skallert en Merkmalen muss allerdings di(' Reihenfolge de r Balke n bz w. Säule n die Ra ngordnung der Merk malsausprä gun gen wieder geben. Die Breite der Balken oder Säulen ist beliebig, da dies e nich t inter pretiert werden kann. Balken- lind Sta bdiagra mme eig nen sieh ebe nfa lls zur Darstellung d iskre ter . met rtscher Merkmale mit einer überschauba n-n Zahl \'011 Ausprägungen . wie z. B. die Zah l der Kinder. ;" lit Balk cndiegramnu-n lässt sieh auch de r Zusam menha ng zwischen zwei (lind mehr] Xlerkmalen darstellen. In Abblldung 5.3 ist der ZlISlllll11I t'IIha ng zwische n der Schulbildu ng und eine r gl'l" ing fiigig PIl ßl'sehiift igun g getrenn t für ~ liinlll'l" un d Frauen vtsualislert , ~ rall sieht deut lich. dass das Xivr-au der Schulbildeng bei Frauen einen Eluft uss auf eine gortngfüglge Erwerbs tätigkeit hat , nicht jedor-h bei Männom. \reil die ent sprechenden Fallzahlen Tabelle 2.1 (S, 28) entnommen werden kÖIlIII'II. wurd e hier auf eine Angabe verzichtet . SIE' ht die Tabelle alleine. müsst e hier eigcnrlich die Zah l der Frauen mi t ger inger Schulbildung, die Za hl de r Frauen mit mit tll'rf'r/ hillll'n'r Schulbildung. die Zahl der ~ l ä n nE'r mit geringer Schulbildun g lind d ie Zahl der Männor mit mittl r rr r/hiilwrN Schulbildung a ngegeben werden . weil dieso de r Prozeut uierung zugru nde liegen.
112
Abbild ung 5.3 : :-" lini. /:-"I idi-Job nach Sehnlabschluss und C eschh-cht . ,--------------~
•
F,auen
_""'drY' Sdl.lobWlkJ..
M30J1llf [J ,""""",,_
, S<:Il
Q ud le' SO El', Wd le W (g"w;r ht et)
K reisdiagram me
In Abbildung ,jA sind die Angaben zur wahlubsiclu ab Kreisdiagram m dargestellt . Die GrüN.' der Krei ssegment e ist propo rtional zur n-lariven lläutigkeit der jeweiligen :-" lprklllilbilll Spräguug. Kreisdiagranuue f' iglll'll sich vor al lem zur Illust ration der Verteilung nominaler Merkmale. Abbildung
,j A:
Kreisdiagramm der 'Yahl absicht (gü ltige Summen in P rozent )
Q uelle : ,\ Ll.Hl: S 19')-1.
n=2 _2')~
113
Gmpllikeu
Hi stogramm e und Linien zü ge
l hs togra mm o lind Linienz üge dienen der Da rs tellun g stet iger Merkmale. Sie worden aber auch bei dis kreten met rischen Mer km alen eingesetzt . d ie sehr viele Ausprägungen a nneh men können . wie t., ß . Einkommen. F ür die graphische Darstellung wird das Merkmalzun ächs t in benachbarte Klassen zusammengefasst. Bei I l iBt nym mmcll werden d ie ~ I!'ss \\"erl(' durch Rechtecke übor den Klassen symbolisiert. die unruittol bar auema nder angre nzen. Dies ist auc h der auffälligste Untersch ied I II Balkon- lind Säulending rammen. Die Fläch e über den Klassen (Hüllt' x Breit e der Rechtecke) ist proport ional zu den absoluten bzw. relarl von Häufigketten. Verbindet mall die Mit telpunk te der Rechteckoberkanten dur ch Linien , da nn erh ält mall einen Polvgcnx ug. Fü r Linien züge bzw. Polygon e gilt das soeben Gesagte. Auch hier gibt die Fläche unt er dem Linienzug Ausk un ft über die lI äuligkr it j Antf'ill' de r ~[ es.'m"{'f te. üb man sich für einen Llnienzng oder ein His togramm entscheidet . ist reine Gesr-luuacksache. In Ahhihlung 5.5 wird d as Alter (11'c Teiln ehmer zwoior Statisti k-Kurse sowohl durch ein Histogramm als euch durch einen Lin ienz ug dar gestellt. Ab bildu ng 5.5: Alt er von Kur steilnehmern
l.1
"
1,1
I.'
"
\ r ill man zwt-i verschiedene Vern-ilungen in einer Gra phi k dars te llen. so bietet t'S sich an, ein Merkmal durc h ein Histog ramm. da s andere durch einen POI.\'gollm g darzustellen. Llnienzüge eig nen sk-h besonders fiir Zeitreiheuanalvsen. Ein ß t'ispieJ ha ben wir bereits im Kaplt el 2..1 ken-
114
1'"II..tI"" und Gmphikell
neugclernt , wo die Entwicklung der Anteile der Person en . die sich mit einer Partei identifizieren. für Ost- und wesrdeutsehland dargestellt wurde. Zur Darstellung nominaler und ordiualcr xlerkma b- sollten die Rechteelf' nicht aneiuauder gf'zPi dlllf't werden, weil dles sllggt'rit'H'n wiinh', dass Differenzen zwischen vlerkmalsansoräguugcn interpretierbar seien. In Kapitel 3.3 .1 wurde von dleser Rpgr ] abgewlchon (Abbild ung .J.J), weil lwi den der Irr-ms metrisches Messniveau unt e rstellt wurde. \\'i r werden in Ka pit el r.G Streudiagramme kennen ](, f1H' Il . mi t deren Hilfe rk-r Zusamm-nhang lwisdlPli zwei merrischen ;" lprkma!Pll dMgps t l' llt werden kann.
Kartogramme I n Ka rtogrammen werden Merkmale geogra phischer Einheiten abget ra gen. Dip einzelnen Merkmalsausprägungen worden dabei durch unterschiedliche Schraffuren od er Fa rben repräsentiert. Die Karte in Abbildung G.ß auf der gegcuübcrlicgen-b-n Spill' zeigt d"11 wählerantett. d('11 die ;\,SDAP bei den R('ichstagswa hlpll am G. ~ Iä rz 19:3:3 in den einzelnen Sta dt- und Landkreisen erzielen konnte . .Ie dunkler die Schraffur. umso höher der :\'S DAP-Antl'il. Ganz dun kel sind die S tadtund Landkreise darges tellt . in denen d ie ;\'SOAP mehr als;:,o % der Stirnmen erhielt : ga nz hell d ie Stadt- lind Landk reise, in denen de r ;\,SOA PAnteilunter 30 % lag. Zur Da rstellung mussten die Prozen twer te gruppir-rt werden. Wü rde ma n jedem Prozentwert " im' uuterschledliche Sch raffur 1.11weisen. da nn wäre das Ka rtogra mm nich t mehr interprettorbar. Die \\'a hl der Ka tcgoriegrcnzen ln-ein Husst das A IISSt'i1 eil des Ka rtograntms n a t ii r1ich entscheidend. was bei der Interpret ut ion einer solchen G ra ph ik berücksichtigt werden muss.
115
, t•
.
..: "
~
." ,
"~ ~
C.. .. '; ~ .1 '0 ~
~
111111 11
116
5.2.2 Missbra uch gra phischer Darst ellungen Manchmal werden gra phisc he Da rstellungen bewusst oller unbewusst so gt' wähh , da ss die t'iW'Ilt' l nrer pre r a tlon de r Da ten ßpstii tz t wird. ;"1t'js!('IlS handelt ('S sic-h 11m Fah rlässig keit r-n bei rlor Erstellung de r Graphiken. manchmal jedoch a uch IIIll bewusst e Xlanipulationon. Anhand des schon lx-kannt en Beispiels zur Wahlabsiclu \\"011(' 11 wir d ie Auswirkungen felseher Du rst eil U IIgs weiSl'n demonst r-ieten. In Abbildung tl.i ist dargest ellt , wie sieh eine Veränderung des ~ (ll bs ta hs der Einheiten der y-Ad lsr a uf d ip A ussage kra ft de r Graphi k aus wirkt . Eigentlieh wärp die Ska iir-rung 1I1\f d a nn korrek t , \\ '1' 1111 sit' von 0 0/(, bis 100 % gehe n wiirde, da j a Ihf'O,.eti.~ch eine Parte i 100 % der Summen bekommen kan n. A11 i.prdt'lll wäre rlann leicht prkl'111111<\ r. wie vieI eine Pa rt pi vom "ga 11Z"II Kuchen': bekommen ha t. Diese Darst ellung ist im linken Dia gramm in A bbildung ::i .i zu sehen. Der Xa ehrctl dieser Da rstel lung besteht d arin , dass d ie Unt ers chiede zwischen den Parteien nicht sehr deutlieb a usfallen , da keine Partei mehr als 40 % Sum men erhält und dami t nicht einmal die Hälfte der llöhe der G ra phik
. • I, .. ,, .. .'
Abbildung 5.i : \\"ahl a bsieht Iwi Veränderung des y- AchSl'll-).[a bsla llt's
,
•
': n
Qu d l<" .\ LI. ll n i I')!).l ,
n : 2 29~
Um d ie Unt ersrhh-de hervorauhehen . könnt e ma n deshalb den umgekehrten \ \"q !: ein schlagen und dip Skalterung nu r von 0 % bis --10 % vornehmen, wie in der rechten Graphi k in Ahlnldung 5.i zu sehen is t. Dip Unt ersch !ed" zwischen den Pa rteien werden da d ur ch st är ker her vorgehoben . Dip in Abbildung 5.2 auf Se it e 111 gewä hlte Skalicr u ng kan n als ein Kompromiss zwischen di(';;PII beiden ext remen Durstellungen a ngesehen werden.
117
Graphike"
Falsch wäre es . wenn die Gröscnskala nicht bei null begänne. In Abbildun g 5.8 wird dies anhand der St imma nteile für en u und SP D verdeutficht . ,Yähn 'nd in der linken G ra phik die korr ekte Darstellun g hpnutzt 11'111"11('. zl'igt dip rf'( ·htp Graphik lediglich den Achsenausschnit t zwisehen 20 % lind .!O%. Dadurch werden (!ir' G riibt'nw l"hä 1tnis~!-' l.wisd wn C DU/CS U und SP D dram ausk-rt .
-
Abbildung 5.8: \rahlilbsicht mi t kor rek ter und falscher Grundlinie
,.
•
•
,
!= . . t •
...
Q"d l~,
" .......
I
,\ Ll.f1l ·S 1!I'J.l,
I
-
I
-
F
...
I
.
,n-,...
"
..
n =2 _2H~
Zah lft'idH' ßt'ispi(']f' für Manipulationen grilphisd wr Darst ellungen finden sich bei Krämer (199 1), wie man e~ richtig machen sollte bei K rämer (l 99.!).
118
Aufgaben zu Tabellen und Graphiken l. In rler folgende n Tabelle ist das Wahlf' l'gl>hnis (11'f Rl' kh st a gswa h l vom 14. September 19.'30 wit'(\,>rg t>gdJPII. Bit te ermit teln Si!' dip Wa hllJl' ll'ibgung un d den Anteil der ungültigen Sti mnwn . P rozontuloren Sip die Stimmen für die einzelnen Parteleu (a) auf Basis der gültigen Stimmen und (h) a uf Basis der Wahlbcre-htigt cn. waruni wi rd in der Regel a uf gült ige SI i 1Il men prozent 11 ir rt "? Tabolle 5.7: Ergeb nis der Retehsragswahl vom 14. Sepnunber 19:.\0 t fuhh:rgt:blli .~ Wa hlberechr igt o
42.957.G7;J
Abgegebem- Stimmen ungültige Stimmen
33 .22fl.I,j8
Cültigc Stimmen
:U. 970.85'
KPD CS PD
2;J-t.f)OI
.t.592.OUO
11.902
3r D
8.577.738
DDr
1.:322.:385
Zen t rum
-1.127.910
RYP
1.059.141
nvr-
1.609.77-1
D:'\YP
2.-Fi8.2,16
:\SD.-\P
6.-109.610
Son stige
-l.702.061
2. Bei der Reichst agswahl 1932 I'rzi('!te die :-;SD:\.P 3 7,:3% der gültigen Stimmen. Um wie viel P rozent lind um wie viele P rozent punk te st ieg der Ant eil der Nationalsozialisten im Vergleich zur Reichstags wahl von 19:30·! :3. Bitte s tellen Sie das Wahlergebnis der Reichstagswahl 19:30 graphisch dar! Wf'k hf' Dia gramme können zur Darstellung verwandt \H'rdl'll "!
119
AuJ!J" oclI
-I. Auf die im A LLOUS 199-1 gestellte Fragt '. .,Und wie wird Ihre ciqcnc wirt schaftl iche Lagc in einem Jahr sein ?;;. konnten dio Befragten von
"wesentli ch l!f:.~.~ e ,,'; bts -uxsentuch: schlechter" ant worten. In Tabelle ö.S s ind die Antworten getrennt. für west- und ostdeutsche Befragte wiedergegeben: Tabelle ;:;,8: Wi nschafrliche Ei nst ellungen im A I ,t OUS 199-1
\rest vesenrlteh hl'sspr etwas besser
gleichbleibeud etwas schlecbtor
wesentlich schlech ter
S 1I1ll llW
Ost
S1I11l11ll'
38
22
GO
:3-18
23 4
GU2
1388
üGl
2249
293
119
-112
23
21
229 0
1077
"
3:~G7
Bitte berochnon Sie Spalton-. Zeilen- und Totalprozente. Inn-rpret ioren Sie d ie Inhaltliche Aussa ge de r TalJI'II,,!
6 lage- und Streuungsmaße u.t Lagerna se . . . .... . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . ... 122 6.2 St rcunngs make ....... . •. .. . ....... . . . ••..... . . . . • . . . .... . •••••••• 131)
Im vora ngega ngene n Ka pitel wurden Jliiutigkf'itsn>rtl·jlungf'1l SI IWi t> deren Da rstellung d urch Tabellen lind Gra phiken behandelt . In diesem Kapitel werden IlU Il statistische Maßzahlcll vorgestollt , dio die zentrale Lage eine r Ver tei lu ng U1HI die St re u ung 111'1" Mess werte cha ra kt eris ieren. In TaIH']l!' Ii.I is t d ie St udienda uer von 11 Absolventen der Polit ikwissenschaft \\'il'{ll'rgr'gp!wll (das Of'ispiel ist fiktiv) . In de r linken Ta belle li"gl'll (\ie :>. Il:'s.-;wf'rte d PI einzelnen Personen als Urliet c \'01'. d. h. so . wie wir sie willkürlich nacheinander notiert haben. Um die Ubersichrlichkoit zu erhöIWH . wurden die Messwerte nach ihrer Gr öbp geordnet. Diese so genann te primäre Taf el ist in der rechten Ta belle wiedergegeben . Tabelle G.I: Semes ter zahl von Politologen : 1lllg rn p pit>rl P Dat en
Ur/iHle
prntuire Tnfel r
.r;
1 2
12
l'
,, l' 3
10
11 211 7 12 8 12 s 11 111 13 11 13
e
1 2 3
,, e 7 8
u 10
11
111 11 11 12 12 12 13 13 14
l'
20
Xlit i wird de r La ufindex für die ei nzelnen Mer kma lstr äg er (hier also Pcrsonen ] hezeirhnet, mit .!"; d ie konkrete Merk malsausprägu ng des i-Iell Mer kma ls t rägers [bzw. der i- tell Person). Allgemein nirnnu der Laufi ndex i
121
Wert e zwischen 1 und n an , wobcl 1l der Anzahl der Merkmalsträger ( Persoucn ) ent spricht . Im Beispiel .Jäuft.. der Index i als o von I bis 11. da dit' ~l esswert e - die Semesterzahl - bei 11 Perso nell erhoben wurden. :\lit i =·1 wird a lso der vierte !\!f'ss\\'prt bezek-hnet , mit x~ die konkrete :\!prkmalsaus prä gung de r vierten Pers on. I n de r Urlistc nim mt x~ den , rerl 15 a n, d. h. diese Person hat bis zur Magist erprüfung 15 Semester lan g s r udiert , In der primäre n Tefelulmmt dagege n x~ dCJI \\'e rl 12 IHI, d. h. der Laufindex wird bei der Sortierun g nicht berücksichti gt . Sowohl llf'i der e rliste als auch hl' i der primären Tafel werden clif' !\Iesswerte einzeln aufgefüh rt . es handelt sieh daher Ulll l11ty fll1l11irrte Date n. In einer Ifäuf i gkeitsta helle (Ka pit el 5.1.1) worden dagegen gletcho Messwerte zusammengefasst (gr uppierte Dllten ), Zwischen un gr up pierren un d gruppierten Da ten gibt I' S keinen I nfor ma t lonsverlust , da die Merkmalsausprägung einer jeden Person vollst ändig rep roduzierbar ist.
Tabelle G.2: Semesterzahl von Politologen: lTällligkpitst alwlh' k I 2 3
J,
f" I
%
,,
11
2
9.1 % 18.2 %
12 13
3
27, ;~ %
2
14
7
20
I I 1
18.2 % !.I.I % 9,1 % 9.1 % 100,1 %
u
L
10
"
11
kum. % 9.1 % 27.3 % 5-1 .6 % 72.8 % 8 1,9 % 9 1.0 % 100,1 % 100.1 %
Der La ufindex für die einz elnen Ka tegor ien wird mit k bezeichn et und 1/1. wobe i m der Zahl der Kalt'gor if'1I f'llts prkltt: in (!ie'sem ß pisp iel sind es sit'lwlJ. Der [,clll/ illllex f ür K uleg fl rtm k .'wIlte IlJI/ kein en Fall m it dem Lau/ iuda f ür Merk ma lstriiqer (hier: Personen] i ver, we(;h.~dt werden . Dip ~ lp llmal sallsJlrä glln g einer Ka tegori e wird mit Xl. bozeirhnet. r~ entspricht der Merkmalsansprä g un g 13 Semost er. Da dip Da ten zusammengefasst wurden. Ix-nötigen wir noch eine Anga be iibr-r die lIä ufigkf'it /"l mi t der dip ;\lprkmalsallsprägullgf'JI auftreten. / ". ist hier 2. W/lS hecleutet , dass I'wt'i Po!ito[OW'1I 13 Semester bis zum Abschluss beuöt igten. P rozen t ua l ausgedrtlr-kt haben 18.2 % der Studierenden (2 von
.Jäntr von 1 bis
122
11) 13 SI' llW~I(,1" bis zum Ab~('IJ I Il~~ des S tudiums ben öt igt . In der le t711'11 Spal te sind die kumulierten {addier ten] Prozente angegeben. 9.1 % der Studierenden II1lIll'1l 10 SP liWSIt>r bis ZIIllI Abschluss IH'uiiligt. 27.3 % c11'1" Studiorendon haben 11 oder 10 Semest er bt'niitigt , 5~ .(i% de r Studierenden nich t meh r als 12 SI' IlU'~It'I" , 73 % IH'nigPI" als 13 Semester II ~W. Die SIiITIIIW der P ro zent e addiert sich wegen R und un gsfehlern hier nich t ga nz exakt zu 100 %. Die Berechnun g kumulier ter Prozentwor te ist erst a b ordlnalskaliertem Skalennive au sinnvoll . weil die Mer kmals ausprägungen da zu nach der Grü!o,e sortiert wenlp ll müssen.
6.1 Lagemaße Xliuclwert e kennzeichnen die zent rale Lage einer Verteilung. '''('nil vom ?\ Ii1tel wert gesprochen wi rd. dann ist in der Regelein ~I)l'~ ieller ?\ Iit telwert . nämlich das arithmetische ?\riupl, geme int. Die drt'i wiehtigst t'lJ ~ litt t'hn'r te si nd: 1. Modalwert 2. Medi.m 3. Arithmetisches ?\litt el
" -eldwlI der drei Mitt elwerte ma n berechnet . hä ngt zum einem vom Skfllermivcau des Mertmole und zum anderen Hili der zu t reffenden inhalt fichen AIlSSllgt' ab. Ik-i nom ina l skalierten :-'krkmalen ko mmt der :-'IOIlalwer t in Fra gt'. hel ordiualen ?\ 1t'rkmalplJ wsät i'lich tlt' l' ?\tt'tlian lind bei metrischen Merkmalen läs~ t s ich a uch (las a rtt hmetische Mlt tel sinnvoll Interpre t ieu-n. Zwe i weitere xfiuelweru- fÜI" mindestens rar ioskalierte Xlerkma h-, da s
fl CO-
metrische und da s harmonische Mitt el, sind für 11I1~ \" 011 u ntergeordneter Bedeutung (vgl. Sachs 2UUu, S.7U -78). Das gt'OII11'trischt' Mit tel komtut bei pos itive n. ratios kallerten Daten zum Einsatz und ist in ha lt lich bei der Beroch llU ng du rehs ehn i t thchor '''achs t 11msfaktoren (UmsaTi', ZiIlSi'1I IlSI\·. ) an gemessen.
6.1.1 Moda lwert DI'I" Modalwe r t ist der M es swe rt . der in einer Verteilung am häufi gsten vorkommt. Ot'i einer graphischen Dars tellung ist der Modalwert also
der Gi pfl'l hZI\". da s Maximum der Verteilung. Die Beaeich nung für de n Modalwert ist nicht einheitlich. Wi r benutzen X'\/Q'
Kommen zwei !\tt';;.s.gol"it> (J;" = 3 ) ist. (Das lH'if.1 aber nicht . dass die m eisten der elf Politologen 12 Semester bis zum S tudlenabsrhluss lx-nötigt habeu.} Modalwert e lasse n sich für all e Messu lveaus bestimmen. DeI" Xlodalwert der Relig ions zug-hörigkeit {nom inale, Merkmal . Tabelle G.3) ist hpi westdeutschen Befragte n .Evaugelisch / Freik irche". bei ostdeutschen Befragten .Keine Konfession-.
Tabelle G.3: Rt'ligion sm gf'hiirigkt'it \\ \'>;t,I"lItseII11\lI,1
Os td"utsd ll,,, u!
Häufi gkeit rel. Häufig. Willfigkl'it n-l. Häufi g. !}(l5 (lAU Evangelisch i Freikin-he 284 U.25 4.) Katholisch 1:131;\ U.37 U,U4 0,02 And ere christl. lloligion .':>li U.lJI l()!} Nicht ehristl. Hd igiull U.05 IU U.U I Keine Konfession 7(j5 377 u.te uus I Il !) Gesa mt 2285 I.UU I.UU AI.I.BCS 2006
"
,
6.1.2 Median Der M edian iSI der \ \'{'rt. der d!e nach der G riik a ufste igonrl sortierten xlossworto in zwei Hä tfron teilt. Der Xledlan iSI also der \ \'t' rt. der in der Mit te liegt. Der Median der drei Einkommen 1000 Euro. 1500 Euro lind 8000 Euro ist 1500 Eur o. Die Bexeir-hmmg des Xlcdians ist i,
Um den Xledian zu ermitteln, IIlIlSS man die ~ 1f'sS\n'l'l t> zunächst ordnen, d. h. dip pri märe Tafelerstellen. Ans (:hlit>f."IHI s ucht man den Wer t . der
124
in der Mit te liegt. Bei einor ungerade n Zahl von Messwerten exrsno rt gona u ein ~ I I'SS\\"t'f l, der in der ~ I i tt l' liegt , und zwar nn der Stolle n; ' . Der Media n ist d ie Merkmals ausp rägung de s Messwerts. der an der n~1 ten Stell e in der gl:'ord llPtl:'1l " Pftl' i1 ung Hl'g t:
(G.l)
i =;[ ~.
Im Beis pielzur Studiendauer. die für n = 11 St udi oronde erhoben wurde . lx-träg t tief xled lan
i
=
;[!Jf!
= I 6 = 12 Semester .
Bei 11 Mess werten liegt der sechste ~ (I'ssl\"('rt - ( ll + 1)/2 = Ii - in der ~ li tte der Verteilung. Die Merk malsausprägun g des sechsten Wert es ist .(6 = 12 SI'lllPsll' f. Dip mit t lere St udiendauer het fä gt a lso 1:1 Semester. Die Hä lfte der Studierenden benötigt bis zu m St udienabschluss weniger oder gleich 12 Semest er. die Hälfte mehr als 12 Semester. In dl' f ersten Hä lfte lll'tilld" 1l sieh bereits zwei Studiere nde , llip r lH'ufalls 12 Semes ter st udiert haben. Bpi d iesen beiden kann man nich t da von spre r-hen. dass sio .schneller' st udiert habon. Bei einer ger a d e n Zahl von Messwe r t e n existi eren zWl'i nuu ler e \refte, und zwar an den Su-Iten n und ~ + I. Bei 12 vless wert cn liegen der SI'eilste (!fl und der siebte (~ + I) i\[t'SSI\w t in der ~ Iitte. Es ha t sieh Iwi einer unge raden Zahl von ~ 1 1'SS\\'I' rt e ll eingebürgert , deu Xledian als arith nu-tisrhes ~ li tt pl der Morkmalsa usprägungen der belden in der ~ I i ttf' liegenden ~ reS;;l\"eft t' zu berechnen:
(G.') Würdo in unserem Beispiel noch ein Polit ologe mi t I ' 2 = 21 Semest ern hi nzu komm en (insges a mt sind t'~ da n11 n = 12 Personen). würde sleh der Media n wie folgt er mitt eln:
12J
~
1'6 +X7
12 +1325
--, - ~ - -, - = "2 = 12 ,5.
Die ~ I\'rk lllillsa llsp l'ägll llg dos sechsten ~f l'SS\H'I' IS ( 1'6) isr 12 Semesu-r. dip Merkmalsansprägun g des siebten Messwert s (X7) IWlräg l 13 Semoster. Das a rit hmetische Xlinel a us diesen beiden Wer ten ist 12.GSemester. Die m ittIf'rf' Studie ndauer he lräg t nun a lso 12.GSt:'lIlt'Sle]', Alt ernat iv kiillllPll auch d it' heirleu mit tleren wer te illlgt'gel )(>11 werden. was bei ordiualskalle rt en Merk malen angemessener ist . Die Berechnung des Media ns set zt ledi glich vora us. dass die ~ [ l'ss \\'(']' le in ein e Reihen folge geb racht werden können. Er ist deshalb für alle Daten a ngemessen . die mindes tens ordinalskalierr. si nd. Bei einer groteu Zahl von Beobacht ungen lä ss t sich der Xledian am einfachs t en
11 a 11 pt sd lulp Mu tlore Rpirt, Fachhochschul reife Hochschul n-ife Gesa mt
/"
'X
901
43 %
GGO
30 %
I"
4G2 2221
7% 20 X
100 %
kurn. % 43 % 73 % 8 0 'X 100% 100 %
126
6.1.3 Arithmeti sches Mittel Das a ri t h metische M ittel ist der 'fert, den alle Merkmalsträ ger . also z. B. Personen. im D u r ch schni t t aufweisen. Land läufi g hrzp iduwt man da s anthmettsche :-'litlp l deshalb uurh als Durchs chnit tswort . Das artthmettsehe ),litlf'1 wird m it i: hezeichnot. Oll' Berech nung des arlt hmetischen Mit tels setzt mindestens intorvallsk allert e Da ten \"()raIIS . • Br-i u7Igr1lJl pierte71 Date n - wil' in Ta belle G. I - lx-rechnet sich da s arit hmetische Mittel wie folgt:
"
i =
L Xi .= 1
n
(6.3 )
.
Zur Berechnu ng elr'!; a rithme tischen Mittels werd en die Merkmalsa nsprägungeu a111'f :\1erklilalst fägl'r sumn riert (L r j ) und anschlil'b!'nd d urch tlit' Anza hl der ~ I('rkillalslrä g(,f (n) dividiert (vgl. zum Rt'dllll'll mit dem S ummenzeichen Burtz 200·t, S. 703f. ). [im' Division du rch 1I bedeutet inuncr. dass r-itt Dur chschnittswert ausgerechnet wird . llier ist PS also rlie d urchs chni ttliehe Ausprägun g tlps Xlerk mals Xi . im konkre«-n Beispiel also d ie d urrh schni tt liche Semestorza hl-
L" X,
-
;= 1
r ~ --
~
"
X l + X 2 + .1'3 + .f ~ + .f~ + .[ 6 + .fr + Xli + X 9 + .f 1O + X Il
10 + 11 + 1l
+ 12 +
n
12 + 12 + 1I
I ;~ +
13 + l·t + 15 +20
Dip durchschnittliche Studiendauer IIPträgt also 13 Semester. ü b man zur Berechnung der Sum me' der Xlerkmalsausprägungen die \ff'rtf' der primären Tafel ode r der Urlis te enmirnmt., ist na türlich völlig egal. • Für Da te n. die ineiner Häufigkeit s ta belle vorliegen (gr uppierte Dut m ) - wie in Tabelle 6.2 - , si"ht. rlie Formel etwas anders aus:
127
m
L:: ( X I;' r~,, )
.r = 'C-o''--- - -
(GA)
J etzt werden als o nicht d ir' Merkmalsa usprägungen aller Personen (x;) summiert . sondern die ~ 1(' rkllla lsallsprägllllg(,11 der Kategorien (.tl;) multipliziert m it den-n Ilüuftgkelt U n )' D ip Divis ion d urch 11 bleibt . Angewendet auf das Boispk-l in Tabelle G.2 Ix-rechnet sich r:
lQ ·l ~
+ 11 · 2 + 12·3 +
1:J · 2 + 14 · 1 + 15·1 + :.10 - '
11
Das Ergebnis ist nat ürlich dasselbe. Das arit hmotische Mittel lst der
Tabelle G. i:!: Einfl uss von Ausrei sern
X .\1o
i .t
12 12 I:J
12
12 12.:1
128
\ r ä hrl'n d Modalwer t und Median un verändert bleibe-n. verkleinert sich das ari thmetische Mittel in der Vert eilung ohne (11'11 Aus rei s er . Die durchsdlllittlidH' Studiendauer Iwt rägt nun nicht mehr 13 Semest er . sondern 12,3 Semoster. Das arithmetische Mittel mini dwrh den ertremc n Wert verzerrt; während Modalwer t und Median gleich bleiben. Das arühmetlscbe Mit tel webt zwei Eigens cha ften auf, die m a n sieh bei anderen statistischen Ben-ehnungen - Will Beispiel der im An sch luss be... handelten Suvuungsmaj,e - zunutze m a chen kann:
1. Die Summe der Abweidlllur;en aller :>. 11'sswerte vom Mittelwert ist O. Mathematisch ausgedr ückt , stobt das folgr.ndermaken aus:
"
L (I , - .c) ~ o . ,: 1
Würde ma n in diese For mel irgendeinen anderen \ \'I'rt a nstelle des arith metischen Mit tels einsetzen . würde ein \ \'erl I' 0 hera uskommen. d. h. dass nur das ari thme usrhe Mittel diese Elgenschaft hpsitz\. 2. Die S umme der qlwdrierte1l A bweich1l11!J f'II aller Afp.~.mtert e vom Mittelwert bzw. die ..sUIllIIW der Abweichungsquadrat e' (SA(J) ist minimal. Auc h d a zu wieder der mathematische A usd ruck:
L" (.ci - iY = min . • ", 1
..Minimal" in dieser Formel ln-ist, das." bei der Berechnu ng der quadriert en Abweichungen der x lesswcrte von irgendeinem anderen Wer t das E rgf'lm is au f jpdt>1l Fa ll g riibn wäre a ls bei \ 'e nl'Plldung des arithmetisehen Mlttels. Wir wissen n U11. dass die durchschnit t liche Studiendauer i der elf P olit ologe ll 13 Semester lx-trägt. die m itt lere Studiendauer (x) bei 12 Sr-mcstcm liogt , und dass d ie am st ärks ten besetzte Ka tegorie (I ,I/o) 12 Semes ter ist. Das arithmetisrhe Xliuel ist de r grüblt' ,rt'lt , gefolgt von ~ It'f lia ll und
Modalwert. In symmemsehen Verteilungen sin d ~1t'{liall un d a ri thmetisch es ~ Iitt el identisch. wie ma n an der Ver t eilung der Körpcrgr öt,o der im A LLODS
129
200-1 in Westdeutschland befragten Männer [linker Teil in Abbildung G.I ) erkennen kann (i = 1: = li8 cm}, In schiefen Verteilun gen wird der ari rhmet ische :.'.0t telwert st ärker in Richt u ng (1f'S IängprPll E ndes der Vertpilllng beeinflusst . Das kla ssische Beispiel für eine schiefe Vert eilung slnd EinkOIIlIIH'II. Dip Verteilung ,1('1' monatlichen Xet toelnkcnunu-n der in ' \'<'Stdeutschland befragten Xlänn er (ALLBUS 200G. rechte r TPiI in Abbildung G. I ) ist lin ks.sleil (rechtsschief'): Dip Einkommensverteilu ng s teigt zunächst (a m linke n Ende] steil a n und fällt da nn nach recht s flach a b, Das längere Ende der Verteilung ist bei den höheren Einkommen. Das arit hmet ische Mittel de r Einkommen (gestrichel te Lin ie) wird durch die so,11I' hohen Einkomnu-n nach OIH 'II heeinflusst., der Medtau {durchgezogene Linie) nicht . Di p mit tleren Einkomnu-n (i ) slnd da her nied riger a b d ie durchschni ttliehen Einkom men (x) , Möeht o man Einkommen IIO('h da rstel11'11 . so wird mall m it den durrhsctmittlk'hcn Ein komnu-n i: a rgument ieren . möcht e mall diese nied rig darstellen , wird man die mittleren Einkommen i verwenden . Auch die St udien da uer der Politologen ist link sst eil verteilt: Der Median bl,t rägt 12 Semes te r. rlas arit hme tiscln- Mittel 1:3 Semeste r (Ta belle G.5 ), In t'ilwr rechl.~s te ilell {llnksschiefen] Vf'I'lt'illlUg befindet sich das lä ngere Ende der \ 'ert etlung am Ii nken Ern I." IH I S emplrlseh jedoch solteuer vorkommt (vgl. Abbild ung 3.3, S. 50). In rechtssteilen Verteilungen ist rlas a rithmetische :.'.litt l,1 kleiner a ls de r :.'.[ec!iau. Abbildung G.I: Sym me trische und link ssteile Verteilung
- --- -".-
:
•
".
'" ... _.-
!
,.
- -,-- -- ....- !
--.~
,
In ur nmodalon s vm nu-t rischen Vert eilungen fallen a lle d rei Sün elwer n- in einem Punkt zusa mmen (I .lfo = i = 1'). In einer linkssteilen Veru-itun g ist der Modalwert der klein ste ' ''prl, gefolg t von Media n und a rit hnu-t lschem Mitu-l (r.llo <.f < 1'). In einer rechtss teilen Vertr-iluug nimmt clas
arith llwtisdlt' Xlit tel den kleinst en ' ''fOrt , der Median den mit tleren " -eI'l und de r Modalwert de n g rill'.t f'll '''ert a n (1' < i < I;\/ o ) '
I:.lU
6.2 Streuungsmaß e Ein ~lillf'hwrt beschreibt dip \ 'erteilung umso besser , je näher d ip Daten beieinander liegen . Streuen d ip Daten jf't!oeh stark, ist dip Borür ksh-htlguug eines St7'e1J.Jmg$llwße.~ ra tsam . Die xltu olwerte einer beheblgen Verteilung können nämlich bei unterschiedlicher Streuung klentisch ausfallen . So ist r. B . in einer Ver teilung von drei Einkom men in Höhe von 2UUU Euro. :3UUU Euro und -tUUU Euro das leicht zu errechnende D ur chschnit t seinkommen 3000 Euro. Auch bei rlrei Einkom men in Höhe \ '011 100 E uro. 900 E u ro und 800 0 Euro orgäbo sieh ein arithmetisches Xli uel \'011 300 0 Euro. Die beiden Verteilungen streuen jedoch unters ch iedlich stark. Dargeste llt werden die folgen den :-' Iafizah!eu : 1. Inde x quali tativer Variation
2. Variationsweite 3. Qua nilal.stand 4. Varianz
o. Standardabwr-k-hung G. Vartatiouskoefftztent
Welchos St reuungsmai- a ugemesse n ist, hängt auch hier vom Skalenniveau der betrachteten Merk male ab.
6.2,1 Index qualitati ver Variation i\Olninalp Streuungsmase sind nicht sehr weit verbrei tet. Die ~ lilN>, die zur Yt'ffiigllllg stehen - wie rlie Devta uz (Kühne! un d Krebs 2007, 9ü 1L) oder der hier dargestellte Index qualiranver Variat ion (lq V) - , ber uhen darauf, dass die Str euu ng bei nominalen Merkm alen maximal ist , Wl' Il 11 die .-\uspragungen eines Xlerkmals gleich häufig besetzt sind . Die Streuung ist m inim al. \1"1'1111 alle Beobachtu ngen in eine Ka tegor ie fallen. Br-i e inem Xlc rkmalmlt zwei Ausprägungen ist d ie S treuung maximal. wenn je-k- der beiden Kategorien 50 % der Beobacht un gen beinh alte t . Si!' ist min imal. wenn nu r ein e der Ix-iden Ka t egorien lu-setzt ist. Der Index qualna tiver Varia tlon berechnet sieh nach
Stn;uullyml<Jpt
IQ~ ' =
131
}- I>i (711
k.l
1)/m
(G.3)
.
wob ei r n d ie Zahl der Kate gor ien und PI._ die rel a t ive Hä ufigkeit der v- ten Ka tegorie an gibt . Für die westdeu tschen Befragte n beträgt die Streuung der Religionszugehiirigh>it (Tabellt' 6.:3. S. 12:3)
lQV =
I
-
(" .
+ .:]72 + .022 + .05 2 + . 162 ) ·1/5
=
0 81 . -.
(G.fi)
Für dio ostdeutschon Befragten ist d ir St rouun g der RE'I igiollszllgr hör igkri t geringer . Rund TU% der Befragten be finde n sich hier in einer einzi gen Ka t egorie, nämlich ..Keine Konfesslon''. OPI" Ind ex quuli rari ver Va ria tion Iw tr ä gt 0.3i . Bei einer gleichen Verteilung der Beobacht un gen auf a lle Kategorien Pi = I/ K wird der Index 1 (maximale Streuung}. Sofern eine Kategorie alle Beobachtungen beinhaltet (Pk = I ) nim mt der I nd ex ej nen wert von Xull a n [kr-ine St re uun g).
6.2.2 Variationsweite Dip Va r iat io nsweite (auch: Spuunweitc] gibt den Abs tand zwischen dem ma ximalen und minimalen \ r er t einer Verteilung an. Die Bezeichnun g ist normalerweise V, manch mal euch r , wegen der en glisch en Bezeichnung mnge. Let zte res wird von uns a ber nicht empfohlen , d a die Bezeichnung r in der Regel für den Penrson'schcn Korrclaiionekoejii zientc ii verwendet wird [vgl. Ka pitel i .6). Die Bn t'(:hllung \"011 V Sf'tzt voraus. dass die Dat en eine Ra ngordn ung haben.
v=
X",a;r -
X mi ..
(G.i)
132
V ist de r Wert m it 111'1" größtl'rl Mr-rkm al saus pr ägnng [nich t zu ver wechseln mit dem Wert mit 111'1" häufi,q.~tell Mcrkm alsa us präg ung] abzuglieh des \'"('ftps mit der kleili.~t erl ~ 1 f'l"kmalsilllSl)rägllng (pIH'IlSO nicht zu ver wechHI'III m it dem Wert m it der seltensten Merkmalsausprägung}. Im Botspiel der St udiendauer prgihl steh
l' = ,t·",o... - r ",in = 20 - 10 = 10 Semes ter.
o ic Varia t ionswei t I ' ist 10. Zwischen dem S t udicrcnden . der a ls Erster sei Il Studium heendete. lind demjenigen , der mlptzt das Studium a bsehloss , Jjl'gell also 10 Semest er . 6.2.3 Q uartila bstand Dtc Variationsweite nut zt lediglich dir beiden ' \'l' l"tr a n de n Enden der \ 'crt eilu ng un d ist daher em pf ndlieh gegenüber .-\usrei seru . Die S paunwcite der Semext erxahl lx-tr ägt 10: oh ne den St udierenden. der 20 S I' IlWHIt' 1" studiert ha t , Ix-trüg e die Variat ionsweite ( 15 - 10) = 5 Semester. Der Quartilabsta nd ist nicht abhängig von den \\,prt l'n an den Enden de r Verteilun g. Er gi bt die Differenz zwische n dem 3 . Quanil und dem I. Quart il einer Vert eilun g an (vg l. Abbildu ng 6.2) , Zur Bestimmung der Quan tle \\"1'1"111'11 die :-. It'ss\\"l'rt e a ufs teigend sortiert 11I)( 1 in vier glpic:h stark IJl'sl'tzte Gruppen geteilt. Jodos Quanil enthält 25 % der Mossworte. 25 % der Messwerte sind kleiner als oder gleich dem \ r r rl des 1. Qu artils . 75 % sind gleich gro b oder gröscr. Das 2. Quartil ist der Median. DaH 3. Quarril ist de r \Ye!"t . a n dem 75 % der werte kleiner oder gleich gro b sin d lind 2;j % gleich grob oder gröbe r. Die mit rlen-n ;jO t;{ der Xlesswerre befin den sich vwisrhen dem 1. lind 3. Quarnl einer Veneilnng. Da d ie Zahl de r :-'lrsH\\'pl"te nirht immer exakt durch 4 teilbar ist , gibt ps verschiedene Berechnungsmet hoden. Dip werte des 1. lind 3. Qua rtils können ebenso wie der :-' Irdia n (2. Quartll ] einfarh an d en kumulierton Prozent werte n a lJgell'st'n worden [Tabelle u.2, let zte Spalte). 25 % der Studierenden haben nicht länger als 11 S t'IlH'SII'I" , 75 % nicht länger als 14 SemostPI" s t ud lr-rt, DaHI , Quart iI der St ud ionlä nge der 11 r oh Iologcn liegt bei 11 Semestern und das 3. Qua rt il !w i 14 Semestern. ,i O% t1l'l" St udierenden haben zwischen l l und 14 Semestern his ZUIll Abschluss bl'lIiitigt, der Quanilabst and Iwll"ägt ( 1,1 - 11) = 3 Semes ter.
13:J
StrcUUlIYSIIl
Abbildung G. 2: Quanilabstand
/ 'c-- -
Ma'lIa n
1. QuMt.~_-I
3 Q<.I8<1iI
Q uarli abstand
'"
25%
2.s'll>
'"
Minimuni. I. Quartil. Median. 3. Quartil und Maxim um werden hä ufig zu r Cha rakterisicmng der Lage und Breite einer Vert eilung hcruugeaogeu und als fj - PllTlkt e -Zu.~(Imm cnf(j.~,~ lm.rJ eitler Vel·teil urlg (TlKkry 1977) bezeichnet. Ta belle G.G: Semesterzahl - ;) Pun kte-Zusa mmenfassung Mininuun I. Qua nil
10
:3. Quanil
11 12 14
~I axilll um
20
~1t'{li all
Grafisch wird die ö-Punkte-Zusammenfassung ein er Verteilung durch Boxand- \\, his kr r-P lots visualisiert ( A bt.tl.lnng G.3). Oie untere G rr llze de r Box ist (las 1. Quartil (11 Sem-ster), dir ohere Grenz(' rler Bl>X ist (las.1. Qu ani l (U Semester]. Dir Länge der Box entspricht dem Quantlabsrand JcI - 11 = 3 Semester]. Innerhalb der Box ist der ~ 'pdian (12 Semester ) durch eine Linie gekenn zeich net . ..... 11 der Box er kennt man deut lich. dass die Studiendauer linkssteil vert eilt ist. Oe)" Abstan d zw-ischen Xledian nnd :3, Quarril ist gröker ab der Abst a nd zwischen Median und I. Qu a rril .
Die Box winl du rch n H>i ZiilltH' (u1hi;;kcr ) na ch oben u ndnach unt en verlängert, Dip ZiilllH' eutsprechou dem Xfinlm um und Maximum der Vertel-
134
Lagc- and
Stn.,a ang~"'''ße
lung. sofern Xltn huum bzw. Ma ximum ketnc Ausrotsor sind . Ausn-üer sind ;" !f'ss\\'f'rtf' , die weiter a ls rle n 1,5fad lE'Il Qnarülabstand von der Box entfemt sind . Sie werden einz eln dar gestellt . Sind Ausn-ikor vorha uden. dann ist der Zaun a n der Stelle des kleinst en bzw. grökten ~fpss\H'rtes . der kein Ausr eisor ist. Der Q uartilabsta nd der Studiendauer lw triigt 3 Semester , der l, ;:;fa d }!> Q ua rtila bsta llll 1, 5(3) = .1. 5 Semester. Dip unt ere Grenze für Allsrl'ibt'l" ist denmach I . Quanil - I. 5(tQR ) = 11 - 1, 5(3) = G.5 Semester, die obere G W I\ Zf' für Ausrofser lH'trägt 3. Qu ar til + I, 5{IQ R) = 11 + L 5(3) = 15, 5 Semestor. Semes te rzahlen kleiner als G.5 und grö w-r als 15,:> sind Ausrei ser. Ausreiser nach un ten , das Iwibt St udiere nde. die weniger als ü.5 Semes ter bis zum Abschl uss lwniit igt ha ben . existieren nicht. Der unt ere Zaun e nts pricht desh 15.5 Sell1l"stl:'r ), nämlich 2USemester. Er ist einzeln in der Ab bildung \'islla1isiel"t. Der nhere Za un is t der griibH' \r ert de r Verteilung. der kein Ausreibl'r ist. nämlich 15 Semest er [vgl. Ta bolle ü.L ).
,
Abbildung G.3: Box-and-whisker-Ptot
.
-~
e
,
_~====c===::..:·:·:"""<'-~"-'
I '-======:;::======":..
e
t
a......
----'------ -
Dei Inter vall- und ra tloskaliorten xlcr kmalcn gibt der Q ua rtilabstand an . wie weit d ie mittleren 50 'i{ der Messwert e einer Verteilung voneinander entfernt s ind, Dei ordinalskaliertcn Merkmalen kan n der Abs tand zwischen den Quartilen nur im Sinne von Ran gp lätz('11 inte rpret iert werden [vgl. Kühne! und Krebs 2t)(li. Du). Die Angalw de r Qua rule ist ans chaulicher: Das L Qnartt l des Schulahsc'hlusses hat de n \rert Ha up tschute [Spa lte
kumulier te P rozent I' : Ka te gorie, in de r 25 % der Fä UI' erreic-ht werden). der x tedian hat die Auspr ägung ..),Iittlere Reife" und das 3. Qu art il füllt in dip !\atl:'gorip "Farhho("hsd l1llahsrhluss".
6.2.4 Varianz Im G,'g"ns at z zu Vanatiou sweire un d Quani labstand berücksich tig t die Va r ia nz alle \\'"rtl' einer Vorteilu ng . Sie gibt ,li!' d urchschni ttlich e Va r ia tio n a ller Merkmale wieder. Die Bezeichnung für (He Varia nz ist .~ 2 .
• n t'i 1111!/nLppi ert en Dat en wird die Varian z wie folg t berechnet :
" (Xi - .t)2 L:
.~ 2 =
"-0'--::-__ '
SAQ
71
11
(6 .8)
Die Su mme d er quadrierten A bweich un gen aller ),1t'Ss\\l'r tt' vom Mittelwert (SAQ) (d ie nach Punkt 2 in Abschnit t G.I minimal ist ) wird du rch 11 dividiert . Das Ergebnis - die \'aria nz - wird deshalb auch als durchschnittliche oder mittlere qlj{uil"(lti.~ che A lnuci dumq hezeichuet. Durch die QU(ldrierullg der Abweiclllm gcn vom Mit telwe rt werdr-n zwei Ding" erreicht . Zum einen verschwinden die Vor zeichen dt-r Abweir-hungen. Dies ist auch notwe ndig, da d ie durchschnit tliche einfache Abweichung aller Mess werte vom a rirhmedscho n xüu el immer null ist , wie wir in P un k t 1 in Abschni tt G.I g PS" IH'1l ha ben. ' Zum anderen werden d u rch die Q uudricr uu g gröscre Abweichungen vom Mittelwer t st ärk" r Iwrikksidltigt a ls kleine. Die Summe eh-r quadrie rten Abweichu ngen wird mit Hilfe einer Arbeits tnhr-lle ermittelt [vgl. Tabelle G. 7 a uf (11'r folgen.l-n Sei tf'). Dip Anzahl der Xlesswert o Il beträg t 11, dte rlurchsr-hnitthche Semosterzahl lx-t rägt .t = \;1. Nun kann in der letzu-n Spalt e die Summe der quadrierten Abweichungen vom Mi ttelwert Ix-rechnet werden: sie beträgt SAQ = 7·1, Im Ik-ispiol ergibt sich also eine Varianz von
s
2
~ = "'7·1iI = G...--/2 ~ 6 . i3.
Alternativ küuutc lIIilli di.. (1 ~~ "Il.fnl /kfl iiYf der riuzeluon Abwcirhungeu SUlIllIlif'I"I'11 und durch ;Hp Z" hl ,l" 1" n..,l ", d lt UlII\PIl d ivi di"I"('I1, wodur d l lll>lll d ito ,.'\ [) Sln'\lIllJg' erhält. Dip"p" :'\ I >l ~ wird j, )dodl nur sohr ,,·h '·ll ""rwl'lUl<'t,
136
Tabelle G.7: Berechnung der Varianz aus der primären Tafel
i
I,
I i - 1:
I
10
3
2
11 11
-2
12 12 12 13 13
- I - I - I
, "t 3
G
8
-2
(Xi - 1:)2
", .J 1 1 1
0
0
0
()
j
1
,
9 I () 11
20
,
.I!.l
2:
1.t:3
0
74
I'
15
2
Loktor ist diese Za hl schwor zu interpretieren , da durch die Quadurril lig die ursprüngliche ~Iabrillh t'it [Semester] verloren gega ngen ist. • ß ei grup piert en Daten werden nicht die einzelnen Merkmalsa usprägungen Xi, sondern die Morkmalsauspriigungen de r Kar ogorion I k in die Formel otngebr ach t. F ür jedl' Ka tegorie wird dir- quad rier te Abweichung \"0111 Mit telwert ( I k - 1')2 berechnet und m it ih rer Hä ufigkeit f ZI multipliziert . Dir Ib-rcch uung erfol gt wiederum anhand einer Arbeit stabelle (vgl. Tabelle (j.8 ),
L'" (Xk -
82
=
'=0"_--=
r )2 . f z,
n
_
Im Beispie l ergibt sieh: _2 _ 7-1 _ . ~.) ~ . ~ . .s - T1- G . I - ~ 6 . 1 .3 .
Die Varianz Ilt't rägl nat ürlich wiede r G,n.
(G.9)
137
Tabelle ü.S: Berechnung der Varianz aus den gruppier ten Da ten k
J "k
1 2 3
10
,,
, G
t;
11 12 13
l'
IG
20
L-
x l" -
1 2 ;1
"
.r {Ik -
-2
- 1
2
1 1 1
{Ik - X)2. [ ,,'
.f)2
9
9
'.
"
g
1 Il 1 ,1
0 1
2 7
0
1
j
49
-19
7·1
11
6.2.5 Standardabweichung Die St a n d a rdabweic h ung erg ibt sieh direkt aus de r Quadratwurzel der Verlenz. Sie wird mit $ bezeichnet . • Bei un gruppierten D1'I t(,1I la utet die FOf!lH'1
$
=
,J;;2 =
"
~(.c;'l- i')2 = JS.~Q
.
(6, 10)
• ßl'i gruppierten 0 1'l t l' II lautet l!il' Formel m
ro,
S = VS ~ =
L: (Ik - ,r)2 " Ir.
C ",_--:c_ _ -k=
"
(G,l1)
Im Beis pie l erhalten wir
s = ..[ii = 2M .
Die Standardabweichung Iwtriigt also 2.G9 Semester. Im Cegonsa rz zur Vertanz Hisst sich dleso Zahl in der ursprünglichen ~ hd,eill lll' it (hier : SI'mest erzahl] a ngeben. Die St andardabweichung ist dit, l Vul"zel aus d CI" m itt leren I[lJIl11mti schC1l Alnaeiduusq n/let· Il'c7,t e.
138
ßci an nä her nd normalverrollten Xk-rkmalen liegen ca . G8% all er Wert e im Bereich von ± 1 Standardabweichun gen um das a ri thmetische Mittel, ca. 9,:; % der \\"t'rtf' befinden sk-h im ß t' rt'k h von ± 2 Sraudardabweu-hnngen. Dip I\ ürp prg riibc' d t' r in Wt'Sld putse hlan d lH'fraglf' 1l Mäum-r (ALLOüS 20D..!. 11 = 979) ist annä hernd normalverteilt um ein arit hm etisches ~Iit tel von 178 cm mit einer Sta ndardabweichung \"011 7.3 r m (linke Grafik in Abbildung G.1. 5.129). Ca . GS % der befra gten westdeutschen Männer sind zwischen 17\ (178 - 7. 3) und 180 (178 + 7.:3) c m g ro b. Xlerkmale sind allerdings nur selt en normalverteilt. Die Xoruialvertellung ha t j pdcleh eine grob!' Bedour.nng für die S(:hlil'b!'ucl" St atistik. wie wir in I\apilt'l 10.3 feststellen werden.
6.2 .6 Vari ationsko effizient ~ I('rkmal{' mi t einem höheren aruhmettschon ~ Iitt(' l weisen häutig auch eine g rü!<,"J"(' Standardabweichung au f. On Fa ri at ion.~ ko('1fizie7l t I" relutiviert die Standardabweichu ng am a rithmetischen ~ Ii lt el .
v =::.t
(6.12)
Er uinunt r-lnen Wort > 1 an. wenn d ie Sta ndardabweichung g ril!<,pr ist als das arithmetische Mittel. Mulriplizu-rt mit WO gih t der Venntlonskodtizien t die Standardabweichung als Prozent wert des a rit hmetischen ~I i t telwerts an. WPi! sich clip ~ Iabein llt'it (hier nn) rnusktlrvt . ist der Variatinllskop lfi~i (,nt eine dimensionslose Grii!<'e. Er f'igllf't sich de sha lb ZUIll \ 'prgll'ieh der Streuung bot zwei Gruppen a uch da nn. wenn ein Merkmal in unterschiedlichen ~ la N'in lH' it plI {z. B. Eink om men in US- Dn1Jar und E ur o ) vorliegt. Für dle Semes terzahl beträgt de r Varlat k.nskooffiz leut 2, 59/13 = 0,20 , als o run d 'Z u % der durchschnitt liehen St udienda uer. Die Berechnung des Variationskoeffizienten ist möglich. wenn das let racbt eto Xlerkr ual kein e negativen \\'f'rtf' annehmen kann . wie PS ln-i ra tioskalierten Merkmalen der F
I au
In Tabelle G.9 ist angegeben. ab welchem Skalenniveau die in dlosem Kapit el behandelten Lage- und St reuuugsmake sinnvoll interp retiert werden
können. Tabelle G.9: Univa riate
~ Iatzahl{' ll
nominal
:'\ Ioda l wert
X
:'\!f'(liall
arithmetisches Mirn-l Index qualitativer Variation Qnarrilabstanrl Varianz k Standardabweichung Varia t ionskoeffizicnt
X
und Skalenniveau Skalenni vea u ordinal intervall X X X X X X X (X) X X (X)
ratio X X X X X X X
14U
Aufgab en zu Lage- und Str euun gsparam et ern 1. Sie haben bei JU
Xi
1 llU
P t'fS01WII
:.1 3 WU 90
fel gende Iutelligenz quofieut en gemes sen :
4 80
;j
6
t
8
111
WO
70
lOU
9 120
10 110
Bitte boreehncn Sie die behandelten Lage- lind S t reu ungs pa ramoto r lind interpretieren Sie diese inhalt lieh ! 2. In zwei verschiedeneu Ländern betrügt das Durchsrlmit tsoinkomnu-n .t = 1.000 0 :-' 1. In Land A lx-t rägt s = 1.100 0 :\1 in Land B iS = 6:38 0:\1. In welchem La nd ist d ie Einkommensverteilung [bei a nsons ten gleichen Beding un gen ) gerecht er? 3. In der folgenden Tabelle ist die Altns\"PflPilu ug von Statisti k-KursTeilnehmern wit>(!e rg('gt>lwll (die glt> id ll' Verteilung wurde \H'fPits mi t Abbild ung 5.;) auf Spil l' 113 graphisch dargestell t ]. Bitte beror-hnen Sie die behandelten Mittel- und Streuungswerte nnd interpretieren SiE' diese inhaltlich!
I 19 I
2 20 ,
3
,
6
t
21 22 23 13 13 10
t
8 9 10 11 26 27 28 29
6
2
4. Das arithmetische xlitrol einer Verteilung beträgt -I, der Median G. Ist der Modalwert gfö Mo r als G, kleiner als lH'illt" oder liegt er zwischen 4 1I11d G'! c . Sle möch ten die Non-uvcrtcilung einer Kla usu r durch ein en Mit telwert cha ra kter isieren . \\"I'ldw(r) ~ditteh\"(,ftk ) is t/ sind a ngemessen
und warum'!
G. Im Mainzer Xlie tspiegel sind d ie mittleren Xlieren für jt'{lt' Wohnungsgr uppe an band des :\ft'tliillls ausgewiesen. \ raru lll'?
7 Zusammenhangsmaße 7.1 7.2 7.3 7.4 7.[, 7.6
Kreuztabellen uud st atistische Unabhängigkeit .1 42 Ma~l' für zwei dkhutUllll' Merkmale . . .. . . . . . ... ..• . . . . . . . . .... . . . 14& ~fal;l' für zwei uominalskalierte Merkmale 14!l /l.1al>l' für Zl',d ordinuls kaliertc Merk male 15U r.lall für eiu 1l00tlinalskaliel" k l< lind ein mctrisrhos Merkmal 161 l\fa t:.l' für zwei lJH'trisdll' Merkmale 16&
wen» wir WiS SI'1l wollen , ob Arbeiter da zu neigen. dit' srn zu wählt'lI. ob Vorur teile besonders bei aut orit äreu Persönlichkeite n zu findeu sind. uder ein gutes Abitur mit einem guten Studienahschluss einlH' rgl'llt, dann sind wir auf (\1>1' Suche nach einem Zusammen ha ng zwischen zwei Merkmalen. Zusamuu-nhungsm a j,e drücken die Stärke de" Bezieh lm g zwische n 1.1I'. >i Merkmalen au s. Es gibt eine Vtclzeh l \"011 Zusammenha ngsmalen (Tabe lle i .I ). Wpk hes ~ I ab angemessen ist, hängt in erster Linie \"0111 SkaJeuniveau der Merk male ab . Da sieh für j PI1I'.s Skalenniveau verschied ene 7.11sHmml'nha u/,,'S IlHlbf' hen-chnen lassen . muss man aujerdem ber ückstehug cu, dass nirht alle ~ la N> 1.11111 selben Ergebnis kommen. Da rüber hinaus haben alle Zusa nuuenha ngsma be bestimmte Vor- un d Nachteile, die bei ihre r l nt erpret ut .ion berücksichtigt \\"'1"III>n müssen. Ta lwllt, r.i. Zusammenhangsmate
I Merkmal 1 I Mnkmal2 I Zusammon ha ngs ma6. dichotom
dichotom
nominal
nominal ordinal
ordlnal
nomina l' metrisch ' llwt ris d l mr-rriseh • unabhängiges Me rkmal.
2 x 2-Ta hd lell: Proxonrsatxdifforouz. O,lds-[lat io. o {phi}, Yules Q Mehrfeldort ab ellcn:
I
Cramörs V, C,.\ [lamhda] (gannnu} . t all-~lal;l' (7),. Tel, P {rho ], S" llll'rs d [et a-Quadrat )
)
r ia rll.. P r, >
I 111 FIlIIWIllINl IlPsth rä n ken w ] r uns Huf I'inigt' west>nt Ilrhe ~ rabza h11'11, Eine ausführliche Darstellu ng findet s ich bei Benninghaus (2005) . Für da s \ '(' 1"sründnts multlvarlate r Anal yseverfahren ist die Kenntnis \ '011 Odds-Ratios.
z"~,, "'" ", ,,h,,"ys ,,,pe
142
fI
der Kovarianz lind der P roduk t-xlomcnt-Korrel arlon zentral. Logari th miort o Odds worden in logisrisclu-n Regr csslonsmodclk-n als abhängige Variable verwandt. Kova ria nz- und Ko rrelarionsnrau-izcn sind tIN A us-
gangspunkt für Strukturgh-nhungsn.od-lle und faktorenanalyusr-he Yt'rfah ren (vgl. Reinecke :WUG) .
7.1 Kreuztabellen und statistische Unabhängigkeit A ll g!'1l01ll1llf'1l wir milchte n hera usfinden . ob Os tdeutsche eine and!' r!' Einstellung ZUIll Schwangersr-haftsabbruch haben als Westdeutsche. Dazu habcu wlr die Merk male Eins t ellung zur A bt reibung (,\ Yelli l die Frau t's will") IIJld Erheb ungsgebiet [Befragung in \Yt,~ t de tl t sl:h l a Jld oder Ostdeut schland ) gekreuzt (Tal)('111' 7.2). Solche Tabellen werde n auch als Kont ingenzrabellen bezeichnet . weil sie dir- gemeinsame Verteilung awcier ~ I!'rk malt' wieder geben. Ik-ispielsweiselehuen in \Yt~ t d t'u tst·h l a n d I . 1 Ul von 21..18 Bt,Fragten einen Schwangerschaftxahbnu-h ab, in O Std l' UI schla ud lehnen ..I JO von JOSG Befragten einen S("hwangefSt:haftsabhfll("!I ab .
Tabelle 7.2: Einstellung zur Abtreibung nach Erhebu ngsgebiet (Häufigkeiten)
Gebiet Abtreibung? nein
\Yl'St
Os t
.no
Summt'
1401
J' Summe
747 21..18
676
1423 3234
tose
1811
.-\LLIlCS ".006
Dip a llgemeine Fo rm einer Kreuz tabelle ist in Tabelle T.:l auf der u är-hsten Seilt, dargestell t . Die Variable in den Spalten wird in der Regel mit X bezeichnet . die Var ia ble in den Zeilen mit Y [vgl. Kapitel G.1.2). Der Laufindex für OiE' Zellen läuft VOll i = 1 . . . /, der Laufindex für d ie Spaltr-u Hin j = 1 ... 111. In den Zellen stehen d ie H äufigkci ten [, fll gibt als o die H äu f ig kei t wieder, dio sich in der ersten Zl'ill' und ersten Spalte befindet .
143
THIIPIlf' 7.3: Allgemeine Form oinor Kre uztabelle X,
J:2
.. .
y,
In
In
...
y,
h,
[n
.. .
, y, Sl' altt'llsll rn1lI('
I"
,
In
,
...
Xm
Zeih-nsunnne
'" !lj I::
hm
j ;:ol m
hm
t.:
,
L I" i-I::I f i2 ... i-L I i.; i-I
I:: h j
j=1 m
,
I:: .,hj
m
L I:: /;j =Jl ;- 1 -,
Die b eobacht et e n H ä ufigkeit e n emer 7,1'1If' werden allgemein His fb (ij j be zeichne t . f steht auc h hir-r wieder für Häufigkelt en. b gibt an, dHS.~ es sich um die beobachteten ll äufi gketn-n handelt, i kennzeichnet die Zeile und j die Spalt I' . f bl. l 2 ) wäre also d lo beobachtete Häufi gkeit de r Zt'III', die in der ers ten ZI'il" und der zweiten Spalte steh t , und dies sirul im Beispiel ·11 0 P I'TSOIll'Il .
Um zu bestimmen wie die Einstellung zum Schwangerschaftsabbruch vom Erh ebungsgebiet abhängt. muss spaltenweise prozenmiert werden (Kapite-] G). 6G% der in \ \'psttlplltS(:hland Befragten ( H OI/2 1·18 · 100) Iehuen l"int' Abtreibung ab. jl'(IO(" h nur 38 'X (4 IOj IOS6 ' 100) tlPT nstrleutschen Befragten {Tabelle 7.4, Spaltenprozente in Klammern}. Tabelle 7.4: Beobach tete Häufigkotten und Spaltenprozente (Kon tingen ztabclle)
A br rei Il1IlIg"! nem
j' Gesam t
Gl 'bit' t \rl'St Ost 1401 .nu (38%) Wi %) i -li (3G%) 076 (62 %) 2 148 (100%) 1080 (100%)
Gesamt
1811 142:1 .'3234
(GG%) (·H%) (100 %)
A LLB loS 2006
Ost- und westdeu tsche Befragte un ters cheiden sich offensichtlich in ihren Elnstellnngen - es besteht ein Zusammenha ng l\\'isdn'II dem Erhebu ng», gebit't 1111(1 tief Emstellnng zur Abtrl'ihllllg.
z"~,, "'" ",,, h,,"ys
144
fI
"'ße
\ ri(' würde die Tabelle aussehen , wen n kein Zusam men hang zwischen den Merkmalen bes teh t . d. h. die boiden Morktuale stat istisch unabhängig l sind"? In diesen! Fa ll dü rften sich die Ein st ellu ngen \" 011 ost- lind westrleursr-hen Befragt en nirht um ersrheiden. Oil' prOZPlll lla!P Verteilung der ahhällgigt'1l Varia ble (EillSlt'lI11llg zur .\ ht fl'ih u ng ) wäre dann fiir jPd l' Auspräg ung der unabhängigen Varia ble (\\"I'SI , Ost) identisch [vgl. Ta belle 7.5). Die Ablehnung ('1111'S Schwange rschaft sabbruchs müsste \)('1 os t lind wes tdeutschen Befrag ten ;)ü % lx-tragen. die Zns rimmung ·U %. Dlo Häufigkelten. d ie dem ~[ode1 1 sta tist ischer Unabh äng igkeit entsprechen . werden Bis erwartete lläuJi.qkeiieli bezeichnet.
Die e rwa r teten H ä u figkeite n lassen sich ga nz ei nfa ch erm it teln , Indem man die Zeilens umm e mi t der Spalten sum me ruultiplizier-t lind diesen \rert durch rlie Gesamt za hl der Befragten (11 ) dividiert. Die e r warteten lIä ungkoiten werden mit f . (i j j bezeichnet.
1,
_ Zeill'IlSUmnle ' Spa!t ellslIm mc
.(ij) -
n
Im Beis piel ist d ie erwartete Häufi gkeit in der link en
r
J o( lI )
=
( 7.1)
otwn-n Zello a lso:
:l U 8 ·1 811 = I:102,D. 323 1
Ca . 12U:3 von 21-18 in \\'pshll'llt sr hi llnd befrag ten Personen müs sten einen Schwangerscha ftsa bbruch a blehnen , wenn kein Zusa mmenhang zwischen dem ErllPll1l n ~gl'hi t' t und der Eius tr-llnng ZUl U Sdl\\'angprsl"h aftsabhnwh lx-st änd e. Auf die in Gleichung 7. 1 besch riebene Ar t und \"" isl' ka nn ma u IlUIl auc h die erwa rt et en Il äufig kotten der ande ren Zellen ber echnen. Talx-llen , dto dto erwar teten Häuf t gkeiten beinhalten . werden a uch a ls l ndifforeuzt a 1)('1 Jeu bozek-lun-t .
na~ Kunz <'] ,t
MuP~
jü,- zwei
didwtu",~
14:;.
Mn-/,;mule
Ta belle 7.5: Erwartet e Häufi gkotten und Spa lten prozente bei s ta ristischer Una hhä ngigkeit (Indi ffercnztnhellc ] Gf' bif't Abtrf'ih llllg"! nein
ja Ge samt
\\"1'st 1202,9 (56%) 943 .2 (44%) 2148 ( 100%)
608,2 477.9 1086
Os t (56%) (44%) (100%)
Gesam t
1811 1423 3234
(56%) (44%) (100%)
ALLBUS 2(1)(;
Stat istisrllf' Una bhängigkeit ist eine sYllIlll('\risrhe Eigeuschaft , \r ellu die prozent uale Verteilung innerhalb der Spalten ident isch ist , rla nn ist a uch die prozent uale Verteilung tunerhalb der Zl'ih'll idon tiseh, WiE' mall durr-h Zellenpmzentulorung <11'1" orwanoron Häufigkoin-n leicht fl'.s l st plll'n kann.
7.2 Maße für zwei dichotome Merkmale 7,2.1 Proze ntsa tzdifferenz Ein einfach
ZII
lnu-rp rotien-ndes ;"[a b fiir den Zus ammenhang in 2 x 2-
T ah el1PII ist die Prozen tsa tzdiffer enz. Die Proa-nrsa tzdlfferenz der Ablehuun g eines Schwangorschaftsabbruehs zwischen \\'I'st · lind Os tdeutschen
lässt sieh aus den beobachteten Häufigle-iten (Ta belle 704 ) berechnen.
1401 410 -- - ) . 100 = 27 (2148 108G
Prozenrpunk te .
(7.2)
oder kann direkt a us den Spaltenprozenten {Tabelle 704 ) hestimmt werden : GEi %- :J8 % = 27 P rozent p un kt e . Die P rozentsa t zEli! fl'rl'nZ h a t einen \\"ertr lwrl'ieh von - 100 his t 100. J e grökr der a bsolute \r r rt, urnso stärker der Zusammenhang. Boi st a t istisr-her V na bh iing ig kel t zwoto r Xle rkmalo
(Ta belle 7.5) ist die Prozentsat zdiffer enz null. Die Prozent sat zdiffer enz ist ein asymmetrisches Zusa mn u-nhangsmas. Sie hä ngt da von a b. welrhes Merkmal als abhängig und \\'l 'ldlt's als unabhängig hetrachret wird . Hier wurde dito Einstellung ZU llT Schwangerschafts-
z"~,, "'" ",,, h,," ys ,,,pe
146
fI
abbruch in Abhängigkeit vom Erhebungsgebiet be trachtet . W ird dagegell das Erhebungsgebiet als a bh ängiges Xlerkrn al lx-r rachtet (was weni g Sinn ergibt. da wohl niem and wegen sein er Einstellu ng zur Abt reibung de n \ r ohllort \'erlagnt ), dann ä nde rt sk-h die Prozent satzdifferenz. Xur (4 10/ 1,'1 11)· 100 = 22.6 % der Gl'gllt'r eines Sr-hwa ngl'fS('ha ftsa hhr llchs lt... ben in Ostdeutschland. aber (676 / 1423) · 100 = 47. 5 CX der Bofürworter. Die P rozen tsa tzdifferenz beläuft steh a uf [( 410 / 18 11) - (6m / 142:1 )1· 100 = - 25 P rozentpunkte.
7.2.2 Odd s-Ratio Für das Verständnis logisrischcr Regressionen sind Odds {Cha ncen} und Odds-H anos (Chancenver hältnissc) von zent ral er Bede ut ung. F ür eine bi-
nä re a hhä ngige Var iable gt'11l'1l die Odds d it' Hä ufigkeit des interessier end('11 Ereig nisses (Ablehnung eines Schwangerscha ftsa bbruchs] zur Ilä ufigkeit des Geg('Jl('reignisS('S {Befürwortung eines Schwangerschafts abbruchs ] an.
Hä ufigkei t Ereignis
Odds = 11"uunC g kei .. ·pIt G-egencrergrus
(U)
Tret en lx-ich- Ka tegorien gleich häufi g a uf. dann betragen die' Odds 1. Dip Odds ha ben einen Wert grö ber eins. wenn das interessierende Ereignis hällfig,'r a uftr itt als ll
I, ,'1 ,'1 .
(7A )
Dip Abl eh nu ng dos Schwa ngersch aft sabbruchs ist für westdeutsche Bofrag te 1,9-mal hä ufiger als d ie Zust immung. Es korn nu-n 1.9 Ablehnungen a uf eine Zustinunung. Ump;ekf'llrt ist das Verhältnis von Zust illl11l1l11g zu AhlC'hllu ng 1 vu 1,9 (1/ 1.9 = 0.5.'3 ). Fü r ost dentsr-he Befr agte IlI't rag f'n die Odds
MuP~
Mn-/,;mule
147
OdebOst = --;:;-- = 0,61 . . 6/6
(i ,G)
jü,- zwei
didwtu",~
410
Für Osuteutsche ist die Ablehnung eim's Schwangerschaftsabbruchs sPIll'" ner ab die Befürwort ung {Odds « I ). Die Chance der Ablehnung eines Sell\\'angersdlaftsahbruehs Ill'trägt U,6 7Il 1. Die Chancen einer Befürwcrtung I/ O. G = I.GG. Die Od ds für In>stlle utselw und ost deUlsehe ß t'fra gt f' werden als konditionale Odds bezeichnet . Konditionale Odds sind d urch die Auspräg ungen (West. Os t] eines unabhängigen Mr-rkma ls [ Er hebungsgebiet) bedingt. Odds sind keine Wa hrs cheinlichkciu-n. Die üb er den Antei l geschätzte Wahrscheinlichkeit der Ablehnung eines Schwa ngerschaftsabbruchs bei Ostdeutscheu bet r ägt 0..18. Die \\"ahn;c1win\ir hkeit sPlz t llil' inte ressierende Kategone allen Kategor ien ins Verhält nis, die Odds sp171'n da gegen d ie tntcrosslorende Kategorie zur Gegenkategorle ins Verhältnis. wahrscheinltchkelten können leicht in Odds um gerechnet werden. Dazu wird die Wahrschclnllchkelt des Ereignisses p d urch die Wa hrsehelnlichkelt aller anderen Ereignisse ( I - 1') dividiert (G leichung i .6). F ür Ostdeutsche also O. :~8/ { I - O .;~R ) = 0.6 1.
Odds = _ P1 -1'
(7 .6)
Besteht ein Zusannncnhaug zwischen dem Erhebu ngsgebiet und der Einst ellung zur Abtreibung , da nn unt erscheiden sich llie O dds der westrleutschon Befrag ten von den Odds der ost deutschon Befrag ten. Um d ie kondltionalou Odds miteinander W vergleichen. wird das Verhält nis. d ie OddsRa tio (das Chauconvorhältnis]. gebildet .
.
Od ds l
Odds-RatlO = - 1-1 O. ( S2
( 7.7)
Die Odds-Ratio bet räg t für west- lind ostdeutsche Befragte L8R / 0. 61 = S, I. Die Chance der \Yl'stdl'lIlsdwn einen Schwangerschaftsabbruch abz1l1ehtl\'1l , lJl'trägt das .1.lfaehl' der Chance der O st d e lltsdll'll. 0111'1" 1l111-
z"~,, "'" ",,,h ,,"ys
148
fI
"'ße
gekeh rt a usged rückt: Dip Chance der Ostdeutschen. Schwangorschafrsab.. brüche a bzuleh nen . beträgt r-a . ein Dr itt el ( l;;~ . 1 = O. :t!) der Chance für \ \'estdeutsche. Odds-R a nos ha ben einen Wertelx-n-ich HIIl 0 h is 00. Sind die boiden kondinonalen Od ds ldentisr-h [kein Zusanuuen ha ug], dann nimmt d ie OddsRa tio tim WH! I an . Ein Odrls-Rat to > 1 bedeut et . dass die Odds fiir Grupp!' 1 gri) ~l' r sind a ls die Odds für Gruppe 2. Ein Odd s-R at io < 1 zeigt , dass die Odds für G rup p\' I klein er sind ab für Gruppe 2. J(' weit er der \Y.'rt von I entfernt ist, umso st ärker ist der Zu- amnu-nha ng zwischen den llt'idt'll :-, 1t·rkma lf'll. Ein Odds-Rat io von 4 giht einen st ärkeren Zusa mmo nha ng wieder a ls ein Odds- Rat io von L i. Ein Odds- Ra tio \"011 0,25 drüc kt einen stä rkoren Zusammenhang aus als ein Odd s-R atio VOll 0,.1 . Um dir- Stärke des Zusammenhangs von Odds- Hanos < 1 mi t Odds- Ra t los > 1 zu vergleichen. wird der Kehrwert der Odds-Ranos bet ra chtet, die kleiner 1 sind. Eine Od ds-R atio Hin 2 drück t einen gleich starken Zus ammen ba ng a us wie eine Odd s-Ra tio W lII 0,;:; (1/ U,5= 2) , allerdings in un terschiedlicher Richtu ng. Dies wird deut lich, weun ma ll den na tü rlichen Logar ithmu s der
Odds-Ratlos berechnet: In OJ> = - 0. 69 lllu\ln2
=
+ 0. 69.
Odrls-Ra t ios zä hlen zu de n sYlllnH't risdlPn Zusammonh a ngs ma sen. Dip GrUbt, der O dds-Ra tio häng t als o nicht da von ab. welche-s der beiden ?- IN kmale als ilbh ä ngig oder una hhä ng ig lu-tra cht et wird . Ein Kritikpu nk t a n Odds- Ra tlos bes teht da rin, dass sie nichts meh r über die Grübp der Odds (u nd Wah rschcinlichkeitc n] a ussagen: Eine OddsRat io von beispielsweise 2 kann da ra us res ultieren. dass die Odds für G rupp!' I 0.02 lind für G rup pe 2 U,Ul bet ragen (U.U2/0.01 = 2). Die Orlfls für das intf'H'Ssif'TI'lldp Ereig nis sind dan n für GruppE' 1 zwa r doppelt so hoch. alle rdings au f einem sehr ntodngen :\" i\'f'a u.
7,3 Maße für zwei nominal skalierte Merkmal e P rozent satzdifferenz und Odds-R at io sind ?- Iab t, für d ie Stä rke des Z1Ixanuuenhangs in 2 x 2-Tab d ll'n. In Mehr feldert abellen la;;.s!'" sich mehrore P rozen tsa t zdifferenz en und Odds- Hanos berechnen. Auch für Mehrfeldertabollen gibt l'S Masz ahlen. d ie den Zusa mmenh a ng zwischen zwei xle rkmalon in ein er einzigen Zahl ausd rücke n. Xomt nalskall erte Zusa mmcnh an gsm eje ha ben einen \Yerh,lwJ"{'ieh \'011 U bis 1. Xullbedeutet kr-in Zusammenhang: eine ein s giht PÜl perfekt en Zusammenbang a n. Sie sind
Maß e /Ur- zwei .",milwl,ka/ie.le Merkmale
l,l !)
vorzeichenlos. well die Ausprägungen nominals kalierter Merk ma le keine Ra ngord nung aufweisen .
7.3.1 Konti ngenzkoeffizient C und Crem ere V Cramers V und der Konringenz koeflixh-nt C sind y2-basil:'rtl' Zusammenhan gsmaf"l:'. Ansga ugspun kt zur Berechnung von \ 2 (c hi 2 ) sind die heobachteten Häufigkelt en fb (i j ) lind die Iwi staüst tscher Unahhäng jgken erwarteten l l äufigkoiten f €(ij ) , d ie in den Tabellen 7.,1 un d 7.;) a uf S. 1,1:3 dargestellt sind.
.1(' gr iit \'T (Jie Dilft'rr nz zwisdlP ll beohachteren lI11d erwart eten ll änfigkeltcn. umso st är ker weichen die Da ten vom Modell stat istischer Unab hängigkelt ah. \ \"ie man in Ta belle 7,4 sir ht .lehll!'l1 140 1 IH's tdl'llIsr!le ß t'fragte einen Sdl\\'angersd laftsahbrudl ab (lin ke ohere ZI'1I('). ß !'i statistischer Una bhängigkelt der belden Merkmale Erhebungsgebiet un d Einstellung ZU Ili Schwangerschaftsabbruch müssten ca. 1203 (1202.9 ) westd eutsche Befra gte einen Srhwangersrhnftsabbruch ablehnen {Tabelle 7.5). Die DlffeTt'IlZ zwischen den beobachteten un d (\1' 11 erwa rteten H äufigk-in-n bet rägt für die lin kt' ohrrf' Zf'ile f b(;j ) - f e(ii ) = H Ol - 1202.9 = lOS. I. Es habell meh r westdeutsche ßefragt.' (198.1) einen Schwangerschaftsabbruch abgelehnt , als wir t'!; bei statistischer Unabhängigkeit beider Xlerkmale er war ten würden. Die Differenz zwischen beobachteten lind erwarteten Hä ufigkotten muss für j{,lll' Zolle berechnet werde n. Die SUIIlIllf' dieser einfachen Ah\wi dlllllgl'll für alle ZI'Ilt'1l ist bei j eder Kreuz tabelle nullund deshalb als :-" Iai. der Abhängi gkeit. beider Merk male ungeeignet . Die Differenz zwischen erwarteten II l1d beobachteten Häufigketten wird deshalb qecdri ert: ( f b(;j ) - f~ l ;i ) ) 2 . D urch dir Quarlrlerung falle n dit> negat iwu Vorzelr-hen \wg. Zudem werden groso Abweichungen der beobacht eten VOll den erwarteten Hä ufi gketten stärker gowl-ht et als kleinen Abweichungen . Ob eine bes t immte Abwetdm ng a ls gro i. oder klein III bewerten ist , hängt au serdem davon a h, \\"il' groi, die erwa rtete I1ä ufigk.'il ist : Sowohl in der Zelle links oben (fll ) als auch in der Zolle rechts unt en (f22) bt't riigt die Difforeuz zwischen erwarteteu undbeobachteten ll äufigkeiteu 198,1. Dips.' Differenz fallt bei einer er wartet en Häufi gkeit HlII 1202 ,9 (links olwn) weniger stark ins Gewicht als bl'i einer erwart r-t PU 11auli gkei t von 477 .9 (rech ts II nt en]. Die qnad riert e Differenz (fb(ii ) - f t( ;j ))2 wird doshalb an der erwarteten Häufigkeit einer Zelle f . (ij ) relativk-rt:
l5U
ZU~d mnIC"lla "g, m
(fb(ij ) -
f . (i j ))2
f erij )
,2
Die Ma kzahl ist nun nichts anderes als d ie Summe dloser quadrh-rten und an den erwarteten Häuftgkeit en relativierten Abweichungen für alle Zellen:
(7 .8)
Die Summenzeichen geben an. (Ia.<;.<; (fblij ) - f e(ij ) )} f e (ij ) für a lle Zellen 1)('rt'c:hll('l und dann addiert wird. F ür 111'11 Zusammenhang z\\"isdll'll Erhe hllu gsgt'hit't und Einstellu ng zur Abt reibung resultiert ein \2 _\ \"l'rt von
2
( 1.101 - 1202, 9)2
,=
1202,9
+
(4 10 - 6()l;;, 2f
sos. 2
+
(7H - 9 ,15 , 2)2
9·15,2
+
(fi7ü - 477, tl)2
477, 9
= 221.
Ein \ 2_\\"l'rt von null bedeutet ke tn Zusammenhang. .\ 2 ist als ~ Iab der Stärke pines Z usammen ha ngs j edoch 1lIlgPpig IU't, wet I der \ 2_ \ \"prt von der Za hl der Beobacht ungen a bhä ngt . \\"ürdl' ma n di e beobachtet en Hä ufigkeitr-n in den Zellen \'011 Tabelle 7.4 verdoppeln . dann würde s ieh auch der , 2_\\"1,l"t verdoppeln. ohn e dass s ieh a n der prozentualen Verteilung - dem Zusammenhang - etwas ändl'ft. (\\"il' werde n in Kapitel 12 jl'dOl:h St'IWlI, dass \ 2 für die SI:lllil'M- udl' Statistik e int' g rubt' ß "CIP llt.1Hlg ha t .) Aus dic'S(,111 Grund \\"11]"(1(' 1} 1I la b(' vorg eschlagen. die \ 2 nOI'llJiI'H' U: Der Kon ringenzkoottizient. C lind C ramers V .
• Der Kont ingen ekceffizien t C hat ein en \\"C'f t t'iwn 'kh zwischen Il und einem definierten Xlaxunum C"lux_ C berechnet sich nach der Formel
(7.9)
151
Maßt' für zwei Iw mi uuls/;alie rle MerAlllUle
n ist hier wieder die Anzahl der Mosswerte. Die maxi ma le Cröte dos Kontingenzkoeffi zienten i ~ t ab hängig \ ·0 11 der Zahl der Zeilen bxw. Spalten einer Tabelle und läbt sich nach
R = min (I .IIl )
(7.10)
bestlnunen. H ist das Minimum der Zeilen- bzw. Spaltenzahl. In einer 2 x 2- Tabelle ist H = 2, in einer Tabelle mit S Zeile n und -1 Spalu-n ist H =:1, in einer Tabelle mit -1 Zetlen und :3 Spalten ist R ebenfalls 3. In eine r 2 x z-Tabctlc kann G maximal de n We rt Gm"" = / (2 1)/ 2 = 0.707 annehmen. Im Beispiel resul tiert ein Zusa m menha ng der Stärke
G=
221 22 [ + .12:3-1 = 0,25 .
• \ r ('i! Kontingenzk oeffizienten a us Ta bellen unterschicdhcher G rübe nur lx-lmg t vergleic hbar sind , ist Cramörs Y vorzuziehen. Cr amers Y nor miert den y2. \ r ert , indem d ieser durch den maxi mal er reichbaren \ 2. Wprt in eitle r Tabelle d ivid iert wird (Gleichung 7. 11). In eine r 2 x 2Tabelle kann \2 maximal so grob sein wie die Za hl der Beobacht ungr-n 7/ , hier also 323-1. In ~kh rfel(ll' rt !lI)('''en ist X ~"''' = I/( H - I). lI"olwi R a uch hier dem Mini mum der Zeilen - bzw. Spaltenzahl entspricht
(".ra rners \' = V~ xr: = V~ ~ Cramers V nim mt für unser
C ramers Y =
ßp i~]lif' 1
(7.11)
den Wprt
221 :l2:H · (2
an. F ür 2 x z-Tabellen ist Craruörs Y \"011\ ß etfllg iden risrh mit 9 (vgl. ZU f lIf'rlf'it ung I\ iihlle\ lind Krebs 2007, :l:lG ). Aufgrund 1I111f'rschtodheher B erechnungsarten ka nn 9 allerdings negative Vorzeiehon annehmen.
152
ZU~
Cramers V und der Kon t ingr-uzkocffizient fa llen also ungefä hr gleich hoch a us . Ein Cramörs V von 0.26 liegt im unt eren Ben-ich au f einer Skala von o his 1. deu tet als o auf einen geri »geu Znsa mmenha ng hin. Zu Ilf'ar htPl I ist allerdings. dass die empirtsrh I II beobachtende n '\'('rtl' von Cramers V in der Rogel weit vom Ma xim alwe rt 1 eutferut Si IU\. Cra mers \ '-\\'I'f lf' awtsehen 0.1 und 0.2 werden als schwar-hr- Zusa mm enhä nge angesehen. Dip Intcr protut ion der Stärke des Zusammenha ngs ist mit Au sna hm t' der Ext n-mwerte U- kein Zusa mm enhang - und I - perfekt er Zusamnu-nhang jedoch nich t ('irlllf'utig. In de r Litera t ur herrschen unt erschiedliche Auffessungen darüber, a b wann ein dur ch Cramrrs V getuvsseuer Zusamnn-nhang als st ark I II bezeichnen ist. Ein a nderer Kri t ikpunk t ist der, da», eln e pilll.igt' Ma svahl nu r wenig über die Art de, Zusammenha ngs zwischen zwei mehrfach gestuften. nominalskallerten Mer kmalen aussagt. Für de n Zusammen hang zwischen der Religiousaugchörigkcit lind der Einstellung zur Ab t reibung [Ta belle / .G) lwträgt Craruers V 0.17 (, 2 = G1.99 ). Dieser " 't'rt deu tet a uf einen schwa chen Zusammen han g hi n. W ie sieh die Angehörigen verschiedener RI'Iigionon / Kcnfess tonen in ihren Einstellungen unterscheldon. geht daraus nicht hervor. Dazu muss das Ant wortverhalt en der einzelnen Relig ionsgr uppen mite inander verglichen \\"P1'(If'1l - am ninfaehst en anhand der prozourualen Verteilung. Ma n sieht, da ss katholische Befra gte und Bofragto ei ner nich teh rist Ilrhen G la ulx-ns gcnwinschaft einen Sch waugerschuft sabbr uch prozentual am stärkstell ablehnen. Die ger ingsie Able hnun g äu sem konfessionslose Befragte (Spalte .Keine']. Tabelle 7.6: Einstellung zur Abtreihung nach Religiou - fil'Obad ltptt' Häufigkelt en lind Spaltenprozente It d igiulI .\IIII \')"(' :\"icht Keim' Fr elk . christl. cbrisrl. C es amt ll('in 5 11 (6-1% ) 56 l (j 1%) 33 (66%) rs (80%) I j j (50%) 1393 (65%) j, 30 1 (36'7,. ) 226 (29'7,,) 17 (3 1%) 19 (2ü','{,) 180 (50%) j ·13 (3,,%) Gesa mt 8 12 (100%) i90 (100%) 50 (100%) 97 (100%) 35j ( 100'iq 2136 (100'1<. )
.\ btrt'iIJ1lug?
E\·an~ . /
,,
!{ ;l\ t.
Maßt' für zwei Iw mi uuls/;ajierle MerAlllUle
153
7.3.2 Das PR E- Maß lam bda (,\ ) Die Stä rke des Zusa mm enha ngs zwischen zwei Merkmalen wird be i den =: P roportional Re duc rion in Error] da rau gemessen. wie gut die Werte eines abhän gigen xlorkmals d urch dir- Ke nntnls eine s una bhängigen Xlcrkmals vorhergesagt werden können . .\ (Iamhda) ist ein PR E~ ~ l ab für nominale Dan-n.
PRE-l\laRe n (P RE
Zur Illus t ration wird die Bundestags wahl 199.! hera ng ezogen. Gegen den seit 1982 amtierenden Kanzler Helmut Kohl trat 199-4 R udolf Scha rping als Spltzeuka ndldat fiir d il' SP D au. nachdem f'S Oskar Lafontaine 1990 nicht gelungen war, einen Rl'giprll11gS\\"'f"hspl tll'r1ll'iznfii hn-n. " 0 1' (11'1' \\"a hl erh ob die Forsehungsgruppo \\"ahlpn die " 'ahlabskh t in einer Umfrage. Von 88 1 westdeutschen Befra gten, die eine Parte i angaben, wollte n :3;JO Befragt e die C DU/CS U 1I11d 3-l5 Befragte die SP D wä hlen. 186 ßcfragro wollten ihre Sti mme ein er anderen Partei zukommen lassen. Bei der Berechnung ein es PR E- :'\ l a bt,~ wird zunä chst ver suc ht , den Wert der ab/liingig"l1 Variablen ohne Kenntnis einel' lIl1abhiillgigell Vmi tlblen zu progll fJ ,~ t izierell (Schritt 1). Die Ilt'st f' Prognose für ein nominales Merkmal is t deren Modalwert (Xlodus] . Bei P rognm;p des Mndus werden d ir' wcnigsten Fe hler gernac ht . Der Modus de r \\"ilhlabsit"ht ist dip C DU/ CSU. Bpi ProgtlOSl:' einer C DU / CS U-\\"ahla bsit"ht Hegen wir in :350 Fällen ru-hrig, denn so l"iPIt' Pers onen haben j a tatsächlid l eine \\"ahl abskh t ZllgUIISt('U der C DU/ CS U a ngf'gl' bt'n. In 531 (:~.1 5 + IS6 ) F ällen - das sin d d ir' Befr a gt"II, die nicht CDU/ CS U wählou wollten - irren wir un s. Boi der Vorher sage einer anderen Part ei, z. B. der SP D, würden wir jedoch in noch mehr F älle n - nä mlich bei G:3ü (:3GO + ISü) Personen - fal sch liegen . Die Summe der Fehler lll'i Prnguose der abhängigen Variablen ohne Br-rtk-ksichtiguug einer una bhängigen Variablen nennen wir Fphlf'f \.
Zur Procnosc der alJhäugigell Variable wird nun eine unalJhängige Varia· ble hemngezogen (Schritt 2). Zur P rognose der Wah lab sicht verwenden wir die Kan zk-rprä fr-ren z. In Abb ildung i.i auf der nächsten Seit e ist dor Zusammen han g zwischen der Kanzler präferenz und der Wahlabsicht wiedergegeben. Fü r jede Auspr ägung der un abhängigen Variable n wird der Wer t dl'r abhän gigen Varjahlen II UIl getrenn t prognos tizil'l" t. Der bpstp Progw)sewort ist der Modalwert de r kond itionalen, rl. h. durch die Ausprägung des una bhän gigen Merkm als bedingten. Verteil un g des ahh änglgen Merkma ls. Fü r die -l-l-l Befragten . die Helmut Kohl als K anzler bevorzugen.
z"~,, "'" ",,,h ,,"ys ,,,pe
1&4
fI
prognostizieren wir die Wahl der COU/CSU, woil die C OU/CS U hier am häufi gsten genannt wur de. In 335 Fällen treffen wir mit dieser P rognos e ins Schwarz e, in 109 Fällen (20 SP O- \Yä hkr und 84 Wähle r anderer Parteien] irren wir uns. Unsere P rognose fiir die 4:37 Befragten . di" Rudolf Scharpiug be vor- ugen. lautet dagegl'll SP O ( ~ IOl l a l ka l eg() ri p). Hier s("häl7t'u wir dil' Wahla bs teht von :320 Personen richtig ein. dagegen irren wir uns in 117 (15 + 102) F älton - deuj enlgon Befragt en. die t rotz eine r P rä feren z für Rudolf Scharpin g nicht die Sf' D wählen wollen. DiE' Su mme der Fehle r. die wir t rotz Ber ücksicht igung der unabhä ngigen Variablen lx-gehen. nennen wir Fehll'l"t . Alfgemci n berechnet m a ll F,'hl l'r 2. indem ma n für j ede A uspriigll1lg der unabhängigen VaNableu die Pmg71D.';ef ehle,. beITe/m et /J ud diese summiert: Im ß pispie l berechnen wir als o für die ers te A usprägung der unabhängigen Variablen (Helmut Kohl als IH'\·ol"l.ll glt'r Ki'llll.lerkalllli(lat ) 109 Fehler lind für die awetto Ausprägung (Rudclf Srharplng als bevorzugter Ka nz lerk andida t] 117 Fe hler. Fphll'rt lll,trägt also 109 + 117 = 22fi. Tabelle 7.7: Zusa mmenhang
\'()J\
Ka nzler prä ferenz un d " 'ah lab skht
Kanzlerpräferenz Wahlabsicht COU /CS U SPO Andere S UIll IlW
QlJ ~II ~:
Kohl 3:35
Scharpin g 15
25 8'
320 102 437
""
S IlIll IIW
350 345 186 881
Furs
Der I"tzt" Schrit t best eht nun in der En llittl uftg des PRE-Afll]lrs (Schritt 3),
(7.12) Diese Formel ist für alle r RF> ~ I ~b(' ident isch. Lediglu-h d ie Berech nung der Fehler unre rscheidct sieh. wie wir Ix-t fI t schon werdeu. .le kleiner Fehler- im Vergleirh zu Frh lr ri ist, umso besser wird die a bhä ngigo durch die unabhängige Varia ble prognos t iziert . Zusä tzlich wir d die Differenz ewlsehen Fehlt' l" ' und Fl'hle rt a uf einen ' ,""rleht'l"eich zwischen 0 IIl1d 1 ncrmiert., indem durch Fehle r , dividiert wird .
Maßt' für zwei Iw mi uuls/;ajierle MerAlllUle
155
+1 annehrnon. A ist 0. wen n d ie una bhängige Var iable die P rognose nich t ver bessert und den \\"I'rt 1, wenn wir den \Yert der
In wiewei t wurde di e Vorh ersage de r \Yahlabsk ht nun durch dlo Ken nt nis dos bevorzugten Ka nzlers verbessert? Im Beis piel ergi bt sich:
A~ ~ ( F_'_h_hr " '~ '~ -~F~'_h_"'_',,,) Fphlrrl
(53 1 - 226 ) = 0.57 . 53 1
Die Feh ler ln-i de r P rognos e der Wahlabsicht werd en durch die Ken nt nis (11'r Ka nzll' rp rä ff'rpllz also lIlll 57 % verringert.
A ist ein a.~UJll mctrüchc.~ Maß . Jf' nachdem. welche Variable a ls a bhängig und welche a ls u na bhä ng ig lx-t rachtet wird, ergibt s ieh also ein unterschtcdltchor Wert für A. F iir die Vorher sage des präferieru-n Ka nzh-rkandidaten d urch die wahla bsieht (was ein t' Vert ausch un g der a bhängig en und der nnabhäugigen Variahlenbedeut et ] prgibt sieh ein >. von 0,72. Die unterschiedlichen Worte resu lti er en aus der unterschiedlieben Ber echn un g von Fehlerj : einmal l iegt dessen Ber echn un g die \Yahlabsich t zugrunde, da s andere Mal die Ka nzlerp räferen z. Für den Zusamnu.nhang zwischen E rlw bllugsgehit't lind Einstellung zur Abtreibung (Tabelle 7A ) beträg t >. 0,19. Der dur ch >. gemessene Einfluss der Rell gtonsvugehöngkott a uf die Einstellung zum Schwaegerschaftsabbruch (T a belle 7.ü ) liegt nahe nul l, nämlich bei O,O-l. Cramörs \ " deu te t d agege n a uf einen schwa chen Zusammenhang hin. An diesem ß "is pit'l lässt sich ein Xachteil von A demonstrieren. A kann einen \\"prt von nul l annehmen. obwoh l andere Zlisalll lllt'uhallgslllai-f' wie C ramers \" einen Zlisamnwll 1Jang ausweisen. end zwar d an n. wenn die ~ ! odalkatPgorip rlos abhängigen Merkmals für jede Ausprägung des unabhängi gen ~ lor kma ls tdent isr-h ist. In Ta belle 7.(i prog nost izieren wir fü r j('rlp !\o nft'.'i sio lls-j Hl'iig iolls7.llge hürigkeit die Aus prägun g .nrin-. Led iglich für Konfes sionslose (, Kf'ille') prog nostizieren wir .ja'. Selbst be i Konfes sionslosen sind belde Ausprägungen d l';; abhängigt'/l ;"!prk lllal s (nl'in j j a) j edoch ungefähr gll'k h s ta rk besetzt , so dass sieh die Prognose durr-h Ke nnt nis der Rrli g io llszugl'hiirig kri t nu r gertngfügtg \"(' r!wssr·rl .
156
ZU~dmnIC"lla"g,m
7.4 Maße für zwei ordinalskalierte Merkmal e Bei ordlnalskalierten Xlerkma len können wir uebe n der St ärke auc h dir Rithtllllg des ZlIsallltlJl'lIhan gs angt'lwll. Ein positiver (nega uve r) Zusamnu-nhang liegt vor , wenn höhere \ r t'rtf' auf der einen Variablen mit hiilll'l"I'll (niedrigeren] Wert en a uf der anderen Varlnbk-n einhergehen. Zusammenhangsmuke für ordinalskalierre Merkmuh- haben einen ,rl'rtelwreich von - I bis + L wohl'i - I ein perfekter nega tiver Zusam menhang ist , + I da g Pgt' lI ein perfekter positiver Zusammenhang. ~1I11 bedeut et wie bei den nonünalskallerten :-' Ii'l"kmalf'n, dass kein Zusamm enhang vorlipgt. Es gibt eine Vielzahl an Zuxammenhangsmajen für ord inals kalicrte Xlerkmall' . Die am häufi gsten verwendeten sind ;" Ia!-.e, d ie auf dem Paarvergleich basieren: Kcn dulls tnu-xla jse (Tb und T~) un d ga mma (,). ,rir !>Pschränken un s a uf 1. 1 hat den Vorteil. dass es wie otn r n E· ;"[a b interpr etiert werden kann. ga m m a
b)
Zum \ 'ers täudnis der Berechnung \·011 1 ist es llolwe lllli g , sich dip Logik rles Paa rvergleichs vor Augen zu füh ren . Als Beispiel dien t der Zusammen hang zwischen dem Schulabschluss 11l1d dem poli tischen l nt eresse (Tabelle 7.8). Bolde Variablen sind ordinalskaliert. , d. h. sip weisen ein e Ord nung auf. "'ir unt erstellen. duss der Schulabschluss das politische Int eres se beeinflusst. Tabelle 7.8: Kreuzt ala-lle zwischen Bild ung und politischem Interesse p ,,]. Interesse
Kd n Wpllig Millel Stark Sehr sta rk Surrune
Schulabschluss Realschule 1" 11/ Abitur 228 72 10 20!J 3il6 67
11:l1I]>t schule
74 1
21!) i;j 1ü4!J
4üll I ss
"
101 t
244 22!) 103 ü;j;j
Summe
310 662 1445 637 265 :j:J] !J
Q " d l,', ..\ LU ll·S Ifl'J·!
Ein Befra gter kann z, ß. einen .H a up tschula bschluss- und ..kein politisches Interesse- ha ben . ein anderer einen .Healsehulabsehluss'' und ,.wt'llig pol]-
MuP~
jü,- zwei onli"ul,ku/ie ft e
157
!Ifnk"'ul~
tisches l nreresse-. In der Logik des Paa rvergleichs wird diosos Paa r als ko n kord ant oder gle ichger ich t e t bozeichner , da der zweite Befragte einen höheren Schulabschluss und ein höheres politisches Int eres se hat als der t>r.-;tt' ß pfra gtt>. Ein P a a r wird als konkorda nt be ze k-hm-r, wenn c1it, Person. diE' einen höheren \ \"\'rt auf der einen Yariahlen aufweist . auch eiue u höhere n \\"I'rt auf der anderen Vanablen ha t . Konkordante Paare deu te n au f einen posiiincu. ZIL,~amm cn}Ulng zwischen zwet Yanu hlen hin. Insges amt gibt es 228 Personen mit .I la up tschulabsch tuss- und .keincm politischen l nteresse'': 2U9 Personen haben einen •• Rcelschulabschluss lind "w('nig poli tisches In reressc''. Al l" 2U9 Personen dieser ZellE' ha ben einen hiillPrpn Schulabschluss un d ein grii" erl'S polltlsches Interesse als die 228 P,' r.-;OIll'11. dir- in der Zelle links oben verortet si nd, d. h . si" wetson bet briden Merkmalen .nu-hr- auf Dip Auzal ll konk or danter Paare ( N~ ) dipsl'r belden Zellen berechnet sieh aus dor :-' Iultiplikation der Zellhäufigkeiten. als o 228 x 209 = ·t7 .0;:"J2 Paa re. dP1lI1 jeder Befra gte aus der einen Z(,][" bildet mi t jedem Befragt r-n der an deren Zelle ein Paa r. A II(' PI' [S(l IW l l, die sich in Z,'l1pJ] rechts ,m d un ter halb einer Ausgangszelle befinden, ha ben a uf beiden vlerkmalcn einen höheren \\"ert , Die Za hl der konkordanten Paa r" für (Hf' link!' oberl' Zf'I1 f' (228 Befra gt e) Iwr,,1"\1II1'1 sieh daher als 228· (209
+ 07 + 4GO + 24·1 + 189 + 229 + 87 + 103 ).
Zur E rmittlung der GCM17ntzuhl konkrmlrmt e,. ['UUf 'C wi rd jedp Zelle der Ta bo lle ein m a l zur Ausgangsz elle. Zu den Zollen in der un tersten Zeile sowie in der äUh('rstpn rechten Spalte existieren kelno Z"II(' II. die recht s und unterhalb liegen. Man fängt am besten in der linken oberen Zelle mit der Berechnun g a n: N~ :=
228· (20'J + ,16U + 11:\9 + 87 + ü7 + 2·14 + 22\J
+ 72, (67 + 24·1 + zas + 1O:~ ) + 3M· (-WO + 189 + 87 + 2-1 -1 + 229 + 1(3) + 2(>!=1 · (2·U + 229 + IO:J) + 741 · ( IS9 + 87 + 229 + 10.1) + -WO · (229 + 103) + :.1 19 · (1:\7 + W:J) + 189· (Im)
+ 103)
1699::;0 1
Es kann jedor-h vorkommen, {lass eine Person einen "Rpalsd llllabsl"hlllSS" erworben hat und nur .wenlg- politisch interessiert ist, eine andere Pers on
158
ZU~dmnIC"lla"g,m
dugogon einen .Hauptschnlabschluss' und ein .starkcs politisches Irrteres aufweist. Ein solches Pa a r wird d iskordant oder u nglelr-hger- ichte t gena nnt , da d ie zweit l;' Person gpgpnül )l'r rler erst eu lJt'i der einen \ 'arte hlen ..weniger- aufweist. bei dor anderen Variablen da gegen .mehr-. Diskord a n11' Paa re geben einen negativen Zusamm enha ng zwischen zwei Variablen wieder , da höhere wert e a uf der einen Variable mit niedri geren Werto n auf dor anderen Variablen einhergehen. Auch für die Gesomtzolü diskonirl7ller Paare (.'Vd ) gibt I'S eine allgemeine Berechn ungsvorschrift . AIII' Häufigk-iten in 7,1'111'11, die liuh und unt erhalb einer Ausgan gszl'l1e liegen. werden mit der lI äutigkl'it der ..... usgallgszellt' multipliziert . wo bei auch hier jedl' Zolle einmal zur Ausgangszelle wird, Zu Zellen in (11' 1' ganz linken Spalte lind der unterstell Zeile existieren keine Ze1lE:'11, d ie links und unterhalb liegen ~ hier kann t'S also keine disk ordant en Paart' geben. Mlt der Berochnung s ta rten wir in der Zelle recht s oben: SI' "
.Yd = 10 , (;{Kö + 741 + 219 + 75 + 209 + ·WO + IR9 + K7) + 72 , (38ß + 741 + 219 + 75)
+ 67 , (7-11 + 219 + 75 + ·160 + 189 + 87) + 209· (741 + 219 + 75) + 2·1-1 . (219 + 75 + 189 + 87) + ·WO· (219 + 75) + 229 ·(75 + K7)
+ 189· (75) = 7t-05:17 In unserem ß l'isp it>1erm it teln wir also 1.69!Lj U1 konkorrlame und 786 .5.1'i' diskordaure Paart>. Überwiegen in einer Tabelle ~ \\'il' in diesem Fall - dip kon korda nte n Paa re. so liegt ein pos it incr ZIJ sammenhang \ '0 1'. Der Zusa mmenhang zwischen zwei Variablen ist negativ, wenn P S meh r d iskordante als kon kordante Paart' giht. Zwischen beiden Variablen besteht keui Z uBammenhang, wenn die Zahl konkorda nte r und disk ordunter Paart' gleich grob ist.
Bei 111'1' ß I'rl'd ul1l11g des Ordtn atmase, i wird nun einfach IJjI' DiRn enz zwischen konkordanten lind dis kordant en Paaren ins \ 'prhiih llis zu allen konkordanten lind diskordant en Paaren ges etzt:
Maßt' für zwei orJillllls!;
159
(7.13)
Luud + 1 an . Das \ 'ollf'id IPrl gibt an , ob ein IWgat tver odrr positiver Zusammenhan g \"orli,·gt..Jl' grö l!.l' l" der Unterschiod zwischen de r Zah l kon kord anter lind dis kor da nter Paa r!', umso st ärker ist der Zusammenha ng und da m it der Bet rug von "f' "f erreicht sein Maxi mum VOll + 1, wenn in eine r Ta bolle nur konkordant e, jedoch keine diskorela ut('11 Paa re vorl iegen. 0 1'11 \\'ert - I nimmt "'f nur dan n a n. wennes in ein er Tabelle nU I" diskord ant e, abe r keine konkordanten Pa a rt' giht. "f is t ein sYlllllwt risd ws ~ Ia l; . DI' r \ Yen von "'f ist also lluah hängig davon. welche d p l' Var ia blen als a bhängig bz w. unah hä ngig betrac htet wird .
"f niuuut \Yf'rt f' zwisdwn
-e
Zwischen Sehnlabsr-hluss lind politisr-bem Interesse r-rmittelu wir einen Wert von
16H9:'"j01 - 7865:37 91296-1 , = 0.:107 . 7 ~ .;;:;""'~,...;:;;:;::;; = IGnD50 1 + 7RG5:37 2 1860311
[in \Yer t \"0 11 0.367 deutet a uf e inen rela tiv starken posit iven Zusa mmenhan g hin . Das heikt : .J., hiilwr der Oiltllln gsahsdtluss . umso s tä rker ist das polit ische Int eresse. [ in negatives Vorzl'id wll wiirde bedeuten, dass m it höherer Bildung das poli tische Interesse abnimm t. Bot der lnterpret a tion des \ 'orzeichens ist all erdin gs die Kodierung de r Variablen ZII beachten. Die Berechnung des Kennwer tes er folgt ja nur a nhand der zugewiesenen Zehlen werte. \l ngeacht et der dah i nt e rstehenden in ha ltliehen ~ lcr kmalsa usprägUllgPll.2 ) ist oben falls ein PR E- ~ I a b. 111 kan n - multipliziert. mi t 100 - als pro portiona le Fehlorreduktion interpretiert werde n. Im Beispiel wird der Vorhersagefchlcr um 3G.7 % verrin gert , wenn ZU f P rognose di r- Schulbildu ng der Befragten beriu-kslrhtigt wird" [ in ) ' \"(1Il - , 50 würd e bedeu ten , dass der Prognosefehler II IIl ;:'0 % verringer t wurde. 2
Um dieInrerpreratlon zu enok'hteru, sollte die Zuor dnung de r Zahlr-nwert e zu den so ('rf")l\"Il, d ass "in A.lIsli" K d" r llU llu'r;srh " u \' ",'rte auch mit ,,;m'T!1 A lIs t i"l'~ d"r inhaltlid "'ll A uspriijl;tm~ ,],·S :\Ir'rkma ls ,'iu)u·rw·!rt.
:\ t"rk", ab,l\lsl'rii~ull K" lI
WU
ZU~dmnIC"lla"g,m
Ta belle 7.9: Eckenkorrot at ion in einer zxz-Tab cllc
SP D AI\(I('n ' '\'o = U.
I
Arlwil{']"
,,-,A rh('ilt'r
I UU 0
.30 .30
.vc _ 100 (r,U) _ .300il, /
_ I
, r ('il ~I immer dann ± 1 wlrd, wenn PS in de r Tabolle kr-tue diskordant en bZII". keine konkordant en Paare gib t, werden auch bei einer .E ckenkorrcla tion' pe rfek te Zusammen hä nge a usgewiesen. In einer 2 x 2-Tal wllt' hegt eine Eckenkorrel ation bereits bei einer unb esetzten Zelle \"01" {vgl. 'Fabelle 7.9). Beschr änk t sieh eine Hypot hese a uf das Wahlverhalten WlII Ar beitem [z. B. .Arlx-ite r wählen S P O '), dann ist d as dargest ellte Ergebnis. / = 1, erwünscht. C e lllä b d ips!'f 1l.\" po l!t"Sf' liegt ei n perfek ter Zusatunu-nhang \"01". Ande rs stellt sich di r Sltuatlou dar, wen n die llvpotheso bein ha ltet , dass Arb eiter älx-rproporuonal häufig SP D wählen un d Nicht-Arbeiter (......Arbeiter] ülx-rp roport ional häufig andere Parteien . Ein per fekt er Zusanuuouhang im Sinne dieser Hypot hes e wäre nu r dann gegeben , wenn aussehlif,b]kh dit' Di;Jgo1\;j]e beSf't zt wäre. Kendalls Tb (sil']W unt e n) ist in d iesem Fall r-in angemesseneres ~ Iab . Tb bet rägt für Ta ]wlll' 7.9 u.os.
CI)!'r d ie konkordanten und diskorda nt en Paare hinau s g ihl , ' S noch weitere ß pzit,ll11nge/l zwischen Paa ren in eine r Krenz rahelle. die nes [Verknüpfungen}. InsgesMl lt gibt PS in jeder Tabelle n(n2- O Paare, flie skh ;JUS der Zahl kOllkoniont cf", disko rdant er, in .r verknüPf tc f'. in y vr l'kn üpf ter lind in r und y verkn üPftc f' Paa re 7. IISa m llWIl.'w l 7."II. [in P a a r ist in r ver knüpft, wenn es in .r dieselben \Y.'flt', in y a ber uut er schiedli rhe Werte hat. Eine Verknüpfung in y b edeutet denselben Wort in y , abe r unterschiedliche ,refit' in r , I n r lind y ist ein Paar schlicklieh ver knüpft. wenn dieselb en ,refit' in r und lJ \"Orli(>gell. d as Pa a r als o in eine r Zelle lit'gl.
Kennwerte. die Verknüpfungen !)(,f iirksich t igr u, sind v, B. Kendalls lall~ Ia bp (Ta, Tb. Tc) und SOllWl'S' d. Kend alls T- ~ I a b(' und Somers ' d untcrscheldon s ich im Zähler nicht H IIl / ' dieser ist im mer X c - N v . Im Xcnncr werden jedoch zusätzlich zu Ne lind X o Verknüpfun gen berücksichtigt . Der Nenner ist bei diesen ~ lab t'lI dahe r gröier als !wi "/. Aus diesem Grundnimmt "/ svst entatisrh höhen- Wert e an als die T- ~ I a k oder Somers ' d. Xur WI'III1 ga r keine Verknüpfungen in de r Ta belle vorliegen , sind die werto lden tisrh. Solange ma u berlk-ksicht tgt , d ass / svstemansch
hiillPrp Wf'rte annim mt als die 7- ~ l a N' lind Somers' d . spri cht nlclu s gedessen Verwendun g. Zudem ist der Derrag VOll ') als proporttonale Feh lonedukuon i nterpret torbar.
gt'll
7.5 Maß für ein nominalskaliertes und e in metrisches Merkmal: eta- Qu adrat (1]2) ,,2 ist ein ~ Iab für d il' Stärke des Zusammenhangs zwisch en ein em 110m ina lskalierten unabhällgigt'n ~ lf' rklilal und einem mindest ens int e rvallskalu-rton ahhängigl:'ll Merkmal. Wi r werden dip Stärke ll.,s ZllSallllllf'nlHlllgs zlI'isd H' n dem Gt'Schlt'cht (nom ina l) und den Ma thoma ti kkenntulsseu (UlPtrisch] in de r bundesdeutschen Bevölkerung unt ers uchen. Die Allt agsth ese daz u laut et , dass PS Unte rsehtode zwischen de n Gf'so·hl pd l!prn gib t, und Männem der Umga ng mit Za hle n leichter fällt als Fra uen . Zur Über prüfun g der These verwenden wir Da ten eines Leist ungst es ts der bundesdeutsehen erwachsenen Bevölkeru ng, die I9!).t im Rahmen einer int ernational angelegten Untersuchung er hoben wurden - den Int er nat iona l Adult Literacy an d Lifeskills Survey (1:\1.5). Vom Des ign ähnelt I:\LS 111:'11 PISAUntersuchungen. Get.'S!pl wu rde aher ketn schulisches \r isst' n. sondern C rundkotupeu-nzen in verschiedenen Bereiche n. unter anderem im Umga ng mit Za hlen (1111111cracy• ..... llt agsmatlu-matik ]. In Abbildung 8.2 sin d die Ma themauk keunt msse als Ilis togra mm darges rollt. Die durchschni ttliehen Kenn t nisse (a rithmet isches ~ lit h' l ) lagen l!.l9-1l oPi 292 Punkten a uf einer Ska la von U bis ;jUlI. Abbi ldung i. I: Kennt nisse in Alltagsmat hematik
, e
'. L\ 1.5 . [)pllt" ,hl" " d 199 1. ,, -2.002
162
ZU~dmnIC"lla "g,m
J/Z ist ebenso wie ..\ (vgl. Ka pit el 7.3.2) ein PR E~ M a b . Zunächst wird versucht, die Ausprägung des abhängigen Xler kmals oh ne Ke nntn is eines weiteren :'I 1i'fkma ls m rhl' rZllsage lJ {S chrit t 1). Für ein nwt risd ws Mer kmal ist der IwsIP Prognosewert dessen (J ,.ithlJJ cti,w:h c.~ M itt el. Die Summe der qnnr lrterten Abweichungen aller Messwerte vom arü tunettschon Xlittel ist m inimal. wie wir a us Ka pitel G.I wissen. Bei Verwendung dos a rith metische n Mittels als Schätzwert begehen wir des halb den kleins ten (quad ra tischen] Fehler. Die Grük des Feh lers entsp ric-ht der Su mmt' der AbWt-'id lllllgsquadra tf' (a bge kürzt: S,\Q, vgl. Ka pltel G.2). Dil'sP lässt s jeh aus den Elnz elmesswerte u oder aus der Varianz ,~2 llt'rt'd ult'lJ. • F ÜI" die 20G2 Beobacht ungen ka nn d ip Summe der Abweichungsquadrare mit einem Sta tisti k-Programm aus den Einzelmesswerten 1)('rechn ot werden:
SAQge, =
n
2IJ(i2
;. >1
;.. I
2:) x;- 1 )2 = 2:) ,r; -
292)2 = -12229,i G.
• Ahe rua üv kann dir- Summe dC'1" Abwelchnngsquarlrat e leicht aus der Varianz 82 lind EIl']" Za hl der ß t'o!Jaeht llllgl'n n rück gerechnet werden. Die Vartanv B Z = E ( r~ :f)~ = ~ der Kennt nisse in Alltags.marhomat ik l)('trä gt 2048 P u n kre. Die Summe der A bwetehungsq uad ra t e IwliiU ft sich dah er a uf
"
S,V~g," = L (x; - .r)2 =
8
2
•
n = 20·1l:l x 2062 = ·1222955 ,
;= 1
~ Iit
Ausnahme von Run dun gsfehlern s ind die \ \"en l' ide ntisch.
Im Bcispielhet r ägt d ie SAQ 4.22L9,jG. \\'ir bezeichnen diese a b Cesamt sununo der Abweic hun gsquadrate SAQ.'I<"3, da alle Merk mals trä ger in die Berechnung einftiesen (Fehlen}. Zur Progn ose der a bhä ngige n Variablen soll nu n {'i ll (' una bhängige \'ariable Iwra ngezogt'lI wpnlpll (Schritt 2). Das Ausma l. der Verkleinerung
des Verhersagefehlers du rch di E' unabhängige Variable gibt a n, wie stark tie f Zusa mm enhang zwischen den beiden Variablen ist. Für jede Ausprägung der unabhängigen Varia bleu (:\liillllt'r lind Fra uen ) wird der \\'I'rl
der ahhällgigt'll Variablen {Ma tbetuatik keunt uisse] nun get rennt progUO:-itiziert. Dip Xlathematlkkenurnissc sind in Abbildung 1.2 ge t rennt für :-' Iälllll'r und Fraur-n da rges tellt . Dip durchschni ttlichen xlathematlkkerm mlssc lwtragen 2!JG ,! ~ P unkte für die 11 = !J:31:1 bolragte n :-' läll nN , be i einer Varia nz .~2 von 22·12,66. Für dif> 11 = 11 2~ befragten Frauen belaufen sich die Xlathemarikkenn misse a uf durchsch nu rlieh 288.1-t Pu n kte be i einer Varia nz s'l \"011 lKI(i , ~6. Dte Frauen schneide n also gr ringfiigig (um 8 P unkte) schlechter ab als die Xlän ucr. Abbil dung 1.2: Kennt nisse in Alltagsmathematik nach Gt>sehl,'cht _
_
' M
Fra"""(""' __ · a ·1124j
!
••
"'
••
L\ LS. Deutschland 1991.
\ Yir prognostizieren nu n für :'. Iänlll' r 29G , 1 ~ P unkte und für Fra uen 288, !-t P unkte au f der Skala . Wie man in Abbildung 1.2 sieh t, weichen di e Mathematikkennmlsse de r Frauen und :'. Iätlllt'l" von lhn'm jt'1\"f'il igl'll G ruppennuttelwert ab. Dir Su mme der Abweichungsquadrate wird jetzt get rennt für Männor und Frauen berechnet:
164
Z!j~u",,,,,,,,I""'Y"fI"J.ße
,~
SAQM.innee =
2:) X;- 2% . 14 )2 =
210 36 17
lind
'= 1 112 1
SACh", ,,t n =
2:) Xi - 2SKi.t)2 =
20K6G59.
i od
Im Beispiel bet rägt die S.-\Q bei den xlä nnern 2.1U:J.G17 und bei den Frauen 2.08G.GG9. Di e Summe dieser beiden W('rh' entspricht (km Feh11' 1", der !ll'i (11'1" " orl wrsagt' t11'1" \ lat hPl1Iatikk('llntnisst' be i Ken ntnis (11's Geschlechts began gen wird (F('h lpl"2): SA Q~'at = 2 1036 17 + 20tiGG59 = ·1. 1HO.27f:i .
0 1'1' let zte Schrit t best eh t in der Ermit tlung des PR E- ~ l a bt 'S {Sch rit t 3) . Dip :-" Ia bza hl 1/2 be rechnet sich nun ein fach aus der Differen z von SAQ y-. und SAQ kat dividiert durch SAQyc.:
2 Fehler, - Fehler2 Tl =
SAQg,. - SAQkat
Feh ler,
17. 1'1
S AQy.-
Im Beispiel !:'rgih t sk h:
2
" ~
SA Qye. - S AQkat S 'Q , .-'
geo
~
·12229;') 6 - 4 190276
."""' (1 ;" """"vU
= 0 ,008 .
2 hat einen werteboreich von 0 (kei n Zusammenha ng ] bis + 1 [perfek ter Zusa mm enhang), E in Zusammenha ng der Stärke 0,00 8 ist zu vernachlässigt' Tl (kein Zusammenhang]. Da d as u nabhä n gige Merk mal nominalskaliert ist , is t '/ mrZt'id u'ulos. TJ2 ka n n - m it 100 multipliziert - prozentual mrer pretiert wen]P Il. Der Fehler bei \'or twfsagf' der Xlat bemat ikkeu nn tulsse wird durch die Kennt nis des Ge schlecht s der ßE'frag te ll u m O ,OO~ . IOO = 0, ~ % vorkloinert .
1/
C clcgen rlich wird auch di e Q uad rat wu r zel aus '12 als M a b der Stärkt, des Zusam menhangs angegeben:
M aßt' für zwei ", tlri~dle M crlmwlr : KUV(lf lUIl Z ,,11(/ P rud,,/;t-MulII"fll-Kurn:lul iufl lfilJ
T} =
R .
(7.1;))
7/ kann ebenfalls Werte zwischen U lind + 1 anneh men . Im Beispiel rosult icrt
Tl =
R
=
V O.0077 =
om.
Auch I} ist nahe null . Bei den Befragten des IALS 199.J ist da s Gl'sehlt'eht zur Erklärung unterschiedl ich guter Xlathemattkkenntnte«- bodeutuugslos.
7.6 Maße für zwei metrische Merkmale: Kovarianz und Produkt-Moment-Korrelation Kovarian z und P roduk t-Moment-Korrela tion UlI'SSt'1l die Stärke des linearen Zusam menhangs zwischen zwei mindestens intervalls kalier teu [motrisehen} Merkmalen. Die Produkt-Monu-n t-Korrelation wird nach dem Statistfker Ka r! Poarsou auch a ls Pea rsons r bezeichnet . \Ypu n ohne näh ere Angab- von Korr elati on gesprochen wird. dann ist meistens der Pea rson 'seht' Korrela t ionskoeth zteut gerneint. Auch hier soll die Berechnung wieder an einem ß eisp it'l verdeutllcht werden. Die C DU wurde nach dem Zweitr-n \\'t'lt kri pg ab üln-rkonfcssl onclle Partei gegründe t. Da sie das ..Erbe" der katholischen Zentrumspartei ant rat. liegt die Vermutung nahe, dass auch die e DU lx-sonders in katholischen Gebiete n veranker t ist , was sieh in den \ \"a hh>rgf'll1lissf'll nil'derschlagen müsst e. Unsere Il ypotht'st' lautet : .,J(' hi.lwr der Ant eil der Katholiken in einem Bundestagswahlkreis. umso höher ist der Stinuueuanteil dor C DU··. Die 1I ~· I)()l h ('S(' soll a nhan d der am thohen Ergehnisse der Bundesta gswahl 199" für dit' 16 rholnland- pfäl vischen Bundestagswahlkreise überprüft werden. :\lerkmalslriiger sind hier a lso nicht Personen. sondern \ r ahlkn'is('. Für jeden der l f Wahlkreise liegt «in :\I\'ss\\"f'rtpaar vor, das.~ a us dem Kat hollkenanteil (Xt) und dem Stimmenanteil de r enu (U,) besr eht, Da es sich hier lllll ProzPlItwt'rtl' handelt. slnd hehle Merkmalt' ranoskaltert ,
Hi6
ZU~dmnIC"lla"g,m
Der Zusammenhang zwischen zlH'i metrlsehcn Xlerk malon lässt sieh in r-iStreudiagramm darstellen. In Abbildung 7.3 ist de r Zusammenhang zwisdll'1l dem Anteil der Ka tholiken und dem (Zwt'it-) Stillunl'uantf'i1 der e DU darges tellt . Auf rlor .r-Avhse ist der Kat holikenanteileines Wahl kr!:'iSI'S. auf der II-Aehsr' de r Stinunenuuteil der e DU (a n gült igen St imuwn ) abget ragen. Beispiels weise betru g der Kat holikenann-il im Wahlkre is lG1 (Bit burg] 91,.t %, lind d ie enu erhielt dort knapp G:j % der gült igen Zweitstimmen. TWill
Abbildung 7.3: Srinnneuanteil der
" , "'so
I" " "-0 c
-..
"
enu
..
und Ka t holiken ant eil
l:Ii1bu'll
•
zc rc
o
o
rc f.:'lb"li'"".m.il
"'"
Auch ohn e ein Zusammcnhangsmas zu bon-chnen , sieht ma n bereits. dass de r Stimmenenteil der eD U UIll SO höher ausfällt. jr- g röl', (']" de r Kat holikenanteil ist. ZwiSl·II!'1I den beiden :\[('rkmalt'1I besteht also ein positi\"l' r Zusam menh ang . rl. h. wenn .rj eine n kleinen \rf' rt anninunt , nimmt auch Y i einen kleinen \r !:'rl an . wenn X i grob ist , ist auc h lIi grnk Ein negativer Zusa mmenhang besteht dann. wenn d te ,lJ,- \r H \(' mit xunehmendon .Ij-\\"f'rtp n kleiner worrlon. Br-ispiel: Jo hiihrr (11' 1" Ar botteranteil in otnem Wahl kreis. 11111S0 schlechter das wahlorgcbuis der ('DU. Koln Zusammenhang besteht . wenn eine Veränderun g des .f;-\\·{'rtes die G rübe des y,\" erh'); nich t boeinftusst . üb ein Xi- hzw. y,-\rHt grob od er klein ist , kann nich t absolut, sondern nur relati v zu allen ande ren .r j- bzw. ,lJ;-:\lf'S-S\\'f'rt t'1I 1ws tillllllt werden: Ein
SI immenun teil von 38 % für die CDU wiire ein kleinot \ r ert verglichen mlr den Wahlergebnlssen der CDU in allen anderen 1;; Wahl kreisen. Ebenso ist ein Kat holikena nteil \"(H1 3;;';{ in den l G rheinland-pfälzischen Wahlkn-isen nicht sehr hoch. während der gll'id lf' P rozl'ntsal z in Sr-hleswig-Holst ein ein hoher \r f'rt wäre. Gro6> ~ 1f'ss\\'f'rIP SilUI daher ~h'Ss\\·t'rt f' , llip überdurchschnittlieh sind. kleine Messwe rt e solche, die un terdurchschmttbch ausfallen. Die enu erzielt e im Durcbschui u in den I ü wahlk reiscu .J3.!.JG % der giiltig('n Stinuneu. nn d der durchschnit tliche Ka tholik ena nteilbet rug :)-t,!.J!.J 'I<,. Gm!; .. cnu-\rf'rtt' sin d als o griit,ef als -t3.9ü %, grot p Katholikenanteile sind griitl'l" a ls j -t,99 % Ka t holiken. \\"Plln ein positiver Zusammenhang besteht. dann rmikte ein iiberdurrhschnittllcher Ka tholi kenanteil auch ein überdurehschnittliches Sthnmergebnis der cnu nar-h sieh ziehen. ein 11Ilterdurchsch niI tlIcher Ka t holi kona nt ei l dementsprechend ein unr erdurchschnittliche s Wa hler gebnis der cnu. Zeichnet man die artthmettschen xliu cl i: und fj in die Graphik eiu. e rhält man vier Quadran ten (vgl. Abbi ldung 7.4). Abbildung J A: Stimmenanteil der CO U und Kat hel ikona nteil mit den jeweiligen ~ I i t t elwerten
ec
~a so
, ~
...
-..
"
~ ;, ao
.-
~-
c 0
20
rc 0
o
ro
'"
so
'00
"'alh"lik,~'a",";l
Im linken unteren Quadran ten Iicg-n alle \\'ahlkreis l', die einen unIerdurchsch ni t t Ilohen Kill holikenant r-il und eiII('Tl 11nterdu rchsr-h niIIIlohen
HiS
ZU~dmnIC"lla"g,m
Cljlj-S rinuucnantcil a ufweisen. Tm rechten oberen Quadra nt en befi nden sich diejenigen \Yahlkrt'ise, die sowohl hinsi chtlich eh,:, Katholikenanteils als auch c!1'S Sümmenantells der cnu tiberdu rchsrhnittlich absrhnoiden. Liegen die ~[ (>ss\\"{'r tpaaf(' ha upts ächlich in dteen boiden Q uadra nt en. dann variieren der Ka t hollkenantellund das Sriunuergebnis der enu posl riv miteinander. ~ [ it Ausn ahme eines \\"ahl krrises liegen al Ir ~[I'SS\\"(']" t pa a re im linken unt eren lind rechten oberen Quadranten. was auf einen starken positiven Zusammenhang deutet. Bei einer negativen Kor n-lauOll müssten die ~ 1('Sswp rtpaan' vor allem im linken oberen und n'(·htPIl unt eren Qua dra nte n H('W'Il, da d ip N,-\\"l' l"tf' dann mi t gröw-l" werdenden r i- \\""rt PIl abnehmen müssten. Lif'g t ketnc Kor rela t ion \ '0 1". da nn sind d ie ~ lt'SM\"(']"t paan' rela tiv gleid ullä big üb er alle Quadrunten verteil t. Um dif' Stärk,' des Zus am menhangs zu berechnen, llI US.<; bt'r ikkskh tigt werden . wie weit die einzelnen Messwert paare mit den Koordinat en (Xi:Ni ) vom Schwerpunkt der Vert eileng (x :y) abweichen. D iE';; tUII wir, indem wir für jedes Messwertpaar zunächs t die Differenzen (.r ; - x l und (Yi - f)) hererhnen. Dies;' Abwl'idlllllgPIl sind für die beiden \\"a hlkn 'is(' Bit burg und Kaisersla ute rn in Abbildung 7.;:i dargestellt . Abbildung 7.;:i; St.irumcnantei l der CDU lind Ka t holi kena nt eil in zwei
Wahlkreisen
.
~i lbu 'll
.- -
.........•..•....
I<.:ai",rslaut~m
" I<.: alholikenallleil
y
Maßt- für zwei
", tlri~dl e
Mcrlm wlr: KUV'lflUIlZ ,,11(/ P rud,,/;t -MulII" fll -Kurn:lul iufl Hi!l
Im Wahlk reis Bit burg sind 91 ,..\ % der Bevölkerung kat holisch. d ie Abweichung ,T i - i: bet räg t 9 1,-1- 5-UN = 3G,-1l P rozent p un kt e, Die CDU er hielt do r t 51,68 % der gültigen St iWllWII, a lso 8 ,.'2 P nm'n t lllln kt t' nu-hr als im Durchschni tt aller Wnhlk n-iso (y; - .ii = 5'2.flS - ·13,9G), Da s Abwt'ir hlln gsprodukt entsprlr-ht (x; - x ) , (y; - i/ ) = :m.-Il· 8 .72 = :U 7 .5. Graphisch kann das Abweichungsprodu kt - wie in Abbildung 7.5 au f der vorh erigen Seit e - als Flä che da rgestellt \wrd pl1 . 3 Die Differenz (x ; - xl ent sp richt der waagerecht en Ausd ehnu ng. d ie Differ enz ( l/i - Ü) der senkrechten A usdehn un g des Rer-luecks. Im Wahlkn'is Kaiserslautem ist rler Kat holikena nteilund d pl' Stimme uant-il de r C DU unterdurchsehnitttich. Das Alm"'id lllngs prod ukt bf'lrä gt hier (x ; - x ) . (Yi - ül = (3-1.89 - 5cl. ml) . (37.fi8 - ..\3 ,9ti ) = (- 20.1) . (-6.28) = 126.2. Das Abweichun gsprodukt ist also kleiner als im Wahlkreis Bitburg. was ma n bereits optisch a n der Griibf' d er Fl ächen erkennt . Die Kovaria nz ist der Durchschnitt de r SUIIIUW der Abweichungsprodukt e
für alle ~ lesswertpaare. W ä h rend flit' Varia nz (Hf;' Stn-uung eines ~ Ierkmals be zeichnet, gibt d if' Kova ria nz d ie gemei n.m llle Sl rc 1JW1!J a n.
SAP
L:" (r , . '" I
zll!e it~ r
M erkm al e
j-] . (y, - Q)
n
(' ,lG)
Zur Berechnung der Kovaria nz Wl'Il"t'IJ(II'1I wir r-ine A rbeits tabelle (T a belle ' .lU), In de r ers ten Spal te sind dto ~ lp rk m a 1st]"äg('r - hier die wa hlkrr-ise - verzeirhuet , in der zweiten Spalte di e Katholikenanteile (x; ) nnd in d er dritten Spalte die \Y
Für;" I<',sw' ·rtl', .... re im Iiul«,u ohf'f('" und f('(:ht ('11 H"t" n'lI Qu
z"~,, "'" ",,,h ,,"ys
17U
COI .'
= 7,1 32 . = IHN.13 16 •
fI
"'ße
(7. 17)
Die Kova ria nz ist null. wenn kein Zusatumeuhang besteht. Ein wesentlleher Nachteil der Kovaria nz besteht dari n. dass ihn' G rüt-l' VOIl\ gl>wähltl'll ?\ Iabslab abhä ngig ist : Hät ten wir dir- belden Merk male nicht in Prozen t. sondern in relativen Häuf i gkeit eu gemes sen . dann würde d le Summe der Abwe ichungsprodukt e u m den Fak tor lO.Ollll kleiner a usfallen. Diese :\Ia i.sta bsa bhäugigkeit erschwert den Vergleich ve rschiedener Kovaria nzen. Der Bet ra g der Kova r ia nz ka nn m a xima l so gr os wie das P ro d ukt c1!'1" 511111dardabweirhung en werden: Icorl ::; /jr . iSY '
Durch Sta ndardisierun g cut geht ma n diesem Problem . Die Stunda rdisierung er folgt , indem ma n die Kovaria nz du rch ih r Maximum n Wm
SA I'
jS'~Q
(7.18)
. ". js.~Q.
Aus der recht en Gleichung kann man schr eiben kann :
L"
SAP
i= \
J SAQz . SAQ ~
L R
i= \
Tl
(x; -
her auskürzen . so dass man auch
xl . (y; '2
Ü)
(Xi - i' ) . L (Yi - ü) R
'2
(7.19)
;= \
Der Wertelx-reich von r liegt vwisehen -cl uud + 1. Bei den Extremwerten ± 1 liegen alle Xloss worto auf eine r Gernden. Nim mt I' d en \rt'rt 0 a n, dan n besteht kr-in linearer Zusammen ha ng zwischen den boiden Sler kmalen. r is t ebenso wie die Kovarianz ein symuu-t rischos ~ I ab. Zur Berechnung von
I'
wird auf die Arbenstabclle zu r ückgegri ffen [Talx-l-
le 7.10, S. 171). Dip Summe der Abwpit huugspn H!ukt l' bl'trägt 1189.13.
z"~,, "'" ",,,h ,,"ys ,,,pe
172
fI
Die Abweichungsquadrate für den Kat holikena nteil (81\Q,,) und d ie Ab.. weiehn ngsqu ad raro Sti mmenantei l der e DU (S'AQ y) werden in den bei.. den letzten S palt e n berechnet. Dur ch Ein set zen in Oleiohung 7.19 erh äl t
man:
SA P
/SA(t ·SAQ.
1189.07
_ 0
J(jI;~().70 " 315.96 -
~
.S0 .
Liegen Kova ria nz und Standardabweichungen der Ix-iden Mer kmale vor . da nn kan n I' alrernut.iv mit Ck-ichung 7. 18 erm itt elt werden . Die Kovaria nz zwischen dem Ka tholike na nt eil und dem Sti mmenanteil de r e D U beträgt 7,1.32. diE' Sta nclanlabwE'i rhllllg des Ka tholik ena nteils s" = JS AQ,,!rl = 136,7/16 = 19.58 und die Standardabweirh nng d c~ Su mmena nteils de r eDU 8 " = .)SAQy/u = .)315.87/ 16 = -1,-1-1.
J6
,"
__ CO V" y __ 8 ,, ' 8 y
74. :32 o· -;~-'o'",-,:::-',", = 0 ."') 19.58 · L I-1
-
Das Ergd mis ist natürlich dassl'lIl1'. Die Korrela tion l wisdw ll de m Anteil der kat holisc hen Bevölkerung lind dem " ·ah lc·rgplmis der e D U bei der Bundes tags wahl 1994 in Rheinland..P falz beträgt also0. 85. Da d il'spr Wprt se hr na h am Xlax imum I ist, liegt ein seh r starker Zusammenhang vor. r 2 kann - mult iplizie rt mit 100 - proze nt ual lntr-rpretiert werden. r 2 = 0.85 2 = 0. 72 IwiM, da ss 72 % fi t'!" Unterschiede im Stinnnenantei l der e DU auf cl\'11 Ka tholik ena nteil zurilckgeflihrt werden können. W ir werden im n ächs ten Kap itel au f di ese Interp reta tio n vur ückkon uuen . RI ,j der I uterpretution der Stär kt, dE'S Zusammenha ngs zwischen Kathellken a utcil und Stimmenergebnis für die e DU IllII SS berücksichtigt werden. dass mi t Aggrega tda te n hä ufig st ärkore Zusanuu-nhä nge gem essen werden als mi t Individualdate n. was auf G rn ppiprllllgsc'lfektP zurilrk geftlhrt werden ka nn [ vgl. Pappi 1977.90). BI'i Individualdate-n beohar:!tt pt man nur selt en so starke Zusammenhän ge. Ein Beispiel ist der Zusa mmen hang zwischen den Lesekenn tn issen [F lfekt cxte] lind den Xlathemarikkeunmis.. SI'n , der in Abbildung 7.6 darges tellt ist. ITiE'r ist T = 0. 88. Der enge Zusa mmenhang widerspricht der VO ll vielen Menschen pr äferiert.en These
Muß~
fii, · zw~i
",d,ü,.h" Mnlm w l,,: KU"U";Ufl Z ,md PfVdukt- Mu",~"t-Kun da til'" 173
Abbildung 7.u: Lese- und Mathemat ikkennmisse
c
'"
ao
aoo
Fließte;o;te
'"
L\ LS 19!)\. Deutschland. 11- 2062.
wonach Fähigkeiten im Umgang m it Texte n nur schwach mit F ähig keiten im Umga ng m it Zah len korre lieren , In Abbi ldu ng 7.7 au f der nädls ten Sl'ite sind unterschledlh-h stark ,HISgeprägt o Zusammenhänge dar gestellt. In der obers te n Abbildung ist ein positiver Zusam menhang an Stä rke O.\J!.l9 abgebildet , direk t darun ter ein nega tiver Zusam menhang gleicher Intens it ät . In der dr itten Abb ild ung korrelieren die Merkmale imm er no ch recht stark (r= O,Gii). während in clpr unters ten Al.bilduug kein ZUsal llIlH'uhan g 1wi!:idlP ll den beiden Merk1l1<11f't1 besteht (r= U). r l'r fasst au!;."d dipMit h de n lirten.n~'l z usammenbang zwischen 11l"I'i Merkmalen. Auch Iwi einem uiclultnearen (z. B. u- föt migen ] Zusammenhang zwischen zwei Merk malen kann r einen sehwachon bzw. keinen Zus a mmenhang a us weisen .
z"~,, "'" ",,, h,,"ys
174
Abbildung 7.7: Darstel lung unte rschiedlich holu-r Korrela nom-n
,
<
:
................... ....~.,.-. .
.'."
-r:
. ... .'
.
,- ... """
..
...., -
:, ".
-------.............. •
..
,
-,
'.
I...' .:<".' . - -;'- ;;:. -"
. ' ..'
" .L",:
--.
:
~' c.:"'.,,',..
.i. . .. --
I
fI
"'ße
17&
Aufy" be"
Aufgaben zu Zusammenhan gsmaßen 1. Sie möchten den Zusammenha ng zwischen der Konfes sion UTHl der Wah lahskht prlifen . In der nachstehenden Tabelle ist die \Yahla hsieht für Nicht- Kat holiken lind Ka tholiken wiedergegeben. Bitte lx-rechnen Sie die Spalten- und Zeilenprozente und interpretieren Sie die Aussagt' der Tab elle! \\"it, stark ist der Zusa mmenha ng zwischen beiden Xlerk ma ton a usg eprägt'? Berechnen Sie hit t c den Kon tingenz kOl'llizit'lltf'1l C, Crumers F sowit' ..\ (Vorhersage der \Ya hlahsicht )!
CD U/CSU
SP D AN DEHE SU1n lllt'
nicht katholisd l 236 3!.lO 2ü8 8!.l4
k atholisch 2!.l7 2()& Ii!.l ü81
Summe 1j:J3 W&
·j·n
1&7&
2. Prü fen Sie a nha nd der a bgebildeten Ta belle, ob es ein Zusammenhang zwischen dem Schulabsch luss (1" 1" Interviewer und dem Schulabschluss de r Befragten bes teh t . Berech nen Sie bitte " in angemessenes Zusa mmen ha ngs tua i..
Befrag ter Ha upts chule Realschule Fl fH/ Abit ur Summe
Inte rviewer Haupt- Hl~l.l - F HHj schule schule ABI 38!J fi!.l l 670 162 352 503 107 3f 7 658 1170 H 90
Qu e lle: ,\ L U K S 199 _1, wes tdt'utse he Htofr agte
,,,
S umme
tcsn
1017 ü1j 1 3:H8
z"~,, "'" ", ,,h,,"ys ,,,pe
176
fI
3. Aus Erfah rung wiss en Sle dass äIt PH' xlenschon nur nngem ~ Iäll· nern die Tür aufmachen. Sle vormuten deshalb. dnss in einer Umfrage die männlichen Interviewer eher j un ge Mens ch en befrag t haben. die weihllr-ln-n Int erviewer eher iHtPrr ~Irllsd\(' ll. Xachfolgend ist das Durr-hsr-lmh tsalt er alle r Befragten wINlrrgf'grlwll . das Durchschnit tsalter der von den Int erviewern Befrag ten und das Durchschnittsalter der VOll den Int erviewerinnen Befru gteu. Berechnen SIP auch hier bitte ein an gr'messeuos Zusammenhangsmag. Altcrsdurchsdmi tt
All" Befragt" VOll Mann Inter viewte VOll Fra u lnterviowte
45,83;:;6
Varianx 286.16ri 3
n 34 42
45.6635 46. 1916
282.89 15 293 .1J079
232U 112 1
Q ud lc, . \ U.lI l·S 199·)
4. Sie möchten den Zus ammenhang zwisc hen der Au kentcmpera tnr und Ihr em Eiskonsum feststellen. Da zu haben Sir a n fün f anfeinauderfolgendon Tagen die Tem per a t ur SOlI"l(, die Anzahl der von Ihnen verzehr ten Eis noti e rt. Bitt !' berechnen Sie d ie Stärke des ZlIsalll llwllhangs mit Hilfe des Pearsou schon Korreladonskoefttxteut en r und interpretieren Sie da s Ergebnis! Zl'idulI'll Sil' die Mess wert paa ro in ein Dia gramm ein! Ta!-\
I 2 :l 4
,
Temperat ur (OCl'lsius)
Eis konsum (Anzahl )
I'
I 7 2 4 2
30
2U
"
17
c. Bitte antworten Sie mit richt ig Oller falsch . a ) Das Ta uschen von Spaltr-n in 1'111('[ Kreuz ta belle hat einen Einfluss au f den " '('Tl von 1 . h) Das Taus chen HlII Spalten in einer Kn 'llzta lwlll' hat einen Einfluss auf den \rnt von Cramörs V.
8 lineare Regression 8.1 G ru udl;nla nkl' da Hcgrcs siousanalysc 8.2 Da.~ mathcmatisdu- Modell der linearen 1tl'I;H'Ssioll 8.3 llt'stirnttlllllj:!; rk-r Ik).\H'ssiullSfuuktiulJ 8.4 Q ua liliit ,[('1' Ih'gn's:,iull
177 178 .
179 UH
8.1 Grundgedanke der Regressionsanalyse ~Iit JIiUt' einer Regressionsa nalyse untersucht man den Ein fluss von einer oder mehreren una bhä ngigen Var iablen auf eitle einzige a bhängige Varia ble. Das Verfahren heist Rcgressions(m alysc, weil d ie Ausprägun g der a bh ängi gen Variable a uf die Auspr ägungen der unabhängigen Var iablen zuriick ycjiihrt ("fPgrt'(liprt") wird. W ir hpsrhränkl'll UIIS ni r d irsr Einfüh rung auf dir lineare Rinj a\'hrr grps.<üon.
Bot einer linearen Regression wird eine Beziehung zwlschou un abhängiger und a bhä ng iger Variable un terstellt , die sieh durch ciuo Grm dr darstellen lässt. Eine solche lineare Beziehung könnt" heisen: Y is t im mer 11m dr ei Einheiten grüN' r als X. Mathem atisch formuliert: !I = :r + 3. Das :-" Iodrll könnte aber auch heiN'11: }~ ist immer 11m den Fa ktor 250 gröi,pr als .Y: !I = 250 · :r. Ob die ß pZil' hullg zwischen zwei met rischen Merkmalen linear ist, läss t sich mit einem St reudiagra m m leicht ülx-rp riifen. Vorausset zung einer linearen Rrgrrssioll ist , llass d ir brtriligt f'1I Merkmale mdrischelj Sk alcnnivCllu i-lllf\\"f'ispu .1 Bei r-im-r F:illjllchrpgn'Ssioll {bivariat e Rr gn 'ssion ) wird der Einfluss eine" einzigen unabhängigen Variable auf die a bhä ngige Var iable geschätzt . Bol ein er multiplen Regression wird da gegen de r Etnftuss mehrerer Merk male auf eine a bh ängige Variable betraehu-t . Dip Fommllemng "Rr grf'Ssion " Oll } ' a uf X " gibt die Erklärun gsrichtung a n . X wird zur Erklä ru ng von }' hera ngezogen: X ist die un abh ängige Var iable Y ist die a bhä ng ige Varia ble. In der Spwdl\l"l'ist, de r linea ren Rrgn 'ssioll sagt man dann: ..:-" Ian führ t llit' Aus prägu nv; des :\1t'rkllli-lJs Y au f dir Aus prägu ng de s Merkmals X zurück", deshalb Rl'grc'ssion V Oll F
Im :-'Io
<..Iit' ab loiillKige Yaria bll'
x.
alll \r eld w Variable ab abhängig und welche als unabhängig berrachter wird, ist von der Fra gestellung a bhä ng ig. wie bereits in Kapitel 5. 1.2 erläutert wurde.
8. 2 Das mathem ati sch e Mo de ll der linearen Regression Das mat hem a tische ~ Iodpll einer linearen Einfachregression beinhaltet ein unabhängiges Xlerk mal x, ein ab hän giges Merkmal y. die Konsta nte a IIIlfI die Steigung b.
y =a + b · x
(8. 1)
Der \ r (>]"1 jJ bes timmt sieh ans der Konstant en n lllziiglich des mi t dem Faktor b muttlpllzleru-n Wl'rtes I . Egal, welche Wert e für a und b elngesetzt worden. da s Ergebnis ist immer eine Gerude. Graphisch bot ruchtot ist a der Schnit tpunkt der Ger nden mi t der y-Aehst,. b ist die Steig ung der C eraden. Bei einer S teig ung \'011 b = 0 wrlii uft d ie Cerade pa ral.. lel zur r - Achsc {y = a + O· x = (I) oder I' S ist die J · Arhse selbs t [fiir a = 0). Abbildung 8.1 auf de r nächs te n Seit e zeigt verschiedene Gerade n für unterschiedliche werte von II und b. Links oben in Ab bildung 8.1 ist die Funkt ion y = 3 + x wiedergegeben. Der Schnit t punkt mit lief y Achse ist also Iwi 3. dit' Steigung ist I ( 1 . I = .r). Rec ht s daneben ist die Funktion y = 2.5 · I .la rge-n-lh . On Sr-hnlttpunkt mi t der y- Ad ISf' ist O. dir- Steigung 2.5. Eint' solcho Gorad e WiHI 811eh .Ursprun gsgerade' oder .Xullpunktgorade'' genauut, da sie durch den Ursprung bzw. Nullpunkt des Koordina tensyst ems geht . Links unt en (y = 7 +0.2 . .r] ist eine Gerade mit der seh r geringen St eigun g von 0.2 abgebildet . Die Ge rad e verläuft als o fas t parallel zur .o....-\chse. Daneben (y = 16 - 1.5·.r) ist eine Gerade mit de r Stei gung - 1.5 abgebildet . d. h. die Ge rade stf>igt nicht . sondern sif' fallt mit zunehmendem \\"rr! von x . Dtc Steig ung der Ger aden liisst sich au ch imm e r als das Verhältn is einer Di fferenz zwcler Punkte auf der !I-..-\ehSt, zur Differen z derselben Punk te a uf dE'I" .r-Achse an geben . Bet racht en wir dazu die G erade recht s oben in Abbildung 8.1. Zwischen zwei P unk ten mit den Koordi na ten (rl; .IJ!) =
(2; 5) und (J'2: !l2) = (-1 : 10) liegt die Differenz a uf der y- :\thsp von Y2 - v. = 10 - ;) = 5 und auf der .r-Achse von I2 - X l = ., - 2 = 2. Eine andere
179
Bezeichnung für denselben Sachver halt ist ßY = 5 lind ß X = 2.2 Dies wird auch a ls .S teig un gsdu-ie-k' bezeiehnot , da der Quotient ß } '/ ß S di p Steigung der Ceraden an gibt , im Beis piel 5/ 2 = 2,5. Dips bedeutet, dass }' tuu 1,5 Einheiten a nstt>igt, wenn X UII1 eine Einheit steigt . Abbildung 8.1: Versehteck-no lineare Funkt ionell
::0,-f'~'-"~" '-----------,
ZD
"
"ro
v ~l,~,
,u" <2< '
,
,
o +--~~-~-~----j
o
rc
.. , ...
0 v
* 16_
:
,.~~
..
,·z - 2
,
0
zo
"
_
,
I .~,
"
ro
,
o +-~-~---,-~---i o s
o+---,-~__,-~---'1 , o
Dieses lineare Modell wird uns Immer wieder begegnen. Als staristlschos :-"[0(11'11 wenden wir t >;; a n. \\ '1'1111 wir einen lun-aren Zusammenhang zwisehen Z\\1'i Variablen unterstellen und aufg ründ dies!'!; Zusammenhangs eine Prognose der ahhäuglgen Variablen abgeben wollen.
8.3 Bestimmung der Regressionsfunktion Zur Illus tration greifen wir das Boispiel au s Ka pitel 7.6 auf. W ir möchten Ix-stimmen. wie st a rk der Ka t holikenanteil in r-iru-m Wahlkreis (las \Yahlngl'llllis der enu Ill'l'infl usst , lind ein Modell lx-rechnen, das PS uns erlaubt . den Summenanteil der enu auf G nl1ld lagl' des Katholikenanteils zu S\·hätzl'l1 . Dazu Fiilur-n wir eine lineare Regression des enuS, lmmenanreils auf den Ant eil der Ka t hollken in den r heinland-pfälzischen 2
~ ist das gr lechisrhe grubt, Delt a und wird hä ufig für die Bez('id ln\lllg elnes Inter valls lJPlI lltzt , in ,li"' ''lIl Fall " I,u für eine Sl n~·kt' .
Bundest ags wahlkreison d urch , d . h. wir such en ein e C cr ndo zur Vorhersago des Cljll-Stirunn-na nteils. Dip allgemeine Funkt ion d il'Ser Ceraelen geht a us Gleichung 8.1 her vor ,
wobei (ll'r Schnit tpunkt der Geraden mit der y-:k hse, (I , Iwi rler Rl'gress ion als Regre$.~ io n,~k on$t (mt e, und die S teigung der RI'g l"l'ssionsgl'radt'll, b, als ReglY'$.~ io flskoeJjizient oder Regres sionsgewich t bezeichnet wird . \ \'I'llll Gleich un g 8.1 solchcrmasen als .S chä tamodell- verwendet wird , schreibt man sie als :
y; =a +b·Ii .
(8.21
Die Schreibweise Yi (sprich: y-l1<wh) verwendet 111<1n , u m deu tlich zu machen. dass I'S sieh bei .I); um eine Schätzu ng autgmud c1iesPf G b-tchung handelt und nicht um einen beobachteten \ \'Pf t . Die heobachteten Werte Ni weichen ja mehr od er weniger \'011 der Gl'rad pn Yi a b. Die Abweichungen e i worden auch als Residuen bezeichnet .
ei =Yi -Yi
(8.3)
Die Ermittlung der Abstände erfolgt graphüch ge,~ehrn immer entlang der Richtung der abhän9i.Qen Varicblen: da es daru m geht, be i der Vorhersage dir-sor Variablen möglichst \wll igp Fehler zu mnehen. Bei einer Regression \" 0 11 Y au f X worden die Abst ände da her ent la ng der A usprägung de r j -, Var ia blen minimiert . \ vürdc ma n d ie Abs t ände ent la n g der X -Varia blen best lnnnen. käme die s einer Umkehrung de r Rid ltl mg der OI'zil'llllllg zwisehen den \ 'ana blcu glnlch. so dass X nicht mehr d il' un abhä ngige, sondern d ie a bhä ng ige Variable wäre und V d il' llna bhä ngigt' a ns tat t de r a bhäng igen Variablen. Dip (Ieraden . d ie sich a uf dte«.n bei dou , regell ermit teln lassen. s ind nicht ldenrisrh: deshalb is t gen au darauf zn achtun . welche Variable die a bhängige und weicht' die unabh ängige ist {vgl. C lan s un d Ebner 1989 , S, I U8 -112),
Da dip \ 'orht'rsag!:' nat iirlk-h milglit hs t gut sein so ll, st ellt slrh di p Frage, weleho Gprarh' dle Punktewolke [vgl. Abbildung 7.3 au f Seit e lGG) a m besten beschreib t. Man könnte pin!' Cerade "pl' r Augeuseheiu' d urch d il'
181
Punkte legen. Diese würde d ie 1.111;(' der P un kte vermurlich nur seh r IlIl ZIIreichend wiedergeben. Xahcliegeud scheint os. die C I'ra. ]1' zu suc hen , bei de r d ip Summe (lpr Abweichungen von der C eraden null ist (2: ei = 0). Dies ist allerdings kein gl'('ignf'tI'S Kriterium . weil es in [ednr P unk t wolke mehrere Ge raden gibt. die d toso Beding ung erfüllen. S ta tt dessen millimiert man die S umme der quadriert en Abst ä nd E' L weshalb das \ '('ffuhren auch als K le in st e-Qu ad r a t e- l'vIethod e bezeichnet wird (01.5 = O rdina rv Least Squares].
c;,
" " Ln cf = 2.) Ui- Ü;}2 = 2:) Ui- a + b.rj)2 = mi rt! ;-=\
; .. 1
(8 ..t)
;",1
wobet d ie y;-\Y"flr die aufg rund der (noch zu hestinuuenden] GP!"1Il!" 1l erm ittelten Schätzwerte und Yi die beobachteten Wer t e sin d.
Aus der linearen Algebra ist vielleicht noch bekannt, d ass man das Minieine r Funktion er häl t , wenn man d ie 1. Ableitung null setzt und die 2. Ableuung bot einem Minimum pos it iv sein muss (is t die 2. Ableu ung negativ, erhält ma n ein Xlaxirnum]. Da d ir beiden Pa ra met er a und b 13('sucht werden. IllUSS Giridllltlg 8A partiell nach Q und lJ abgrlpitet werden (vg l. Bort z :WO.l, S.18ZJf.). Für b "r häl t mall nar-h ein igen Umfommugeu folgondo Formel: ITJlllll
L" Ix·, -
; -1
.t ) . (y, - y)
L" Ix, -
;= 1
x)
,
(8.0 )
Zur Bere chnung von b IWlIiitigPII wir d ie Summe de r AIJ II"t'idlllllgs produ ktf' (SAP ) lind die Summt' der Abwetchun gsqna d ra te von J: (SAQ... ).
Aus bund den arithmet ischen Mtneln i und li kann dan n die Regresstonskons ta nre a best immt werden. Eine Eigensr-haft der d urch die KleinsteQuadrate-Met hode tx-reehnetcn Ge rade n ist es näm lich, dass sie d urch den P unkt (i:;!J) - den Schwerpunkt de r Ver teilung - verlä uft . Auberdem ist beka nnt . dass u der Sr-h nittpuu kt der Gl'radl'tl mit der y-Ad lSf' ist , also verläuft die' Gf'radt' du rch deu Punkt (O:u). Da mit haben wir zwei Punkte,
der Ceradon und können die Steigung de r Ceraden b auch a b Steigungsdreierk festlegen:
b
ßiJ
y- a
y- a
(8.G)
= ßr = i' -O = ~ '
Durch Umformen ergi bt sich
(8.7) D!c Sunune der Abweichungsprodukte 5A P und die S umme (11'r Abwcichuugsquad rute SAQ... haben wir bereit s in Kapitel 7.6 {Tabelle 7.lU) herechnet . Ollreh Einsetz en in die Gleichungen 8.5 llllli 8. 7 ergibt sieh
,.
SAP SAQ...
wm J:~
" ~ -- ~ -- =O
613G.70
'
191
und
a = fj - byr ' i' = 4:t 9G- 0, 194 · 5·1.99 = 3:1.29.
Dip Rl'gn'ssiollsgt'rar!l' in unserem ßt'ispip l lautet also:
.!Ii =
:n :w + OJ!J1 ·.Ti '
Rl'gn'SsioJlskollstant l' und Rl'grl's'..;ionskol'lfi:dl'llt lassen sich anschaulich interpretieren: \ \ "I'lltl die uuabhängig!' Variable 1IllI (·iIW Einheit ansteigt. ändert sieh der Sehätz\\'('rt der abhängigf'n Variable U Ill b Einheiten. Für einen Anstieg de, Kat holi kena nt eils 1Illl r-iuen P rozent punkt prog llostizil'n-n wir einen An st ieg des C lj lj-S timmmanteils 1I1ll O,IV4 Prozentpunkte. Ents prochcud sagen wir einou Ansti eg des Cljlj-Stimnu-nanteils von 1,94 P rozent punk ten bei einem Anstieg des Ka tholikena nteils 11111 10 Prozentpunk te vorher . Ist b = O. dann iiht die unabhän gig!' \ ";uiahll' keinen EinHuss auf dip abhängigl' Variable aus oder der Einfluss ist nichtlinear. Dip
183
Abbildung 8.2: Regn'ssio n
des
fluf
CD U-St tnune nant e ils
Ka t holi kenant ei I
'"
" +--,-~-,-~-,-~-,-~-,---I
o
'"
so
100
negn~ssio Tiskons t a 71 t e ist der \\'('rl , den wir für Xi = 0 p roguostizien-n. Bei ein em Ka t holikena nteil vrm U% prognos tiz ieren wir einen Stimmenanu-il von 33.2U % für die C DU. In Ab bild ung 8.2 ist die ermit telt e Regressfonsgera de l'ingr zE·jd lllpt.
Dip Gleichung [j; = 3:3.29 + O,lfJ I· Xi kann nun zur P rog nose (, ,Seh ii t z u n ~r) dor v . Variablen aufgrund des \ \'er hos EIer X · Variablen verwendet werden. Au f unser Beispiel a ngewendet, kann man jet zt als o zu ein em beliebig en Ka t holike na llteil in einem \\'ah lkrpjs .ri den S riuuueuantei l der cnu Üi ,_"ehiil ze n".
So würde man bei ein em Ka t holikena nteil VOll ' U,' 8 % aufgrund der RE'gres sions gleichung einen Srinuncnanteil der C DU von fj = :~:I.2U + O.l U,1 . 7U,78 = 47,02 % prognos tizieren. Im \\'a hlkreis Corheru . I\"() gen a u d ie.. ser Ka tholikenanteil vorko mmt, bf't räg t der taü;iichli che Süm mcnautci l de r cnu aber GU.9-t %, lieg t als o üb ur dem gl'sehä t Ztf'lI Wert . Dittoren zen zwisdle!l Yi- 11llEI Yi- \ \'nt('l1 konuue n vor. weilnirht a lle 1I!'ilbarhll'II'1I we rte exakt auf einer Gerad en liegen.
184
8 .4 Qualität der Regression Dip Regressionsgera de repr äsentiert. die beobachteten \ ,"I' f lt' umso 1>(';;SI'L je wf'lligl'f d if' ge~'h ätz lt'lI \r en e y, von den beobachteten \Yl:'rt l'l! Yi abweichen. Ein ~ 'a l, für (Hp Ann ähe rung
n
Zur Erkläru ng \ '011 R2 sollte UHU\ s ieh noch einmal d ie Logik etnos r RE{vgl. Ka pitel 7.:3. 1 lind 7.5) vergegenwärtigen. ßt' i P RE-?\ la M' n versucht ma n zunächst . dip ab hän gige Variable ohne lI im u1.iphung piner unabhä ng igen Variablen 1.11 prognostizieren. Im Fall einer met rischen Variablen ist der bes te Schatzwert deren a rithmetisches ?\ Iit td ii (=11 1'sprungliehe Prognose), im Beispiel also das durchschni ttliche Wahlcrgcbnis der COU in den rlu-iula nd- pfälvisrhen Bundest agswahlk reisen. niimlirh ·t.'H IGIX. Die Differenzen (y; - y) gehen an. wie welt wir mit dips!'r P rognose Will den beobachteten werten entfernt sind. Ansebliesend wird dte a hhä ngigl:' Vilriab](> au f Basis einer unal.häuglg-n Variable vorhe rgesagt . Dor beste Sr-härzwert ist nun de r durch die ennit telte Regrosstonsglotch ung pro gnostizierte \\'I'rt y; fü r eiue konkrete Ausprägun g der unabhängigen Variable I ; (= neue Prognose ), Die Abwciehungcn Yi- Yi geben a n, wie wei t die Regressionsgerade von den beobacht et en Wer ten ent fernt ist. Das Cii tek riterium 11/'1' P rognoSl' bes t lnunt s irh nun d araus, in welchem Um fa ng die Fehler au f Basis der ursprüngbehen Prognose d urch die neue P rog nose vermindert werden. ?\ l a ~t'S
Diese Herleit ung \"011 R2 wird nnhand ein er Beobachtung in Abbildung 8.3 a uf der nächsten Seilt> gra fisch veranschaulieht . X i ist der \Yprl der unabhängigen' 'a riable (Ka Iholtkenanreil}. Zu ihm gehört de r beolmeht ptl' \Yert dc r abhängigen Variable Yi {St immenantell der CD U). Der \ \"I'rt a uf der Pa rallel en zur .r-Achsc ist der Mittelwert. 11('1' a bhängigen Variablen f) im ß l:'ispit'1 der durr-hsclmit tliche Anteil der COU . Also der \rert , den wir ohne Ken nt nis einer unabhängigen Variable n vorhersa gen. Der wert auf der berechneten Gera den [); = a + b . .i'i ist rl il' Sch ätz ung der a bhängigen Variablen y; du rch d ie Regressions ger ade.
Abbildung 8.:]: " arialln.'r!pguug im lineare n Regressioustuodell Yi
•
Yi
o
+ b · Xi
Yi
Y
Yi
Yi
} Yi
- Yi Y
Y
Y
Xi
Die Abweichung eies beobachteten 'Ye r h >;; vom ~lith'Jwert Cl/i - 1/) soll e rklärt werden. Si!' läs."t sic h a uft eilen in elit' Abw"id lllllg des bl'ob (lrhtt'tl'lI 'Y"rlt>;; \ '01\) St"h ätl l\1'r t rler Rl'grpssiollsgl'r at!i'n (Yi - Üi) mi/ i (lip Abweichung des Schät zwertos rler Rl'g rf'Ssiollsgl' ra d l'll Will Mlttelwert (!ij - V) . Die DiffPH'1l7. Yj - !I kann mit H ilfe de r Regresston von }' a uf .X erk l ärt werden. Die D ifferenz y, - Yi kann nicht anf X zurück gefüh rt werden , sil' bleibt uncrklärt.
+
f!:-:;.l!, ~r k läl1. <·
(8 .8)
..\ bwt'ichung
Im Wahlkn-is Cochcm liegen wir mit der Prognos e d es durchschnit tli chen C DU· .-\lItl' ils fI von -l:].!)(3 % um G.9S Prozent punk te dan eben . denn d er rats ächllr-he Stimmenanteil der C D U in Cor-hem Yi bet r ägt ZlO.9-l %. Die 1.11 erklärend e Abweichung bet rägt also Ni - !I = 50.9·1 - -1:1 .% = G,98 P rozentpunkt e. Zu r Erklärung des Sununenauteils der cnu ziehen wir den Katholikenanteil im Wa hlkr C'is heran. Auf Basis der berechueton Rl' gwssionsgeradon (!i, = 33.29 +0, 19·1· .Ti) erwarten wir für einen Wahlkrels mit ei nem Kat holikr-nan teil VO ll 70,78 % (\ Yl'r t für C oehem }, d ass ..j7,{)2 % der Wähl.'r für die C DU st immen . ~Iit Hilfe dos Katholikenanteils wird die Schä t zung also hesser, sie liegt näher am tat s ächlichen Srinmu-nergcbnis dpr cnu. Durch dle R t'g rt's." ioll werden .0, - Y = ·17.02 - -13 .!Jfi = :U lfi Prozentpunkte des iihe l'llurdlschn itllidll'll Srinunenanteils de r C D U. Der
186
Kat holtk enanr ell erkl ärt den wahlerfolg der e DU in Cochem nicht vollständig, a ber einen Teil davon. Die weit erhin nicht erklä rt e Abweichung bet riigt .!Ii - y; = 50,9'1 - 47.02 = :1.92 P rozent pun k te. rlenn auch Iwi Kennt nis des Ka tholikenant eils prognos tizieren wir 3. 9 ~ Proz entpunk te 111 wenig. Diese Abweichun gen mü ssen nun für 11.111' 16 wahtkreiso berechnet 1\"('J"{!P Il . n t'HII" sie summiert werden , müssen sie noch quadriert werden. denn sonst heben sich posit ive und nega tive Abweic hun gen au f, so dass die gesamte .-\I l\\·l'id lllllg für alle " 'ah lkrl'iSl' 0 her ragen würde,
"
"
L (Y, - y)'
L (Y, - U.)'
~
;'01
j .d
-----------
-------------
(:~ ...m\-S:\Q,
l · n ,· r k l ä n~ - S .\ Q ,
+
"
L W, - y)'
(8.9 )
j .. 1
----------Erklär lo-S,\Q,
Die 111 erk lären de Gf'sam t-S.-\Q.. . setzt sich also a us einer durch die Regressiol! une rklärten 5.-\Q . . 111H! einer dur ch die Rf'grf:'ssioll erklärten S.-\Q.. . 111SanIl111'1l. Das "prh ältnis de r erklärt en 5...\Q . . zur Gesilmt-5 ,\Q.. . ist das ;>' Iab für die Güte der Regresston. H2,
(8.10)
Zur Verdeutlichu ng der
PR E- ~ I H b- L()gi k
kann man auch schreiben:
H2 = FehleI" , - Fehlt'1"2
Fehler j Gesilmt. S.-\Q.. . - UIlf'l"k läl"h '.S.-\Q.. . GI'Salll t-S.-\Q v
L:" (y, - ü1' - L:" (y, - .Vl' ~
O''---_"__
i, ..
"'O ~~ '
L:" (y, -
i: l
y)'
_
(8.11)
187
Die G('~alllt -S:\Q g in Gleichung 8. 11 ent s pricht den Fehlern bei der 1Ifsprünglichon P rognose (Feh len}, die Ulwrklä rtP-SAQy den Fehlern auf Basis der IWIWTl P rognose (Fehler-]. Die Differenz gibt die Verringerung der Fehler durch die IIillm ziphllug der lIuahhängigt-'lI Variable an. Die G ]pidl1lllgPII 8. 10 lind 8.11 sind na türlich identtsch. d a Gf'silmt-SAQ g Ul\prk lär t('-SAQ g = Er kliirtp-SAQg. .
hat " i1wJI \ \"t'rtf'I Wfpieh von 0 bis 1. H 2 nimm t den Wer t 0 a n. \\'('1111 die unabhä ngige variable X di e Vorhersago nk-ht verbessert. In dies em Fall ist auch b = 0, .le gröf,{'f J{2 ist , des to gröt-I'T ist de r Ant eil rh-r erkl är11'11 Varia ttou der ahhängigl>lI Variablen. ßpj J{2 = I liegen alle Messwerte auf der Rpgrrssi ollsgeradpll . Dip Unt erschiede in der ahhiillgigl'll Variable lassen sich dann vollständig (zu 100 %) auf die una bhäugt ge Variable zurückführen. j{2
Um die Berechnung von U2 in unserem Belspiel duroh mfüh ren . erwettort man Tabelle 7.lU (5. 171) IIIl1 die Spalten zur Berechnun g von y;, 11; - y;, (y;- y; )2. y; _ fj und (fi, _ y)2, Die entsprechende Tahelle s.r ist auf Seite 189 du rgestellt. Durch EinSl'tzpn der .r;-\\"el"tp in die Regrosslonsgtoichung lassen sieh die
y;- ,,"prte berechnen. Die Summe der quadrierten Abweichuugen 2: (Yi - iiJ 2
ist die une-klärte S:\Q von }', di r Summe der quadrierten Abweichungen L: (üi - y)2 ist d ie er klä rte S:\Q \ '011 V. Dip unorklärtc S:\Q b(,triigt 85,..19, die erklärte S:\Q 23 l.(l5 und di e gesamte SAQ 3 15,87.3 H2 lässt sich na ch G leichung 8.10 wie folgt berechnen:
hZI\". alternativ nach Gleichung 8.11:
3
Allfjq llllli u m Bu nd ll"" sll"" ,'nmü" k"il"" "Bls!,ridl!. dip Sn ", " ,,' allS ,·rkliir!.,·r " ",I uncrklärter 8 ..tq y (K ,._I' 1 + 2:11.(1" = :Illi.!" :l) uk'ht exak t der G(,>;mnl-Scl q y (:l 1!';,X? ). SPSS " nniu"l t 'll"' rklär tt' S AQg VOll X' ,, !';21'l , pin!' "rk liirw SAQ . \'011 2:1O, :11I 1illd eine G" S
"j""
188
=
3 15 , 8 7 - 85 . ..19
315,87 ·
= 0. 73 .
J( 2 = 0. 7:1 ist ein sehr holu-r \\'"rl , der in der Praxis nu r s('I(('1I erreicht wird . Mtt 100 multipliziert , lässt er sich als P rozen t wert int or pretierr-n: Dip Varianzaufk lärung bot rüg t 73 7'(,. O d e]" anders ausgedrückt: 73 % der Unterschiede im SI immeneuteil der enu lassen sich auf d ie Höhe des Ka-
tholikeuanteils im Wahlkr,'ü; zurückführen. Und als rR E-:-' lak Der Fehler bei P rognose des Sünnnenantc ils der tholi keuauteils 1IllI 73 '/(, reduzi er t . .Aus llWII ,
enu
wird d ur ch Kenumis des Ka-
n2
lässt sieh im biva naten Fa ll der Kcnela t lonskooth zient r bostlmden n
" =
.f1ji .
(8.12)
Im Beispiel würde der a uf dipS!:' \ \"('is(' (>flll ittf'l tf' \rN! r = 0 .85 bot ragen. }{2 ist alle rdin gs nur lw i einer Reg ression mit e ine r unabhängige» Variablen identisch mit dem quadrlr-rre u Kom-la t lon s koefti zfont en r 2 a us
Kapi tel i ,G,
Nichtlineare Bez ie hungen Niumu /l2 sehr ni('tlrigf' \\ fo rtp an , so kann clips un re rschiedlir-he Ursar-hen ha ben. Ein!' :\Iögl ich kl'it bes teht da ri n, d ass die un a b häng ige Varia b ie X tntsä chlieh keinen Ei nfluss a uf V ausü bt . wip in Abbildung i.i a uf Spitp l i ..j (r = 0 ). Es könu re aber a uch sein, d as s ein nictulinm rcr Zusammenhang besteht. In Abbildung 8 ...j a uf Seiro 190 sind vers chiedene uicbtbnoare Bezieh ungen darges tellt. TIpi nichtlinearen Bez iehungen ist der Anstieg in V von der Posit io n a uf de r X - Ad ISf' a bhängig.
l!.lU
Al.bitdung 8A : ;'\khtlilll'ilrf' ZllSilllln lf'nh iillW'
,
, .
"'" .;
i:
.
,
,
.. .. ..
I
I 'j i( . .- , '. '.., , I .,
'.;
~~~~", ._~
_._-"-". ..... _._ ..---------
.-
:~.:
,
. .... .•' ..
., 1"
.
(
Nirhtliucan- ß f'i'i,' hllURf'1I kiinlwn im Rahmen des linearen Rpgrp;;sio nslllorlells 11I'riicksi <:hti gt werden. wenn durch pinl' gef'ig nl't_f' Yf'ränd f'run g der un a bhängigen o d er a b hängigen Var ia blen eine linea re ß exiehu ng zwis chen den tr a nsformierten Varia ble n her gestel lt Wl' nl f'll kan n. Ein ßeispiel: 111 der ÜkOIlOlllip wird ein expouentir-ller A llst~l f'r Lehnhöhe ~Il it zunehmonder Zahl der Schuljahre a ngeno mmen: Lohn = ca+bSchul J ahr e (vgl. die recht e, un tere Grafik in Abbildu ng 8..1 ). Du rr-h Log a ri thmieren erhält ma n einen linearen Zusammenhan g «wischen dem logari thmierten Loh n und der Za hl der Schuljahre: ln~ } = a + b . Sc hul jahre. Regresston skonst ante u nd fkp;wssionsk(wlfizil'llt lassen s ich d a n n mit einer linea ren Regression schät zen. Bcacbt et werden muss a llerdings. dass !>I·i einem Anst ipg de r unabhängigen Vartablou um eine Einheit nun der Logari thmus der a bhängig en Varia blen - In y - u m b Ei nhei t r-n (linea r] a nste igt [siehe \\'oolrlridge 200(;, 4(; ff.).
Korr elation und Kau salität Abschlle k end ein Hinwei s zur Inn-rpretatton : \Yir interprerieren die Er gebnisse von Regression sgleichungen häufig ka1I" al. .Y wird dann a ls ursächlieh fü r Y a ngesehen . W ir ha ben in Kapitel 2.:3 jedoch gesehen , dass d er Nachweis von Kau sa litä t bei nicht ex perimentellen Da t{'11 sch wierig ist un d
I!H
den Ausschluss altema river Erklärungen über ein e Drit t variab len kont rolle erfordert. Die Dritt varia blenkontrolle erfolg t im Ra hme-n der Regres sion sanalyse. iudem die als relevant erachteten Dri ttvaria blen a ls weitere unabhängige Variablen im Rf'g rf'ssiollslllod pll aufgenom men worden. Mit ninor Tll1Jltiplcn Regression kann der Ein fluss mehrerer unahhängigf'r xlerkma11' auf ein abhängiges Xk-rkmal gl'se hiit zt werden. Die Interpretation der Koe tttzu-nten er folgt analog zur luvarlatcn Regression . Iiegressionsa ualysen sind auch da nn sinnvoll. wenn wi r ausschlicklieh a n emer Progn osp des abbängtgen :\ll'l"k lllals int eressiert s ind , In Ka pitel 7.G wurde für die Le,e- und Xla t hem a tfkkenmnisse eine P rodukt-MomentKor relu t lon von r = O,tlS fest gestellt , Dip Rl'gn 'ssiollsglr id ulIIg für den in Abbildung 7.6 (S. 17.1) da rgestellten Zusammen han g [ Daten : IA LS 1994, n .=2()(i2 ) wurde mit einem Statisti k-Programm berechnet:
fI:i"ilp=
f 1.G+ 0,8 ·1. Lt'SP
(8.13)
Fü r einen Ans tieg der Lesekompet enz um einen P unkt prognostizieren wir eiuou Anstieg der :\Iat homa tikkompetenz um 0.8 Punkt e. U 2 beträgt 77 '){. Dip Lesekompotenz ist da mit sehr gut zur Prognose der Mathematikkornpetenz geeig net. Ka usal würden wir diesen Effe kt der Lesekompetenz wohl nicht interpretieren . Urs ächlich für d ie Murhematik- a nä die Lesekenntnisse sind a ndere Fa ktoren wie die Intelligenz oder die formal e Bildung. Dip lineare Regresston :;t>tzt metrische fJbhällg ige Me rk mo l e \ "O I"llUS. I n den Sozlalwis sens r-haften haben wir jedoch häufi g: keine metrischen Xlcrkmnle. Etwa dan n , wenn wir die Wahlabsicht von Befra gten (nominal), die Erwerbs tätigkeit VOll Fra uen {dichot om] oder die Stärke des polit jschen Intf> l'f'sSl's (on linal) erklären möchten. Auch für kategor iale Dat !;,11 extsüeH'II Regressionsmodelle . Eine leicht verständliche Einführ ung findet sieh bot Andre], Pt ,,1. (1997. Ka pite l 5).
Aufgaben zu Linearer Regression l. Wt>1chf' Frages tr.llungen könne n mit Hilfe de r RI'g rf's." io n 1l1'a nt wortf't wf'rdl' u'? (Bit te lu-ant worten Sie dil' Fra gl' iu ma xim al 2 Sä tZf'Il). 2. Sie möchten W iSS!'Il. welchen Ein fluss der Ant eil der Ka t holiken auf da s wa hk-rgebnis de r SP O bei de r Bundestagswahl 19!)-l in RheinlandPfalz ha ue. In der Ta belle sind für jeden rheinland- pfälaiseln-n Wahlkreis de r Ant eil der Katholiken X i lind das \Yahlergehll is der SP O lIi wierIt'rg('gl'h('lI. ß iu (' be rechnen Sit' dip Rpgressiollsgprade! Ist die ennittelte Regn-ssionsfunkt lon eine gut e Schä tzung des Wa hll'rgPlmisSI's de r SP O'! Borechnen Sie zu r Bea ntwort ung d ies er Fra ge das ß es t inunt heltsmas R 2 ! Inter pretieren Sie alle errechneten :-. rabe inhalt lich!
! \Vahlkn'is Neuwird Ahr weiler Kuhlenz
Cocla-m Kreuznach Bit h Ufl-: "l'rier Mout aba ur
Muinz \\'Ol"lIIs
Frnnkent ha I Ludw igshafon Ncust ad t -SIJl·}...-r Kaiserslauter n Pinuasens
Südpfalz
r ! I I55.55 4U.96 ./I;
8 1.(19 7:.1. 14 7U,78 :.1 2,60 !H ,40 87.97 50.76 51.36 :.12.81 :.1 1.98 38.01 45.61 34.89 45,!l8 55.07
3-1.17 :l7.9:.1 :.12.84 44.01 32.72 39.60 42.21 :lü.55 42.42 43.1ü 40.8:.\ 3M 9 46.70 41.66
ae.ca
3. Berechnen Sio für das obtgo ßt'ispi p] den Korrelarlouskoefttztenten au s den r-inzolru-n xlesswcn on und aus dem ßea im nuhettsmas!
9 Stichprobenziehung 9.1 9.2 9.3 9.4
Gr undlageIl Zufallund Wahrscheinlichkeit Zufallsges teuerte Answahlverfahren Nicht zufallsgeste ue rte Auswahlverfahren
.
195 201 20~
2 1!J
Um Angaben tlhe r die St ru kt ur der ß f'völkrr llilg zu erhalten . werden von amt lieber Seit,' r('g(' l m ä~i g Volkszählungen durchgefüh rt. Dip let zte Volkszä hl ung ist scholl eine Weile her . Sie fand in d er B undesrepublik im J a hr 1987 un d in der DDR im Jah r U181 statt. Erhebt ma n die Da ten wie im Fa lle von Volksz ählu ngen bei allen int eressierenden Unu-rs uchu ngsemheiten - hier a lso bei de r gesamt en ß evi\1 kpfl mg eines Staa t!:';; - , dann spru-ht man von einer Vollcrhclnmg. Eine bedil ke rnll~wf' it e E rhebun g wie (lif' Volkszählung ermöglicht unt er anderem fein gf'glit'llertf' reg tona le A ualvsen . Die Kehrsone der Medaille ist allo rdlngs. d ass bevölkerungsweite \ ·01lerh ebungen se hr kosten- und zeitintensiv si nd . Nach Angaben \ ·011 Dick mauu (200S. ;375) kost et e die Volkszählung i 9S7 11ll'h r als I Xlillia rde 0 \ 1. Die Aus gaben fü r ei ne IWU , ' Volkszählung in Deutschla nd werden noch weit a us hiilwr \"f'l"allsdlla gt . Das Stat ist ische Bundesamt sc hä t zt dif' K os ten a uf r-a . 1AG Mrd. E uro , d as Deutsr-he Inst itut für \rir tsch aftsfo!'Schllllg a uf r-a. 1 Mrd. Eu ro (B unrlesmin ist r-ri um des Irinern 2011G: Wag ner 200G). .Aus Kostengrü nde n wird der näe hstt, Zt' llSUS im Jahr 211 11 da her keine tradi tionelle Volksz ä hlu ng me hr sein . Staudes sen wird ein re9L~terYle<~tütz ter Zensn» du rchgefü h r t (Krügener 2011ü) , dessen Kos ten das Statistische Bundesamt mit ca. -tGO ~ li 1Ji o ll e ll E u ro hf'zill"f'r t. Reg ist el'gf'stii t z t hf'i!>t, rlass Daten a ns de n Verwalt ungsregistern genu tzt werden - insbesonde re a us de n \ iPldpl"pgist prn und de n R pg is tp rn de r Bundesagent u r für A rb eit. Die Reg ister ent ha lten a ber nich t a lle interessierenden Mer kmale. A ngaben zur Bildung u nd Ausbildu ng sind in den Verwa ltungsn-gisn-m beispielsweise nicht en t ha lt en. Zusä rztic h werden doshalb Umfragen be i einem Teil de r B ürger u nd Bürgerinnen d u rchgefü h rt. Der P reis für d en Verzicht a uf eint' t raditionelle Vollerhebung besteht d a ri n. d llss mau die Verteilung Iwstimmter Merkma le in de r Gruudgesanu hen nicht meh r kennt, sondern sf hätz('n IllU S,<;. Zu r Beant wortu ng wissenschaftlichor Fragest ellungen si nd bcvöl kcrungsweite Voller hebu ngen nicht n ur a us Kos ten gründon ungeeignet. Würde
W4
Slj{'hplVlH:'flZj~J.Il"!I
ma n alle wahlboredingten Bundesbürger - als o ca. GO Millionen vlensehe n - vor einer \rahl nac h ihrer Wa hla bsich t befragen. dann liigl'n die Ergebnisse sicher nicht meh r \" 01" der \ r a hl vor. Aus diesem Grund befragt man nicht alle " 'a hlht' I"t'(·ht igtell. SOlIlII'nl trifft eine A1t81.L'(Zh/. Answahlen werden auch als Stichpmbnz oder SIlIUpleS Iwzf'id ulPt (\'141. zu Auswahlverfahren Seheafter Pt al. 1900: Lp\'Y und Lerneshow 1901 : ß iiltkpll 197G). In rlor nachfolge mleu Tabelle ist die wahlabsieht von 1.2;){) Befragten vor dor Bund-stagswahl 19o.! und das tatsikhliehe Endergebnis wk-dergegeben. Obwohl ledi glich ein kleiner Teil d u " 'ä hler befragt wurde, weicht das Ergebnis .1(']" Umfrage vom tatsächlichen \rahh'rgl'1)J1is nicht sehr weit ab . Das ist aber nich t immer so. TIpi der Bumle sragswah l 2Um wurde der Stimmenanteil von cou/esu \'0]) nah ezu allen Umfrugel ustltut en deutlieh zn hoch ausgewiesen. Tabelle 9,1: Umfr ageer gebnis und tutsächliches Ergebnis der ßT\r 19D.!
" arid CDU/ CSU SI' D FDI' Hündnis (IU/Griint'
I' DS REl'
!' orsd Hlllgs' \'a hh'n
" TlI J JP
,12.5% :15,5 % 7.0 % IW % 3.5 % 2,0 % 1.2[;0
(Bl'fmgte)
Allltlidws Er n-bnis 4 1,5 % an,.! % 6 ,9 9(,
. ,3% ·1.4 % 1,9 % 47. 104.57 6 (Wii hll'r)
Es ist keln Zufall. dass sieh d ie Methoden der Stichprobenziehung paral1(,1 zur Wahlforschung entwickelte n. Xorr ualerweise können die Ergebnisse pillP]" St ichprobe nk-ht an den ErgC'lmissPlI für dip Grnndgesallltheit \"alidier t werden. Bei \ rahlt'n ist das anders. Hier gibt das Wahlergebnis rlie Srimmenanteile für d ip t'illZl'lllt'll Parteien in de r Gnu ldgpsamtlleit an. waren die Umfr agl' ergPilllissp weit vom tatsä(:hliC"!1P1l " 'a hlergl'llllis entfornr , so lag dies häufi g an verzerrten St ichp rob on . ..Fehlprognos enwurden zum An lass genom men . die Srir-hprobenziehu ng un d die Dau-norhcbung zu überdenken. Die entsrheidenrh- Frage ist , wie ma n auf der Basis von Stichproben Aussagen iilwl" die G run dg.'samthl'it troffen kann. Oipsp Fragt' ka nn mit Hilfe
G nm dluY" 1l
der schließe nden Statistik bzw. ln/en~nz$tat istik lx-antwortet werd en. Im Gq;I'Il~atz zur bisher lx-ha ndel ten deskriptiven Stat ist ik, die sich der Beschretbnng l"orli t'gf'llllt'f Daten zul"rit'(It'llgihl , werden m it der sl"h lit'N>11l11'1I SI at ist ik Sr ich prol .ene rgebnisse vernllgemei non. O b Auss agen iibor die Grundgesamtheit zulässig sind, hängt wesentlieh davon ab. auf welche Il eü e die Einhei ten der Sttchprol«- ausgewählt werden . Prinzipiell un terscheidet ma n zwischen zu/ aUsgesteuerte1l und nicht Z1I/al t~!Ie<~tellC1te1l Auswahlverfah ren . Schltlsse \"IJU der Sriehprube a uf d ie Gnlll clgf'samtllt'i t - im Belspiel illso ' ·0 11 1.2,j0 Befragtr-n auf ·ri ~lilliollt'll \\'ä hlf'f - sind nur bol Zufallsst ichproben t heoret is ch bogrüud bar. Warum dies so ist 1111\1 welche Möglichkeiten ps g ih t, Srich probonres ultatc zu verallgemeinem. dami t Iwse häfligell sich alle folgl'nd(' 11 Ka pit el.
9 .1 Grundlagen Be vor ,lit, versch iedenon Fortnon der Suchprobonztehn ng erläutert werden köuneu . sollten einige Begriff(' ge klär t seln .
9.1. 1 Gnm dgesamt heit, Auswahlgesamth eit und St ichprobe Unter G r u nd gesa mthe it oder P opu lat ion werde n alle Ein heit en verstanden. auf die sich die Untcrsuchuugshvpot hescn heaiohen . wobei die Einheiten real existieren müssen [vgl. ZUf Annahme fikrive r G rundgesa mtle-iten die Krit ik von Rohwer und Pöt ter 2( 02). Int eressier t man sieh für rlas Wahlverhalten de r Deutschon bei otner Bundes tags wa hl. dan n stellen all e bei dieser Wah l wablb erecbugten Bun desbürger dle Grundgesanuheu dar. Soll die ',"a hlkampn H'r iehh'rs ta t t llug der an ttagenstärksren ül.erregionalen Tageszeitungen {ohne Boulevardbläuer} I,{'i der Bundesragswahl 2UU9 inhaltsanalytisch ausgewertet werden, dann zähle'lI alle wahlkampfbezogenen Ar tik el der .Frunk fur ter Allgemeinen Zeitung", '\I'T .Fr ankfur ter Rund-ahe u'', der .S üddeutschen Zeitung', der ,.tag pszeitllug''' uud
der ,.' ,"I'\t" zur Grundgesanuhett. Sollr-n dit' Studienwünsche rheinlandpfa lzis;·llt'r Abiturir-ntenuutersucht werden. dann gehören alle Schüler des 13. Schuljahres in Rhoinland- P falz zur G r undgesamthol t . Ken nwort e de r G rundgesa mtheit (baw. genauer: einer t hooret ischen Verteilung ] werden als Parameter bezeichnet . Zur Dars tellu ng werden griechische Buchs raben verwandt - z. ß . kennzeichn et JI (spr ich : mii) da s artthmcttscbe Mit te l in der Grundgesamtheit und (J2 (s prich : sigma] die Varianz.
l !.lu
5 ti1'/,JIIV ocnzit "!l " !J
, ·OU de r Grundgesamtheit ist die Auswah lgesamt heit zu un tcrschelden. Sie besteh t aus allen Einheiten . aus \I1'nPIl dir Stichprobe ta tsächlich a usgf'l\'ä hlt wird. ZUf Untersuchung de r Studienwünsche flwilllallll-pfalzisdwf Abit unent en könnten wir llt'ispit'lswpisl' alle Gym nasien anschreiben un d deren Dire ktore n bit ten. uns eine Ltst e aller Schiller des 13. Sr-huljahrcs zu schk-ken. Die Allswahlgesamthei t lx-steht dann aus den au f diesen l.ls rcn verzeirhueten Sr-hütern. die Gr undgesamtheu a us allen rheinlandpfälzis chen S..hiilem. Dir' Auswahlgesamtheit. und nicht d ir Grund gesamtheit ist demnach die Gl'lm dlage der Sti ehllm!wlI zicJl1m g.
Die Allswahl gpsa mt llt'it kan n sieh von der G ru lld gr'SrJaSSE'1l haben. besteht ovorr-overage. Dip D ifferenz zwischen Aus wa hl- un d Grundgesamtheit wäre in diesen beiden Fallen durch eine veraltete Liste verursacht .
Elne Stic h p robe ist eine Tollmenge von Unters uchungseinheiten . dip na ch bestimmten Regeln , dom Auswahlplan. ausgezählt wurde. Synonym verwendet ma n auc h die ß pgriffe A uswahl oder Sampie. " ' ir könnten 7.. B. hei der Auswa hl von Schü lern in Rheinl and-Pfal z so vorgehen , da ss wir erst eine Schülerliste erstellen und dann aus dieser Schülerliste [erlen zehnten Schüler auswä hlen. Ken nwert e von Srir-hproben worden hä ufig als Statistiken (snllt ple ,~tllti,<; t ic) lH'zt'iduwt , \rir haben scholl d in'!"SI' Sta tis tiken für Stir-hpmben kennen gelernt. 7.. ß. i: für das arlthmetlsche :-' li ttl'l oder s2 fiir die Varianz. DeI" Zusammenhang zwischen Gru nd- und Auswahlgesamt heit ist in der folgenden Abbildung verdeutlicht: Die Grundgesamt heu wird durch die 1It'IIe Ellipse da rgestellt . die Auswahlgesamtheit durch die darüberliegendt' dunkle Ellipse. Die 11t']I('1l Krelse sind zlI"l'i verschiedene Sriehproben A lind ß. Under- und overco vorage sind die bt'id t'n stcholfönuigen Übt'rla ppun gen rechts und links. " 'i t· ma n sieht , enthält Stichprobe A Einhe iten. die nicht zur Grundgesamtheit gehö ren (was über die gestrk-helte Linie hina usgeht ]. Dagegen sin d in Stic hprob- ß IIl1l' Fällt' ver zeichnet . d ir' sn-
1!)7
G'"lJ"dlug~"
wohl zur Auswahl- als auch zur Grundgesamtheit gehören. Da jedo Stic hprobe auf der Auswahlgesamt heit beruht , können Fälle, d ie zwar in der C rundge-amrhcit , nicht aber in de r Auswa hlgesamtheit vorha nden sind (undpn:o\"Pl"age). nie in eine Stith]lro]W gelangen. Je \\·"n ig!'f Auswahlund Gl"ulldg.'salllthe it voneinander abwelrhen. umso bes ser dip Gl"uud lagp der St.ichproheuz fehung . Sprac:hlich vernaehlässtgt ma n den Unrerschiod zwischon Auswa hl- lind Grundgesamtheit häutig, auch wenn kla r ist , dass die Auswahlgesamtheit und nich t die G rundges a mt hei t der Stichprob enziehung zugr unde liegt. Abbild ung 9.1: Auswahlgesamtheit lind C run.l gesanuhcit
Ovcrcovcregc
U ndcrcovcragc
... ..
Grundgesamtheit
All,wahlge
Be! der St uh p robonziehuug muss ewts chon der A uen mtdci nhc it (E I" Il('lmngs cinheit ) und der Uvüersuchsmoscinheit un terschieden werden. Die Auswahlein heit ist die Einheit , die der St ichprobenzieh ung zugr unde liegt: die Unt ers uchuug soinhcit ist die Einheit , di e Merkmalsträger ist. Im oblgen Beis piel wan-n Auswahl- lind Untersuchungseinheit idl'nt is{'h , nämlich Schüler. Cenauso gut könnt en wir auch Schulen auswählen lind jeden Schüler 11.'1" a usgewählten Schuten befra gen . Die Auswahleinheit siud nun Schulen, die Unt ers uchungseinholt sind woltorhtn dir- Sehiilt'r; Sdl l i ('~lidl interesstorr-n wir uns für deren Studlonwünsr-he.
l U8
5 tid ,JIIV ocnzit "!l " !J
9 .1 .2 Befragungs verweigerung Angest rebt wird . die Dat en für die gesa mt e Sti chpro be zu erhoben. Bei 111'11 meist en n r fragungf'\l t ret en [edor-h in er heblic he m Umfa ng Ausfäl11' a uf (vg l. Schnell Pt a1. 2008. 289), Gelingt es nich t, eme Person zu bofrn gou. da nn sprech en wir von emph lhut-Xon resp onso . Die :\" idltbea ntwort urig einz elner Fragen (Ite71H Von rc$llOlI$e) wurd e bereits in Kap itel -l angesprochen. Unp roblematis ch s ind A u sfalle, d ie keine Auswirku ng a uf die Qualit ät
der Srk-hprobe halu-n. Solche Ausfälle werden als stick prolwllJu'u t ml
1>ZIl".
zufällig IJI'ZPid llWl. Das Wor t zllflillig deutet a n. dass d ie roaltsterte Stichprobe dann als Zufalls st ichprobe a us der a ngestrebten S tichp robe angesehen wird. St irh prob enn eutralität wird bpispir]s\\"pisp unt erstellt , wenn r illt' Zielperson nicht befragt werden konn te, weil den-n Atln>sst> nicht rk hli g notiert wurde. Zu einer Minderung der Stich prob enqu alit ät führen dagegen nicht st ichprobenneut rale bz w. syM emati.~ehe A usfälle tNon- Iiesponse E rr o r' s, Dit,SI' werden d urch das Unt ers uchun gsth ema «der das Unn-rs udl ungslles ign verursacht. Ein sys h'lIlatisdH'r A usfall I.ä gt' r. B. dann vor . IVI>nn im Ha ushalt nie j em and anget roffen wird , weil alle Ha ushaltxan gehörigcn berufstätig si nd , oder Berufst ätige häufiger Il US Zeit gründon das Interview verweigern. Ein syst Plttat isd wr Ausfallbestände auch dann. wenn vnr allem Bofragu- mit rechtsext remen Einstellungen eine ß efra guu g zum T hema Iiccht sext rcm ismus a blehnen. In beiden Fälle n wäre n in der St ichprobe bes tim mte G r uppen - Ber ufst ät igo bzw. Befr ag te mit recht sextreII WIl polirischen Einstellungen - im Vergleich zu r G rund- bz w . Aus wahlgesa mt hei t unterrepräsen tiert . Die Stichproben würden syxtt-ma t ist-h YO II
der Gnnulgesamr heit abwelrhen . O b ein Ausfall stichp rohenne utra l ist oder nicht . lässt sieh nur sr-hwt-r feststellen. Bei mündlichen und telefonischen Befrag ungen können die l ntcr vicwer na chfra gen. warum eine Pe rson die Teilnahm t' a n der Uuters urhung ab lehnt. In Tabelle 9.2 a uf der gegen überheg enden Seite sind d ie Ausfälle YOIl Befra gungspersonen bei m ALLß US 20(J{i wiedergegeben. Wie man sieht , gibt es nur sehr wenige s tichpr obenneut rale Au sfalle , zu denen Xicht-Befraguug aufgr und falscher Adressen, Wo h UllUgS\\'f'{'hspl und T od gezä hlt werden. Personen, d ir nic-ht in Privath aushalten wohnen , zäh [P li qu a Dofinltion nicht zur G rundgesamtheit . Br.lm A LLß US 200Glu-lief sich der Ante il st ichprobenneutraler Ausfällc a n der Brut tos tichprobe a uf 11 %
IUU
G nm dluY" 1l
in wcst- und 9.2 % Ostdeut schland . Dte systema tisch e n Ausfallt' rosult leTI'II ZUIll gröst en Teil aus lJej ra guIl H.51!t'T w ci.qcn m rJf 1l. Dies e werden zu den syxtemat.isa-hen Ausfällen gl'zählt. II'l'il man davon ausgeht , dass sich dil' P I' ThOIll' U. die eine Teilnahme ver weiger n. von den teilnahmebereiten Personeu unter scheiden (vgl. Dickma nn 2008, .l22). Ein sys te ma tischer Ausfall liegt nar ilrlich a uch da nn vor. wenn eine Person nicht in der Lagt' ist. ein Interview in deutscher Sprache zu führen. Dips!' Ausfällo füh ren zu eiIW f Unterrepr äsent a tion Will Xügrauu-n in der Stichprobe. Migranten. die FfagPIT in deutscher Spra che beantworten kiinuen. unterscheiden sich Spllf wahrscheinlich auch in a nderen :\It'rkmall'll \'011 Mig runt en. d il' dazll llit:ht in de r Lage sind (z. ß . im Bildungsniveau ]. Ta belle 9.2: Ausschöpfung heim ALLß lfS 200G W e >;t u
Ursprüugli..he Brut tru;! ichprobe
Zus ätzlich eingesetzte Adres sen als En;.at~ fiir ~tid'l'roh"ml('utr!\le AusmII" Bruttostichprobe S,iehprolwm'{·llt fi,I,· AusfiiH,' ill~I!;''S
+
-
-
Systematische AusfällC' im;g''S<'lIlt - Im Haushalt niemand a llgpt ro!f"11 - ZP nieht aUl!;ptT<J!fpu - ZP nlclu
lJ('fra~llug,fiiloi,l!;
- ZP wf\wigprt t,,1. bei Infra res t l'rujPkt1pit Ulll!; - ZP ilUS Z" il !\"r üml" 1l un'ht mUl Interview I"' n'it - ZP K<:lU'r,,1I "i" ht ZUlU IntPf\';" w h"rp;1
- ZP sprir-hr uh-ht hinreichend
,I!;,'I\UI\
Deut sch
- .-\d r{·~~C' nicht abschließend bearbeitet - Interviews als (T" il-) Fiilsd ulIIl\ i.l"lltifi~i"rt
Aus wert.hure Int er vie ws
n
,,7i1
WU
26[,2
6 t7 Gt19 70 1 132 122
11.2
232
10 3 13
Vt'rw~,'"
- ZI' j,·ht nicht in I' ri \"a! ha u~ tw lt ß crclulgtc Hrutrost lchprube
Ost
,
G7 57 \5 3 116 238 137 167
as
26 1 2366 121 26
72 2299
lUU 11,0 2. 1 1.'
o.e 5 ,3 1.0
""
26,1 55 II 15 133 20
lUU
2620
.';9.8
\ 198 .3
-1.2 2. t 2.' 0.' 1.6 .11 ,-I 2. 1 0.5 1.3 40.2
63 SC 26 107 10$ 0
I UU
8,7 IOU
0.2 1.0
1,·1 0,5 H
0, ; 100 57.2 3,5 2.-1 3.3 1.0 1.3 11.2
10
OA
18 11 2 2
0.6 0,7 4 2 .8
rs
Qu e lle: \\"as me , Pt al. (200 7). S. 61\.
Um die Qualirii t d-r Sl id lprohf' angpllPll ZU können. wird häufig die AIJsberechnet. Sie bezeichnet II('n Amell reali siert er Inter-
.~thöpj1J.llgsqlJote
2UU
5 tid, JIIV ocnzit"!l"!J
vicws an einer ..lx-reinigt en Brut tos tichprobe''. Die "h t'ft'i nig tl' Br uttos t ich1'1'01)('" ist die lIT1l die st ichprobenneut ralen Ausfälle bereinigte Zahl <111('1' zu Ilf'ffagpnd pn Personen. \\'ip hoch die A llSsd liipfllng S(llloll:' ist. hängt a lso m a~g('bli eh davon ab, was a ls suchprobenneut raler Ausfa ll grz äh lt wi rd (vg l. Koch Hlfl:J). Bei s(,fiös('1\ St udie n werden deshalb 1H' I)('n der Ausschöpfungsquote a uch die A rt der Ausfallt, angegeben [vgl. für d as SOE P He uefeld 198; . 182, 18-1 ). Dip Ausschöpfungsquote lx-tr ug beim A LLß US 200G in Westdeutschland -10.2 % lind in Ost deut schland -12.8 %. Im ALLßUS 199-1 la g d ie Aussr:höpfuugSllllOte noch lwi 33 .2 % (\ \'I'St) bzw. 33. 2 % (O st) (Kor:h Pt al. 199-1) . Dip AusSI:höpflln gs qu otP liegt hl'im A.LLßUS 200G also rund 10 Prozent punkt e nied riger al s Ix-tm A LLßUS ZOO -l. Dip E ntwicklung beim A LLß US zeigt den allgen u-inen Tr end hi n zu höherer Bofra g uug svcrwoigeru ng. Der Umfan g des Un it- Xonresponse lä ss t s ieh bei a llen Formell der ß (... fragung durch eine E r hö hung der Kont aktversuche - also wiederholte, Anschreiben. Antelefonieren . mehrmalige Interviewe rbesuche - , kleine GE'S(:lwnkp (incrntivcs). I'i ue s pI'ziplle Schulung der Inte rviewer nsw. I'Pd uzif'ron (vgt. Dillman 1978 ). Im Europenn Socicl Sm-vcy w ird pillt' seh r ambi tioniert e Ausschöpfungsq uote ( rc.~PQnse mle) von 7U% in den teltnohmenden Staaten anges trebt . In der ersten R und e (2UU2j:WU:3) wurde (!iPSI' zwar in einer Retho von S t a a ten (null Tei l dout llch] untersch ri tten. In den X iedcrlauden . deren Bevölkerun g eh er a ls .bcfragu ngsmüde' g ilt , wurde allerdings eine Aussch öpfungsquote realisiert , die nur ger ing füg ig un ter der Ziel ma r ke Will 'iO% la g un d deut lich über de r nat ionaler E r hebungen (Bilfict Pt a l. 2(07). Di p Za hl der Ko nt a kt versuche IIl1d ein spezielles Int erviewert raining zur Konversion \"011 ßefra gull gsw r\\"eigerern wird fü r d ie hoh l:' Aussch öpfun gsquot e ver an twortlic h gemacht. Ausfälle werden sieh ahr-r auch lx-i eine r sorgfält igen Dan-nerhebun g k aum vermeiden lassen. Umfr ageinsti tut- versuchen. das P roblem systPllIa t ischer Ausfällt, du rch dio Kons truktion \"I1Il Gewirhtungsfakton-n zu bt'heben (vgl. Gabtor et a l. 199-1: E lliot 1991) . Gruppen, die in de r Srichprobe im Vergb-ich zur G r un dg esamtheit unterrepräsent iert siIHI. \\"(' HI(' n bei der Da tena nalyse höher gewk-htet lind G ruppen , die in der Srk-hprobe im Verglek-h zur Grundgesamtheit iil)('rrr 'p riispn til ' rt s ind. wer d en »ledrtger gpwiehll,t , un d zwa r S(). dass die An t eile in rler St ie h prol w denen der G run dgesamtheit entsprechen. Techn isch lxt dles o Ar t der Cewicht uug , die a ls Rcdreesment (:'\ad lgl' wieht llllg) bezeichnet wird. mi t St a ti stikpro gramnu-n leicht zu realisieren.
Zufull uml
W(l llr~d,ei" ljdikdl
2U I
Cewicluungsfak toren kÖI\IWII nur fiir xlcrk malo gebildet WI']"( II'II, (\1']"('11 Verteilung in de r Crundgesamthcit bek annt ist. etwa d ur ch Volksxählungen. Nur für dif'~1' Merkmale lassen sich auch ~ystt:' lllat iM:ht:' AIIWpidlllllgPIi \" 0 11 der Grundgesamt heit. feststellen. :\icht kontrollk-rbar ist allordtngs. ob die Ausfalle innerhalb l'i111'1" Gruppe rem zufällig erfolgt sind: \\"l'r(\1'11 dte Ant worten von ~ Iig rantrn hochgewichtet. weil ~ Iig rall trll in der reulls ier\t'1I Sti chprobe unterrepräsentier t sind . dann fust dies auf der Annahme. dass sich das Antwortverhalten der befragt en Migran ten nicht von dem Antwortverbalten der Xllgrantenunterscheidet. dil' nicht an der ß I'f ragu ug tl' i!gPIlOlllllWl\ ha ben. Zude m ble ibt Tt I:' 11I- ~0Il rf'~pOIlSf' !Jf' i der Ge wicht ung unborücksiehrigt. Bel Da tenan alysen \\·1']"(11'11 in der Regel die Un ters uchungseinheiten hertirksicht ig t , die a uf de n interessierenden Merk malen keinen ein zigen feh1('IHII' l\ "'erl a ufweisen. Soll der Einfluss Ill's Alters. d t's Geschlechts und der Bild un g auf das Erwerbseinkornnu-n mit einer multiplen Re9n:.~sio 71 untersucht wl'l"dell , dann werden aussddie!<.lich die Personen analyxiert , für dle Augeben Z11 allen vier Merkmale n vorhanden s ind. Di I'S(' ~ ll' thod(' wird als lisiu nse deletion {listenweiser Fa lla ussch luss ] bezeichnet. Ge recht ferti gt ist dir-se " orgl'hl'lls \\"t' i;;t, nur darin . wenn die kom pletten Fälle als eine Zufallsst ichprobe au s allen Fallen aufgefasst wer-den können (kf'ille syst em a tischen Au~ ralll') ' Diese Annahme ist in vielen F ällen nieht haltbar. In 111'11 vergangr'nen Jahren wurde daher eine Reihe \" 011 stat isrisrh eu Verfahren zur Behandlung \ '011 fehlenden Werten ( mis<~in9 va/ues) {weiterIent wickclt, die ger ingere Anforderungen an den Ausfallmechanismus stl'lleu. weil sie alle beobachteten Informationen ausnutzen (\·gl. daz u Allison 2002 ; Litt le 1111(1 Ru bin 2(02).
9.2 Zufall und Wahrscheinlichkeit Wenn im Alltag von "Zufa ll·· gesprochen wird, meint ma n da mit meist ein willkürliches Ereig nis . da s keiner lx-stimmten und nachvollziehba ren GI'SI'l7mä !>igkl'it unt erliegt . Im mathematischen Sinne wird ein Ereiguis als zufällig bezoich net , wenn PS das Resu lt a t ein es Zufallsexperiment s ist. ßp i einem Zufallsexperiment smd die m ö.qlichen Ere ignis.-;l' bekannt , nicht a ber welches Ereignis ra rsäeblich eintrit t. Zufallsexperimente sind zumiudest theoreti sch unendlich hä ufig wiederholbar. Bl'ispif'le fiir Zufallsexperimeure sind das \ \"l'l" fen einer ~ lii nzt:' oder eine s \Yürff'ls, (las Ziehen der Lot toz ahlen 0 111' 1" die Ziehung einer Zufallsstichprohe. Das Au ftreten der
2U2
Stit'''J 'mocllzit!nm g
Ereignisse r-ines Zufallsexperiments ist mit Wah rsehcinllch keircn mar hematisch exakt besch reibbar. Ein einfaches und immer wieder gern IWIlUtzlps ßI'is pit'1 ist da s ,rf'rfl'lI eines normalen ,rlirfl'ls. .X or tnal'' soll Iwi~I'II . dass der Würfel sechs gl-I, r-he Seit en hat. Dte möglichen Ergebnisse des Wu rfs lassen sich mit den Ziffern bezeichnen, die auf dom Würfel a ngcgclx-n sind. Dip Xlcngo der Elruu-ntarcrgnisse bestehr aus de n Zahlen L 2, 3. .1. i) und G. " 'I'ld ws dieser Elementarereign isse auftritt. ist dem Zufallsprozess ii!wrlasS('Il. Jedes dieser EI"t'ignisst' hat d ip gleiche Auft ret euswahrsrheinllchkeit , wenn der Würfe! nicht manipuliert ist und man bei m , r .'Tf,'n nk-ht schununelt . Wah rschoin llchkciten können mi t Zahlen im Ben-ich von 0 his 1 oder mit entsprechenden Prozen twerten (0 bis 100 %) b"zPir-hu r-t worden . Ein sicheres Ereignis hat die \ r ahrsd lt'inlifhkpit 1 bzw. 100 % , ein un möglic hes Erei gnis die " 'ahrsd winlichkeit [) bzw. 0 %. Die SUIIlIIW der wahrscheinlichkeitou aller Elementarereig nisse ist 1, weil sich Elementuren-ignisse gl'gpllst'it ig ausschlleken. Da raus folgt , dass d ie Cegenwahrscbeiulichkeit f'ines Erpi gtl is.~es 1 abziig1irh der Wahrscheinlichkeit des Erpigni s.'.;('s ist. Da belm " '" rf(,11 dos " ' Urf('ls Irgendetno Zahl fallen muss - wir schheson also aus. dass der , rlirfl'l auf der Kante st ehenbleiben könn te - li nd nicht zwei Zilfem gl l'id IZ('it ig auftreten können, läs.~t sieh sagen, das.... mit !OO'Xign Wahrschetnlfc hkott olne Zahl zwische n 1 lind G fallen wird. Sind alle Elementarereig nisse wie heim ' Yt'rf('ll eines , rU rfels gleich wahr scheinlieh. dann lassen sieh die Wahrscheinlichkeuen I' der Element a rercignissc j = I.··· , TI mit
[' (U } ) ~
,~
Ill'rt'l·luWIl. wobei ;.; hier die Za h l de r lllöglirlwtl EII'll ll'lltarf' Tl:'i glli ssp hezetchnet. Fü r de n Wurf eines \rürf!'ls ermit telt man für jedes Eiementa -
reretgnts die \rahn;d ll'ill!i("hkl'it P = I/ Cl = 0.16. Sind die Elementarereignisse eines Zufallsexperiments gleich wahr scheinlieh (l.aplace.Expt'riull'nt) . dann lässt sich die Wahrscheinlichkeit aller möglichen Ereig nisse eines Zufa llsexperiments du rch Zähl en ,1l'1" günstigen Ere ignlsseA (d. h. da s Elntreten von A) im \ '('fglf'it:h zu allen möglidll'1l E rl' iglli.~sl'n er mit teln:
Zufull uml
2U3
W(l llr~d,ei" ljdikdl
1>(A ) =
Za hl de f fiir ..\ günstigen EI1'ig llisse Za hl aller mögl ichen Ereign isse
(9.1 )
Diese \ra hrse hf>ill1ichkl'it wird auch als Laplace-Wahrs cheinlichkelt oder fl prio ri- \rahrsdH'inliehkeit bezeichne t. A prio ri. weil die Wahrsehetnlt chkett P(A } vor der Durchführung des Zufallsexp eriments theoret isch best im mt werden kann . Ein Beispiel: Man könnte danach fragen , wie wahrscheinlich das \rpffl'n einer geraden Zahl ist. Die m iigJidlt'lI giins t igt·u Ereignisse werden mit .nder- verknüpft: ..\\"i e wahrsch einlich ist der \rurf einer 2 oder einer .t oder einer G'? " Drei von sechs möglichen Eh-ment a rerelg ulssen sind gerade Zahlen:
I' (gl'rat!l' Zahl ) = 1>(2 oder-t m\t'r 6) = 1'(2U4 U6) =
3
1
G= "2 =
0.5 . (9.2 )
Dem entspricht die Addition der Einzelwahrscheinlirhkeiteu (Add it ions-
theorr-m ], weil sich l\it· mög lichen Ereignisse des Zufa Jlsexpt'rinll'llt s .einmaligen Werfons eines Wür fels
1>(2) + 1'(4) + 1'(6)
1
gq~t' n s{'i t ig a ll ssth l it' ~t' ll :
11
:11
= Ü + (1 + (3 = "6 = :2 = 0.5 .
(9..1 )
Die Wahrschetnltch keit des Wurfs einer geraden Zahl lx-trägt also 0,3. :-' Ian kann auch da nach fragen . wie wahrscheinlich t'S ist , zweima l hin tereinander eine 6 zu werfen , also pillE' 6 /l1HI noch einmal elne 6. 1>(6 n 6 ). Insgl'Salll t ha t das Expemnent Z\wim alißI'S \rl'rfl'll piJll'S \riirfl'ls :36 EIementarereign isse (Talw111' 9.3). Das g ill1s t igt' F:feign is ist (G. 6). Eines der ;3(; möglichen Erei gnisse ist das zweimalige \ rt'rfpn r-inor G. also ist di e Wahrscheinlichkeit p(G n 6) = 1/ :36. Die wah rschoinllch keit lässt sich a us dr-t Multiplikation tief Einzelwah rsrheinlich kei ten [Xlultiplikationsrheon-rn für unabhängig- Ereignisse) berechnen:
2U4
Slj{'hplVlH: 'flZ j~J.Il"!I
Ta belle 9.3:
~ löglidll'
Ereig nisse lu-im zwelmal igen Wor fon eines \\" iirf,'ls Er gebnis
-') ' i
dE'S
I. Wu rfs
-4GG
(1,1)
(2,1)
(3,1)
1',1)
(5,1)
(G.I )
2
(1.2)
(2,2)
(3,2)
(4.2)
(G.2)
(G,2)
3
(1,3)
(2,3)
(3,3)
1',3)
(5,3)
(G,3)
(I ,')
(2,')
(3A)
(',')
(5,.l)
(G,')
(1,0)
(2,0)
(:1,5)
(',0)
(G,5)
(G,O)
(I.G)
(2,G)
(3,G)
(' ,G)
(5,G)
(G,G)
G
1' (6) x P (6)
= ~ . ~ = a~i = 0,027 .
(9" )
Die \Ya hrsd winlichkl'it. zweimal nachei na nder ein e G zu werfen. Iw trägt also 1;''3 6 bvw. 0.027.
\\"pi! man beim \\"iirfpln hä utig an hohen Zahlen inte ressiert ist, könnte man aueh fragen. mi t welcher \Yahrsehpinlichkl'it man zweimal hintereinand er ein.. Zah l größe,- als .. wir ft. Diese \Ya hr.;c1winlichkeit lässt sich d urch Auszä hlen leicht hes nmnu-n (Ta be lle 9.3) . Sie be trägt 4/ 36 = 1/9 = 0.11. \nl' werden im nächst en Kapitel 1I0di einen anderen. den Irrquentis tlsehen, \Yah r.;d u'illiiehkf'itslwgr ilr kennen ler nen. Eln e üla-rsich t hcho Einftthrung in die \\"a hrst:heilliit hkl'itst h,'orip findet sich l)f'j Kühnel und Krebs (20(}7, 107-127).
9 .3 Zufallsgest euerte Auswahlverfahren Ein Auswahlverfa hren wird als zufällig bezeichnet. wcnu j ndr- Einheit der Auswahlgesamt heit ein e gleiche bzw. rine ungebbm-e lVahrschrinlichkeit
gr öscr null hat , in die Srichp robo zu gelangen. Die gleich e oder be kannte Chance wird durch Zufallsverfahren realisiert . Wollen wir eine Sti<:h probl' von GOO der 9.700 rheinland- pfälzischen Abit urienten [Angaben lallt St atls tischem Landesam t R hoinland-Pfalz für 199;j) zieh e n, und !wsilzl jl'df' r Abiturient die .fIltiche Wah rsdlt'in!irh kpil in die Stichprobe zu gelangen , dann lx-träg t die Auswahlwahrscheinlichkeit 9~ = 0,OG2 (also ca. G%). Dar aus folgt unmitt elba r, dass vlcrk malsa u-prägungen. die hä utig in der Auswahlges am theit vorkonunen . auch eine hohe 'Yall rHl:h ein\ithkf'it ha be n. in rlie Stitllpro be ZIl gelangen. und Illllgpkp!lr t. :'\1,IIIlWIl wir a n. dass von den 9.700 r!winhllld-pfälzisd wn Abiturient en ·mo :\If'diz in und 3 Byz an tis tlk s t udteron möchten. Die ' Ya hrscheinllch kei t. einen Ab i t uriont en III it :\ Iediz in-S t udienwu nsrh a uszuwählen. ist deut lich höher (400· 1/9700 = 0,04 1) a ls di e wahrschetnlich kcit , eine n Abiturien ten mit Hyzant.istlk -Studicnwunsch auszuwählen (:1 · 1/U700 = 0,000:1).
9.3.1 Einfach e Zufa llsa uswa hle n Bot einer einfachen [a ueh : unolngeschräu kten ) Zufallsauswa hl (,~imple
random Saml)lc) besitz t jede mögliche Suchprobe vorn Umfan g 11 a us de r G rundgesamlheit (u nd jedes Element der Gru udg('sa ml lwil ) di!'spllw Auswahlwahrschelnlich keh. Alle Srichprobenelenn-me werden unabhängig vonein a nder per Zufa ll in einein Auswahlvorga ng eruritt elt . Technisch kann dies z. B. du rch eine Lost rommel (Lottertea us wahl) oder d ur ch Zufalls zahlen geschehen (vgt. zum konk reten Verfahren Babbie 1997, 2 14 f.). Nehmen wir an , wir hätt en eilll' Ka rt ei, in der a lle 9.700 rheinl a ndpfä l/.isdlen Abiturienn-u w rzl'itl llwt wären. Soll unser e Stichpruhe ;:iOU Schüler enthalten. da nn können wir die Ka rt ot rlurr-huummerieren und ;jOO Zufallsz a hlen zwischen I und 9.700 erzeugen (jede Zahl ha t die gleiche Wah rschein lichkeit} bzw. einer Ta belle entnehmen. Diej enigen ;:i00 Schüler , deren Num mern mit den Zufalls zehleu übereins tim me n, gelangen in die Stichprobe. Ge na uso gu t köun reu wir die Na men der Schüler au f Zertel schreiben. flieHl' in eine l.ostronune! stecken und mischen. Aus dirHt'r Trommel müss ten da nn nacheinander ;jlJO Zettel gf'zog t'll lind die Xamen notiert werden. Jeder Schüler hat - wie wir Ilt'reits oben gpst'ht'1I hahenceine A uswahlwahrsr-hein lichk eit von 500/9700 = 0, 052 .
2U6
5 tid ,JIIV ocnzit "!l"!J
Fiir die Srichprobo ist r-s unerhoblieb . in welche r Reihenfolge die einzelnon Schüler gezogen werden. Zudem kann jeder Schüler nur einmal in die Auswahl gf'lilllgl'll - wir zh.hr-n (lir Srk-hprobe ohne Zunlck/eyclt. Aus einer Grundgesamtholt der Gr iibe ;\' können insgesamt ('~') (s prich : X iilll' r 11) verschi edene Stichprnbeu des Umfangs Tl ohne Berückstcht.igung der Anordnung und ohne Zurücklegen gezogen werden. Der Ausd ruck ist de r Biuom lal kooffizicn t und wird als "N über n'' gelesen.
C')
N! ) (N n = n! . (N TI )!
(9 .3)
n! ist die Fakult ä t von n , also n· (n - 1)·(n - 2)<3·2·1, S ! ist cur sprecheud X · (N - I).( N - 2),3,2, 1, Zur lllust rat ion gehe n wir \ '01\ einer Grundgesamt heit
.v
von = cl Elemente n ans, nämlich {\'a tor, O pa, Mutter, Oma }, \\"i" viele Stichproben der G röbp 11 = 2 können aus dleser G rundgesa mtheit gezogen werden" Insges amt können
2-1 4! ") ( 2 = 2! . (-t 2)! = --I = 0
(9.6 )
Stichproben vom Umfa ng n = 2 au s eine r Grundgesamtheit \'011 N = 'I Elementen gezogen werden. Die Zusammensetzung der einzelneu Stich proben ist S\ = (Van-r. Opa }, 5'2 = [Vater . Mutter]. 8 3 = (Vater . Oma), 5'4 = (O pa . Xlut ter) , 5'5 = (O pa . Oma) lind 5'6 = {Xlutter. U ma], wie in Ta bolle 9.,1 zu sehen ist. Dip \\'ahrsdll'illlil·hkt'it , dass etne hestimmte dieser Stirhproben realisiert wird . lx-trä gt P (Stiehprohl') = l / @ = 1/ 6. Aus einer Grundgesamt heit von !.I.7UU Schülern lasst-u sieh schon me hr als lUll.'i3 verschiedene Stichproben vom Umfang 3UU zn-hen. Ein bekanntes Auwenclungsheispiel für G leichung !.I.3 ist die Frage lII'I('h der \\'a hrSl·lwinlichk-it . G Richtige im Lott o Gaus 49 7U erzielen. Die Anz ahl der Möglichketten, Ga us 49 Zahlen zu ziehen. hr tr ägt ('~~) = 6! . ( 1~~ 6 )! = 1 3!J8;~i:\ lfi. Die Wahrsclu-inlirhkcit. dass eine bestimmte Kom bination fal lt [a m bcsten natürlich di e, die man Sl,II:>.<;t getippt ha t) beträgt als o 1 /(~q) = 1/ 1391'\3816 . Die Ziehung der Lo ttozahlen entspricht dem Ziehen einer Stichprobe vom Umfang 11 = Gaus eine r C mudgesanu heit vom Umfang ;\' = ·1!J ohne ßp riieksiehti gung der Rpihl'llfolgp 1Il111 ohne 7.11riicklf'gc'll.
2U7
Tabelle 9.4: \Yahrsdwinlirhkeilen fiir Such probon Stichprobe Vater. Opa Vat er, Mut ter 8 3 Vat er , Oma Op a , Mutter 8~ 55 Op a , Oma 55 Xlutter , Om a
8, 8,
p(Stidlproll(') l/G l/G l/G l/G 1j G 1j G
Frauenanteil
0% 50 % 5(J % 5(J % 50 % 100%
Zur ück zum ß ('i:-:o pi(']' das in Tabelle 9.4 da rgest ellt ist. Aufgrund clor unterschiedlichen zusammen-erxung der Suchproben variier en auch die Kennwerte (x üu elwen e, Anteilswert e l:'(r.). In der recht en Spalt e ist der Frauenanteil angt'gl'lll'll. In vier de r sechs St ichprolwul )(>t rägt der Frauenamei! ZiO%, in etnor Suchprobe [Vate r. O pa ) n % und in einer SliI'hprohl' ( ~ l ll Ul' r, Om a ) 1Oo 'l . In zwot Suchproben wird der Fra uouan retl unu-rbzw. überschä tzt. in vier S tichproheu sti m mt der Frauenan teil mit dem AI1\(·il in der C rundgesanuheit überein. Beim Frauenanteil in Sti chproben handelt I' S sich 11111 eine Z uJall .5vari flble P . Bei Zufallsvariablen geben die Ausprägu ngen die Ereignisse eine s Zufa llsexperiments an. Im Beispiel ist das Zufallsexperiment das Ziehen einer Stich probe. Oie Zufallsva riable Fra uenanteil ha t die Ausprägungen 0 %, Zi(J % lind 100 'i(,. Weil wir d il' \Ya hrsd winlk hkl'il kennen. mit der die einzelnen Stj r-hproben gezogen werden (1; 13) . können wir au ch an geben. mi t welcher wahrscheinlichkeit verschiedene Fra uen anteile in Stichproben realisiert werden . Die \rahn;ch"inl k hk('it einen Frauenanteil von O'J( zu cr halt en. Ix-trägt I · i /G. In vier St ichproben lx-t rägt der Frauenanteil (;0 %. Die \\'a hrS('hpinlirhkpit, in einer StichprolH' einen Fra uena nt eil von ZiU% zu erhalten. IJl't rägt daher
·1· i / 6 = ·1/6 = 2/ :3. Dip Wahrscheinlichkeit , etnen Frauenanteil \'0 11 100% zu erha lten , lJl'tr ägt I . 1/ 13 = 1/ 13. Die \rahn;dlt'üllkhkl'its\"prtpi!ung de s Frauen ant eils ist in Ahbildung 9.2 visualisiert . Auf der l'- A<:hsl' sind die Frauenanteile abgetragen. auf der y-Aehse de ren wah rschcinllchkoi r. Die Wa hrscheinlichkeit sverteilung eines Stichprobenk en nwerts - hier des Anteilswert s - wird als Kennwerteverteilung bezeichnet. Kennwe rtvvert eiluugeu gl'lwll an. wie star k sit"h die Kennwer te in mÖ!l1icheli Stirhp rolw n
SIi ,.1<1' mlH:" zi I'"'''' g
2U!:!
.
Ahbtldnng 9.2: Wahrschoinlirhkeirsverteilung des Frauenanteils
I
0%
~ 'llo
11)(1'llo
I
F""-"'Nlflted iIl Stid1proben
Stichprobeu
VOIli
Umfang 11 - 2 aus einer Grundgesamtheit vom Umfa ng :'\" - ·1 [ohne
Herücksiclniguug der Ano rdnung und ulme Zurilrklegen].
den Parametern der Grundgesamt heit uuterscheidon. Als Stichprobenfehlet wird die Abweichung der Stichprobonk-nnwcrte vom Par amet er de r G run dgl'salllthei t be zi'idull' t . Der Stichprobenfehler hängt von zwei Fak torr-n ab: der Griif,e der Suchproben und der Streuung des tnt eresst orenden Merkmals in der G rund gesamtheit . \ '0/1
a ) .Ie grüf,t'r der Stichprobenumfang. UIllSO sch ma ler ist die Kenn werteverteilurig. d. h. Abweichungen der Stichprobenkennwert e VOIll Parameter der Grumlgcsamt heit werden kleiner. Bei einotu Stichprol x-numfang W)I\ 11 = 2 variier t rler Franonanteil in Stichprobon zwisch en 0 % und 100 % (Abbildung 9.2). In möglichen Sr irhpmhen des UmFangs n = 3 aus der Grundgesamtheit {Vater, Opa , Mut ter, Oma} variiert der Frauena nteil zwischen 1/3 und 2/3. Im Extremfa ll bes teht. unsere Stichprobe aus allen Elementen der Gr und ges amtheit . In diosern Fall muss der Kennwert der Stichprobe mi t dem Paramet er (11'1' Grundw>samt hf'it Ilhere insrimmen. l.) Ein anderer Extl'f'lllfallll1'st eht . wenn das imeresslen-nde Merkmal in der G rundgesamtheu keine Streuung aufweist. Im ßp ispiel wäre dies der Fall , wenn unsere Grundgesamt heit ans vier Fra ur-n lx-sränd o. Der Frauena nteil in der G rundgesamtheu wäro d ann lOOI,if. In jed er (11'1' möglichen Stichprobe ll aus d il'Sl'r Grundgesamt heit beträgt der Frau-
2U'J
enanteil da nn ebenfalls 100 %. .JE' grübt'r die Streu un g r-ines Merkmals in der Crundgcsemthoit. UIIlSO stärker streuen auch die Kennwerte in 5,lr-h proben. Dies e Angaben Will St ichproben fehler werden im näch sten Kapitel priizisicrt. Wichtig ist , da ss \\'ahr sehein!iehkt'its n-rtpilllllgpll für Stichprobenkennwerte die Verbi ndung zwischen dem [unb ekann ten] Parameter der G rund gesamt heit und den möglichen Stich probenkennwerten hers tellen. Dip zusanmn-nsetzun g un d di,' Kennwerte möglicher Stichproben sind Rculisa rionen des Zufallsoxpenments Zieh en einer S ti chp7'OIJe lind deshal b berechenbar. Existieren zentrale Einwohnermelderegister wie in (1t'1I skandina vischen Staaten. dann lasse n sieh pro blemlos einfache Zufallssttehprobou fiir Bevölkcr ungsumfragen ziehen - vorausgesetzt da s zent rale Einwohuemn-ldcregis ter darf ab Auswahlgrundlage genu tzt werden. F ür den Europeon Socinl S urllcy wurden unt er anderem in Dä nemark . Norwegen. Schweden und Finnland einfache Zu fallsst irhprolwli aus den Einwohnermelderegtstom gezogen (lI iidt'1" und Lynn 2tl07). Einfache Zufallsauswahlen werden auch innerhalb von Heushalten
Auswahl
HlI\
Z I1l"
Personen anba nd VOll Zufalls-ahh-ntalx-lh-n geuutz t, Sie ge-
währt eisten. dass [edos Haushalt smit glied dir- gll'i("ht' C ha ne!' hat, an ((PI" Befra gung teilzunehmen. Dazu dien t eint, Tabelle (Schwcde7l.~chlü,~,~rl oder ki.~h setccuon 9r·id) , die für jede Ilaus halr sgröke eine zuvor au sgeloste ZlIfallszahl cuthält . Bei Einp-rsoneuhaushalt--n kann na turg-mäk auch nU I" eitu- Person befragt werden, weshalb hier in der Tabelle imme r eint' 1 \'eczt>idwt:'t sein llIUS.<;. Fü r Z\\,pipprSlJlH'llhallshalt e wird ein!' 1 oder eine 2, für Dreipersonenhaushalte eine Zahl zwischen 1 lind :3, für \ 'ie'l"jll'rso... neuhanshalte eine Zahl zwischen 1 lind .. usw. zufällig ausgewählt . Die Haus hnl tsgröbe ent spricht der Zahl de r Pt' ThOIW II , die zur G rundgesamtheit zälll!'ll , Als Auswahl kriterium wird da s Alter herangezogen , Besteht ein Haushalt aus vier Personen und findet sich in der Tabelle für dies\' Ha ushnl tsgröbe die Zufallsz ahl ,,3" , so ist die dri ttält es te Person zu 1)('fragen. Die lnrer vieweran weisnng könnte natürlich auch vorsehen. dass PS die dritt j ün gst e Person ist. Für joclon Ha ushalt wird ein f'igt'llt'r Schwedouschlüsscl ausgelost . Die P roblemat ik des Verfuhreus liegt auf de r Ha nd: Trifft der Inter viewer die zu befr agende Person nicht an. dann besteht die Gefah r. dass einfach eine anwesende Person a usgewäh lt wird.
21U
5 tifhplv b<;Ilzid,u llY
9.3.2 Systema t ische Zufa llsauswahlen Da fein t' Zufallsauswahle n recht aufwändig sin d. lx-dient man sich häufi g Auswahlverfahren. Eine in der P ra xis n >rl'fl'ite te Form de r systematischen Zufall sa uswah l ist der Zufallsweg (m n dom umlk), de r im Zusnm mon ha ng mit der rue hrstuhgon Zufallsstichprobe erläutert wird. sys 'f'lIlatisdl~>r
Bel einer sys tr m a ti.~ ch en Zufalh.~ ti chp ro llC wird ]ptligli l'h da s erac Stichprobcnelemcnt per Zufal l ermit telt (wiederum anhand der Zufallszahlenru1)('1 ]" oder des Zufallszahlengcncrators ]. Ausgehend Will dieser Zufallszahl
werden alle weiteren Eleme nte systemarisrh ausgewä hlt. Dips ges chieht, Indem jedes k-I P Element in die St k hpro!>p gelangt . \ \'ip grot-. da s Intervall k ~wis("hpn ~1I'"i auszuwählenden Elementen ist, hängt von der Grök der zu t il'llI'lule ll Stichprohe und der Grii!;p de r Auswa hlgesa mtheit ab:
S tich proben! nt e rvall
Grö!;" drl" Auswa hlgpsa ml lwit GrüN.' der St ichp robe
Ziel sei wieder um . eine Stichprobe mit 50D Schülern zu kons tr uieren . In unsen-m Fall würde sich nach dieser Formel ctn Snchprobentnn-rvall von 9 iOO/ SOD = 19,4 ergeben. Da wir nur jede 19. oder jede :W. Persou auswählen können , runden wir ab un d befragen ausgehend von der Zufallszahl jt"{I('1l 19. Schiller. Der Boreich rler Zufallszahl H gib t s ieh ebenfalls durch das Stichprobenlntorvall. I m Bpispiel miissPIl wir eine Za hl zwischen l und 19 ermitteln . \\'ä rP dto Zufallsza hl 18. da nn ist dir 18. P~>l"S(J1l a uf der Liste die erste ausgewählte PPfSOU. da nach folgt die J i ., die 50. usw. his zur 9U89. Person der List e. Insgesa mt sind es 510 Personen (zehn nn-hr als Iwa hsi<:hligt. da wir das Inter vall abgerundet haben].
C')
Von allen möghchen StiehprolH'1l des Umfangs 71 aus einer GrUlulgp.. samtheil X kann bei einer systematischen Zufallsauswah l nur eine geringo Zahl realixier-t werden: s ip entspricht (11'1ll Stk-hprohenintervall k" Im Beispiel könnte n 19 w l"se IJ ipdpllP Sr.irhproben gezogen werden. weillediglieh 19 verschie dene Za hlen (die Startzahlcn] zufällig ausgewählt werden, wäh rend d ie ..restlichen- Stichprobenelement e in Abhän gigkeit vom ersten a usgewä hlten [11'11]('111 bestim mt werden. Die einzelnen Ziehungen sin d statistiS(:h vOlleinallllpl" ahhän gig. Das erste grzog~'l\e Elenreut hestimnn dil' Auswahl aller weiteren Elemente. Jelll' der k Stichpruhen (nicht aber
211
j ede der möglichen Srkh proben] lind jodos Element der Auswahlgesamthei r besit zt die gleiche Wah rschcinfichk-it , ausgewählt zu werden [vgl. zum Stit:hprobt"ufphll:'r Lpvy und Lenu-show 1991. 74),
P roble ma tisch ist eine systNna liseht" Zufallsauswahl . wenn c1it" Systematik der Au swa hl m it der O rdn ung der Kar tei iihereinst.immt lind das O rdnungskriterium mit d E'1lI Untersuch ungsmerkma l korrelier t {Bölt ken l!J76, 166-173), wäre (zugegcbenermaben unr ealis tisch] unxert- Kart ei so aufgeba ut . Ilass der zufällig ausgewählte ers te Schüler Ma thematik als Leistungsfach hä tt e un d jl'd pr weitere 19. Schiller ebenfalls. da nn pnthi1'ltp II11SE'H' Auswahl lediglir-h Schüler mit ma rhematischem Schwer punkt . Als Folge erhielt en wir r-tn falsches Bild de r Studienwü nsche. weil Schiller mit Leist ungskurs Mathemat ik skh in ihr er Xeigung zu bestimmt en Sturlienfächern mit hoher Wahrschetultcbkeit von allen Schülern unterscheiden.
9.3.3 Komplexe Zufallsau swahlen Liegt keine Auflis tung all er Einheiten der Auswa hlg es am t hei t vor - wie im Fal le (1.,1' GO Millionen hundesdeutsr-ln-n \ \'a hllwfI'I'htigtt'n - , verwender ma ll z\\,.'Ckmä bigpl'\\'" isp ein m Chr,~tlJfiflC$ St ichllmlwlwe ,jahren, Soll eine selten vorkomm ende Slcrkmalsausp rägung unte rsucht werde n. dan n bietet sk-h eine disf!I'O/llwtionul gt,~ chifhtct e S/ic};prolw an. iu der PI'rsOllPII ll\ it 111'1' i nt en-sslerenden ~ Ierkma lsa usprägung ii he rprc sport tona l vert ret 1'11 sind. Ist der riinmliehe odor personolle Kont ext elnor Zlnlpersou für eine Unters uchu ng int eres sant . d ann ist eine Klum pens tichpro be angemessen.
Geschichtete Auswahlen
Zur Ziehung einer gp>;('hichll·tl' lI Stil'hp ro!l., werden dip EII'llWtJ\ P der Auswahlgesamt holt IJI'ziiglkh des int eres sier enden Merkmals in Schicht en (bzw. GI'lIPIWIl ) ein ger eilt. Aus diesen Schic hten werden dann (get re nnt) Zufallset lrh pro ben gezog('u. Fii r {'ÜW geschichte te Stichp robe sprechen zwei G rün d e: fi l's t eh t d ie Au swah lgcs a mt hei t aus versch irdenen G ruppen . d ie in sich sehr h OIll Og " 1I si ud. dan u kan n die Genauigkeit 111'1' Stichprobe gegenüber einer ei nfachen Zufallsstichprohe Iwi gle id wr St k hp ro!wlIgrii j.,p erhöht werden . \\'ircl dil:' GI'Öbl' einer Schicht eutsprecbcud ihrem Ant eil an 11;>1' Grumlge-amt heit gf'wählt, rlann spricht ma ll von einer proportional ge.~ch ichtetell St ichJllVbc.
212
5 ti1'/,JIIV ocnzit "!l"!J
In der Hl'gt'l e ntscheid et ma n sieh jedoch für geschichtete Stichproben. wenn eint' (1(11'1' meh rere Auspr ägungen r11'S Schichtmerkmals bei einer einfachen Zufallsauswahl nicht in hinreichender Zahl in der St iehpro lw vert roten wären. In solchen F ällen zieht man ('iw' düpmpOlt ior llll ye,w:hich td e Stichprob e. in 111'1' die Ant eile der einzelnon Schichten fl i cht den Anteilen in dor Grundges amtheit cutsprechen. Dip Interessierende Schicht wird überrepräsen tiert. Im Gq ;ensa tz zu den zuvor besprochenen einfachen Zufallsauswahlen hat hier jPdes Element nicht meh r d ie gb-ichc, sondern nur noch eine Ilfkm m t e bzw. all gc b!m7'C Chance. in di,' Stidlprohe zu gelangen. Im ALLßUS wird für \\"est- und Ostdenr schlanrl die Stichprobenziehung gp.. trennt vorgenommen. lind zwar so. dass dle np \"Ül kefl lllg Ostdeutschland s in 111'1" Gesumtstk-hprobe im Vergleich ZUI" G rundges am t heit ülx-rrepräseut iert ist. Durch die disproportfonale Schtchmng wird er re icht, dass die Fallzahlen für separate Analysen der ostdeutschen Befragten a us reichend hoch sind . \\"I' I"let ma n boide Sti chprob en zusammen aus. dann muss die unterschiedliche Auswahlwa hrscheinlichkeit für Ost- und \\'I's t' !l'u tschp wieder rüc kgängig gent acht werden. Dips ges chieht durch eint' Design-Gewiclu uug (vgl. für den .-\ 19% wasmer et al. 19%. GI f.) . ß I'lI11 A wird Innerhalb der Schichten - in Ost- und \ \"l'sldl'u tsc hlan ,1 - eine mehrstufige Zufallsstichprobe gl'lOgt'n.
nnus
n nus
Gl's("hichll'l p Zufallsa uswahlen set zen voraus. dass rlie Verteilung ,II'S Schicht merkmals in der Grundgesamtheit beka nnt is t. Auserdcm muss für jede Auswahleinholt das Schicht ungsmerkmal feststellbar sein.
Klumpen auswahlen KIllIllPI'llstid lprolll' 1l hieten sich immer rlaun an , wenn man den Kontext . als o G ruppenz usa mmenh änge. untersuchen möchte. D ie Auswahl bezieht sich nicht auf Unters uchun gscinln-iteu , sondern a uf Aggregate VOll Ur!· tersucbunqseiulieiten: so genannte Klumpen. Von einer Klumpena uswah l sp richt man nur da nn, wenn alle E It 'IIlI'IlIt' eine, Klumpens in die Stichprobe gelangen IlIHI die Element e des Klumpens die Unn-r suchungscinhein-n sind. \\"pun wir dir' Vermutung haben, dass d ip Studlenwünsche der einzelnen Abiturienren von de n Smdienwtlnschen ih rer ~ fi ts(: hiill'r abhängen, wäre eine Klum pens tichprobe a ngem essen . Die Klum pen wären in diesem Fall Schulklassen. Es würde also ein e Ausw ahl von Schulklassen get roff en. Alle Schüler der a usgewä hlt en Klassen wären in der Sti chprobe.
213
Klu mpena uswahlen haben bei gb-ichor St ichprohengrük in der Regel einen grüb"n·n Stich probenfehl er als einfa che Zufalls a u swahlen. \ 'or all em dann. wenn die Klumpen in sich sehr Itolllogl'n snul. sieh a ber stark voneinando r unt erscheiden. Wärou die Gymnasien l)f' i~ p i pls wp isp stark fach lieh ausgerichtet [u-chuische Gymnasien, , r irt Sl'ha ftsgylllu asipn, Gy mnasi um mi t fremds prachig em Schwerpunkt] . dann dü rften sich die St udienwünsche \" 011 Abit uri enten von Gymnasie n mit verschiedenen Schwer punkten sta rk unterscheiden. , rU n!" z. B . eine Kl11SSp eines "'i rtsdlll ft ~g)"m ll aH iu m ~ a nsgl'wä hlt. dann könnu - ma n an nehmen, rlass sich d it' S tlu1il'llwiinsd w der Schüler erheblich zugunst en \\" i rt s("h a ft ~ \I' i ssr ll sdJ a ft lid lt'r Stlll ]jl' IlZ wf'igl' von allen Schülern untersr-helden. " 'ir hä t ten a lso eve ntuell eiueu für die Grundges am theit .untvpis ehcn' Klumpen gezogen. Da alle Schüler dieser Kla sse in dto Suchprob e gelangen. fä llt die Abweichung erheblich ins GI'wicht.
Mehrstufige Zufallsauswahlen Mehrst ufige Auswa hlen sind r-iue Reihe nacheinander dun:hgcfülwtcr Zu[ allsc usumhlcn. Au f de r ersten Stufe wird eine Stichprobe a us Gf 'Up1JClI
Vall
Elementen: den Pri mö reinnedc n, gezogen. P rtmä n-inheitcn sind häufi g rcgionale Einheit en wif' Gf'lllpindf'1l oder Stitumbezirke. Aus rlen Ele me nt en der ausgewählten P rimä re inheil en wird da nn eine weite n' Stichprobe gpzogen. Diese Elemente sind d ie Scbmdärei7lhcitcn. Dip a usgewählt en Sck uudärclnhciten kön nen Gru nd lage ein er weiteren S tichprobe nzb-hung sein . ..... uf der let zten Auswahlst ufe werden Ehe Unt ers urhungsein hciteu ausgewäh lt . Das " orgplll'n soll zunä chs t am ß l'is pie1 de r St udienwünsche rheinlandpfälzisdH'r Schiller verdeutliebt werde n: " ' ir könn ten zunächst eine St ichpr obe a us allen Schulen ziehen, die " in 13. Schuljahr a nbiet en (G vm nasicn . int egrierte Gesamtschulen] . Dir' ..... uswahlgcsamt heil besteht a uf der ersten St ufe a us den 1..l (j Schulen. an denen d11S ..... bitur er wor ben werden kann (Primärem hei tcn} . Aus den ausgewählten Schulen we rde n da nn a uf rh-r zweiten St ufe Schüler [Sekuudärelnheiteu] allsg('wiihIt . ' \"it' viple Schüler wir P fO Schule lluswäh lpll miiss eu, UtH eine Stkh prollPllgrii t,E' von GOO Schülern zu err eich en , hän gt davon ab, wie viele Schulen a uf der ersten St ufe a usgewä hlt wurden. , renn wir GO Schulen a uswäh len. müss ten pro Schule 10 Schüler a usgewählt werden: wählen wir 2ii Schulen a us. da nn er höht sieh d ie Za hl der Schüler a uf :W.
214
5 ti"hpTlJm:nzid , u II!I
Der Xarhteil mehrstuf iger Auswahlverfuh ren besteht darin. dass man a uf jeder Auswahlstufe einen Stichprobenfehler begeht und sich diese Stichprobcnfehlcr addieren. Der St ichp rotwnfehlcr wir d umso kleiner, je grük r (HI' Stidlprolw uud jl' geringer d ie Var ianz des lnt eressiereurlen :\Ipf kmals in der Auswahlgesamtheit ist. Um den Sth-hprobenfehler au f der ersten Auswahlstufe klein zu halten, müsste n also möglichst vie le Gruppen bzw . P rim äreinheiten ausgewählt worden. Ebenso kann ma ll den St k-hprobouFehler der zweiten Stufe minimieren. Ind em möglichst viele Sck uudärelnheiten a usgewä hlt werden . Im Beispiel müssten zunächst möglichs t viele Schulen a usgewä hlt werden und ans diesen Schulen wieder um möglichst vi!'lp Schüler. In diesem Fall nuuinuert man hl'illl' Fehler durch dle \'I'fgröserung der Stichprobe. Bei gpgplwlwr Süchprobengröse, d ie bl'i uns 500 bet ragen soll, ist I'S jP" doch unmö glic h. gleichzeit ig beide Stichprobenfehler ZII minimieren: J\' mehr Schulen ausgewä hlt werden . umso weniger Schüler IIIÜ~St'1I pro Schule befragt werden und umgekehr t . And ers a usged rück t : Indem man deu Stichprobenfehler einer Stu fe rednziert , erhöht mall den Stichprolx-nfehlcr auf einer anderen St ulp.
Aus dieser Zwickmühle kann ma n sich jedoch befreien, wenn ma n ausät zlieh dil' Homogenit ät der Auswahlgesamtheit berücksichtigt . Die Schüler einer Schule si nd einander ähnliche r als die Schüler verschiedener Sehnleu. \r ä hlpll wir nur wouige Schulr-n aus . I)('st" ht eine gröke re Gefa hr, da ss die ausgewählten Schüler uutvpisch für alle Schüler sin d, als wenn wir mögliehst viele Schul en in de r Stichprobe berücksichtigen . d iese jedoch immer nu r durch wellige Schüler repräsent iert werden. E ine möglichst hohe Zahl an auszuwählenden Primä reinheiten schmälen alll'rllillgs den Effizlvnzvortei l mehrstufiger Srichprolx-n, da wir dann wiederum mehr Schulen Illll Schülerltsten bitten lIliiS~I'II. die Int erviewer [wenn wir d il' Befragung mündlieh vornehmen] woitcro \rl'gt, zurücklogen müssen usw. Xlan wägt in der Regel die Effizienz vorteile weniger Primär einheiten gegl'll die Nachteile einer ungenaueren St ichprobe an und wird einen :\li u\'III,t'g beschn-i teu . Da die Pli m äreinheite7l - im Boispie l Schulen - in der Regel untersch iedlieh gw h sind. müsse n dies e mi t einer Wa hrscheinlichkeit ausgewählt 11'1 '1'den . dle pmj!urtim lld zur ihrer Gl'iiße ist. Man hezpichllPI rlleses D!'sig n auch als PPS..Des ig n (probahili ry proport ional to sizf'), Nehmen wir 1111. wir haben UIl S en tschieden. 500 Abit urleun-u auszuwählen. Au f der ersten S tu ft' SOI1P ll 25 Schulen a usgewählt werd en. au f der zweite n
Stuft' jeweils :ZO Abitu rient en. Die Berech nun g der Auswahlwahrscheinlirhkei t soll nun für ~ wl'i verschiedene Sch ulen verdeutli ebt werden: SchuhA hat 189 Ahiturlenu-n . Schule II 49. \\'ürdpll wir auf der ers ten Stuft' dit, Schulen nicht entsprechend ihrer Criibp a uswählen. so h ät ten beide Sr-huh-n eine Auswahlwahrschelnlk-hkeit \"0 11 25 x 1/ 146 = 25/146 = 0.171, da PS I·tu Schulen p;ibt un d wir 25 Schulen a uswähle n. Auf der zweit en Stufe hä tte ein Ablturh-nt innerhalb der Sehuk- A die Cha nce 20 / um = 0.100 a usgewä hlt zu werden. inn erh al b de r SeImIt· II wäre di e Chance für einen Abi turienten :20/ ·19 = 0.·108. Die Gesamtwahrscheinlichkei t kann man lIC'IW:hneu. indem d i,' Wahrscheiulichkeiteu lwiclpr Stufen tnultipliviert werden . Die Chance , da ss ein Ab it urient der Schul, ' A in die Stichprobe gelangt , würde insgesamt also 0.018 (0.171 x O. 10Ü) be tragen , während ein Abl turient der Schule II mit einer \rahr sch"in!irhkei t von 0 ,07 (0, 171 x 0,.108) in der Aus wahl vertreten sein wür de . \\"il' man sieht . resultieren d ie ungleichen Auswahlwahrscheinlichkeiten der Schüle r aus de r nntersrhiedlichen Zahl rler Abiturienten a n den beiden Schule n. Um dip unterschiedlichen Auswahlwa hrscheinlirhkeiten auf der zweiten St ufe auszugleichen . mu ss eine Schule mit 189 Abiturienten eine grö bere \ r a hrselwinlit hkt'it erh alt en. in die Stichprobe zu gela ngen . als eint' Schule m it 49 Abiturienten. Dip Auswahl eine r Schulp ll\ USS proport ional zu ihrer G riibl' erfolgen. wobei die Grübe einer Schule ihrem Anteilan a llen Abiturienten entspricht:
Za hl der Abiturienton einer Schule Zahl aller Abit urienten in Rheinl and-P falz "
FÜI" Schule A bedeutet dies . dass ihre Auswahlwahrschcin liehkcit \" 011 15 x 1/ 14G = 25/ 1·16 = 0.171 a uf 25 x 189/9700 = 0,48 7 st eigt, für Schule B. dass ihre Auswahlwahrscheinlichkeit von 2;) x 1/14 G = 25/ 146 = 0.171 auf 25 x ·19/9700 = 0 , 126 sinkt [vgl. Tabelle 9.3). Dip \ra hrM'lwill1ichkpit, da ss ein Ahituriont der Schule A in die Stichprobe gela ngt. beträgt jetzt 0.051 (DAS7 x 0.10Ü): die eine s Abi tunent en der Schule II beträgt ebe nfalls Ü,051 {O.l 26 x O..IOS). I Die Wahrschetnltchkct t in die St ichp robe zu gela ngen, ist für (die klein ere) Schule II zwar viel AhWl'id ll llll{l'lI kÜlll11'r\il uf/lfUlUl " uu RUlidulI /ll' ll l' lIt,t ,·hl'lI. B \·j, Jl ;'\",,,:lon 'd ll l\'l1 hiu". llllKl'f1ll 1d" t l' \\"l'f lt'
1·\·rW(·II
2Hi
5 tifhplv b<;Ilzid,u llY
geringer als für (die grösere) Schule .-\ (0.126 zu 0,487); dies wird aber durch die höhere Auswa hlwahrscheinlichkeit de r Schüler VOll Schule B auf c1!' r zweiten Stufe kompenxier t . Tabelle 9.;J: Auswahlwa brsr-hetnlfcb kett beim PPS-Drsign
J. St uft' 2. St ufe Insgesamt
Schule A
Schule B
2:) x IiN /9700 - 0 ,487 20/1 X9 = 0 ,106 0,.187 x 0,106 0 ,052
2" x -lfl/9700 - 0 ,126 20/49 = 0,408 0,126 x 0,408 0 ,052
Fü r die Bun desrepubli k exist u-rt. kein zent rales Eiuwohncnueklercgistor , das die Ziehung einer einfa chen Zufa llssrirhprobe er möglicht . F Üf Bcvölke run gsurufragen se tz t ma u daher mehrstufige Auswahlverfahren ein . ist eine Auswa hl auf Basis des AD~ I-~ Iast ersalllplps . steht fiir Arbeitskreis Deuts cher Ma rktforschungsinstitute [vgl. Arlx-itskreis Deu tscher Markt- und Sozialforschungsinstit ute 1999 ). F iir das A O ~ I - :\l as t t' rSa lllpl l' wu rde aus den Stimmbezirken zur Wah l des DeutSe!WIl Bund est ags eine Stichprobe gezogen (vg l. Porst 198G, 8C-88 ). .-\IIS diesem Xlas tersam ple wurden Untersuchproben - Net ze - gezog{'II, die jewe ils ZIU Stimmbezirke ( Samp ic- ['oill l.~) umfassen. Die Stt nunbezlrke st ellen die P rimäreinheilen da r. Auf der zweiten Stufe verzicht et ll HH I au f die Ersn-llnng oiuer Liste mit alle n ll a ushahen . Die Zufa llsauswahl de r Haushal te soll durch das Besch reiten eines ZufaIL~1l!eg.~ ( Raruiom ROllt e) gr währll'istt't worden. Der lntorvte wor prhält eine lnfä llig gr wgpnp Startadrosse und bestimmte Begehungsregeln. die zur Er mittlung der weiteren Adressen führen . Adros-cm-rm it tlung und Int er view können dabei get ren nt ( Adress Ralldom ) Oller gem einsam erfol gen. Auf der drit ten Stufe werden aus dl' ll l laus halr en die BI'fragullgspl'fSOlWIl allsgpwählt. Besu-ht ein Haushalt aus mehrprell Personen. dan n muss die zu int erviewende Pe rso n prnTi tt l'lt werden. l . B. die Person, (li!> Wl/'tl t Gebur t steg hatte. Hänfig worden aber auch Zufalls zahlen rabellou wie der Sehwi'dt'llseh lüssel verwendet. Die Auswahlwahrscheinlk-hkeiten a uf der letzten St ufe sind un gleich: eine Pers on in einem Ein person enhaush alt hat eine Auswahlwahrscheinlichk eit von I, für Personen in Vierpersonenha ushalten b etr ägt d iese 1/4 . Die un terschiedlichen Auswa hlwahrscheiu lichkeiten können durch Ge wichtun g hl'i rler Datenanalyse wieder rtlckgäugig gemarh t werden [DesignEine
A D~ I
~Wgliehkl'it
2 17
C ewicb rung]. DE' I" Xarhteil d er Auswahl der Ha usha lt!' un d der Befr agun gspersonon durch dlo Interviewer liegt a uf der Han d . Eine Zufallsauswah l liegt nu r dann vor. wenn der Inter viewer sieh sowohl an die Begehungsrr-geln als auch a n d ip Zufallszahlenr ahelle zur Allswa ld dps Befragten hält. Hier ist d ip Gefah r g ro~. dass IHe Int er viewer aus Zpitgriindl'll die Begehungsregeln .nbkürzen'', oder die P P l"SO Il befra gen. die sie gerade im Hau shal t antreffe n (vgl. Durroch 1994).
Das A D ~ I-~ hlst {'rsal1lpl (' wurde a uch zu r Ziehu ng der Stic hproben des Soxio-ökcnomischcn Panels herangezogen. Der 198-.1 gezogenen Stichprobe A des Sozio-ö konomischeu Panels lit''gl'll z. kna pp GOO Sa mple-Points zug ru nde (vgl. Ha nofc ld 1987, 171-170, 181 f.). Brtm SO E P erfolgt e dil' Ertuit tlung der Hau shaltsad ressen getrennt \'11m Inte r view [Adress Ra ndom ). Da das SOEP eine Ha ushal tsstichprobe ist , entfiel die dri t te St ufe (vgl. ll anefeld 198 7, 136) . Bis Hl!.l2 {auserdem 1998 ) wurde das Am, (Stichprobendesign a uch für den A LLOUS verwendet.
n.
Seit 199..t [Ausnahme: 1998 ) werden bei IIt'1l AL L ßUS- E rllf'h ull gell Ge.. meindest ich prel H'll mi t Adressenz lehun g a us de n Einwohuern lt'ld t>rt>gist em realisiert. Die Stichprobenziehung erfolgt gorrennt fiir Ost- lll ll i \Yrs ldeutsr-hland (dis proporttonale Schich tung], Au f der ersten Stufe WP]"( 11'1I proportional zur ß t,\"ölkt'l"l lllgsgrÜN.' Gemeinden ausgewühl t ..Aus (11'11 E inl\'o1tllt>rn lt'hle regisl ern dit>sl'l" Gemeinden werden a u f der Z\l"Pi U'1l Stufe 7Uflillig Personen gezogen {vgl. zum .-\LL ßUS 199..t Koch PI al. 199..t). Die Befra gu ng erfo lgt pe rsön lich-mü nd lich. ON Vort eil geg enüber dem .\ D ~ r Des ign lieg t 1I11\('r anderem darin , dass die Stic hprobenziehung \"I11I ko111men ge t rennt \"(1\1 der Feldphase ist. Die Interviewer ha ben kei nen Ein fluss auf (Iit> Allswahl der Personen. E inwo llllt'rlllf'id pn'gistl'fst lchpruheu sind allerdings t euer: auf eine Registerstil:h I)I'olw m ussl I' heim ALLnUS 1998 ans finanzi ellen Gründen \"t'l"~i("hlet worden (vgl. Ko ch et al. 1999. 2 f.).
Telefonstichproben Auch bei Telefonumfra gen wird häufig eine mehrstufige A uswah l realisier t . Die Zufallsallswahl kann ohne eine Liste der Telefonnummern erfolgen. D ll S ursprünglich in den US A entwickelte Verfa hren h l'ibt Rendom Di9it DiIll/iflY (ROD). Auf der ersten Stufe ka nn rill t> Rl'gion /\·t>fl llitt lu ngs.<;IP\lp ausgpwä hlt werden. a uf de r nä..hsten Stufe wi rd pe r Zufallsver fa h ren eine Anschlussnummer erzeu gt. Die zufällige Cenenerung von Telefonnummern hat gegenüber einer Au swa h l aus dem Telefonbuch d en Vor teil. dass auch
218
5 ti1'/,JIIV ocnzit "!l " !J
Teilnehmer in die Stichprobe gela ngen können. die nic ht im Telefonbuch verzeich net si nd, Dies ist in den USA n JII bes onderer Bedeut ung. da dort der Auteiluicht f'ingt' t ragPlwr Telefonnummern sehr hoch ist. 111 Deutschland sind nac-h Angaben von Foltmer un d Smid (1998, .19 ) lO,G % der wostund 18.7 % der os tdeutschen Anschlüsse nicht im Telefonbuch pp liSII'l. Dip An wendung des
non schelt en
in der ß undrsrepuhlik da rnn. dass die
Vorwahlen und Teilnehmernummern hier - im Gegensatz zu den USA -
unterschiedliche Längen haben . In Deutschlan d hat s ich fiir wissonschaft-
liebe Unters uchungen der Ga bler- Hädcr-A uswahlrahme-n (Ga ble r und lIärler 19(8 ) lind in der Markt forschung das A D~ I-T(' lpfonlllaslprsampie durch gesetzt {ll äder und Glplllsn 2011G), Bolm Verfahre n von Gable r und Hader werden zunäehst di p 100.,1' Blocks in O rtsnetzberetch-n ermittelt , in d.'nPII sieh mindes tens eine eing etragene Telefonnummer befindet. Ein Iüüer B10ek ist der Stamm einer Telefon num mer ohne die letzt en beiden Ziffern. E.~ wird davon ausgegangen, dass in den lü öor Blocks. in denr-n sich keine pillgt·t ra gPllPn Telefonnummern befinde n. auch keine nicht pilLgerr ageneu Numme rn existieren. F ür die ht'St'tzh'1\ l U().'r Blocks werden alle möglichen Ziffernfolgen erzeugt . Dies e Zlffemfolgo n werden als Auswahlgesamtholt für Telefon stich pro ben zur Verfügung gestellt. Elnget ragrl Jl' und nicht elngetragone Telefonnummern haben h eim (I abler-l lärle rDesign dit' gleiche Auswahlwahrschelnlich kelr. Xicht jede der generierten Ziffern rcpraseutk-rt eine existierende Telefonnum mer. Es kann sich auch Ulll eine nich t vergebene Num mer band ..ln. Die nicht vergebenen Xummorn si nd eticlus robenneu irale Ausfällt'. Telefo nstic hproben stellen Flaushaltsstichprotx-n da r, Kommt ein Kont a kt zus tande. da nn muss auch hier wieder zufällig eine Person ausgpwählt WPH I"lI, Telefons üc h proben für Bevöl kerungsumfragen set zen elne hinreichend hoh« Telefondichte voraus, Dips ist in \\'('st- lind a uch in Ostdeutschland der Fa ll. Prohlomatisch ist allerdin gs der zuneh mend .. Ant eil von Privathauxhaln-n. die ausschlicklieh über "in Mobiltelefon er reichbar sind. ßt'i einer Auswahl aus den cingcuugcn-n lind nicht ci ngetragem-n Fest norz nutumem ist der en Auswahlwahrschelnlkhkeit null, rl. h. sir' können nicht in d ip Sttchprobe gelang en. In diesem Ka pi te l wurde n dir' P rinzt pien der versr-hledem-n Auswahlverfahren darges tellt. III der Praxis ist die Zirllllllg eiue r Zllfallsstichprob., au fwändi g und mit zahlreichen P roblemen behaftet. Einen Ein blick in die
Nielli
zllf
21!l
P ra xis der Stichprobenziehung vermittr-ln Ga bler er al. (1998) lind der Arbei tskrcis Dem scher Markt- und Sozialforschungsiustitute (1999).
9.4 Nicht zufa llsgeste ue rte Auswahlv erfahren Ik-i nich t zufallsges teuerten A uswahlverfahn-n unterliegt die A uswahl der Unt ersuchungseinhein-n keine m
Umerechiedeu wird awi..... nswahlverfahren. \Yillkürlkh ist ein Verfah ren . we nn keine Auswahlkrtterien an gogeben werden. ßpi b(' W II~~I t'1l Auswahlen werden die Elemente nach lx-stimmten Zielen aus gewählt.
sehen willkü rlic h en lind
Z llfall~ prozl'ss.
bC Wll.~.~ t CtI
Im G l'g<' n ~ll l z zu den zufallsgesteuerten Auswahlverfab reu ist der st a nsusehe Schluss a uf ein e G rundgesa mtheit nicht möglich. weil keine Anga be über d ie Auswahlwahrscheinlichkeit gem acht werden kann , Wissens chaftler s ind jedor-h nicht immer an ..... lI~sag(' l1 über dif' Grundgesamtheit interessi e rt , Dies gilt insbesondere für dit' quali tative Sozialforsdl1l ng (vgl. Flick 2()D7). Zude m sind zllfalligt' Auswahlverfa hr en nicht immer realisierbar. Die Ziehung einer Zufallsstichprobe aus den wohn un g,...losen ~ IP IlS(:ht 'll in der Bundes republik dürfte s ieh schwierig gest alt en. Möglich sind aber Erhebu ngen in Ei nr icht un gen für wohnungslose Xlenschen. Die Aussagen de r Untersuch un g ruüs....en sich da nn auf die unte rsuchte Gru PPI' boehränkm . Auch cxp-rimcntelk- Design s be nöt igen keim ' Zufallsstichproben. ln Experimenten ist die zufalligt, Zuteilung der Tcihn-hmer auf die einzelneu Versuchsgruppen entscheidend. nicht eine Zufallsaus wahl de r Teiln eh mer aus einer Grund gt'sa mtlwit. Auc h bei nicht zufallsgesteuert en Auswahle n müssen Krite rien der Au swa hl angcb ba r lind lx-urteilbar soin. W illkii rl iehl' Answahlen - von Schnell et al. (2008) ab Auswahlen a ufs Geratewohl cha rakt eri siert - s ind wix... enschaftlieh nicht zu rechtfertigeu . Zu IIt'lI willkürlichen Auswehlen zähl en Pas~a n t Pll befraglln gt'n . Eilw willkürlk-he Auswahl liegt a ber au ch dann vor. 11"1'1111 im Rahmen einer qualitat iven ErtU'lmng au~sddief;1irh d ie leicht \'('rfügbarpn Fä llt'! (und lwispif'b\\"t'isp nk-ht die t heoretisch iuterec...anten Fä lle ) untersucht 1\"t'HIl'Il. Q uotenauswahl
Eine Ylischform a us bewusster und willkürlicher Auswah l stellen QlIU' tenauswahlen dar. In wissenschaftlichen Untersuchungen werden diPst' vor
22U
5 ti1'/,JIIV ocnzit "!l " !J
allem vom Inst itu t für Dom e skopie (UD) in Altensbach ver wa nd t . Xltt 1Ii1~ fe der Quotenauswa hl wird eine Stichprobe a ngest rebt. d ie Ausse gen üb er die G rnudg- samrheit Pl'llliigJicht . Dies so ll du rchdie \ 'ofgalw von Quoten, d. h. Anteile, m it denen bestimmte Merkmalsauspriigllugen in der St ictipmbe vorhanden s ein SOllCIl, erreicht werden. Die ..\ntl·i1I' dieser Merk malsa usprägungen müssen in der St ichpro.. be gena uso grob sein wie in der Grundgesamtheit . Um Quoten vorgeben zu können. IllU SS ma n natürlich zunächst wissen. wie groj, rief Antei l ei· III'S ~ lt'rklllaJs in der G rundgf'Salll t hf'it ist. An hand diese r Qll ot l'n wählt 11I'f Inter viewer d a n n willkürlich die Befra gt en aus. Die ,,\\'illkiir" des In.. rerviewers ist nicht mit Zu/all g lpir h:t. llsPt ZPU, wie von den Befü r wor t em die ses Auswahlverfahrens beh aupt et wird [vgl. Xoelle-Xeumann und PI'tersen 1996 , 259) , wir noch einmal a uf d ie Umfrage unter r heinland..pfä lzisehl'n Abitunenten zurück. Als Q uu tieruugsmerkmal könnte ma n z. B. das GI'" schlecht vorgeben. wären GG % 11.111'1' rheinla nd..pfalzb d H'1I Abiturienten Männer und 4G'X Frauen. dann miibten in unserer S tkhp rolw ebenfalls G5 % Xl ünner und 4;j % Frauen vertreten SPill, \\'pld w Schüler wir bpfragl'n, ist belie big . sola nge wir uns an die vorgegebenen Quoten halten. Um dem angestrebten II!I'al r-tnor "rppräspnta t in 'u" Suchprobe näher zu kommen. könnte man zusätzlich zu m Geschlecht noch vorge ben. wie \'i1,1 Prozent der Schüler aus verschtedonon soatalon Schlrhten kommen. K O lll UH' 1I
Das Geschlecht und d ie Schichtzugehörigkeit können nun als un abh än.. gige Q uoten . d. h. isoliert e Merk malsa uspräg un gen . vorgege ben werd en. Z, kö n nte die Q uotp la uten ..GO % Fr a ue n lind 40 % ~ liin nl'f sowie :30% Arbeitersr-hk-ht , GO% Mtur-lschk ht und 10 % O berschieh r.., \\"I'nn d!e Q uorierung un a bhä ngig vonein a nde r erfolgt . kan n PS bot diesem Bolspiel rheorensch passieren. dass alle ausgewählten Mittclschichra ngohöngcn a uch Fr a ur-n si nd und die Xl änner alle A rbeit er.. lin d Oborschichtangohörigc sind. Dip einzelnen Quoten für Gesch lecht und Schiehrzuge höngkcit wä.. ren damit zwar erfüllt, nicht aber eine komb in iert e bxw. abhäu,f}ioe Q uot e. die d ie gemeinsame Verteilung f h 'S Ceschlechts un d d er Schirhtzugehöfig kl'it herücksirhrigt. Abhängige Qu otPll Sf'tzell exakte Ke nntnisse der G run dgesa mt heit voraus, Man kann sich zudem lotcht vorstellen . wip un.. roubsierbar abhän gigl' Q uote n werden, wenn mo hr als zwei Merkmale Iwi der Quot ier un g kom biniert worden. Zudem ist die Ge fah r des .Umdefinieren s" d ur ch Interviewer bei seltenen Xlerk malskombinatlonou grob. weil
n.
221
der Aufwand fiir den Inter viewer s teigt (vgl. Derroch 1994, .W). ..... us diesem Gr unde werden in der Regel meist unabhängige Quoten verwendet hzw. kombinierte Quoten für zwpi Merkmale (vgl. Xoelle-Xeumann un d Pctersen 19913,257). ~[it
der Quot enauswahl sind otno Rpilw
\' 011
;\'acht pi!elL verbunden:
• Dip Vertr-ileng der Quorierungsmerkmale in der G rundgesa mt heit muss bekannt sein. Dies ist nur fiir wenige Mer kmals au-prägun gen
rler Fall, • Die QuotiPnlllgsll wfklllall' müssen für (11'11 luterviewer leicht erfassbar sein, wip etwa da s Ges chlecht. Schon da s Alter, dte Schich tzugehörigkcit oder die Schulbildung können nicht mehr per Augeuschcin fest ges tellt werden. • Ausfällc werden vordeckt. da der lntervlcwer bei ß efreguu gsverweigerungen einfach die nächsto Person mit den geforderten Mer km alen sucht. Eint' Sta tistik über Ausfa lle sowie di e Berech nung der ..... usschüpfllngsqu olP ist somit nich t miiglit'h , dil' da rans res ultie renden Fehle r bleiben unbekannt. Dip Argument at ion , QllolellallSwahlt>n st'it'll nicht schlt'chtef a ls Zufall sstichproben. weil dor t hohe Anteile von Ausfällen zu verzeichnen Sl'iE'U {vgl. Xoellc..Neunr ann un d Put ers en 199G, lG7f. ), ist deshalb nicht s tichhalt ig. Befragungsverweigerungen t ret en auch bei Quotenauswahlen auf, Sie werden nur nich t dokurnenr ier t . • Quoteusüehproben sind mögliehl'l'\I'pise .ropräsont a ttv im Hinblick auf die quotierten Merkmale. Ob d ie St ichpro be auch be i anderen Merkmalen ein verkk-im-rt rs Abbild der Crundgesamtbvit darstellt . ist nicht bekannt. np i Zufallsauswahlen sor gt der Zufallsprnzpss dafür , dass seltene Merkmale nur eine gl'f ing!' \rahrsdwinlichkeit haben in dip Suehprobo zu gelangen und häufi gp xl erk ruale eine hohe Wahrschotnlu-hkott. ß l'i Quotenauswahlen ist (Iil's. nicht der Fall. Es sind keine Auswahlwahrschcinlk'hkcttcu angehbar. Der Schluss auf d ie Crundge-auuheit ist st atistisch daher nicht begründbar .
Der Grund für den Einsatz VOll Quotenauswahlen be ste ht vor a llein darin , da ss d ieSI' kostE'llgiin sli gt'r als Zufallsauswahlen sind .
222
5 tid ,JIIV ocnzit "!l"!J
Aufgaben zu Auswahlverfahren l. Waru m IJI' niitigt man St ir"hprob" ll"! Schildern Sie deren \ 'or- und Xachteile im Yergh-ich zu Vollerhehungen. 2. Für den ALLß US 191J~ wurden zunächst 151 Gemolnden aus gewählt. Aus den Einwohnermeldoregist oru dieser C emoiudeu wurden die Adressen der zu lx-fragenden Personen per Zufalls aus wahl r-rnuttolt. \\'r k hl's Stichprnlu-nverfahren wurde augewand t'! 3. Sie möchten wissen , in welchem Umfang das .Sturh-Trcket' von den Malnzor Studierenden genu tzt wird. Das Student ense krer ar tat st ellt I1l1l P lI dazu r-ine List e mit den Namen der 28.73-1 Stu dierendon (\\"S 1993/1 IJtlü) zur Verf ügung. Ihre St ichprobe sollmlndostens I.UUU Stuellerende umfassen. \ \"as ist in diesem Fall die Grundgesamtheit. was d ie Auswahlgesamthcit" Cebcn Sie Beispiele für undcrcoverage und overroverage. Aus dieser Liste möchten Sie nun eine systPll1atisdll' Zufallsstirhpl'Obt' ziehen. \\"ir gehen Sie vor '! ~. \ \"or in besteht de r Unrerschied zwischen zufallsgestnur.rten und nicht zufallsgestouerr Pli A nswa hlvorfah H' II '!
10 Wahrscheinlichkeitsverteilungen 10.1 10.2 10.3 IUA
Helativc Ilii.u tigkd t ull.I WllhrSl,iteinlichkl'it Hiiuti gkciteu und Antcitc in Stiehproben Stirhprohcumittclwerte Der Zentrale G renzwer tsat z
223 22d 2:15 248
:'I lit Hilft' von Wah rscheinlichkeit svf'rteilun gf'1I lässt sich ang ehen, wir Stiehpmbenkenn werte vom wahr en \,"n t der G rulld gesamt llf'it ab weid u'n . Dtose Überlegungen sind not wendig. tun die Frage zu beantworten, wie auf Basis einer ein zigen Srich probe auf die Grundges amtheit geschlossen [Kapit el 11) und Hypothesen übe r die Oruudgesamt hei t getestet werden können (Kapitf'1 12). \r ie im Kapitel St ichpro bt' nzipll1111g angedeutet wurde , llIUSS rlas St ichprobendesign bei der Da tenan alyse berücksichtigt worden: Design-Gewicht e werden not wendig . wenn nicht jedes Element der G rundgosanuheu die gleiche Auswahlwahrscheinlichkeit ha tte - '1. B . bei disproport ional geschicbteteu Stichproben. Dei Schätzun g des Stichprobenfehlers II1 U S~ eine Syst ema tik der Auswahl, eine Schicht ung oder die .Klumpung' YOIl Fälle n b-rü-kstchngt werden (Kohle r 2006). Mit Stn tis tik-Programmen wie Stata ist dies einfach möglich. Ein e Einführung in dip Analys e systf'lllil t isdwf lind komplexer Zufall xsrichproben geben Sr-heatfor et al. (1996) (sie he a uch Le\'y und Lernes how 1991). Zur Vereinfachung wird in den folgenden Kapiteln von einfachen Zufallsstichproben a usgega ngen.
10.1 Relativ e Häufigkeit und Wahrscheinlichkeit In Kapitel 9.2 haben wir verschiedene Zufallsexperimente bctrachu-t : das Werfen eines W iirff,b und (las Ziehen ein facher Zufallsstichproben . Bei gleichwahrscheinlichen Ereignissen können wir die Wah rse!winli rhkl' it des Auft rete n» \'011 E rf'igni sSf'1l t lll'o ret iSf:h best immen, wie wir gf'Sf'hf' ll haben ( Luplllcc-Wahrschcililichkcit hzw. klilSsisdlf' \r ahrsdwinlidlkf'it). So lx-t rägt die \rah rsdH'illli<:hkl'i t , Ix-tm Würfeln nino G zu erz ielen , gt'lla u
1/"·
224
\{'ah "~{."" i" I i('hJ.-ci I~ VI:" ('i/ u"
.'f""
Wahrsehelulichlc-iten sind mit rela tiven Häufi gkelten eng verknüpft , was im B emo uül-T heorern a usged rück t wird . Das Bcrnoulli-T heon-m 1)('· sagt . dass die relative Häufigkeit eines Ereignisses bei un endlicher W iederholung des Znfa llse xperiment ps der \ Yah rschelnllr-h kpi t ent spricht . ~ la n kann davon a usgt'llf'll. dass anst elle einer .,1I 11f'lul1id l h äufigen- \ril'< I!>rho1ung a uch emo ,.';1'11f bäufige-' \r irdt'r holllng eine s Zufal lsvorgan gs genügt, also z. B. l üü-mal ode r 1.00U- mal. Das Bemoulli-Theorem ist eine Anweudung des Gesetz es grober Zahlen (vgl. Fah rnu-ir et al. 2UOi . 3 13 f.).
Dem Bernoulli-Theorem lipgt ein s ta tistisdl!'r hzw. frf'q lwnt istisd lt>r Wahrsdlf'intkhkf'its1H'griff zllgru lldt> (Gl t'id lllng 10.1). Beim t üe-maltgen Wprft'll emes W iirr!'1s sollte jl'dt> Augenzahl llugf'rah r Hi oder 1i ~ I a l auft ret en. de nn dip Wahrschf'inlir:hkf'it für jl'd p der 6 Zahlen bf'trägt I j G = O,I G lind 100 x O,l G = lU,G . Bei 1.000 \r iirfl'll sollten deutnach ea. !Gi Würfe aufeine Augenzahle nt fallen. Eine Vorausscr xung des ß eru oulllT heorems ist , d ass eine unendlich häufi ge W it'(ll'rholun g theoreuscb möglieh ist.
P(A ) = tim fPI. llällfigkpit (A )
"- X
(10.1)
Das Bornoullf- T heor em läss t sir-h an ha nd ein es Experime nts illus trteren. \r ir bezeichnen dieses Expenmcnt als Experiment I , d a wir Spä tl'f weite.... re Zufallsexper iment e durchfüh ren werden. Ein P rogra m m , das Zufallszählen erzeugt. ers et zt dabei den Wü rfel . Ein solcher .Z ufallsza hh-ugenerator' lässt sieh so kon st ruieren , dHSS er eine Iwlid)igl' Za hl innerhalb eines gp" gPbt>llf> ll Inte rvalls mit einer lx-stimmten \\'allnieht'inlirhkf>it prodnviert . \\'ir lassen uns eine de r Za hlen 1 bis Gerzeuge n. l\'olJl'j jf'd t' dleser Zahlen glt'i<:h wahrschein lich ist. Das entspricht dem \\"I'rfell mi t einem W iiffl'!. Alle Simulatiunen in diesem Bur-h wurden m it den P rogrammen GSTAT und GSTAT2 von Fl't'd ß iikt'r (19!.l:3, 1998) d ur chgeführt . In Tabelle 10.1 werden die Ergebnisse dieses Expe riment s I zusa mmengefasst. Tu Spa lte A sind die möglichen Ereignisse d{'s Zufallsexperiments lt'C1 j eli CÜICH lt'ürfcl,~ a ngl'gl'lwlI. die Augen-ahlen 1, 2, :3, .., 3, G. In der Spalte P(A ) finden sich dir- Wahrschctnltchkctton der EreignisSI'. DieSI' lassen s ich hier einfach durch Auszählen der günstigen im \ 'l'l"glekh zu allen Ereignissen bestiuuneu ( Laplace- IVahrsrheirllichkcil), Die \\'a hrschei nlichkcit ist also beka nn t. In den rosrlirhen Spa lte-n dor Tabelle sind
Rd ufitll! Häufiyk ti t uud
22J
WIlIl f'~dwinli"J. keif
die relativen Häufigkelten der einzelneu Augenzahlen a ngegeben. \\"t'Il11 der \r ürfel In-mal. 50-null, Iüü -malusw. bis I ,OOO.OOO-nw l gewor fen wurd e. ßf'i spids\\'f'isf' giht dif' Zah l 0.3000 in der Spalte ,10' di p relat ive Häufigkeit fiir die Augenza h l G a n. Dip G hat a lso einen A nt eil von 0.3 bzw. 30 % IlI'i den 10 Würfen. Die absolut en Hä ufi gkott en orbält man , wenn man d!e rela t iven Häufig kelt en mi t der jp\\"l'ili gell Zahl de r W iirft> multiplizlcrt . Dle G ist bei den 10 \\" ür fl'H a lso 3-ma l aufgetreten. W ip man sieht , entspnx-hen d ir relativen Häufigkelt en bei weni ger a ls WO W iirft'll nur sehr ungena u de n \\"a hrsdlt'ill liehkf'ilt 'lI P (A ). nähe rn si rh dit'sf'lI aber mit g riit-pr werde nder Zahl von \\"iirff'n inuner mehr a n. ß t>rf'it s Ilf'i 10.000 Wür fen stimmen die relativen Häufig kelt en mit 111'n \ \'ahrsdwi nlirhkpitt'1l bis a uf die zweite Na chko mmax telle iibcn-in. Tabelle 10. 1: wah rscheiulichkelt und rete t tve Hä ufigke it beim Wel"ft' l1 eiTlI' S \\"iir fl'\s AUl ahl der W tlrfo
A
P(A)
IU
I
0 . 16
U.20(1l)
2 3
U.16
11.2 000
O. IG
4
O. Ifi
5
tU 6
tl.2000 0.0000 (1.10(1l)
u
U.16
U.30UO
50 0. 14(1l) O.I6!lll 0 .22(1l1
Hll)
1.000
10.000
Itlll.OOO
(J.1800
0 .1780
0 .1674
0.1668
H, W66
O.I50U
0.1670
0. 1676
0.1651
0 . 1666 O.W6()
o.rsoo
0.1530
0.1 63 7
0.1673
0. 1800 O.HJlll)
O.WOO
0. 1680 0.1656
O.Wi2
0.1 300
0.15!.l0 O.15·1lJ
U.2UOU
U.1!.l00
U.18!JO
0 .167i
0.1683 U.!6[,2
1.00 U.tllll)
0 .16 69 0 .16 73 O.l ijijij
Der Zusammenha ng läs st sich a uch gra phisch veranschaulichen. Abbildun g lU.l ~ e i gt vier S äulendiagramme. Link s oben sind di e rela tiven HäuHg keit en der AUW'1I1ahll'n nach t O \\'ürff'1I dargestellt , rechts danebeu dle rela tiven Häutigkeit eu nach 100 würfen , li nks UIlIt'1I I]jE' relat iven HäuHgkeiten nach l. OO() \\'iirfpn und rechts unten d ip rela tive n H äuftgkeiten nach l. ooO.{)no Würfen. Dip \\'ahrsdll'inlkllkpi t P (A) ist gpst l"idlPlt r-ingezekh not . Da hier die rela t iven H änfigkei t eu die Höhe de r Säulen best immen und die Cmndftäche der Säulen ein e Einheit bn-it sind. ent sprechen die Fl ächeninhal te getra u der rela tiven Häufigkelt hzw. de r \\'a hrsd willlichh ,jt. In dl' r Sum nie ergf'lll'lI d ie Flächen 1, was der Su mmt' a lh-r rela t i\"E'U 11 ä ufigkE' i t eil ent spricht.
226
Il'a ll,.~d",j fllit hkd I~ oen t ilUflgen
Al.biklung 10.1: Simulat ion des Werfens ('iul:'s \Yiirfds 0.3 ~ 0.25 ~ 0.2 0.15 " 0.1 0 05
w
C
~
"=
C
0.3 ~ 0.25
"--
d"~w~·
~.. o~i~ 0.1
,
l.."LL"-'-LlLl2.1J
---,
,
~ ~ o.o~ ciL!.LW--""-l.±L.llUill
Au~c"""hl
'5
0.3 0.25 ~ 0.2 0,15
;g, "
~
0 .1
00 5
'f"""""'--------, IV
,
•
" lliJWJWJ--ill...lli..illJ
"
0.3 0.25 ~ 0.2 0.15 .. 0. 1
j. ~e
0.05
w 'f""="""'--- ---,
, ,
,
" lliJWJWJ--ill...lli..illJ
Au~""zahl
Gl'Strithl'ltt, Lilli" lI: 1'(..1 ) = I /li = lu1i
Im P rinzip ha ben wir mit diesem Expe r imen t I das Ziehen einer St ichprobe mit Zurücktegen simuliert . Die Stichprobcngröje variierte von lU über 30, 100, I. OOU, 10.000, lUO.OOO his ZIl I.OOO.Ü(JO. F ür j ed e Stichprobe habe ll wir die relativen Häufigkeiu-n - die Anteile - der Auspr ägun gen eines rliskret en Merkmals berechnet . Der .wahre" Anteil in der G rundgesamtheit (0, sprirh: t het a] entspricht der Wahrscheinlichkeit eines [rt'ignissf'S P( A). \ Yie wir gps,'lwll haben. konve rgiert die rela tive Häuftgknlt einer Merkmalsausprägung in ein er Stich probe mi t wachsendem Stichprobenunifang gegen den Anteil der Grundgesamt heit. Allerdings kann man die Vergröjeruug der Stichprobe nicht wie die Anzahl de r \Yiirft' beim \\' ürfe)- Expt' rinwnt unendlich oft au-dehnen. denn irgendwann s timmt d if' Gröf,;> der Stkh prnbf' mit der der Grun dgesa mthei t ÜIll'l"f'i n. Diese \ erlet zung rler \ 'ora USSf't mug rles n e Tl101IIli - Theorems - eine unendliche \\' iedprholllng des Zufallsexp-nments eutspneht einer Vcr grö terung der St ichp robe ins Unendliche - ist aber nur dann relevant. wenn dto Grundgesamthei t nicht besonders groll, ist oder um gekehrt die zu ziehende Stich probt, sehr groh ist. "'t'llIl die Crundgesatut heit die St ichpro1)(' Ulll den Faktor 100 Übersteigt , falIt d ie \ 'erlet zuug di escr \ 'or ausset zung schon nicht mehr ins Gewicht.
Rdat it'~
227
If ijufigkeit u"d Wahrn 'hcil<1id,keit
Wt'il d ie relativen Häuftg keit en sieh den Wahrscboinllchkeiren nähern. a ber nicht ident isch sind . wäre t' S wünschenswert zu wissen. wie die relativen Häufigl e-iten WlII de n Wahrscheinlichkeireu a bweichen. Dazu füh ren wir ein neues Experlnu-nt durch. \\"ir vereiufaehen Exp e ri ment II im \ 't' rg lt'ith zu Expe r i men t I dadurch. (lass nur dle rela tive Hä u figkei t dt's Anft retens einer einzigen Augen zahl. nämlich der G. noriert wird . Dip Wa hrschotnltehkott dafür lu,tr ä gt P(A ) = 1/ 6 = 0.16. Dt« Grgt'llwah rsehpinlichkeit P (rI ) - also die Wa hrsd lt'inlichkt'it kei ne G ZIl werfen - entspricht
I' (A ) ~ 1 - I' (A ) ~ 1 - 0.16 ~ 0.8'1. Ein Zufallsexperiment !l.' i rlem nur zwei Ansgän gf' [Ereignis uml Gegenercignis] möglich s ind, wird a ls ß ef71 oulli -Rxpef'i m en t bezeirhuet . Eint'
Reihe nacheinander durchgeführter Bemoullt-Expenmente [z. n. mehrma-
liges Würfpln) nenn t ma n Bomoulli- Ket te. Experi ment 11 lH's tt'h t darin , def! lVü,j el lUO-mll[ zu wefjef! und die /l äufigkeit de s A ujtrctens der 6 [estzuheltcn. Dieser Versuch wird zehn Xlal wiederholt. Die Wa hrsd winlichke it für da s Au ftreten der Zah l G ist I' (A ) = O,l u. T heoretisch müsste die G nach IUUWürfen ra. W oder 17-mal fallen . WIl S ei nem prozentualen .-\1IIt'i1 VOll 16,6% t'llt sprir:ht.
In Tabolle 10.2 s ind die A nteile dor Augenzahl 6 bei 100 Würfpil für die zehn Versuche notiert . \"i e ma n sieht, liegt der heobavhtt-te \".' rt
IIIlf
7. Versuch in der ?\älw des theoretisch erwart..te n \"erte, von 1G.6 'X , Tubelle 10.2: Anrr-ilswertc der Zahl Versuch Xr. A nteil in %
{j
im
bei JOO Würfon 10 18
Alle anderen wert e weichen meh r oder weniger vom erwa rt eten \ " ('rt ab. \"as können wir daraus folgern" \"ir wissen a ufgrund des BemoulliT heo rems. (lass bei einer sehr gro M' ll Zah l von \ \"iirft'lI (7, B. eure \. UOO.OUU-Ill<-ll) dip relative lI ä lltigkt'it der Wahrscheinlichkei t nahezu entspricht. \\'iirff'ln wir nicht so häufi g, da nn welchen die rela tiven Häufigkeit(,11 stärker von der Wahrsehoinlicbkeit a b. Dip Lös ung d t'l; P roblems lwsteht darin , dass Sti chprolx-nk cnn werte nich t .Jrgendwie-' vom erwarteten \ " nt abweichen. Die Abweichung kann durch Wa hrschotnlichkci tsveru-ilun gen angegeben werden.
228
10.2 Häufigkeiten und Anteile
Il'all,.~d",j fllit hkd I~ oen t ilUflgen
In
Stichprob en
10.2.1 Binomialverteilung Be t racht r-n wir zu nikhst eine Il äufig keitxa uszählung des Expe r i me nt s 11 , wir den Versuch nicht I ü-mal. sondern 1.0()()-mal durchführen. \r ir notieren wieder die Häufig keit, m it ,11'1' bei jeweils 100 \riirf"11 die Zahl Ü fällt. Dies en ts pricht dem Ziehen von 1.000 Stichproben des Umfa ngs u = 100 mit Znriiddl'W'Il. T heoretisch kann rlie G Iwi jedem dleser 1,000 Versuchsdurchführungen zwisr-hen 0 und t un-mal fallen. \\'('1111
\\'je wir Tabelle 10,3 ent nehmen können. komnu-n jedoch nur lx-stimmte Häufigkelt en vor , und manche \rerh' kommen we-entfich öfter \'01' als andere. So kann man der vierten Zeile der Tabelle entnehmen, (lass in 18 von den insgesam t 1.000 Ollr ehführungen ( =1, 8% der Ex periment e] die Zah l ü bei 100 Würfen gcnau ü-mal Hel. die s entspricht einem Anteil de r Zah l G von 9 %. ~ Iall sieht . ,lass Anteile . die relativ weit vom erwarteten \rert ( W.G % = 0.1 6·100) entfernt sind. nu r selten oder nie vorkommen . währoud Häufigkeit en lind Anteilswerte in der :'\älw des erwarteten \re rlt's liegen, sehr häutig a uft reten. Am häufigst en. nämlich in lOG der l. OüO VorsuehsdurchFüh rungen (IO.G'lt), fiel d ie Augenzahl ü bel 100 Würfen 17-mal. d. h. bei l, l!c der 100 \\'[irft'. \Yie manau der kUlllu!iprteu lläufi gkt'itsH'rtp ilun g in der let zten Spalte vnn Tabelle 10.3 a bles en kann . liegen 5 1 IX der Ant eils\\"1'1'1" unterhalb \ '011 17 % UIHll'ntspu'dlf'11l1 --l9 % der ,-\lll" ils\\"t' rt e mn' r diesem \Yert. Durch ein lIi stog ra llllll kann man die \ ·.' rteilling gra phisch veranschaullchen (Abbild ung 10.2 auf Seit e 230).
Die Wahrscheinlichkeitsverteilung der Zufallsvariablen .Häufigkeit bzw. Anteil der G bei I üö-muligem würfeln': ist die B inomial verteiluug . Die \rllhn;r!lt'inlichkeitsn'r tPillln g ist in Abbildung 10.'2 als gest richelte Linie eingezeichnet . Die Gleichung lautet :
fiir
r = 0.1. 2. . . . . n, (10.2 )
Die linke Sei te dieser Gleichun g ist die ß t'zl'id lllUUg für " im' Binomi-
alverteilung. Da "'~ e int' Wahrsrheintichkeitsfuuktion ist, wirrl der Ausdruc k fR (x l/;O ) als ,:-,r a hrsd lt'inliehk" it für J' unter 1\. '1' ß f'dingullg, dass
22'J
Hij"jigb'itUI "li d Alltrilr ill S tid lprobm
T.IM·II.. 10.3: Ant"; l"""f'rtr e!t'r Zahl 6 bei 100 W ürfl'll lind W i...lf'rhul ungl'll lIa ufi,;b- il Anl.i 1 al-du t in %
,"
'"
.% ,% 10% 11 % 12 % 13 % ,, % ,, % .. % 1, %
,, "" 2
.... 33
sr 72
90
,, ~
,, % ..%
99
211 '.lL
72
21%
22% 2J '.lL
"" 25% 26 % 27% 29 %
0..
0.. 0 .1 I.'
2..
3.3 6.,
,
10
ze
.. 52
.5
.,.,. 1.0 2-" '
~.5
;2
I"
15.2
2"1-1
9.....
3!2
71.-1 32.2
' .0
.ua
• .>
SIO
10.6
s.s
""5 .,... ". u1.'1.' 12 ", 0.'1.2
, .-I
" .5
1 1
kum. Häufigb i t in CX 0.. 0.> 8
....... 1
0.1
0,1
'" ns ". "I
... 906
9-1.
..1.2 51.0 61.6 , 1.5 , 1>.9 li6. I 90.6 9-1.9
96.'
9~2
9~.2
91J.. 91JI:l 9!l'J
99.' 99.t' 99.H
'000
100.0
1.000
Il'a ll,.~d",j fllit hkd I~ oen t ilUflgen
2:JU
Abbildung 10,2: Anteilswerte der Zahl 6 IlI'i 100 würfen und 1.00U \ Yiedr-rholu ngen
" .------------------,
"ro
,a
, a
,t
J~ , ,
z
.r · l> 7 R
'"'I rL ..
91011 1~1)14151l>17IRI9~~I22n~425~l>~7~829;o
n lind () zut rifft" gt'II'SI.'11. n Ist d ie Zahl 111'1' Wiederholu ngen des Ik-ruoulhExperimentes (hier: 100 W ürfe), 0 (t heta) = P (A ) ist die Wa hrschei nlichkeit dos int eressierenden Ereignisses (hie r: 1/6 für das ..... uftret en der G), n lind () s ind d ie Pa ramet er de r Biuomialverteilung. J: gibt d ie Hä ufigkeit HII , mit der d HS interes sierende Ereign is eintritt . Die G lt'idlll ng kann leicht hergeleitet werden. Da zu Fragen wir, wir- wahrsehr-inlieh es ist , dass die Zahl 6 bei lOU W ürft' n 20-mal a uftritt. A kennzeichnet das interessierende Ere ignis - das .....uftrcrcn einer 6, A das G('.. gencrcignis - das Auftreten ein er anderen Za hl. \ri r betrachten zunjichst
eine konk rete Sti chprobe
~) . A , ; . " il) . s-mal
(1l -z}-mal
Dip ersten J: Elemente der Srichprobe s ind das interessierende Ereignis. die letzten {n - x) Elemente da s Gegt' rIl' rl' ignis. Beispielsweise könnte in den 20 erst...n \rürf...n ...ine 6 aufr reren . in 11t'1I letzten 80 Würfen eine endere Zah l.
Hiiufi9ktil ~ u
uu d
A IlI ~ilc
231
jn Slid'l!lvbClI
Die einzelnen W ürfp sind voneinander un a bhä ngig. D ie wa hrsdn-i nllchkeit dieser Reihenfolge lässt sich daher durch Multiplikation der Wahrschelullr-hkeiten ermit teln. mit 11"r dif' eillzf'hll't1 Ereignisse auftreten (vgl. Gleichung 9.4. S. 20'}).
L,3 ....mal
,(I - 0 ) . .. . . (1 - 0 ). ~ 0' . ( l - 0)'" - <'
(lO..1)
..
rfl - zrllla l
So ist die Wa hrsd lt'inlil'hkr it in den ers ten 20 Wiirf(']] eine G lind in den letz ten 80 \\"[irfen eine a ndere Augenzahl zu erzk-len: 0.16:10 · (1 0,1 6)100- 20. Dip Reihenfolge, in der di e Za hl G au ftr itt , spielt keine Rollo für die Berechnung der Wahrschcinllcbkeit . \ \"('1I1l wir danach fra gen . mi t welcher Wahrschetnliehkeit wir lx-i 100 \\"iirf('11 ZU-mal die Zahl G eraieh-n . dann mi\SSf'1I wir alle Stichprobon (Reihf'llfolgt' n) lwrütkskht igl'll. in denen dif' Zahl G ZU- lIlal auft ritt . So kan n die Zahl G z. B. hei den ers ten 10 W ürft'n lind be i den lotzteu 10 \\"iirfen a uft ret en . Insgesa mt gibt t ~ C) ~ I ögl kh kt'i t t' n . .1' au s 71 Elementen a uszuwä hle n (vgl. S. 20G). In ( ~ ) Stichproben tri tt die Zahl G daher 20mal auf. .lede dieser Stichproben hat dir Rt'I1 tis if'fll ngs wa hrsd lt'inlichkei t 0.1 620 . ( I _ 0,1 6)100- 20. Die Wa hl"Sc!Jr in!ichkpit . dass die Za hl G lH'i 100 Würfen 20- IllHI a uftrit t. ist daher:
f B{20!IOO: O,IG) =
C ZOUO) . O.1Gw . (i - O.1G)IOO - W lOO!
ZO! . (100 =
ZO)! ' 2.7a5 . 10-
110.
, -l,fi2!J· 10-
7
;),a5fl.s:tl 70. 1O:~S . lO2O · l.2GG . lO- 22
= O,Oß79 . Aus Tabolle 10.:3 auf Seite Z29 und Abbildung 10.2 geh t hervor, da ss ta tsädd idl in 7.2 'X de r 1.000 Experime nt e zu-mal di,> G gf'\\'orft'1J wur de. Dieser \\"f'rt wflrde sich mi t zunehmender Za hl von Ex periment en immer
2:.12
meh r dem theore tisch ZII erwartenden \r"rl von 6.79 % annähern . Dir "1"war te ten Anteilswerte der Zahl G bei 100 würfen sind in Abbildung ]0,1 mi t einer gest nchelu-n Linie l'inw' zpif:hllPt , Was bedeutet da s für deu Schluss von einer St k hprolw a uf d ip G rnndgesa mt heit" Häufigkelt en lind Anteile wotchon in etafachen Zufallsstiehprohell vom Pa rameter der Grundgesamtheit a b . Sie t un d ies j edoch nicht belieblg sondern in Form einer Binomialwrteilung. Grobf' Abwoichungen sind sehr unwahrscheinlich. kleine Abweichu ngen wahrscheinlicher. \ \'eil wir die Wall rsdH'inlit:hkpit s \"l'rtl'i ltllJg I\I' r Zurallsvariablen X 1Il111 P - Il ä nfigkl'it(>11 und Anteile in eiufacln-n Zllfallss tit:hprohpn mit Zurücklegen - kennen. kÖIIlH' n wir d te Ab weichungen der St ich pro benkenn wert e vom Parameter der G rundg esanu hoit berechnen. Erwartun gswert und Vari anz
Auch \ \'a hrsd win!ichkeit sn ' rh 'illillgf'n lass en s ieh d urch ~ la bza h l f'lI ln-.. SI:hrl'ih plJ. In Kapitel f haben wir das arith nwt isd H' ~li ttpJ und die Varianz zur ßf'sf"hl'{'i blln g eine r empirisrhen Verteilung a ngpgt' lw ll. Aualo g daz u bezeichnen der E rwartungswe r t und die Varia nz ein er Zuralts vartablcn rlie zentrete Lage und d!e Streuung einer Wahrscheinlichkeit sverteil ung. Erwartungswen und Varianz der Wahrschetnüchkett sver teilung der Ilfiufiykcit e1! können einfach du rch folgt,tu!e Formeln ermittelt werden:
I'; (X ) = 11, 0
und
V(lr ( X ) = 11 ·0 · (1 - 0).
(10.4)
(IU,5)
Der S ta nda rd fehler gibt die St an d ardabweich ung der \\'ahrsd l('inl it:hkpitsvr-rteilung a n lind berochnot sieh a ls I Var (X ). In II IlSl'H'1ll Beispiel resultiert nach Gleichung 10.4
E (X ) =
11 •
0
= IOO·O .I G = 16.6
Hiiufi9ktil ~ u
uu d
A IlI ~ilc
jn Slid'l!lvbClI
233
und nach Gleichung 10.;-)
Va r(X ) = /1 · 0(1 - 0) =
100·0.16 ·0.8:)
= la.s .
Wi f erwarten also bei eiur-m Exper iment . das s "011 100 \Yiifft'IJ durchschnlttlk-h W.G-mal die G fällt DiE' Varianz di PSPS Wer tt's lH'i all en Ex perimcntcn beträ gt la.g. die Standardabweichung / 13.8 = a. 7. Wir haben die Hä ufigkciten des Auftrcteus eines bost tmtutcn E reign isses oben bereits in Anteile umgerechnet . Erwartungswe rt und Varianz de r Ver teilung der Zufallsvariableu P - Antrilswrrtr - ergeben sich nach
E(l' ) =
.!.n . E (.X) = 0 1
.
und
I' ar(p ) = 2" ' \ ar (X ) = n
0( 1 - 0) . n
(10.6)
(10.7)
Die S tanda rdabweichung der Anteilswerteverteilung Lorechnet s ieh au s de r Q uadra twurzel d er Varianz
a, ~ V~. ~
(10.8)
Die Sta ullanla!Jwridl1lng
\ '01 1 Zufallsvariablen. d it' zur Schätzung \ '(1) Parametern der Grundgesamtheu verwandt worden , nen nt ma ll St arldardfchier bz w. Standardschätzfehler. a p ist rlor Srandardfohler des Anrotlswortes. Stan d a rdfehler messen die G rübe des S tich probenfehlcrs. Der Sta ndardfehler d ps Anteils wird uurso kleiner, ie griib!'f der Srichprolx-numfang 1l ist , wie man 11 n For mel 10.8 sehen kann.
0(1 -0 ) gibt
llit'
Varlanv rles Anteils iu der Gruudgesatut beit an. wenndas
Interessierende Ereignis A mit tnnd da s GPgl'lwff'ig nis li mit 0 kodiert ist.
\{'ah "~{."" i" I i('hJ.-ci I~ VI:" ('i/ u"
234
.'f""
Die Var ianz des Ant eils in der Grundgesamtheit ist a m gröktcn, wenn 0 = 0. 5 ist. J (' weiter 0 \" 011 0,5 ent fernt ist. je kleiner die Var ianz des Ant eils in der Grundgesaruthoit . Der Standardfehler des Anteils in Stichpro bon steigt mit de r Varianz des Anteils in der G rtllldgl'sa mt ll.>it .
Im ß pispiel er hä lt ma n für Ant eils von
E(l' ) ~ = =
eine Va rian z
11
=
100 \rür f<> eine n E rwa rtungs wert
1\<'S
-'-qX)
"1
~
100. 16 ,6
0.16.
\"(JII
V ar(/' ) = 0(1 -0 ) 100 0.16(1 - 0.16) = 0.138 100 ~
lind einen St anda rdfehler
\'011
ap = ) 0. 138 = 0.37,
10.2.2 Hyp ergeo metri sch e Verteilun g \ r ürfl'lt man meh rmals hinterei nander. dan n ent spricht ,las ,11'1ll Ziehen einer S tichprobe mit Zurückleg en. Für Umfr agen zieht man Stu-hpruben ohn e Zurth-klegen . Die \ra hrsd winlichkl'its w rtt'ilnng für H äufig keit r-n und Anteile in einfachen Zufa llsstiehproh ' >ll uhue Zurücklegen ist die hypergeomemscho Verteilung. Dip Erwartungswerte sind hei der hyporgeomet rlsrhen Verteilung und der Bmomialvencilun g identisch. ßl'i de r Berochnung der Varianz wird allerdings noch mit dem Fakto r (N - ll )/ (N - 1) mult ipliziert . F ür llä ufigkeiten resultiert
Stidlp1V&t:/lmitldwtrte
V (jr{X ) = n . O· (1 - 0)
N - n N - 1
(10.9)
und für Anteile
V (jr{I' ) = O. ( I - O) Tl
N -n · N - I ·
( 1U.1O)
Für eine g.'gE'IU' IlP S tieh pr obengröke n nähe rt slr-h (N - Tl )/ (N - 1) mit
zunehmender Gröbt> der Grundgesamt heu X 111'1ll \ \"I'rt 1 a n. Ist der Quotien t aus de m Umfan g der Grundgesann heu und dem St ichp ro benumfang
gröbPI" a ls 20, N /n > 20, kann der Korrekturfa ktor (N - n )/ (N - 1) vernaehl ässigt werden. Dips ist in der P ra xis häufig der Fall .
10.3 Stichproben mittelwerte Unser n .'ispipl bezog sich bisher auf den Fall. dass wi r t's mit einer lUSkr eten Zufallsvariablen zu tun haben. Eine st etige Zufallsvariable wäre das Merkmal Alter in einfachen Zufallastichproben. Stetige :\lt'l" kma le ba1);'11 nicht abzählba r viele Ausprägungen. Da gegen wäl"(' das Mer kmal GI.... schlecht eine diskrete Zufallsvariable . da es nu r l}if' Aus prägungen ..Xlanu'' und .Fra u-' besltzt , Im Kapite1 IU.2.I haben wir ein Exper imen t (lUU-mal Wü rfeln ) mehrmals wiederholt. In der P raxis ent sp richt dies ([1'1lI Ziehen mehrerer St ichpro bell der Stiehprolwngriibe 100. ß r'i jed em Expermn-nt haben wir festgehal ten. wie oft dip G gf'filllf'n ist, was de r Fe-rstellnn g der Häufigkeit - lind darans abg eleitet - des Anteilswertes in einer Stichprobe entsp rlr-ht. Wir führe n nu n ein neues Experlruent durch. Exper i ment 111 lwst f'ht darin , a us der Alt ers vert eilung der bun desdeutschen Bovölker nng im J ah r 197,1 r-infar-he Zufallss uchprobe n (ohne Zurücklegen] mit jP\\"pi ls 1.000 Be.. fragt en Zll ziehen. Insgesamt ziehe n wir 1.000 verschiedeue St ichp roben. Für jede Srichprolx- lx-rechnen wir den Altersdurchschnitt .1'. Dip St ichprolx-nxichung simulieren wir m it dem P rogram m ALTM IHI aus GSTAT (vgl . n iikn 1993). GSTAT ent hält rlie Alt ers verteilung 11,'1' hUtlllesdplltsdll'1l nl"\'iilkl'fllllg im Jahr 197,1. Der Altersdu rchschnit t in de r hundesdeutschen
236
Il'a ll,.~d",j fllit hkd I~ oen t ilUflgen
Bevölke rung lag 1974 bei 11 = ;17.27 Jahre, d ie Varianz betrug (12 = 50,1. 45, 11 (spr ich : mii) und (12 [spr ich: sigmu-Quadra t] kennzeichnen den Mittelwert un d die Varianz de r Grundgt'Sa llltlu'it. IIiilltigkpitsausziihlullgl'lI s tf'tigpr Variablen werden dargest ellt. indemman dir- Merk malsansprägungen in Intervalle zusammenfasst und die Häufigkeit der werte in diese n Intervallen berichtet. Die Vert eilun g der :\1tt'I'Sdurchschnitte wird in Inter valle der Breite 0,1 eingeteilt. Jedes Int erva ll ha t eine 1II1lt'n' un d oben ' Grenze, r, n. reic ht das erste Interval l von 34,75 bis :34,85 Jahre. Statt de r Intervallgrenzen kan n als I\ at pgorip auch einfach die lntorvatlmtne an gegel.on \\'I'[(Il']1, wie das in de r folgenden Ta belle 10.4 zu sehen ist. Das ers te Int erval l hat z. B. die :\littl' :3·1.8 Ja hre. In dieSI' S Inter vall fällt der Mittelwert einer etnetgen Sti chprobe, was bei 1,000 Stichproben zur relaüvcu Hä ub gkou 0,001 füh rt (bz w. zur prozentualen H äufig keit 0,1 '!c). Xlan sieht. dass manche Altersdurchschnitte deu tlich häufi ger ermit telt werden ab andere. Besomh-rs hiilliig treten Stichproben auf deren :\1tersdurchsclmitt i nah am \\,prt de r Grundgesamtheu JI liegt , GriihPre Abweichungen vom Pa ramete r rlcr Grundgesamthei t sltul also auc h hier, wie schon in Tubelle 10.3 au f Seilt, LW , selten , da gegen sind klein ere Ab.. weichungeu häufiger . In Abbildung 10.3 ist d ie Verteilung der Altersdurchschnit te in den 1.000 Such proben als Histogramm dargest ellt . Die ges trichel te Linie in Abbildung W.:3 ist die W ahrsche lrrllch ke it sfunk tio n d er N ormalv er tellu n g . \ \-ie man sieht, ist di e Verteilung der Altersdurchschnit te in de n 1,000 St ichproben (Ilistflgram lll) annä hern d normalverteil t (gesl rlchelt e
Linie] . \renn wir viele Stirbproben ein es hinreirhcnd groken Um fangs 11 ziehen. dann verteilen sieh die arithmetischen :\litt d dieser Stichprobenwene normal. In der Praxis ist die Ziehu ng vieler Srirhp robon nicht notwendig, Xlit dem Zentralen Grrllzwerlsatz läss t sieh theo reti sch begrün den , Ilass die Zufallsvariable 5,: - Mittelwerte in Stichproben - normalverteilt ist. Und zwar unab hängi g von der Verteilung des :\!erkmaJs in der G rundgesamtheit . \ \'ir werden auf die Verteilun g \ '0 11 Srirhprobenmittelwerten und den Zentralen G renzwertsatz zurück kom men . Zunächst aber zur Xormalverteilung.
237
St;e'/'pfVbc"",itldw«rtc
Tabelle 10.4: Altcrsdurchschnitte bei 1.UOO Stichproben der G rü~e l. UOO H äufig keit
lute rvalhnitte
absolut
:\\.1_ :1,0.1 :1". :1
I I I I
:\" .7
3 7
m.n
:1"1. !'i
:I',.!J
m.u
:\li. 1 :lli.2 :\li.:l :Il>.-! :11•.:, :11•.1. :lli.7 :W.1l :ll' .!J
:17.11 :17. 1 :17.2 :17.:1 :17.-1 :11.'; :I7.l' :17.7 :17.1' :17.!J :1x.11 :11'.1 :11'.2
as.s
:1...,4 :11'.!j :IK(' :11'.7 :Ix,!< :IK!J
:m.1I :1!1.1 :1!1. 2 :1!1.:l
9
13 13 16 20 23
10 35
11 52 52
in
"
•
kum. Häufi gkeit absolut lu
uto
I
(J.I 0
O. ](J
2 3
11.20 IUO H.-IO lI.70 I AO 2.:1O :l.liO J .!JO li.;'O
urn
0 .10 0.:10 O.7U O.!H) 1.:10 1.:10
36 19
U~)
65
I
7
"
23
2.IH) 2.:10 -I.IH )
85 108 118
:I.:~)
183
U O ',.20 " .20
227 2 79 331
.rua
!'i. :~ )
!O.IlU H,!'iO
1....:10 22 .70 27 .!JO aa.t 0
·IO.:lIl HIO
72
7.:'W
38
:1.1l0
Hl
60
1 ' .I ~ )
s.io ',.20 ". 70 J .!JO
;:'01 552
m ]()
51
60'
l iO.-1O I>li. 1O r U H)
52 57
19 10
JJ~)
15
J .:~ )
30
:I.lK) :\.t,0 ;\.1 0 :l.IK)
3,') 31 20 16
10 22
10 8 9
G 2
2 I 3
U~)
l.IH) 2.20 I.IK)
o.so
O.!JO (U~)
0.20 0.20 0.10 O.:lO
661 7 10 750 795 825
8GO
891 911 927 937 9!j9 909 9 77
986 992 99 1 996 997 1000
ns.ao
;:,.(K)
i H.:,O
1'2.:,0 1'l1i.lH) 1'l!1.1O !JI. IO !J2.7n !1:l.70 !1f,.!JO !Il'.!JO !17.70 !JIt.l'() !I!I.20 !m.-IO !I!I.('O !J!I.70 IIK).IJ()
2:.18
Il'ahrschc;,, /i cH~ ils t'~rteilu"!I~ "
A l,l,ild u llg 10..3: Alrcrsdurchschnlr te Iw i 1.000 Sr ichpmlx-u der 1.000
GrÜ~l '
.,-- - - - - - - - - - - - ------,
, ,
.,
.. .!
1;
<
~
a
. .An 35
3S.5
36
.•6 .5
37
.18S
39
.w 5
SI.ehp."!>"",,,;,,,,,.. .....
10.3.1 Normalverteilung u nd Standardnormalverteilun g D ip S (JnJ 1111vr-rt t'i Iuug I r iigt a ud I d il' S utuc '11 "G a 11 f;' SI·IU' Sonna [\., 'rt , 'i luug- nileh lhrom ".\li t lll'g r iilJ(lpr'· Carl Frlod r k-h Gauf; - 0111'1' •.Glockenkurve- w" g PII ih res d lilraktl 'rist isdll' ll, anelne G lo l"kt' erinne-r nden Ver laufs. DieSO nllal\"\'rt l'i l u ll~ is t lu-deut xam 1. als Vortoilung empirischer .\ h 'l" kllla ll', 2. al s Verte-ilung vou K euuwert cu in S t ichprobr-n uud .3. als Approxiumtion nudr-rr-r tln-ororisr-lu-r \ ·{'r tl 'i l u l l ~l'n .
n..i
dor Kiiqw rgrö f;" [Abbilduug G.I , S . 129 ) oder d "11 Mat hematik kenntnisscn (A h h ild llllg 8.2 , S . 178) handelt , ' S sieh lIähl' l"II llgswt'iSl' III1l normal\"l 'r tt' i1tt' .\ k r k llla lt' . Emphi-a-lu- .\ It' rk llla l" sind in der- Ht'gl'[ jedoc-h nicht norurulvortoilt , Die Bedeutung der Xorumlvortoilnng in dor Stat ist ik rosultiort vor ulh-m a us den l u-leh-n lt' tZt g t' lIlHlHtl 'JI P uukn-n. Si" g ih t dirVr-rteiluug vou Stichprol x-nmit tclwr-rfr-n a n . wir- wir im l{'lztt'1l AIl>.dlllitt ,e,t'sd ll'll haben. A uscrdr-m könuon vioh- Verteilungr-u durch die xcnnulverteiluug a ngl'uiilll'rt werden. Unt er ln-st imnm-n Voraussot zuugeu ge-ht IlI'ispi ('lsWl'isl ' dip Biuomialvcrtc-ilun g iu I'illl' Xor rnalvorte-ilun g über, wir-
2:J!l
Stidlp1V&t:/lm itldwt rt e
wir a m E nd e des Ka pitels sehen worden {vgl. die Übersicht bei Bleymüllr-r et al. :WO-l, Kapitel ll ). Dip Normalvert eilungsfunktion für ein pmpirisrhf'S Merk mal in rk-r SI ichprobe lautet:
1 - e-'', '..... - ',' . f", (x lx;s a) = - s · ,j2ii
(JU. ll)
Ih re beiden Pa ra nwterz - das ist das a rit h metische Mittel de r Verteilung :,;2 - da s ist (lip Varianz de r Verteilung - hestimmen dabel die Lage u nd Breite der Kurve. Um eine Normalverteilung zu cha ra kter isieren. rek-ht die' A llgalw des Mittelwer tes und der Varianz daher a us. Ans die>.. sem Grunde werden Normalverteilungen meistens mit N (.rls2 ) hezeirhnet. Boxleh r sich die Xormalvertetlung an f ein Mer km a l de r G rundgesa mt he it . d a n n werden die g riechischen Bezeich n ung en für d as a r it hmetische Mit tol und die Vertanz - 11 U Jl(1 a 2 - verwendet: N (l tla 2 ) .
- und
Die Funktton gibt di p \\'ahrs(:lwin lkhkl'itsdichtl' a n. Zur Verdentlirhung sind in Abbildung 10.'1 auf der näch sten Seite mehrere Ncrmalvertetlungm mit verschiedenen Paramet er n .r und s 2 dargestellt . :\lal1 kann er kennen . d a ss die Ver teilung mit grü N' r werdender Varianz .~2 breiter un d hpi kle iner \w'nll'lull'r Va ria nz S2 scluualer wird. \\'ird df' r Mlt relwert i' g riibpl", so vorschiebt sich d ie Verteilung a u f d er r- ..... chse nach
recht s. wtrd der Mit t elwert
j'
kleiner, so verschiebe s ie sieh nach lin ks .
D ie Xormalverteilung ha t mehrere Eigenscha ften . d ie m an sich bei d er Anwe ndung in EI('r l n fer enz st a tist ik zunutze machen kann:
• Sie ist s vmm et risch lind r ing ipfl ig , wobei ihr Ma ximum bei .r liegt. Arithmorlsches ~ li tt l'L Modalwert un d Media n sind au s diesem Gru nd Ident isch. • S ie nähert sie h usvmpt o tisch d er r-Achsc, d . h. d e m ' \""[ 1 null. wen n I gegen + <JO oder - 00 strebt. Sie wird jedoch nie g leich 111111 (a uch wenn es in de r ..... bbildung so a ussehen soll te ). • Ihre Wendepu nkte • die steilst en St ellen - liegen bei x - 8 u nd x + s. • Da die Verteiluug s vuuue trisch ist, lwfilUh'll sich 30 % de r Fläd H' link s W JIl
i'
und 30 ljt recht s von
j- .
24U
\{'ah "~{."" i"I i('hJ.-ci I~ VI:" ('il u"
.'f""
Abbildung 10.4: Xcrmal verteiluugcu mit vorschiedcucn Pa ranu-tern l" lind :,'1
ca
7 e;
"' ""cs "'0..1 oz
"' ".s
,
,
Die Fläche unterhalb der Xonnalvcrteilu ng gibt 1111. wie viele x- werte sich in einem bestimmten Ben-ich der Verteilung befinden. Zwischen X l = - = und I2 = -l- cc befinden sich l1]]P .r- \\'erte . also IOU% , di e da zugehörige Fliid lt, beträgt demnach 1. W ir können beliebige F lächen un te r der Xormalverteilring bes timmen. Am einfachsten g('};(:hieht dles. indem wir 11llS ([l 'r Staudanluormal vert t'i lnng bedIonen. Die Standa rd normalverteilung ist ein e Xormalverteilun g, de ren ~ li ttI'1 1I"t'rt nullund den-n Varianz eins ist. Gleich un g lU.ll vcreiufarh t sich zur D ic ht efu nktion d er Sta n d a r dnor m a lvert e ilun g:
(10.12)
Die \\"('rt t' der Staurlardnormalvertellung werden als z- w er te IH>zpirh-
net , da man die \\'('rtr j eder bellebigen Normalverteilung mit tels einer zTra n sformatio n in eine Sr a ndardnormalveneilung überführen kann. Das Besondere der Stand a rdn ormalverteilung besteht darin . dass die Worto der
St;('/'pfVbc"", itl dw«rt c
241
Vert eilungsfunktlon in vielen Statistikbiichom in tabellierter For m vorliegou {vgl. Anhang A. S. 308 ). Dlo \ 'ertcilungsfun kIlon F\" (e) dor S tandardnonnalvcrteilung gibt die 'Yispil'ls\\"pisc' gpht aus der c-T ahelle im Anha ng A hervor, Ila;;s links VOIll z-Wn t 0 dip Fläche U,G hvw, GO % liegt . Da es sich 11m ei ne Will Mi ttelwert osYlllnlf'trisch.>Verteilung handel t, ist die Flächp, die s k h lin ks vom Wf'rt o hefindet ge na uso g rob wie d ip Fläche rechts vom Wprt ll. Links vom zwert + 2 ,G befinden sieh 99,38 % der Fläche. lin ks vom z~Wer t - 0 .!J5 sind p;; 17.11CX . ' Yt'nn man wissen möchte. welcher Fl ächeuan rctl sich rechts vom a-Wert befin det , kann ma n sich die Ta tsache zunutze machen. d as.<; sich \l nter der gesa tut en Verteil ung d ie Fläche I hzw. lUO% bef ndet. " '{, l lll li nks von einem a- Wer t {lie Fl äche 1> ist, dann lwfirlllt't s ich rechts vo m selbon Wn t dte Fläche 1 -'1>. Rechts vo m z-" 'prt + 1,.19 liegt a lso die Fläche I - 0.93 19 = O.OG~I , d. h. G.8 1 Yr. der Cesamtfiiiche. G anz ähnlich läs.'i t sieh auch verfahren. wenn ma ll wixseu mörhte, wie grtl~ die Flüche inn erhalb bestimmter GI't;nze71 bzw. innerhalb eines l ntc ru allcs ist. Da d ie Tala-lle immer die F läche a usweist . d ie l inks von einem zWert lieg t. muss man, um ein Intervall zwischen zwei ,,'eft e ll W erhalten. von der Fl äche, die li nks vom g rös crcn a- Wor t (Z2) liegt, die Fläche, die links vorn kleineren e-wert (Zl) liegt, subtrahieren: q' (ll z) = 't> ,~ - 't>w Zwischen - 1.03 und + 2 befinden steh a lso < I'zo - '1" 1 = 0.977 2 - 0 . 1515 = 0.8257 = 82,5 7 % der Fläche.
Dip F täehenbero-hnnn g ist in de n Abblldnngen 10.5 a ) bis 10.5 d) vtsualisiert. Abbildung 10.5 a ) zeigt dl.. Fl äeho links vom z-, y.. rt -1 2.5, Abbildun g 10.5 h ) links von - O,!J5. Ab bildung 10.5 c] zeigt d le Fläche rechts von + 1,.49 11 nd Abbildun g 10.5 d ) schlicklieh die Fläche zwisch en de n a-wert on - 1.0:3 1l1l{1 + 2 ,
242
\{'ah "~{."" i" I i('hJ.-ci I~ VI:" ('i/ u"
.'f""
Abbildung 1O.;j; Flächen unt er der Standardnormalverteilung • , -2.5
'
E 099J~
b , - "()95
, - 0 1711
Für die Intervalle 1lI1\ den Xliuelwert ( - U ). (- 2:2) und (-3:3) laSsl'1l sieh folgende Flächen fcsthalten: 1. Zwischen - L und + 1 liegen ü8.2i % der Fläche hzw. der a-Wer te. 2. Zwischen - 2 und + 2 liegl'll 9,j ,4;j 'X der Fläche hzw. der a-Wer te. 3 . Zwischen - 3 und + 3 1if'gl'll 99.i3 1i(, der Flik lw hzw. der Z· \ rl 'rt l' .
Da jed e No rmalverteilung du rch ein e a-Tr a nsfor m a t ton in eine Stall' da rdno rmalvcru-ilung überfü hrt werden kan n. können wir auch für jede 11I'lit'hi gf' Xormalveru.ilung m it Hilfe e!t'l' a-Tahelle Fl äe-heuantelle lJt'st illlmen. wenn wir zuvor (11'n ent sprechenden x· " ·(' r t z-t ra ns fornuert haben. Eln \rr r( einer 1Jf'l ir big(' n Verteilung wird a- t ran sformiert (u nd da mit standardisiert}. indem von diesem \ \"I'rl 111'11 ~ l it t t'l \n'rt der \ 'ert oilung s ubtra hier t II lId d as Ergebnis durch die Stand ar dabweichung dividiert wird " .f i - i Zi = - - - ·
,
(10. 1.1)
\ \"('lIn jeder \\"t' ft einer beliebigen Normalverteilu ng a- t ransfonuiert wird , l'fh äl t ma u eine Sta nda rdnonualvcrteiluug mi t den P a r a met er n .r = 0 IIl1d
243
St;"/'pfVbc"", itldw«rt c
2
= s = 1. Ihro .r,-\\"l'rtE' sind jet zt Zj-\\"('rtl', Sie wird dos halb auch " zVerteilung" genannt . Au f dem um gekeh rten Wog k1lJ1Il jede a-Verteilung in eine beliebige Verteilung mit den Puram etem f und S2 überfüh rt werden: 3
.rj = J: + z; , s
(10.14)
Da auch jede A'o1"1lwlve1"leihmg über die Umkehrung de r a-Transfor ma tion gpmät Glpid l1l11 g (1O.1-t) a us der a-Vertellung ableitbar i ~t , lässt sieh anhand der rabelllerten a-we rte die Flächenberechnung für jed e No r-
malve rteilung durch führen. Um bomuszufinden, wie viel Prozent der Fläche bei ei ner beliebigen Normalvnteilu ftg zwisc hen noci r - Wert en liegt a-standa rdisiort man zunächst die Ix-iden .r- wenc, U lll dann dio Flächen fiir d ie standardisierten werte aus de r a-Tabcllc abzulesen:
(r l- .tJ/S =
Und auf ein Beispiel an gewendet: In einer Normal vert eil ung mit dem :\1ittelwert i: = 3 und einer Standar da bweichung \"011 S = -1 soll die Fläche zwischen den Werton .fl = 2 lind :I"2 = 5 berechnet werden:
1>(i1.r) = 'Ps - 1>2 =
= 0.5 - 'I>- 0.25 = O,Gfl1 5 - 0,-101 3 = O,2fl02 = 29,02 % .
Zwischen den beiden .r· \\"('rtt' ll :1 und
liegen in einer Normalverteilung mit drill Mit telwert 3 und de r Standardabweichung 2 also 29.02 % der \ \"ert e, ö
\{'ah "~{'"'' i" I i('hJ.-ci I~ VI:" ('i/ u" .q""
244
1. Zwischen 1" - I , S lind 1" + I · S liegen 68.27 % der F läche. 2. Zwischen 1" - 2, S lind 1" + 2 · S liegen 9jA5 % der F läche. ;3. Zwisrhen J - :3 . e und 1" + 3 ' .s liegen !.l!.l.73 % der Fl äche.
10.3.2 Die Vert eilung de r Stic hprobe nmitte lwerte Aus Abbildung 10.3 auf Seit e 238 ging hervor, (lass sieh Mittelwerte aus meh reren Stic hp roben uormalvertellen. Da es sieh UIIl St ichprobellm ittelwerte handelt , wurden in Abbildu ng 10.3 anf der .r- Achse nicht r- Wert e, sondern r -Wert e abget ragen. Die Stichprobenmittelwerte .\' sind Realisatiom-n des Zufallsexperimentes Zieheneiner ZlIfalbstkhprolll' mit
ZLIrücklegen. Erwartung swert und Varianz Das arithmetisrhe ~ l i t tel - der Erwart ungswert - der Stichprn\ll'/I111i ttl'\wertevertetlung elltsprkht dem a rithmetischen ~[ ittelwe rt der Orumlgesamholt IJ:
E (.:\ ) = u,
Die
\ 'a ri a ll ~
(10.15)
der \ 'l'rl "il llllg der Stkhp1'O bl'nmittl'\wf'rt p Hisst sich durch
( 1O.1ü)
Die Standardabeseichutsq der \ 'erteitung der Stichprobenmit telwerte rochnot sieh ab
U 1; =
~=
'
~- = 11
o
rr :
V II
U~
11('-
( 10.17)
Sip wird als St.anrla rd fe hler des M ittelwe r t s {auch: Sta nda rdschätzfehler] hezeu-hnet, um sip von der Standard abweichung rles Xlerkmals in
24:;.
St;('/'pfVbc"", itl dw«rt c
der Grundgesamt heit (oder einer einzigen Stirhpruhe] zu un tcrschelden. Wenn von Standardfehler gesprochen wird. da nn ist immer die Breit e einer Stich probenkennwertevert eilung gcmci nt . Der Standardfehler des Mit telwe rts ist von zwei Faktoren ahh~lIg i g; Zum eine n von der Varianz de s ~ 1('fkl1\il ls in de r Grundgesamtheit . (12 • .11' sr ärker ein Xlerkmal in de r Grundgesanuhett streut , des to meh r werden auch die Xllttelwerto des Merk mals in vorschiedenon Sti chproben vonein ander abweichen. Zum anderen spielt die Stic hprobeng röt.o eine entscheidende Rolle: Je griiM'f der Um fang der gezogenen Stichproben , umso weniger welchen di!'s!' vom Pa rameter der Grullllgt'Sa mt!u'it 1/ ab. Die Verteilung tlpr Stichprohenmit telwerte ist !wi griiN'ft'lllll schmaler.
G leichungen 10.15. 1O.IG und 10. 17 gelt en für St idl] )robt>n, flit' mit Zurücklt'gPll gezogen wu rden und für Suchproben ohne Zurücklegen. in denen der Umfa ng der G rundgesamtholt N min des te ns das 20-fadw des Umfan gs der St ichprobe ent spricht, ~ > 20. Dies ist im ß eispil'l - Stichproben des Umfan gs II = 1.000 aus der bundesdeut schen Bevölker un g - der Fall. Der Erwartungswert des Durchschnittsah e rs in den Stichproben vom Umfang 1I = I.OOO ist
8 (.'\ ) = 11 = 37, 27 Juhre . Varianz lind Standardfehler
2 (1%- =
(12 -;
50 1, 45 1000 = 0, 506 lind
~ ---
50·1.45
1000 = O. 71 .
(\ I'S
Xlttt elwort es botragen
246
\{'ah " ~{'"'' i " I i('hJ.-ci I~ VI:" ('il u"
.'f""
Wlr erwa rten also durchschnittlieh einen Srichprobom mt tel wert . der dem Parameter dor Grundgesamt heit ent spr icht . nämlich 37, 3 Jahre. Der Stenda rdfehlor des Mittelwertes Iwt rägt 0.71 Jahre. Ist in Stk-hproben olme Zurikklt'gpl\ .; :5 20, da nn muss die Varia nz mit dem Korrekturfaktor für t'lullidw Crundgesamtheit en multipliziert \\'1:'1'den, de n wir bereits in Ka pite l 10.2.2
k pl\IWII
gelernt haben.
Die FOrJIlt'11l für Vertanz und Standard fehler lx-im Ziehen ohne Zurücklogen und ;\'/ 11 :5 20 sind
\'
UI
ur ( .\ ' )
a
=
\'
i - 1l :2 =(J- ' (Jt --
n
X - 1
lind
_ ~ . j A' - rl
- .;n
,V - I .
(10.18)
( 10. 19)
\ \'i r werden den Korrekt urfaktur für endliche Gpsamtlwitf'll in den nächst eu Kapiteln vernachlässigen, weil X/ tl bei bevölkerungsweiten Umfragen gröbe r als 20 ist. Immer wenn X /li :5 20 hzw. 71 /"" 2:: 0.05 müssen die
Standardfehler entsprechend korrigiert werrlen. Wahrscheinlichkeit sfunktion
11 ist der Erwart ungswert der Stirhprollt'nlllit tt'lw('r! .'H·r t1'ilnng, o » die Sraudardabwetchung, (Iip als Standardfehler bf'zpid l1lt't wird. Die Gh-ichung dpl" St ichprob enmitte lwe r t ever t e il u n g laute-t:
(10.20)
Anband dil'st'r Formel kann nun rlie \r a hrsrht'inlit hkt'it sdichle alt der StelIr .r hestimmt werden. DI'f Mittelwert der Al ters vert eilung in der bu ndes deu tschen Bevölker ung lx-trug 197.. exak t JI = 37.2GK Ja hre, der Sta ndardfehlcr de s Mit telwerts (J~ = 0.7102 5. Diese \\"('1'11' werden als Pa ra met er in die Gleichung (10.20) einget ragen. Die Wahrscheinlichkeitsdichte Iw triigt dann 1.. für Xi = 37.2 J ahre
n.
247
St;('/'pfVbc"", itl dw«rt c
= 0.5591 . Dieser \\"nt ist <11",1' nicht gll'ichIJt'llt' utend m it der \\"a)lrsr heinlichkpit rles P unktes 37,2. Boi stetigen Vorteilungen besit zt jeder einzeln e der unendlich vielen P unkte die Wa hrscheinlichkeit null. den n die Fläche - di e ja die Wahrscheinlichkeit a ng ibt - übe r Pu nkten ist null. In Abbildung 10.3 wurden zu r Darstellun g der werte Intervall" der Breit e 0,1 gewiihlt , somit muss de r \\"" rt der \\"almwheinlil'hkeitsdichte mi t der l ntcrvallbn-it e 0.1 mu ltipliziert werden. um ihn mit deru I"m pirisrhpll Wert \'prglpidl('u zu kiinlll"lI: 0.559 1 · 0. 1 = 0.0559 1 bzw. 5.59 1 o/r,. In Tabelle 10.4 (So2.17) sil"ht man. da ss in (i % der 1.(100 s lruulie rten Stichprobon ein Altersrlurchsrhnit t von 37.2 Jahren [Intvrvallmit te] cnui nr-lt wurde. Der in den Simula ti onr-n erm ittel te Wort VOll (i % weicht von dem au f Basis der Normalverteilu ng theoretisc h r-rmittolten wen von 5.591 % geringfüg ig a b. Flächen unt er der Stichprobenmittelwert evert eilung
Dip Flächenberechnnng der St k-hprobenmlt relwerte vert eilung kann wiede r über dip Tabelle (\('1' z-\'I" rt f'ilung erfolgen. Dazu werden die .t-Worte ztransformiert lind die ('ntsprrdll'ndpll F1ädlt'lIallleilp aus der Tabelle üb ernorumen . Das \ ·orgph('1l entspricht also dem Vorgohon bei einer bellobigen Normalverteil ung . Alle rdin gs lautet die Gleichung der a-Tra ns form a tion für die Stirhprolwnmiut' lw.'rtt' \·('rteilnn g
Zi
und
(Jjp
Xi - P = ---
( 10.21)
0,
Umkehrung
1'. = 11 + Z;
' (11'
( 10.22)
248
\{'ah " ~{'"'' i" I i('hJ.-ci I~ VI:" ('i/ u" .q""
I ; is t bei einet- Stie hpfolw nmittl'iwt>rtt' wrte ilung ein lx-llebigor Wl'rt der \ 'erteil ung .
Analog zur Fl ächenberechnung un ter der Xormul vern-ilu ng lässt sich für dir' S tichpro IlI'nm it telwer te vert pilung fest ha lt1'11 : 1. Zwischen JI - 1· a :r und I/ + 1 · a :r liegen G8.:ti % der Stk-hprohenmittelwerte. 2. Zwischen JI - 2 · a :r lind I/ + 2 · a :r liegen tri"' 5 % d er Stichprobenmittelwert e. 3, Zwischen JI - 3 · o » un d /I + 3 · (1:r liegen !.l9.7;j % der Stich probennuttelwert e.
Im ßei:-;pit'l liege n 95 ...5 % de r Mitt elwerte in Stich proheu vom Um fan g n = 1000 zwischen :17,:1 - 2 . 0, 71 = 3;),88 und 3 7,3 + 2 . 0. 7 1 = 38 , G2 J ah ren .
10,4 Der Zentrale Grenzwertsatz Wlr ha ben m it Hilfe \"( 11\ Slmulatlouen demons triert . dass sich Mttt elwerre in Zufallsstichproben bei hinreichend grosem Umfa ng n normalverteilen. Dip theoret ische Begründung llofen der Zentrale Grenzwertsa tz . Dor Zeut ra le Gr enzwortsa tz bei n halt et . da ss eine Su m mt' (und da mit a uch da s a rit hrnet isrhe :\Iit td ) iden t isch verteilter Zufallsvariablen mit zunehmendem St ichprobenumfa ng n gegen r-iue Normalvert eilung konvergiert (vgl. Kühnelund K rebs 2UU7, 196 (f.). Die Bedeutung des Zent ralen Grenz wer tsa tzes liegt darin , da», sieh d it' Suehprol.enmtu olwerte bei hin reichend grosem Stich probenumfang 11 a uch dan n normalverteilen. wcnu das Merkmal in der Grund gesa mt heit nich t norm alverteilt ist. I n Abbildu ng W.G lxt die Alters verteilung der bundesdeutschen Bevölker ung 1974 da rges tell t . Die Altcrsverteilung der U run dgesamtheit ist offensichtlich nicht normalverteilt. Den noch nähern sich die Alwrsdurchschniuc in Stich proben vom Umfa ng 11 = 1000 einer Normalverteilung an (Abl.ilduug 10.3, S. 2:38). Bh-ibt d ie Fra gt', a b wann rler Stichprobenumfang 11 grob gen ug ist, damit sich die Stichprobon mi n clwcr te nor malverteilen . Die Ant wort hiingt WIl der Verteilung t l e~ Merkmals in der G run dgesam theit a b. Rl'i Xlerkmalen. d ie in der G rundgesamtheit normalverteil t sind , ver teile» sich die
[kr Z"" tHlI~ G'''flzwe't~" tz
Abbildung
10. (;:
Altersverteilung der bundesdeutsr-lu-n 197.t. 1I = 37, 27 und 0 = 22,.tG .Iahre
•
•
-
•
ß I'\'iilkef1l ng
•
aruhmettschen Mittel in Zufallsstic hproben unabh ängig H JIl III'r GrÜN' der Stichproben immer normal. Bei sehr schiefen Verteilungen muss der Stichprobenunifang grüber soiu. Als Faus tregel wird ein St u-hprol x-numfang von n = :30 an gegeben , der notwendig ist. dami t sich die Srivhprobenmittelwerteverteilurig einer Xormalvern-ilung nähert. Normalvert eilung als Grenzvertei lung für Häufigke iten und Ant eile
\ \'ir ha ben gcseln-n, dass sieh Hliuftgkeiten lind Ant eil!' hinomia l [bzw. hyp ergeometrisch] U III den wah ren Anteils wert der C rundge-anu heit verteilen. Oei grobl'lTl Sti rhprots-m nufung 11 ist die l,,'onlwIJlcrtcilll ny auch die Grenzl!('1"leil lH1Y [iir llii llfiykei tetl Ullfl Ant eil e. Als hin reichend gro b wird r illt' Slkh prolw angt'sdll'll, \\"1'1111
11· 0 ·( 1 - 0»
(IO.n)
9
(Blcymüller et al. :WO.t. Kapit cl l l .t ). Alt ernativ wirr! gefordert. dass
o
1- 0
" .- > 9 und ,, · - o- >9 1- 0
(10.2')
(vgl. Kiihuelund K rebs 2007, 20.t 1f.). \\'ird de r Anteil de r Stie hprobf' p zur Schätzung lies Standardfehlers des . \ ll t l'ils verwendet (und nicht 0),
25U
Il'a ll,.~d",j fllit hkd I~ oen t ilUflgen
dan n sollte der Stichprobenumfang zudem griibt'r als GO sein. n > GO (vgl . Kühn el und Krebs LOOi , 204lf,), Da ra uf werden wir im nächsten Ka pite l vurfk-kkommen. Die Xonnalvert-Ilung dl'r Anteile hat dle Parameter 0 (Erwa rt ungswert] und 6 1'n- 6 1 {Varianz}: X (O; 6 ( ~-6 ) ) , ßl'i Answahlen ohne Zurücklegen und .;;: $ 20 ist die Vnrjanz wtedor mi t {km Korrekturfaktor für endliche Crundgesanuhciten zu multlpliz k-n-n. Grundgesamth eit - Stichprobe - Stichprobenkennwerte
Die Unterscheidu ng zwischen 1. der Verteilung eines Xlorkmals in der G run dgesam t heit. 2, rler Vertelluug eines ;"Iefkmals in der Suchprobe und J, rlor Ke nnwerte verteilung
ist für das Verstä nd nis der sohllesenden Statistik zent ral. Zusu mmenfassend werden d ie drei Verteilungen a m Beispiel der Altersvcncilung deshalb noch einmal verdeutlicht. Dip Verteilung f'illl'S ~1('rklJlal s in der Gnmdyesamth eil ist in der Rpgpl [und im GI'gellsa lz zu den O" is pit'lt'll aus diesem Ka pitel] unbekannt . W ir bezeichnen das a rtt hme usrh e Mit tel eines Merkmals in der G rund gesamtheit mi t jJ und dessen Stamlanlabweichung mit (1 . Die Grö bt> der Grundgesa mtheit wird mit N hrlricllllt't. Aus de r Grundgesamt heit wird die S tichlJrobc \'O1ll Um fa ng 11 gt'zogen , Die Verteilung des Mer kmals in der gezogenen St ich pro b.. ist bekannt. Das arithmetisrhe Miuol und die Streu ung eines Merk mals in de r Stichprobe können wir aus den beobachteten Daten Ix-rechnen (Kap itel G). Das a rrthnu-tisr he Mit tel des :-'!Prkmab in der St ichpro be bezeichnen wir mit .r, die St
Die h"n lfl wertevelt eillllly ist eine Wahrscheinfich koitsverteiluug. Sie gibt die Wahrscheinlichkeit \"011 Kennwert en. r, TI. des arithmetischen Mit tels . in Srichproben gleichen Umfa ngs 11 an. Aus dem Zentralen C renz wortsat z folgt - wie wir ges" IIPII haben - , dass sieh Miuelwert r- in Stir-hprohen Ill'i hinreichend grobt'lll Il normal um de n :-'litlt'lwf' rt der G rundgesa mtheit /1
251
vortollen. Das arithmetische :\Iit lel {der Erwartungs wert ) der Stichprobenruit telwerteverteilung ist 11. Die Standardabweichung einer Kennwert evertelluug wird als Si(l1ulanlfchlt'r hz\\". St andardschätz fehler Ill'z('ichllf't . Der St andardfehler gibt a n. wie weit Ken nworte in Sti chproben vom Pa rat uetor der Grundgesamtheit abweichen . Der St a uclardfehlor rles Xltt tolwerts ist (1~ = 7;;. Mir Hilfe der Ken nwerteverte ilung lässt sich die Abweichung der Ke nnwert e in Stichproben vom Pa raun-ter der Grundgesa mt heit IInge ben . In Abbildu ng lU.7 sind d ip dr ei \ 'P\,tPi!llllgl'lI dargeseellt. Uben findet sieh die Aln-rsverteilung der hundesdeutschen ß t'\'ii]kpflIllg im Jahr 1974. Auf der r -Aehsc ist das Merkmal Alle r abgetragen. Ausna hm sweise sind hier die Pa rameter der Grundgesamtheit hekaunt . OP\, Ahe rsdurehschuitt in der Grundgesamt heit (JI = :H . 27 Jahre} ist durch einen sen krecht en St rich in der Abbildung eingezeichnet. Darunter ist di e Verteilung der arit hrnet isrhen Mit tel des Alters in Stichproben vorn Umfa ng n = 1000 ab geb ildet . Auf der .r-Avhse s ind Suchproben mittelwerte i"; hier Altcrsdurchschni tte - ah gf'tragl'll. Dip St idlprobell mittplwprlf' verteilen slch mit einem Sta nd a rdfehler von 0.71 normal um den Mittelwe rt der Grundge samthei t (JI = :i7,27 Jahre ). In 0('1' unt eren Abbildun g ist die Alt ersverteilung in einer einzigen S tichprobe vom Umfa ng 11 = 1000 angegebe n. Dor Alterdurchsr-h nitt liegt in dies er Stichprobe hei 1: = :lti,4 Jahren. die Standa rda bweichu ng bei s = 2Z,.ll Jahren. In dieser Stichprobe ist der Altersdurchschnitt niedriger ab in der Crundgcsamthoit.
252
Irall,~dre i li/i..!,"eiI~ oert Ci/
u"!lell
Abbild ung 10.7: Grund gesamtheu . Ken nwert everteilung und Slich prolJl' Alter svorteilung 111'1' bundesdeutschen Bevölkerung Itl74, 1' = 37,27 Jahre und c = 22, ,J(j J a hre
s
•
-
•
•
.00
•
••
Stkhpro]J('lllllitt,,]Wl'rt t'wr tpilllllg fiir n = IIKJO E( X) = 11 = 37, 27 Jahre IU"] <7z = 0 , 71 Jahre
s
00
-•
•
Alter sverteilung in dm' I' Stich pro be mit n. = 1000 Il = 22, '11 .l uhrc
.t = :10, ,1 Juhrc und
AuJ!J" oclI
253
Aufgaben zu W ahrscheinlichkeit svert eilungen l . Wie viel P roZI'1lI der Fläche (d!'!" \r!'rt!') liegen a) links lind 11) recht s von folgl'lld!'1l ;;-W!'rtl 'n: a = - 2,78: ;; = - 0,1: z = 0,9: :: = t. Dü'! 2. Bitt e bes timmen Sie, wie viel Prozent der Flächt' lx-t der S ta nda rdnormalverteilung zwischen z = - 2 um! z = 2 liegen. 3. Wodurch werden verschiedene Xormalvertr-ihmgen chara kte risiert. 11'0-durch unterscheiden sich dil ~t"? ·1 Ce gelJl'Il ist eine Xormalverteilung S (rI20: lü ) m it einem ~ lilt l'lw,'rt \ '0 11 20 lind einer Varianz von W. Bit te lx-rechnen Sie, wie viel Prozent der Fl äd lf' in das Intervall zwischen x = 20 und .r = 23 fällt. ;). \r as besagt der .Zentrule Crenzwensatz-" ü. Oegoben ist die Alt ersverteilung der Bevölkerung d er ß RD. Dip Stichprobetunitt elwerte aus diese r Altersverteilung sind nach dem zentralen Grenzwert satz normalverteilt mi t einem Mit telwer t VOll 37,9 Jahren lind einem Standardfehler ( = S tallda n !a hwl'id lU ug de r St h-hprohenmtttelworte) von lh = 0,7: d.h. N (il:37,9: 0,7 2 ) . In wieviel Prozen t aller Suchprobon erhalten Sip einen Alt ersrlurchsr-hnlt t zwtschon 3u,9 lind 38.9 Jah re n'? 7. Antwor ten Sie mit richtig oder falsch. DI'r Standardfehler etnos Stichprohen kennwertes bes chreib t a ) die Standardabweichung in dor G rundgesam theit . b ) den Fehler. der durch ~fessungpnaui gkt'ilt'll entsteht . c) die Ste uda rde bveichung in de r Stichprobe, d ) die Ste uda rde bveich ung der Ken nwer teverteilung.
11 Konfidenzintervalle 11 .1 Punktschätxung 11 .2 Konfideuziut crvall für den Mi t t el wer t
254 ci 11,'1" G rundgesauuhei t •• 2;;ü J 1.3 Koufklcuxintcr vall für ,kll Anteilswort 0 einer ( h-undgeccmt heit .. 2(j{j J 1..1 Der fo;inHtlss ,[ps Stk-hprobenuurfungs " 2ü8 ~I
Im letz ten Ka pitel haben wir uns mi t de r Abweich ung der Kennwert e in Stichproben vom Pa ra met er der Grundgesamtheit beschäftigt . l n rief P ra xis haben wir nUT Daten einer f'inz igPll Srk-hprobe. Xflt diesen Daten möchten wir Au ssagr ll iibor eine n Para motor der Grundgesamtheit troffen. Ein tvpiscln-s Boispiel sind Wuhlprognos cu: Dort werden per Um frage d ie Srbnmcnenrcilc für die ein zeln on Pa rteien bei einem Teil dor \Yä hlec ermi t telt . \Yissell möchte mall na türlich. wie die einzelnen Pa rteien bei alle n W ä hll'rn absehlwillell. Dir Schätzuug der Pnpulation sparame te r kann als Punlä - oder als In ter lIßIlschätzung vorgenommen werden. Boi einer Pu nk tschä tzung wird der Pa ramot or rler Crundgesanuhott durch einen emztgon \ \"prt de r St ichprobe geschätzt . In de r oben darges tellten Wahlum frage {vgl. Ta bdip 9.1 a uf Seite 194) könnt en z. Tl die 42.5 % der gültigen S timmen . die die eDU unter de n Befra gten er hie lt . ab Schätz wert für de n P rozent sat z der gült ige n Stimme n be i allen \ Yählprtl \'pcwellliet werden. \YPi! P unk tschä tzer mit der zufälligen Zusa m mensetzun g der Stichprobe variieren. gibt man ß ereiche a n. in denen die Pa ra meter der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit liegen .
11.1 Punktschät zung Als Punkt schätzer des arithmetische n Mittels in der Grundgesamtheu 11 wird das in einer konk ret en Stich] lrolll' Iwobadll t'tl' arithmetische ).littl'l 1: verwandt :
(11.1) 1: ist eine Realis at lon der Zufallsvatiahlen j( - arithmetische Mittelwerte in Stichproben. j( wird als Schätzfunktion (Sd lä t7.l'r, c.~ lim ß tQr) für 11
25t.
benutzt. Im ALLß CS 2()().j wurde für mä nnlic he Befra gte in \\"I'stdcut schlan d eine durchschnitt liche Kiiqwrgrüb(' von j; = 178 cm ermit telt , die wir zur Schätzu ng von 11 verweurlen können: (I = 178 rtn . Zur Schätzung eines Anteils (1,,1' O rundgesanuhett verwenrle n wir de n AIItell in einer konkre ten St u-hprobe p.
O=p
(11.2)
Die Schätzun g des Srim mrna nt eils der CDU 0 du rch den Stimmenant eil p der St ichprobe ist : jj = 0/125 = ,12.5%. Oie Schätzfunk tion ist die Zufalls-
variable P - Anteile in Srirh prol x-n. Schiitzer ha ben d rei wünschenswerte Eigenschaften:
• Erwart ungst reue. • Etfizienz und • Konsistenz .
Eine Schätz fun kti on ist ermart unqstre u. wenn der Erwart ungswert der Fun ktion . d. h. den-n Mit telwert , dE'1lI zu schä tzenden P a ram et er der Grun dgesamt hei t entspricht. Ocr Erwart ungswert der Verteilung der artt hmeris chcn Xliuel in Stichproben ;\" ist 11. ).. ist da her ein 1l 11H'I"ZPfI"It'r Sc:hätzPf von 11. Oagrgf'1I ist dip Varlanz in Stithp rolw n kein uuwrzerru-r Schätzer der Varla nz in de r Grumlgesamtheit. Dip Var ianz in einer Stichprobe nntE'!"sdliitzt dip Varianz in der Grundgesamthe u . A ll S diesem Grund wird d ie Var ianz r-iner Stichprobe S 2 mit einem Kor rek t urfaktur multi pliziert, wenn sie zur Schätzung der Varianz in der Grundgesamt heit u 2 verwandt wird {vgl. Olcicbuug t t. s, S. 2(3). Ein verzerrter Schätzer unter- oder überschätzt den Paramet er de r G rundges anuhcit im Durchschnit t.
Ein Schä tzer ist effizie n t, wenn er einen kleineren Standardfehler hat als andere Schätzer. Als Bolspiel soll d ir Köq w rgriibp her an geaogon werden. Die KüqlE'rgröb;' ist ein uorma lvertelltes Merkmal. bei dem arit hmetischos Mit tel und Median Identisch sind. Zur Schätzung der zentralen Lagt' der Köqwrgröbt' der G rundgesamtheit konnte mall nun den Xlodia u 011,,1' das arithmetische Mittel der St idl prolw heranziehen. Es läss t sich zPigPII, dass
256
der Median in Stichproben ;\;- einen gröi.erell Stn ndard febler a ufweist als da s a rithmetische ~ l i ttt' l in Stichproben .\ ". Ein Srhätzer wird als kons ist ent Ill'zf'ieht ll't. wenn mit zunehmendem Stir-hprobennmfang die \\'ah rsd winlirh kf'it t'illf'S Abs tan ds Will zu SI:hätz,' I\(11'1I Pa ramete r geringe r wird . Ko nsistenz ken nzeichnet d as Verhalt en eilies Schätzers be i \ 'I'rgrükrung der Stichprobe.
11.2 Konfidenzintervall für den Mittelwert J1, Bei einem Konfidenzi ntervall wird ein Ben-ich angegeben . Indern de r gesuchte Pa nunt er der Grundges amt heit vermutet wir d.
Wahrsch einli chkei t sinter vall e für Stichproben mittelwerte Dur ch d a s Zt'lllrale C u-nz wvrt t heorem \vi.~SI'1I wir, d as s sieh StichprobenIIIi t tf'hn 'rt I' normal vertoilen, wenn die gt'i'ogf'llt'll St ich] lrol lf'1l hinreichend groi. s ind . Deshal b können wir - hei Ken nt nis der Varianz (1 2 und des Xltttel wcne, JI der Grundgesamt heu ~ berechnen , wieviel P rozent der Stichprobonmi n clwerte S in besrimmt en GfeT1Z('Jl liegen (vgl. S. 2.t2) und umgekeh rt . in wt'k hf'll G renz en sieh ein ht'!;tillllll t('T Pro ze nts a tz de r Stir-hprob cnmutelwert e befind et. Dieser Prozent sat z gibt auch die \\'ahfSl·lwinllchkct t an . mit der ein St h-hprob enmit relwert in diesem Interval l erwartet werden da rf. Solche Bere iche, in denen dir Stichprobcnmdt cluwrte mit einer g ew is,~erl Wa}lI".~ ch ei"li chkeit lieqen. werden als lJ'ahrH ch eili lichkei l-~ intervalle hez eir-hnet, Gosuclu sE'iE'n 7.. B. die Gn:nzen des Interva lls. innerhalb dess en sich 9;) % der Wer te einer S ta ndard nor malverteilung .~Ylllmctrisch zum Xlitt elwert befi nden. Wi f best immen als o j et zt nicht die Fläche aufgr und vorgegebencr Urenz en. sondern die Gren zen a nhand einer vorgegebenen Flüche - nämlich 9.) %. Das gesuchte Intervall , das in Abbildung 11.1 durc h die schraffiert e Fläd le repräsentier t wird , 11m fasst 93 % der " 'erll ', die beiden nicht schralfierten Flächen recht s lind lin ks beinhalten je weils 2,3 % EI"T Flärhe. Links vo m unteren G renzwert befinden sieh also 2.5 'X der F lä;:he, links nun oberen G renzwert da gegen 97,5 %. Dementsprechend befinden sich die beiden G renzwerte a n den Stellen ':0. 0 25 I)lW, Zo.975 ' xlan sucht als o innerhal b der a-Tabelle in Anh an g :\ di e Fläche 0.975 bzw. o.on und liest dann am Ra nd der Ta belle den zugehö rigen c-Wert a b. " 'ie man der
11',mji,kllzi"telH.
257
d~rl M;lIdw~l1: I'
c-Tabcllo ('IlIIlE'h nWII kann , ents pricht der unteren Fläche ein \Yerl von Z(].ll25 = - 1.96 und der oberen ein Wert von 20.975 = U Jü. 93 % d..r Fläche bof nden sich bei ei ner SI a 11IIa rd normal vert ci lung al so zwischen - I ,96 und +1.% .
Abbtl.lnng 11 .1; % Wo.Wahrscheinlichkeitsintervall
einer
Standerd-
lWrtl lll llJr rt rilll ng
oz 95%
or
oc
2.5".
2.5". ,1%
0
,%
,
Allgem ein bezeichnet man die Wa hr;whl'inlir hkl'it, da ss ein " '('rl ' licht in da s \Yahrsdleinlkhkei tsint e n· all fällt. mit n . Dil' Wahrscheinlichkeit dafür . das s ei n \ YI'ft in das \ Ya hrsd winlkh ke itsinl l'ITa ll fällt , wird mi l 1 - fl bezeichnet. De i Intervallen , d ir s vmmetrlsch zum xünelwort 11 liegen , 11('finden sich am linkenund rednon Ra nd der Verteilung ~ der G(o;;amIHädlt'. Die Grenzen liegen also bei de r Standardnormalvert eil un g a n den Stellen 2 'j und 21 - '1' IVi(' ma n in Abbild ung 11.2 sehen kann . Solche ZUIll Mit telpu nk t sYllune tr isdl(' n Wahrscheinlichkeitsint ervalle nennt man zwe ise itige I ntervalle . Ha ndelt P S s lr-h nicht um «lne st a nda rdls lerte, sondern Illll ei ne beliebige Normalverteilung - und IIl11 eine soldie ha nd elt es steh j a a uch bei der Slie h pro hl'lII11iltelw(' rte w rleilung - dann müssen d ie Greuzeu dos Int ervalls z'! und 21_'1 destandardisiert werden. Indem die a-T ra nsformation (vgl. Gleichung lU.21 au f Seite 247) r ückgängig gernacht wird. Splz t man 2 ~ und 21_ y fiir 2 in die Gleichung 2 = ~ ein und WsI bl'ir!e G leichungen nach 1" a uf, dann erh ält man als untere G renz e 1I + z'; ·17t und a ls olll'l"l' Gl"Pll Z(' 1I + Z I _~. ·17z..
258
Abbildung 11.2: \Yallrsdll'iulirhkl'itsilltl.'r\'all eine r S t rmda nht(/l'mallJfT-
lcilu1ty
ci
(,/2
" .L_~"-'c.L
-co
-'--'-"",,"_-J
,
Aufgrund der Svnuuetrie der Verteilung ist z'f = - ZI-'f ' weshalb man für die untere Grenze au en 11 - Zl - 'f ' (1.r sr-hreibeu kann. Die Formel zur Ber-chnung des \ Vahrsch ein1ich kei t sin t er va lls eitn-r Stkhprolwllulittelwertevenoilung lautet daher (vgl. Abbildung 11.3):
JI - Z I - 'f' (1~
$ X$
II + Zl _ j ' (1j>,
(1l.3)
Die Berechnu ng des Wah rsdwililidlkt'itsintl.'n'alls soll wieder um am ßt'ispit'1 der Altersverteilung der lmudosdeutschen Be völker u ng vr-rrleutficht werden. Das Durrhsehnittsalter der ßll nrlt's hiirgpr betrug 197.t JI = 37.27 Jahre. die Standardabweichung (1 = 22,.16 Jahre. Der Standard fehler dos Mit telwerts (1 1 gibt die Breite der Ken nwert evert eilung an U lI(! wird durch j.; berechnet . ' ''ir möchten nun wissen , in welchem Int erval l sich 9::'% der arlthmetischen Mtuol [Altersdurehsehmtt e) in Such proben vom Umfan g n = 1000 a us dieser Grundgesamt heit befinden. (): beträ gt a lso 5 % bzw. 0.05. 1 - (): somit 95 % bzw. O.9;j,
2W
Abbildung 11.3: \Yallrsd ll'illlirhkl'itsillt('r\"all eine r Stid1lJ1v/J('mnitl clwr r -
t rVf'I"tril ll flg 0.' 0.' 0.' 1-"
or
on
22 .46 37,27 - Zl _ ~ , -11000
< _ X< _
22 ,l6 37,27 - ..... n~. , - - -v. ~. "' -11000
< _ ;(_<
37.27 - Ulü· 0.71
:<=;
X :0;;
:m.88
:0;;
X
37.27 + Zl _ ~ -" o r , 2 ~I
'n ..j6
' j~~oo
+ - 0"" -/22.46 - 1000 .~~ n_ . ·
37.27 + 1.9ü· 0. 71
:0;;
In 9::i % d..r mögliche n S richprnhou vom Umfang Tl = 1000 liegt der Alter sdurcbsclmitt zwischen 35,S8 lind ;~Kü6 J ahren.
Konfiden zint ervall für de n Mittelwert It bei be kannter Varia nz der Grundgesamtheit
Ebenso wir wir ein Intervall
1Illl Ij gelegt haben. künnen wir nun ein Inter vallum einon Stir-hprob onmitrelwert .r legen. Liegt ein Stic hp robenmi ttelwert im gra u schraffierten Boreich in Abbildung 11.3, da nn ist 11 nicht weiter als ±Zl_~ • o» von dies em St ichp robenmit telwert r entfernt.
aeo Wenn nämlich ( 1 - 0: ) % de r möglichon Stirhprobenmittr-lwerte nic-ht weitcr als ± ZI _'! . o » [Int er vall] Will Mit telwert der Grundgesamtheit 11 entfernt s ind . dan n ist auch d-r Mit telwert der G rundgesamt heit 11 nicht weiter a ls ± Zl _'! ' (1 " vom StidlprollPllln ittphwft f bei ( I - 0) % der Illiip;liehen Stichproben entfernt . Kon kret : \ rpidlt'1I 95 % der Stichprobenmittelwerte nicht weiter a b ± l.!)(j . U :r vom Mit telwert der Grundgesamtholt 11 ab . dann ist JI bei 9;) % der Srichp robenmit telwr-rte a uch nicht weiter a ls ± 1.96 · U :r HII1 1: eutfernt . In ;) % der Stichproben is t 11 weit er ou tferru. Dieser P roll'ntsal1 kann als \\'a llfs("h pin!il·h keit int er pretiert worden: Die \\'ahfsd winli ehkpit da für. dass der Mittelwert der G ru ndgcsauuheit n im Int ervall ± 1.9G· U :r IIIl1 einen möglichen Stichprobenmi ttelwert 1: liegt , 1)(',trägt 9;) %, die Wehrscheiulirhken . dass 11 unserha lb dieses In tervalls lieg t , tJl't rä gt ledi gl ieh ;) %.
Berechnu ng von Konfiden zint ervallen Solche Bereiche, in de nen ein nnhekannter Pa rameter ,11>1' ( I mndgesamthelt vormutet wird . werden als Vertrauens- odr-r Ko nfid e nzinte rvalle bezeichnet . Die Bildung von Konfidonzlnturvallon erfolg t im P rinzip ebenso wie die HlII \rahfse!wi nlichb'itsin tt'fvalll'll. Die untere G H'IIi't' - ZI - "1 lind die obere G l"l'ni' l' Z l _ ~ müssen wiederum für Z in die Ob-ichung z = ~ ~ pillgl'M'tzt werden. Da wir hie r den \\'I'rt /I suc hen, mÜSM'1l Ill'idf' Gl r ichuug en jl'doeh nach 11
.
.T - z(I-'j l · o » '-.,-------' \mt~ro ( : "'"".
7n
:5 11 :5
1:
+ z(I- 'i l ' o » 0 1><'1'<"
(;"'n'"
Setz t mall für den St a uda rdfehler des Mittelwertes felgende Gleichung:
.
J' -
zÜ -'jl ·
a
..fii
(Il A )
'-.,-------'
GI
ein , ergibt sieh
(11.0)
'-------v-----U "'~'" G ",n1~'
Die Berechnung des Konfi denz intervalls kan n wiederum a m ßpispil'l c!ps Durchschnittsalters ,11'1' bundesdeutschen ß l' \'iilkpflln g im Jah r 1974 na-h\'OIlw gPII werden. \\' ir wählen (m it Hilfe des Programme s ALT MIHI aus
2ül
GSTAT) zufällig eine Stichprobe mit 1.000 Befr a gten aus und ermit toln für dies e Srichp robe einen Aln-rsdurrhsrhnit t j" von 38, 11 Jahren. Die St en darda bwt'idl\lng der Grund gt'Samthl 'it o ht,t rägt 22A(i J ah re. Die Inte rvallgronxen können nach Formel 11.;; bes tim mt werden:
22Aü 38. 11 - z(I _ ~ ) ' .,11000
3S,11
22Aü
+ Z(l - r-ro."'} · =00 V 1000
:~S JI -UJü·O. 71
$ Jl$
;~.s.l I +U)G· O, 71
:36.72
$ Jl$
3\).50 .
Konfidenzlutr-rvalle werden häufi g in eckigen Kla mmern angegeben: [:~(j . 72: :m.5]. Mlt 9;j Xigt'r wahrseholn ll chkeit out hält das Int erva ll [36.72::m.5] den Altersdurchschmt t der Population.
Interpretati on von Konfidenzintervallen Da der Alters d urt-hschnit t ein er Srichp roboP von deren zufälliger Zusammenset zung a bhä ng t, werden wir für un terschiedliche Srichprobou unt er schiedliche Altersdurchschnit te Lind da m it un ters chiedliche Konftdenzlnter valle für Jl erhalten. Mit de m P rogra m m SIMKONOR a us GSTAT sind zehn verschiedene St ichproben mit jeweils 1,000 PeThOIU'1\ a us de r Altvrsvertcilu ug der Bundesdeu tschen gezogen worden. Für jede de r Stirhp ruh eu wurde da s 9;;%igt, Konfidenzinter vall berechnet . Die St ichprobenmitt elwerte sind in Abbildung l L ! du rch Sterndu-n gPkpllllzl'iehlll't, die Koulitll'lLZIntervalle durch Linien. \\"l'i! dle Sthh probenmit telwe rt e unt erschiedlich sind, un terscheidet s ieh auch die Lage ,11'1' Konfklenzlntervalle. Da wi I' h ier a usnah msweisc den ~ I i t tel wert der G ru ndgcsamt hei t It kennen. können wir angeben. 01, ein Konfidenzi nter vall Jl uruscbliekt oder nich t. In neun der zehn Stichproben liegt JI. das in der G ra p hik als senkrechter St rich pingl'zt'khut't wurde. ta tsächli ch imberechnen-n Konfidenzintervall. In der sir-lnen Stic:hprohl' liegt der Altersdurchschni t t rler G flllldgt>sa mtheit, uämltch 37,27 .lahre. a usorhalb d es Konfid enz inte rva lls .
Xormalr-rweise kennt ma n den \ \"{'r t von I1 uieh t , weshalb wir nicht a ngeben könn en , ob ein kon kretes Konf idenzinter vall I1 tut säeb lich einschlir-st oder nicht . 111 U;; % der möglichen St i..hproben aus einer C rundgesa r ntheit
Abbildung l L]: Konfide nzintervalle bei unt erschied lichen Srk-hprobenmi t tc lwert ; ' 11
,
•
••
•
4 l:UI5 ~
,~ ,~ ,~ ,~
. • ,~ ,~
,
• A
~
:H .4 81
..
a 115.7 er .s
~ .,
~
4e . fI5 ~
Alls1/:a!>l' ,]PS P rug ra lll1rls SIMKONOR alls GSTAT
wird das Konfidenzinter vall den Paramet er der Gr undgesa mtheit ent halten. \ r Pll ll wir - wie im RI'is pid - wiederholt Sti("hpro lwll vorn gleichen Umfang ziehen . so verdenlangfrisng. d. h. bei e iner gro sen Za hl von Stichproben . etwa g::i % der Konfidenzint ervalle den Mittelwert deI" Grundg esamtheit beinhalten. In ;'t\\"a ;; % der Stichprol H'u wird das 11111 den Stichprolu-nmittelwert geleg te Konfidenzintervall de n Pa ra meter 1I nicht ctus("hliI'M'll, lind wir irren U IlS lH'i der Schätzung - wie hier in 11('1" siebten Suchprobe. Aus diesem Grund wird (\ auch als Irrt.um s wahrsche inlichke it und 1 - (\ als Ve rt ranen s wah r sch eilllich kei t bezeichnet . Erhöhung der Vertrauen swahrscheinlichkeit
Ist UIIS dtese r Schluss zu unsicher. dann können wir die Vert ra uenswah rscheinliehkoit z. B. a uf I - 0 = O.ÜÜ. al so ÜÜ 7l , erh öhen. Die Irrtumswahrschoinlfchkoit be trä gt (\ = O. 0 I. Die z- \\"PI" tI' zu den Q uanrilen 0.05 lind O.!J\Xi sind ± :2 .5K
263
3S.1 1 +
as.n -
2,58 · 0.71
:::; JI :::;
JH.lI
:3G.28
s JI :::;
39 5J1
')') -IG
Z' I _0,", ) '
-s-
-~ v 1000
+ 2,5S · 0,71
D as Int erval l 1 :3G . 28 : 39 . 9~ I I)l'i ll h ö l t l,t mit 99'Yrigl'r Wahrscheinlichkeit das Durr-hsr-lmittsalter der bundesdeuts che n ß e\-(ilkpru llg. ~[it zuneh mender Vertrauenswahrscheinlichkeit wird das Konfide nzinterval l brei/er. DiE' höhe re Sicherheit beim Sehlit'N'n goh t also m it einer uugenaueren Schätzung de, unbeka nnten Mit telwer ts einher. Der Ex t remfall. dass wir unseren Schluss mi t lOO% ige r Sieherlu-ir tätigen wollten. würde d ie Int er vallgren zen auf - 00 bzw. + 00 aus deh nen. Die dazug-hön-ndc Aussa ge ..~ Iit 100'Xiger Wahrscheinlichkeit überdeckt dös Inter vall von - 00 bis + 00 den P a ram et er 11" ist allenl mgs nicht informativ.
Konfide nzinte rvall für den Mittelwert Ji bei unbe kannter Varianz der Grundgesamtheit Im vorangegan genen ß t'ispid sind wir von einer bekannt en Varianz 11 2 und Standardabwetchnng 11 der Grundgesa mtheit ausgegangen. Xorm alorwoise ist (1 jedoch nicht bekannt , lind damit kan n auch der St an dardfehler d E'S Mit t elwerts 11~ = (J / .J1i nicht lx-rechnet werden. Ab Schätzwert der Standardabweichung de r Grundgesamtheit (J verwendet man da nn die Stnndan.labweichllng der St ichprobe s. Die Varia nz in der Stichprobe ,52 ist allerdings kein erwartungstreuer Schätzer eh- r Var ianz in de r Cmndgesamtheit. Da lH'1" IllUSS ,~2 mit dem Fak tor 11/ (11 - 1) korrigiert werden, um den S("hiitll\'prt fiir die Vertanz der Grundgesamtheit 17 2 zu erh alten.
. 22
(1
= 8
n-
. 11 -
Dip Schätzung der (12
n 1
n
, 'BriBI\~
unterscheidet si ch
VOll
n -I
" (I j - .T)2 L: ;= 1
n
]
(11.6)
der G rundgesamrhelt auf Basis der Stidl pro!ll' der Sti<:hpro!JI'!l\'ariall1 82 a lso nur durch (IPII
K uujidenzint erv flUc
264
Xcnn or. Im ers teren Fall wird durch ri - L im letzteren jedoch du rch II dividlr-rt , Bei gro N' 1l Stich pr oben ist der Br-nx-hnun gs unt orschied bedeutu ngslos, Die g''!iehiitztt· St and ar dabweichung der Gru ndgesamth-it (j ist
'"
v o -, Dur ch d i\' Schätzung VO ll (1 durch dip Stichprobendaten nehmen wir einen zusätzlk-hen Uns lr-herhei rsfuk tor in Ka uf, d a di r St anda rda bwetchung in der Stich probe nicht ide nti sch mit der Sta nda rda bweichung der Grundgesa mt hett sr-in lIlUSS. Dieser Ta tsache t I"ägt man Rechnu ng. ludern m an zur Bestimm ung der Konfidenzi nter valle nich t d ie Z- , sondern die breit ere t- Verteilung heranzieht .
t - Verteilung Die I-\ 'Prtf'ilung ähnelt dPI" Normalvorteilung (vgl . Abbildung 11.5), vartiert aber mit de r Zah l der ..Freihei tsgrade" {abgekür zt df = ,legTt'E'S of frcedom ). I-Verteilu ngen sind Hacher und br eiter als Nortualverteilu ngr-n. weiSP II aber denselben glockcnfömug-n \ 'erl auf auf ~ I it zunehmender Zah l a n Freiheit sgr aden nä hert s ieh d ie t- Verteilung de r Normalverteilung an, wie ma n i n Abbild ung 11.5 sieht . Die 1-Verteilung ist synunet ri s ch zum Mit telwert null. Dip \ 'a rta nz der t-\ 'ortei Iu ng (df / (df - 2)) si nkt mit zunohmnnder Zahl der Freiheit sgrade. ' Bereits bei 29 Freihei tsgraden unt erscheidet sieh die /- \ 'erteil ung ka IIIll nor-h VOll der z-Verteilung. Die Freiheit sgr adt' lassen sich a ls df = n - 1 bes tinunen. wobei 11 der Stichproln-numfang ist. Auch d!e I-\ '('rteilung liegt in Tabellen \"OI" (vgl. Anh a ng A).
Fü r das Konfidenz int erval l erh ält man
.
i ,
UTI'o rt> G"'TIlW
o
+ l (l - 'i :n - l )' r.:
.
v ",
(11.7)
obt'rt> G n.'TIlW
~ Ii l Hilfe des P rogra m ms ALTER aus GSTAT haben wir eine S tich probe von 81 Per sonen aus der bundesdeutschen Bevölkerung gezogen. In der Stichprobe het rägt da s Dur chschnit tsalter i' = :38,57 J a hre lind dip Varianz ,52 = 423.12·19. Xarh C leiclumg 11.6 von Seite 263 seIJätZ('II wir (HI' St au.l ard abcetchnng des Alters in de r (I ruudgesanuheit a uf
Für df < :2 ist dip
\"a ri
cl"r \ '"rt ('illlul\ nicht ddllli"rt.
2ür.
Abhildung 11.5: r-ven cilungcn in Abhängigkeit
\"0111
Freiheit sgrad
I(df=l) I(df=41 1(.11'"· 291
rcu.u
0.3
n,
-;
-,
-" 0..: ''::''' :': ';:' ' ' ' ' '
o
;
iT = J.t23 .12.t9 · ~ = 20 ,7 Jahre. \\'il' möcht en nun m it U5Vtig('1' Vertrau-
enswa hrscheinlichkeit das Konfidenzinte rval l de, Alt ersdurchschnit ts der Gesam tbevölkerun g berechnen: 0 ist also 0.05 bzw 5 % .
~-
38 ,"
I -
t(l _ ~;81 _1 )'
, ~ ...
3<'\ ." , -
t (0 ,9;5;8O) '
20 ,7
V8T :5 11 :5
:38,57 + t( l _ ~ 'ilI _ l)
20 .7
:JR,57 + t (O.9; 5 ;W )
/iIT :5 11 :5
38.57 - l. 9!JO . 2.:~
:5 11 :5
3:U19
:5 I' :5
'
J§T '>0 ...
20 .7 .
JiIT
:J8.57 + i.uao- 2.3
Mit 95%igl'l' Sicherholt überdockt das Intervall [3.,1 Jahre: .,1,1 .Inh re] den Alte rsdurchschnit t in de r Grundgesa mthei t. \\'pil dte St u-hprobe so klein is t . ist der St an da rdfehler des Xlit relwertos grob. Das Konfid enzinrervnll fällt da her seh r breit a ns.
n.. i einer Stich prolll'llgriibe von 121 Befragten UJIII da mi t 120 Freiheitsgraden. Iwträgt der (-\\'Pl't fiir ein zWf'ispitigN; Konfidenzinterval l IH'i I'iner Vertrauenswahrscheinlh-hkeit von 9.j 'X. ( I - i ):I20 = 1 ,9 8 , während der
2ti6
zu die ser Vert raucnswubrscholntichkclt gehörende Z·\ r l'r t ZI _'} = 1,96 ist. Bei "iHN S tichprobe mit I .UUU Befra gten fäll t die Differenz zwischen [: und z-\ r pl"t bereits nicht meh r ins Gpwirht . r-Ta bellen beinhalten f - \ 'f' f t f' i ll1l1gl'lI bis zu 2UO Freiheit sg raden. ßpi gro Molll Süehprobenumfang UJl(1 gro N' r Za h t an Freih eitsgraden , ka nn die a- Vertellung vorwendet werden.
i
;,
(11.8 )
t Z( I _ ") ' -
2 ,fii
~
,,!>t.n.'
(;t'<'mc
Ein absr-hllekendes ß l'ispi pl: Im ALLß US 2UO.t bet r ug d as Kiiqwrg('wicht der in Wt'Stdell tsehla nd befra gten UG:j Fra uen durchschntt thch i' = G9 kg und (j = 11. :2 kg. (Da s Minimum der Verteilung lil'g t bei 3 7 kg. d as Xla ximu m ln-i !GO kg.} Da der St ich probenumfang relat iv gros, ist , wenden wir d ip z- T alu.lle ZUf ß en"l:h nllllg ('itlt's 99'.iHg<'1I Konfidenzintervalls an.
14 2
14.2
:S II :S
69
+ Z(l_~ ) ' J%3
G9 - 2 .51'\ ' - -
:S II :S
(j9
+ 2 ,58 , J963
67,1:;
:S II :S
iO.2
119 -
Z{l_ o,OI ) '
-r-
~ v963
1·1.2
J%3
1-1.2
Das Kör pergewich t westdeu tscher Fr auen lieg t mi t U9 'Xi gl'r \ r llh rsd ll'inlichkcit im Int er vall von 6 7.8 bis 70.2 kg.
11.3 Konfidenzintervall für den Anteilswert fJ Vor der Bundesta gswahl 199.t ermit telte die Forschungsg ruppe Wahlen in einer Umfrage einen Stimmena ntei l \"011 ;
K,mji,I,',ui"telH.
d~1I ,1 " lejl" w~lt
2(i7
0
Die Logik bei der Bild ung eines Konfidenz intervalls fü r Anteilswerte entspricht der fü r Mit te lwerte. In Ka pit el 10 wur de gezeigt , dass sieh a uch Häufi gkelten un d Ant eilswerte bei hinreichend grosem Srichprobenumfang Tl nor r nalum den Parameter der G rundgesam theit 0 mi t einem Staudardfehle r rJp verteilen. Als eine Fa ust rl')!;!"1 für ein "gt'uiigl'uc! groM-s n" gilt Tl • 0 . (1 - 0) 2:: 9. \Y('il 0 unbe kannt ist , wird der Srichprobeuantl'il ]J herangezogen: 11 ' ]J' ( 1 - fJ ) ;?: 9. Im ßt'is pie} r-rhul ten wir also 12GO . 0,07 ' () ,9;~ = 81.375. Auch die Bedi ng ungen i n Gleiclnmg 10.2-1 (S, 2-l9) sind erfüllt. wie man leicht nachrechnen kann . Die a-Transfonuation für d ie A llteih we1"tellcrlei/1l 1l9 laut et
p- H
(11.!J)
, ~--.
",
Das Konfidetuisüeruali für den l/ubeka nnten A llt ei/swelt 0 der Crundgcsamtheit wird nun gehildet, indem -Zl _~ als untere G n>lIzt' und ZI _} als nht'n>Gn'mt' in Gleichung 11.9 t'ingt'Ht'lz t utnl ht' ide Glelchuugeu nach 0 aufgelöst werden. Das Konfid enz interva ll für de n Anteil der Grundgesa mtheit 0 IWfl'eh npI sirh demnach nach
P -
Z (I _ "- } 'rJp
~
::; 0::;
unt<',. (iren,.
r+
(11.10)
Z( l :~l ' rJ~ ,
ob<'.... G ,e n...'
Der St a ndard feh ler des Stichpro henanteilswertes rJp wirdnach GIl'iehung 10.7 (5 . 10.7)
", ~jO. (1 0)
"
ermtuolt. ' Ypil 0 nicht bek annt ist , Ht:hiit:lPIl wir in de r Stichprobe:
p)
rJp
d urch don Ant eilswert
(11.11)
2ti8
Setzen wir
p
up für a p in Gleichung (11.10) ein. .so er halt en wir
. 0""'''' <;",,,,"
pi
.
(11.l2)
ob,'''' G " ,""z P
Anhand dieser Formel könn en wir nun das 95'Xigp Kouüdonz tnte rvall für den Stimmenantei l der FOr er mit teln.
0,0 7·0,9,3
0,0 7·0,93
12:iO
12:iO
+ 1,Ul i , O,IXI7:l
OJ17 - 1,96 ' (J,007:l
:::; 0 :::;
0,07
O,O;).""J!)
:::; 0 :::;
o.osu
Das In te r vall \ '011 3 ,6 l.ls 8,4 % rk-r g ült igen Stimmen iilwnlpf:kt den Stimmenautetl der FOP Ill'i allen W äh lpfIl mit 90 '1cigpl" Wa h rschelnlk-h kett . Dip Wahlkampfstrategen der F OP wären mit dieser Schätzung sir-her ZIIFriede-n. da ,lie Prognose SI'I" st im schlechtesten Fall e inen Einzug in ,11'11 Bundestag beinhaltet,
11.4 Der Einfluss des Stichprobenumfangs lHi ufig sind dip hpl"('(: hnetPll Konhdeuxinter valle zu breit lind damit zu
ungenau. Genauere Schätzungen er hiilt ma n, wenn m an d ip Vertrauenswahrschcinlichkeit verringert oder den Stichprobeuum fang erhöht . ' \'pnn mög lich. ist die Erhöh ung des Stichpro benumfangs vorzuziehen . da sie nicht mit einem Verlust an Präzision einhergeht . "~oie grob der St ichprolx-numfang soln IlI USS , 11m eine bestimmte Genau igkeit der Schätzung zu erzielen. liisst sieh relativ einfach bcstinuuen: Ziel ist ps, die Koniidcneintcruallbrciie (Km) zu verringern. Dip Breite des Konfiden zinterva lls ist nichts anderes als der Abstand zwischen der unt eren lind de r oberen Gn'IlZI'. Fü r die Sti('hprot)('nm ittP!wntl'H'rt t'ilullg bet riigt sit'
am
}{ IIJ = 2 " ZI _ ~ "ar
,
= 2 . z1 Die~e
Gleichung
j
0
",;n "
1ll11~S flUII
nach
11
a ufgelöst werden:
(I LI ' )
Ist a unbekannt , so wird djesos wieder durch CI g(' ~ch ä tz t . Wlr können j et zt lx-rechnen, wle gro b d ie St ichpro be der westdeutschen F rauen im ALLnUS :WÜ.J, sein mü sst e. um den unbekannten Xli u elwcrt 11 d es Körpergewicht s bei einer \ 'er t ra uens wahrs cheinlichkeit Hili 99 % mit einer Konfi den zint ervalllueite von 1 kg zu schätzen . Der zu einem Kontidcnxint er vall von 99 % gehö rende c-Wert bet rägt 2,38, ;' = 14.2 kg.
Um eine Ko nfidenz inte rvallb reite von I kg ZI1 erhalten. müssteil wir a lso ca. 5.4()0 Frauen in Wpstdeutschland befragen. Um die Konfidonzlun-rvallbr eite nochmals a uf 0,5 kg zu halbieren , müssten wir (b ei gleicher Vertrauenswahrscln-inlichkeit ] 21.-.1, 75 - also viermal so viele - Perso nell befragen. Der Srichprohenumfang lII1\~S ver vier facht werden. wenn dip KOlllirlellzIntervallbrett e halbiert worden so ll, weil in Gleichun g (11.1 4) durch die quad rierte KIn dividier t wird. Der St i-hprob-u umfang für Anteilswerte lässt sich a nalo g herleiten und lx-rechnet sich a ls
11 =
-t " Z ~_ J "0(1 -0 ) KI8 2
Ist 0 1I1l1H'kaUlIl, so wird a uch hier (11'r Anteilswert Srhärz ung Ilf'ran gl'zo gen .
(1 1.15) ]J
der Stkhproh(' zur
27U
K uujid" nzint erv flUc
Um vorab den ben öt igten Stichprobenumfang berechnen Z1I können. muss ma n den St andardfehler kennen oder schät zen . Dazu benötigt man (' 111wede r (J bzw. 0 oder (, bzw. p. Im obig en Beispiel Wl1H\l' (j einer schon
durch geführten Unte rsuchung verwandt .
Zusa mme nfass ung In T abolle 11..t s ind dto P un ktschä tzer lind Kunfldonz tntervalle für ~litl ('l lind Ant eilswerte bei unbekannter Varianz der G r uolgcsa mt lu-it angegchcn . In Ka pit el 12 wird im Zus ammenh a ng mit einem Test verfahren d ip Ber echnung eines Konfidenzint ervalls für d ie Differ enz von zwei )' l i t l(' l~ IV(' rt PIl
erläutert . Tabelle 11.1: Pu nkt- und Iute rvallsehätzung P unktschä tzer Mit telwert 11 .r
Sta ndard-
Parameter
fehlet"
A ntl'il
~
p
11:
• ilUS r grS(hM~_t
Die a llgemeine St ru kt ur
VOll
Konfidenz int ervall
:r ± t l -,'i~
P±
,
Zl _'-"
I!i!..=f!.
"
Konftdonztnt er vallen lau tet
Punktschätzer ± Ouentilwert . Standardfehler . Konftdenxlntervalle las sen steh für alle m ög lichen P a ram et er der Grundgesa nu hctt bosrinuucn. In Kapitel 8 wurde mit einer linearen Regression der Einfluss der Les ekenntnisse auf die Xlathcmatikkeumnisse mit de m
IALS l !.l!.l-l für d ie ~ . UG 2 deu tscheu Befra gten ge-c hä tx t . DeI" RegressionskOl'lIiziellt b der Lc'Sc.fä higkp it in der Stirhprol H' heträgl 0,84. Wir mörhten WiSM'Il. wie star k d ie Lesekenntnisse die Xlathe matikkeununsse in der C rundgesanuhe it beeintlnssen. Gesucht is t der uubekanute Regressionskoefftzlonc der Grund gesamth eit ß. Da s Staristik -P rog ru mru Stata gih t für das g;,Cj{jgt' Konfirlonzlntervall die GH'Il ZPII 10 . 8~:0. 8G J a n. ~ ! il 9::iCj{igt'r Wahrschoiulichkcit überdeckt da s Intervall den Regres sionskoeffi zienten der Cruudgesumthcit .
A ufg" lJe"
271
Aufgab en zu Konfidenzintervallen 1. \rll ~ sind Konfideuaiu ter vallo und wozu benöt igt man d i p~l'! 2" W ie verändern ~k h Konhdenzlnte rvalle bf'i: • Vergriibprn ng der St andardabweichung in der Grundgosanuhott? • Vergröi enmg de r Vertrauonswahrschoinlich koit? • Vergröi enmg des Srichprobeuumfan gs"
wurde lx-i 1..474 westdeutscheu Befra gten ein durchschnittliches Mona tsein komme n j: vou 1.8:38.:39 D ~ I er mitt elt . Dil' Staru);mlahwl'id lllng in rler Stit-hpro lH' ir bet rägt 1..4 77,68 D ~ 1. In welchem Ben- k-h li{'gt das durr-hsr-hnit tlir-he Mon atsein kommen alk-r westdeut schen Befragten JI mit 95%ip,p r Wahn;d l('inliehkdt, in welehern Berek-h mit 9!)'ifigpl" wahrsche tnllch kett" 4. Bel der let zten Umfrage der Forschung sgruppe wnhlen vor der Bun desrngswahl 1994 gaben 42,5 % der 1.2;jO Befra gten eine CDU/ CSU· wahlabsieht an. Bit te berech nen Sie das !JIJ 'if igl' Konfideuz intervall fÜI" den Anteil de r COU/CS U unte r allen Wählern, und interpretie ren Sie da s Ergebnis! In der glpid wn Umfrage erhielt d ie P OS J, 5 % l){'i den Befragten, d it' l'lrw Wahlahsk ht iiuN'rtpll . ß l'fl'{:hlwn Sie auch fiir dipsp das 99l': ige Konfitlenz i nt er vall. c . Bitte berech nen Sie, wie grob die Stichprobe der Forschungsgr uppe Wahlen \ "01" der Bundestagswah l 1094 hä tt e sein nuissen , um de r F OP m it einer Genauigkeit von l l': ihr en \\'ähll'ran te il unt er allen \\'äh lern mit !J,j%iW'l" S icherheit schät zen 7 11 können! Verwenden Sie die Angaben ..H IS Tabelle ü.L
;3, Im ,-\LLß US 1!J!J4
12 Hypothesenprüfung 12. \ Grundlagen 12.2 Tl'st d w's Mittelwerts 12.3 Test s für Mittelwertdifferenzen 12.4 X2 _Tl'st auf Unabhängig keit
272
.
275 2tlti 298
Kon fidenz inte rvalle zä hlen zu den SchiitzlJe7jflh ren , da mit einer St ichproIlI' Parameter de r Grumlgesann heit W's<:hättt werden. Eheuso widl ti g ist d ir Fra ge , wif' ma n Hypothesen über eine unbekannt e Grundgesamtheit anhand einer einzi gen S tichprobe testen kann.
Die Reihe der Testverfuhren ist ebenso vielfältig wie die der Schät zverfahren. An dieser Stelle beschränken wir un s a uf Test s Für Mit telwe rte, :\I i t telwer tdifferenven 11 nd den \ 2_ Unabhäng ig keit«test .
12.1 Grundlagen Ausgang-q.unkt eitler Unt ersuchung ist eine JlypotllPSE', d. h. eine noch nicht hewährtE' Au ssagt' Ilher einen Ansschnitt rler sozialen Rea lit ä t. So könnten wir d it' I1ypOtlWSI'1l a ufstellen , da ss Mänuer bessor mit Zahlen um geh en kilnn eu als Fra uen oder die Bildungsbet eilig ung " 011 Kindern vom Bildungsniveau der Elt ern a bhängt . In der Test th eorie ht'zt'irhu t't man dif' Jlypothese, dif' iiht'rpriift werden soll. als Alternat ivhypothese . Diese heinhaltet die t'igen tlkh Juteress toronde Aussagt'. Xlöch ron wir geschler-htss pozifische Unterschiede in don Mathematikkenntnissen prüfen, dun II ste llt die Aussage ,,:\Iiinll er können IwsSt'r mit Zahlen uni gehen als Frauen" die Alterna ti vhypothese da r. Die allgemeine Bezeichnung für d ie Alu-mauvhvpo rhcso ist H...... manchmal auch fl l . .Als C egensr ück zur Alt erna tivhypot hese wird e-ine Nullhy p o t hese formulu-rt. Sie verneint den in der Altemativhypothese beh aupteten Sachverhalt . Dip XulJhypot heM' Z1ll' ge radt' formulie rten Alrernativhypothese würde laut en: ..:'Ilälllwr können nicht IwsSt'r mi t Zahlen unigehen als FraIIPlI" . Die Nullh ypothese behauptet . dass es d('11 in der HA ansged rück ten Unt erschied in den numerischen Fä higkeiten von Xlännem und Fra uen nicht gibt. Fiir die Xullhvpot hes e wird d us Kürzel Ho verwendet.
Gnmdl"yn,
273
Dor (,1"~1t, Sch ritt de r Hypot hes enprüfung Ix-steht in c1N For mulieru ng der Altemarivhvpo t 1H'~p und der dazu kon ku rrierenden ~ ullhypotheso. Sowohl die !f.ot ab a uch die Ho stellen B e haupt u ngen ü ber d ie Gru n d gesamtheit da r. also b,'i~Jlipl~I\·t>isp über d i l~ \r ohnlw\"ölkpfllIlg der Bnudesrepuhli k. Anhand einer Stichprobe soll nun überprüft werden, welche der beiden Aussagen über die Grundgesam t heit . HA " dPI" Ho. zut rifft. Aufgr und der durch Zufalls-chwankungen bedingten Abweichung einer St ichp robe von der Crundge-anuhcit kann t~ jedorh zu zwt'i Fehlentscheidllu,qcn kommen. 1. So könnte n wir aufgruurl der Stichprobe zu der Emsehotdung gelangen. cla~s 1I Hi nnf' r hesse r mit Zahlen umgf'lu'll küuuell Bis Frauen. obwohl in c11'1" Gru ndgesamtheit kein Unterschie d in de n numerischen Fä higkpiten besteht . Dip St jchprobendaten weisen also auf (las Vorlipgl't1 der Altemarivhypothese hin , während tatsächlic h in der Grundgesamtheit die Xullhvpothcsc gilt. Diesen Fehler bei Übertragu ng der Stichpro!wllf'rgt>lmisSf' auf di p Grundgesamtheit nenn t ma n Fehler 1. Art oder a- Fe h le r . Er wird als P rozent wert oder als \ r a hrSl'lwin[jchkpit ausgedrückt lind a uch als l vrt ums u mhrschcinlichkeit !Jl'z('ichtlPt. 2. Zum a nderen könnten wir au f Basis der S tichprobe zu der En tscln-idung gela ngen. dBss geSl'hlt'l:IJtssppzilisdle Unterschiede im Umga ng mit Za hlen nir-ht existieren . o bwohl ~ lälllH'r ratsäc hlich - in c1 E'1" Grundgesamtheit - bessere numerische Fähigkelten ha ben als Fra uen . Entscheiden wir uns aufgrund der Stichprobe für die Nullhypothese. 01>wohl in der Grundgesamt heit d ie Altcmauvhvpcthe«- vorliegt . dann begehen wir deu Fe hler 2 . Ar t bz w. den ß - Fe h le r . Die rkhtigf' Entscheidu ng t reffen wir, wenn die aus der Stichprobe g('folgerte Entscheidu ng m it der Gru ndges amt holt Iihcreinstiuuut. In Talx-l11' 12.1 sin d alle möglichen Entscheidungen aufgefüh rt . DiJ. wir die Urundges am t heit nicht ken nen , können wir n icht mlt Sicherh eit sagen . ob die Ent scheidung a uf Bas is der St ichprobe richt ig ist odt-r falsch. \ r ir kön nen aber di e Wa hrsd willliehkt'it lies 0- und ,ß -Fl'hlt'n; berechnen .
o -Fe hler Um den o - Fchler boree bn en zu können. müssen wir d ie Vert eilung der Stichprobeukeunwerte angeben . IWItIl in der Urundgesamtheit die Xullby-
274
JIYp<Jt" ~s~"p,iifu"!I
Taholte 12.1: Fehlor bei der ll ypor hosen prüfung
In der Gnmdg e.~amthrit
11.
II A
gilt :
Entscheidung aufgr und
110
richtig
ß - Fphlr T
der St ich p robe:
1I.~
c -Fchler
rieb t ig
potlu-se g ilt. Durch den Zentralen G n'llz IH"rtsa lz WiSSI'1l wir llf'ispie1s \\'l'isr , (lass slr-h Xltu olwert e in Sti chprobon normal vertollen. OE']" :-' li U"] II'f' l"t dor Verteilung ist bei Gii]tigkpi l der /10 der durch die Jl rJ postulir-rte Para-
metor. Dip Breit e der Xlitt elwerteverteiluu g lässt sich aus de r Stichprobe schä tzen. Ist die Wah rscheinlichkeit Fiir einen vorliegenden Srk-hprobeukennwer t 011(']" einen noch weiter von der Ho abweichenden Kennwert g' 'rin g, so wirrl d ip ~ l1ll hy pot h ('Sf' verworfen. In der \riSSf'llse!laft haben sich C reuzon ein gebürgert , ab wann ciu St ichprobenkennwert Ilt'i Gii lti gkl,it der 110 als unwahrscheinlich einzustufen ist. Die Gronven befinden steh l)pi () = 5 % bxw. () = 1%" Ist dle " "ahrschetnlichkett für !I"II r-nnittelteu Stichprobenkennwert I'l' i Gii lti gkpit der 110 geringer als 5 % hZII". 1 %, wird die Ho abgelehnt .
Bei dieser Ent scheidun g können wir un s irren. Die wahrscheiulichkel t fÜ I" den ermit telten Stichprobenkennwert be i G ült igkeit der 110 ist zwar gcringer als 5 % hzw. 1 % - wir könn en jl'doth nicht allMwhlil'kn , dass wir eine sehr weit von de r Gr undgesamthalt abweu-hendc Suchprobe gezogen ha ben. () gibt daher die Wahrschetulteh kett an, mit rlr-t- wir uns bl' i Ablehnurig der Xullhyputhoso irren ( Jr1"twll$w (lh r.~rheinlichkeit) . ß- Fe hler BI,i der EnilittllWg de$ ß - Fehler« lautet die Frage: " "ie wahrscheinlich ist das Stithprohl'llngl'l mis, wenn in (11'r G ru utlgl'sallltiwi t die Alte rna tivhypotlll'sl' gilt"? IIiI' r er mitteln wir dip Verteilung de r St.ichprobenketmwer11' bei Gültigkett der Alt emativhvpothese. Ist d!e \Yah rsd winlkhkpit fies Stichprobeu kcn nwcrts lx-i Gült igkeit der HA gering , so verwerfen wir die
Te,t
ci"",
Jfittdwe,t,
27&
Alterna üvhvpor he,e. Auch bet dor Ablehnung der Alt eruativhvpotheso können wir un s irren. d. h. die Alternativhypothose zu Unrecht ablehnen. Die wahrschcinlichkeit für unse-r Stichprobenergebnis oder eine noch g röN'rl' Ahwt'idlll llg von der HA gibt die Griif..\> des ß -Fe hlt' rs an. Ein ß -Fehlt>r wird als akzepta bel a llgl'St'hpn. wenn er kleiner als 20 % ist.
n-Fchler und ß -Fe hlpr verhalten sir-h gegl'nlällfig . .Ji' klei ner der o- Fehler, umso gröN'r de r ~1- F"h l t'r. .Je sicherer wir sein wollen, dass wir die Nullhypo t hl'SP nicht zu Unrecht ablehnen. UI11S0 ehe r lehnen wir die AltomatiYhypo thpSt, zu Unrecht a b.
In der n pgpl wird allerdings nur versucht, di p Wa!l I'M:hpin!ic!lkpit des
0:-
Feh lers gering zu hal ten. Den n 11m d le Kenn wertevert eilung ang eben zu kiinlLl'll. muss Ulan etne präzis!' Annahme iilwl' llit' P a r ameter EIt'r Grundgpsamtlwit ma chen. Dips ist he i der Xullhvpotheso sehr einfach: ste besagt nä mhch uorm a lenl'i'isp, (lass der Zusa m menhang hz w. der U nterschied null ist. In der Alter na t ivhypothese kom m t dagegen meis t IIUf eine ullpräzist, Ann ahme zum Ausdruck. So wird ein Zusanuueuhang postulir-rt. , nicht <11)('1', wie gro~ di E'S E'1' Zusammenhang ist, oder ein Unterschied wird
12,2 Test e ines Mittelwerts Be! r -i uem lI.... po thesentes t wird in folgenden Schritt en vorgegangen: 1. xull- 11 11(1 Alter na tivhypot hese formulieren lind Signifikanz niveau festlegen: 2, Priifg rii!;p (z, B . c-wer t . i- Weft odl'l" \ 2_\\"('rt ) lind Verteilung de r Prüfgröko bes ti mm en; 3, Ablehnungsbereich de r Xullhvporhe«- kenn zeichn en : -I, Priifgrii!;p IWI'P('hnE'1l lind dip Elltsdu-idullg iilwr die l'lll ihy potlwsp treffen. Zunächs t werde n dies !' Schri tt e für den Test ei nes Mittelwerts (bei 1)('kan nt et Varia nz in der Oruudgesamt heit c ) darges tellt:
276
JlYp<Jt" ~s~"p,iifu"!I
1. Null- und Alternativhypoth ese formulieren, Signifikanzniveau festlegen W ir tuöchtr-n wissen . ob d ir Studienzeit in der Politikwissens chaft durch eine andere Form der Bet reuung währ end des St udiums veräurlert wird. rl. h . ob s ie sieh verlängen ,HI,' r verk ürz t. \\' if' d iese andere For m der I1>treuung aussieht , interessiert UIIS jetzt nicht nä her. Um dies zu prüfen. wurden für ein Pilot projek t ;j;j St udierende a usgewä hlt , die anders 1)('-
treut wurden als rlie übrigen Studiereurh-n. Unser e Alternativhypothese besagt , dass anders bot reute Studierende kürzer oder auc h länger st udiere n. Skeptiker behaupten dagegen , dass dle Ar t der Betreuung nichts a n der Studiendauer ändert. Die Studiendauer bei bishortgor und neuer I1>treuung sei ldenrisr-h. Diese Beha up t ung beinhalt et die Xullhypothose. In diese m Boispiel liegt ein e ungr richtrle Altrrnatil'h ypothe$e bzw. ein e
zwe ise it ige Fragest ell u ng vor. da keine Aussage über die Richtung des Unt e rschieds get roff en wird . "Oll einer grrichtrlCll Alten w til'h ypothesr bzw. einer ei nse it ige n Fragestell un g würde mall dagegen sprerhen , \\"1'1111 e twas übe r die Richt ung des Unterschieds ausgesagt wärdo. Dips wär e z. B. dor Fall, wenn wir behaupt en würden , rlass im Pilot proj ek t betreute St udioronde schneller ihr St udi um abschlir-sen. Die Fra ge, ob (' S sich tun eine gel"ichte te od er eine unge rk hte te llvpotheso bxw. eine "inoder zweisc'itigp Fragestellung handelt . wird später fiir die Bestimmung des Ablehnu ngsbereiches wichtig. \\'ie wir vom Studentensekretariat er fahren ha ben. beträ gt rlir- durchsdlllittlidl!' Studiendauer im Fach Po Jitikwissl'lIsr:hal"t hisher im Schnitt 13,5 Semester (J1o) UII(I dit' Stundardahweichung 3.2 Semester (rT ). Die Angaben des Studentensekreta riates sind di e Pa ram et er der Gruudgesa mtholt 1wi bis heri ger Betreuung. Nicht bekannt ist der Mittelwert der O rundges a nu hcit bei anderer Betreuu ng 11. Mlt der Ifo und /JA werden nun unterschiedliche Beha upt ungen iiber den unbeka nnt en Pa ra met er 11 au fgl's tt'11 t .
Nach der r\ullhy!Hlthf'S1' dauert das Studium anders bet reuter Studierender durchschntu tich genauso lange \\'it> bisher:
110
:
11
1' 0
I:L5 Semesu-r.
Te,t
ci"" ,
277
J!ittdweft ,
Die Alt cma t tvhvpot hes o dass anders bet reute Studierende nicht so viel oder mehr Zeit ab bisher zum Erwerb des Examens benötigen , kann man ausdrücken ab:
I/ A :
Jt
f-
/10
i
13,5
Semester.
Getestet wird die lI o. Gepriift wird. ob - bei einer bestimmten Irrtnmswahrschetnlichkeit - das ermit telte Stichprobenergebnis (hle r: durchschnitt.liehe Studlendauor i bt' i neuer Betreuung im P i lol proj pkt ) mit der ;\'1l11hypOlhl'st' ("wa h f!''' durchschnit tliche Studiendauer Ill'i anderer Betreuung beträgt Jl = 13. ;) Semester] vereinbart werden kann. S prich t das ermittelte S tichprobenergebnis gegen die Xullhypothese da nn verwer fen wir diese zugunsren der Alternativhypothese. Lässt sic h das Stichprobent'rgpbnis mi t der :\ullhy potll l'Sf' vereinbaren. dann lehnen wir lhp Xullhypotlll'SI' nicht ab. Ab welchem St ichprobenorgebnls die 1If) verworfen wird. hängt davon ab, welche Irrt ums wahrscheinlich kelt (c-Fehler) bei der Entsr-heldung in Ka uf genom men wird . Denn auch bei G iilti gkl'it der 1/0 kann - anfgmnd der zufälligen Abwetchnng der St ichprobe von der Gnmrlge s amthelt - etn Stichprobonergebnts vorkommen , das weit vom Pa ramotor der G rundgesam theit abweicht (a uch wenn d ies unwahrscheinlich iSI). I n den Sozialwissenschaften ist l'~ üblich. dPJ] o-Fehler nicht griibt' r als O.OG hzw. 5 t;{: werden zn lassen. x tan kann sich dann zu {tuindesteus] I - 0 = O. % hzw. 9G % sidll'f sein, die ;\ullhypot ht'!il:' nicht falschlidll'rweise zu verwerfen. 1 - 0 gtht die VCftmu cn.~l1!ah rsch eifllif"hkcit an. \ \','nll man ga nz sieher gehen will. l.'g t ma n die Irrt ums wah rschelnlichkeit mit ma ximal 1 % fest und kann sieh damit zu (mindes tens] 09 1ft. sicher sein, keinen Fehler zu lx-gehen. Diese Cn-nzwertc fiir die Irr t umswahrschei nlic hkeil {o- Fehler] werden auch a ls Signijika nznivCßu bezeichnet. Die Irrt uni sbzw. \'r'rtralleIlMv
278
JIYp<Jt" ~s~"p,iifu"!I
Unsoro Hypo t hese soll auf ein em Sig nifikanzniveau HlII ::; % getest et wer01'11. \r"k hps Signitikanznivr-a u gewählt wird . hän gt H)lJ den KonsequrnZ('II ab. die mi t r-im-r falschen Entscheid ung ver bunden sind. 2. Prüfgröße und Verteilung der Prüfgröße bestimm en
Xach dem Zentralen G7'(' n zwe rt.~a tz verteilen sieh Stichprobenmittelwert e nor mal IIIll de n Xliuolwcrt der Grundgesamtheit 11 mit PiJU'1ll Standa rdfehler von 171 bei hinreichend groben Stichproben [vgl. Kap itel 10.3). Bel G ült igkeit 11('[ Ho (p. = /10 = 1.3. 5 Semester) verteilen sich die St ich probenmittelwerte normal um 110 = 13.5 Semesu-r mi t dem Standa rdfehler C1 x = a/ .,fii = 3, 2/ $ = 0. 5-1 . Dips!' \ ','rtpiluu g ist in Ab bildun g 1:1.1 (d uf<:hgr m gf'llf' Linie ) dargest ellt. Abbildung
I~ . l; St il'h pro bl'nHJitt l'lw~, rt t,\·t'ftl'i ll1n g~'n
nnt ers rhiedlicln-n Standardfehlern
-.
..........
"
IJ
Il Q
14
mi t Po = 13, 5 und
0,
....... ..... ......
"
"
Wi" man Abblldung 12.1 (durchgezogene Linie) entnehmen kann. ist eine rlurchschnitthche Studiendauer von z. B. l' = 15 Semestern sehr unwahrschelnllch, wenn die durchs chnittliehe Studiendauer in der G rund gesamtheit 13,G Semester 1I11d der St andard fehler U,;).} Semester lx-trä gt . Erzielen wir in der Stichprobe eine n Mittelwert j-. der weit \"011 110 abweicht. so deu te t dies da ra uf hin , dass der Stichprobenmit tel wer t nich t aus einer C rundgesanu heit stammt , in der llip 1\lll1hypot hpsf' gilt .
Te,t
ci"",
279
Jfittdwe,t,
Ob eine best imm te Abweichung .i - 1/0 wahrscheinlich ist oder nicht , hän gt vom Standa rdfehle r des Mit telwerts 17:z ab. W ie wir wissen. wird (11 = (1 /,J1i mit zunehmendem Stichprobenumfa ng 11 u nd kleiner werdender Standardabweichung des ~ 1f'rklllals in der Crundgesautthvit (1 klelner, d. h. dip Verteilung rler Suchprobenmittelwerte wird dann schmaler. Die Sth-hprobenwerte liegen dann näher am Pa ra meter der Grundgesa mtheit . In Abbildung 12.1 is t uebeu der Yert eilung. die im Beispiel vorliegt (/lu = Ll.5. (1:z = 0, 5.1 ). r-iue weitere Verteilu ng (gest riche lte Lin ie] eingeze ichn et , die einen grlit,('\"l'n Stan da rdfehler ( (11 = 1. I) aufwe ist. Ein e durchschni ttliche Studiendauer \"(1I 1 :t = \5 Semest ern (bei 110 = 1:3.5 Semes ter ] ist lll'i einem Standardfehler des Mitt elwerts von 1. I viel wahrsehetnlfchor als bei einem Standardfehler von 0. 5·1. Be! der Berechnung der PrüfgmPe wird deshalb die Abweichung des Stichprolx-nmit n-lwer ts vom Mittelwert (11'r Gr undgesamtheit i: - 1/0 am Standardfehler des Mitt elwerts 17:z relativiert. Die P rüfgriiN' ist bei diesem Test als o einfach der x-transformierte Stichprolx-nmiuclwcrt v:
i - J/o
i - Ilo
(1t
Jii
, ~ --- ~ -
-0 -
'
(12.1)
Die Verteilung der Prüfgröje wird auch ab Testverteilu ng bezeichnet, da a n ihr die 110 geprüft wird . 3 . Abl ehnungsb ereich der Nullh yp othese kennze ichnen Dip Nullhypothese wird abgeleh nt. wen n die \\"a hr.;dll'in!i chkpit dos Stichprobeukennwerts (Prüfgrösc) nder pim'S noch extremeren Ergebnisses bei G iilt igkpit der ~lll lhy p()th psp gl' i"ing ist. Ger ing bei!.t: Die Wa hrsdn-iulichkelt darf nich t grö!.('r als das vcrgegel.ene Signifikanzniveau 0 , also in der Regel 1 % ode r ;j %, werden. Je unwahrscheinlich er ON werr einer Priifgr öso bei G iilti gkpit der llo, 1I1i1S0 wr-iter ltegt er in der Testvert eilung arn Ra nd . Bei ciuor zweiseiti gen Fragest ellung ent spricht die Irr t umswahrscheinlichkeit 0: der Fläche. die an den beiden Rän dern der Verteilun g der Prüfgröje (hier: der z-Verteilung] liegt (\·gL a uch Ab bildung 11.1.5.258 ). Je nach
28U
H IIp1Jt" ts~ fll"ljf1J"!J
die Ftächo entweder nu r am linken / recht en Ra nd oder a n beiden R änder n der Tes tverteilung bet rachtet . Gesucht sind nun dif' zu die ser Flädlt' (zu einem be-titumt en Signifikanzniveau] gf'llürf'lIdp ll G n't1z\\'t'rtr' der Test verteilung. rlif' a ls krit i.•ehe Ir er te (z\\'f'ispit igp Fra gestellung] bzw. als kritische r !Vel·t (pinspit igp Frage- tellun g] bezeichnet werden . Sie grenz t-u den Ablehnungsbereich de r Nullhypo t hese vom Nirb t-Ahlehnungsben-irh ab, Da die P rüfgröt,c z staudardnormulverteilt ist , entnehmen wir die krit ischen lVerl e der Sta ndardlW17IlalvfTt eilll1t!J. Bei der St andardnormalvern-ilung bzw. z- Verteilung der WN t - 1.65 5 % der Flache um Ij'lkell Rand ab. Dip schneidet v , kritischen Worte der Sta nda rd normalverteilu ng s ind i n der Box auf der näe!Jstpll Seit e da rges tellt.
n.
,2_
Bpi Pr üfgrön-n. d ie anders verteilt si nd - 7.. B. oder r-vr-rreilt - , miisdie entsprechenden Vert eilu ngen herangezogen werden . Dip kritis chen " -eft e für die \ 2- oder t- Verteilun g könueu anba nd der Tabellen in Anh ang
M'II
A ermit telt werden. Die krit ische n \ Ve r t e d e r Sta n dar dnor malverte ilung lau ten:
• ei nseitige Fra ges tellung 0
A blehnungsberei ch also: 0
0
-
(X)
bis - 1.65
-
(X)
- 2.:3:\ bis - 2.:3:3
1% Irrt ums wa hrscheinlichkeit links A blehnungsberei ch also:
0
- 1.65
5% Irrt ums wa hrscheinlichkeit links
5% Irrt nmswahrschctuiichkeit rechts Able hnungsbereich also :
1% lr rt muswahrscheinlichkeit rechts
Ablf'hnungsbcreich also:
1.65 1.65 bis 00
2.:3:3 2.3.1 bis 00
• z\\"eist'itigo Fragestellung o 5% Irrt ums wahrscheinltr-hkeit - 1.96 und 1.9G Abh-hnu ngslx-reich also: - 00 bis - l. 9G lind um bis oc
o 1% Irrt ums wahrscheinltr-hkeit - 2.58 und "L58 - 00 bis - 2.58 lind 2.58 bis oc Abh-hnu ngslx-reich also:
281
Tn t ti,ws Milttlwnts
Im gewählten Beispu-l liegt elne ungcrichtetc Altemutivhvpor hese (/1 'I /10) und damit eine zweisei ti.qe Fra.Q estellul/Y vor . Die Irr t ums wahrschein-
lichlc-it ha tten wir mit 5 % all gpsPlzt. ON Standardnormalverteilung entnehmen wir d ie G rPll'I. \H' r tf' ZO.02 5 = - 1,96 1lI111 :::0.9,5 = I.HG, (I. h . nur in
einen z- ' \'(,I"t, der klei ner a ls - 1.9G ud!' !' grö s er als LUG ist. Ist die auf Basis de r Stichprobe der bet re ut en Studio-
:;% der St lohproben erhalten wir
renden lx-rechnete Prüfgr öj,o kleiner als - um oder gröscr als u m. lehnen wir d ie X ull hyputhr'S(' ab. Nimmt die Pr üfgrob - da gegen einen " 'er l zwischen - 1,9ü und 1.% an . dann lehnen wir (lip 7\ull hypollll'sP nicht ab.
:::> 11. 961 z :s:I I, 9tij
-. -.
I l o ahlp!lllPll 110 nicht ablehnen
In Ahhlldung 12.2 ist (11'r Ablehnnngsbereir-h durch d ip grau schraffierte FlJdw dargf'S tPIlt.
Abbi\(lung 12.2: ?wpisr it iger Ablehnnngsbereirh (gra u schralfierte Fläche) bei einem Signifikanzniveau von 5 % in der SIanda rd nor mal vert ei lu ng
z - ·I %
I
z - I .%
I
o +--f'''---+-,---+--,---+--'''' .,....---1 .. c
.,
,
2~2
HyjXJtllt 8fUl"ii/t"'Y
4 . Prüfgr öße berechnen und Entsch eidung üb er die Nu llhypothese t reffe n Die 3::1 im R a hmen der Pilotstudio anders betreuten St udiorendon studicrten im Durchschnitt 12 Seme-u-r. also l, :j Semester welliger als bei bisheriger Betreuu ng. ' \"ir berechnen nun d ie Prüfgröse. um angehen zu können . an welcher Stelle der S ta nd a rdnortualverteiluug d er in der Sti chprobt' ermittelte j' -\rf'r t !if'gt:
12 - 1:1.5 = - 2 3 .2
;r,;
rt
• I.
Fällt die P rüfgröje in den Ablehnungshereich der Xullhypothese. kan n diese a bgeleh nt bzw. .verworfcn': werden. Ik-i Gültigkeit der Nuflhypothe.. SI> ist es dann sehr unwahrsr-heinlich. eine Stkh proh e mit der Ill'o barht t't t'1l Prüfgrö bf' zu erha lten. Fällt dip P r üfg riii.f' da gogon in den .Annahmebereir'h", kan n die Xullhyputh rse nicht verwerfen \\·f'I"(I(>II . Da - 2,77 kleiner als - 1,9G ist, wird die X ull hypotl l('sl>verwo rfen. Der in der Stichprobe ermittelte '\"f'rl ist damit signifikan t.
Hätt en wir in der Stichprobe einen :-' \"(>rt zwischen - I, HG und L !JG ermit telt. dann würden wir di e Xullhvpothose nicht ontetmcn: Das Iwibt jedoch nicht. dass wir dan n d il' ;"\ullhYJlotht 'S(' ann ehmen könnten . ..-\ llM>r der 110 komnu-n a nrh a ndere Pa ramet er der G ru udgl'!;a tut hei t als Erzeuger rles S tichprobenuuttelwer ts in Frage. G l'na u dil's{' lnfonnat icn l iefe r n uns Konfidenz int ervalle.
Konfidenzinte rvall und Sig nifika nzte st Das Konfi denzinterval l für einen St ichpro benmit tel we rt i: lx-rech net sieh bei bekannter Sta ndardabweichung in der Grundgesamtheit o nach G lt>ichung l l. ,j (vgl. Ka pit el 1L S. :WU). In der Stichprobe dvr a nders bet reuten Studierenden wurde eine durchschnittliehe St udienda uer von 12 Semesteru (x ) fpsIgf's l ell t. Gpfra gt wird , 11"0 die d urchschnttt bcbe St ndiondauer 11 ht' i anderer Bet reuun g in de r Grundgesamtheit ltogt , Bei einer Vert raueuswahrscheinlichkeit \"011 !J:j % [bzw. ein er Irrt um swahrs cheinlichkeit von 5 %) result iert
283
Tn t ti,ws Milttlwnts
12 -1.96·
3,2
,ß5 lO.()·l
~ I I-S;
12 -1.96·
s,
!3.0G.
1
~
3, 2
~
Das Intervall [lOH \; 1:1.061 üb erdeckt mit 9:'Yr"iger Wah rscheinlichkeit die durchschnitttlche Studiendauer in der Grundgesamt heit . Das Konfiden zintcrvall uruschliest also nicht den im Signifikanztest durch die Ho pos tulierteu \Yf'rt von 13.5 Semesrem. Wird die Ho in einem Slgnifikanatest bei einem bestimmten Signitikauznlveau () abgeloh nt . dann iibordeckt das für eine Venrauouswahrschetnllchkelt von l - () ber echnete Konfi denzintervall auch nicht den HJI1 der Ho postuli..rten Wert der G rund gesam theit . \YisSl:' n wir auf Basis des Sign ifikauztests nur. dass (bei gegebener Irrt ums wahrscheiulichkeit ] der St ichprobenmit telwert (bei neuer Bet reuung] von 12 Senn-ste rn nicht mit der XulJhypotheSf' vereinbar ist, so gib t uns (las Kontidenzintervall zusätvlich die Informa tion. in welchem Bereich die durchschnitt.liehe Studiendauer bot anderer Bet reuun g in rlr-r Grundgesam theu {bei einer gogobonou Vert ranenswa hrscheiuliehkei t ) Iiegt .
Einseitige Fragestellung Eine einseitige Fragestellung liegt vur, wenn die Alrcrnativhvpothc«- lautet., dass die 11<'111' Betreuungsform dle St udil'lli'l'it verkürzt. Dem Inhalt clpr I"llllhypotl1<'Sf' enrsprh-ht dann clif' T IH'Sf', dass die Studlendaner Ill'i altemariver Betreuung g lpie'h bleibt oder zunimmt.
Ho:
11
2:
I/{J
2: L3.5 und
HA:
I1 < /10
< 13.5
Da die Alternarivhvporhose "im>Vorkürzun g dor Studiendauer pos t uliert . muss eI.>T ges a m te Ableh nun gsbereich links liegen. Bei einer Irr t um s wa hr schei nltchkelt von ;> 'X ergi bt sich ein kr it ischer ' Y .. rt vun c = - 1, 65 (vgl . S. 280). Ist der in der St ichprobe' ormittclte ;;-\ Yert kleiner als - 1t 65 , dann wird die 110 abgelehnt . Ist e-r griikr als - 1. 65, da nn wird die Ho nich t air gelehnt [vgl. zur Kennzelr-hmmg des Al)1f'hl11l1l gs1u>f;>idlf's llPi einseitiger Frages te llun g auch .-l it>Ausführungen auf Seit e 29;)).
284
JIYp<Jt"~s~"p,iifu"!I
z < - 1, 65 z2:: - 1, 63
---+
lloa blpimpil
---+
llo n icht ablehnen
Der Ablehuuugsbereich ist in Abbi ldung 12.3 g rau sch ra tbert dargestellt. Abbil r]nllg 12.3: F:inSl'itip;l'r Ahlehnuugsberek-h (grau schraffierte Fliiehe] bei einem Signifikanzniveau von :J % in der St andardn ormal vert el Inng
o +---r"--,--'---,---+--,---,---"" .,....---1
•
z
Dip P rüfgröl,o bet rä gt z = - 2, 77. wie wir auf S.282 bereits borrehnot hab en. Da die P rüfgrösc z = - 2, 77 kleiner als der krit ische \\"ert z = - 1.65 ist. wird d ir' Null hypothese verwor fen. Die St udiendauer mit TW UI' r n l,t1"\'1I1I llg unterscheidet sich a lso signifikant \'011 der Studiendauer hl'i alte r Bet reuu ng. Wje mall an d('11 Ahlphullllgslll'H'id wlI tn Abbildung 12.2 und Abbildung
12.3 slr-ht , üogen bei einer einseitigen Fra gestellung (gericht!'t!' Altomativhvpothese} schon geringe n' Ab weichun gen in Richtung der Alternativhypo these im Ablehnungsbereich als bei einer zweisei tigen Fragestellung (ungcrichtete Altvruativhypothese]. Ob eine gerichtete od er ung crichtcte AIt!:'rnati\"hypotIIf'SI' formuliert wird, IOUS." vor der Berechnung der Prüfgröw. fpstp;i'Ir'gt werden. Es kann nämlich passieren, d<\ss eine Prü fgriibp he!
einseirigor Fragestellung, nicht aber bei zWl'isei tigl'l" Fr agestellun g slgnifikaut ist . Im Nachhinein eint' ger ichtete Altcrua rivhyp ut hcse aufzustellen (damit eirl1' Prüfgröl-e in (11'11 Ablehnungsberek-h tlpr l\ullhypol ht,Sl' fällt und signifikant wird ). ist nicht. sl'riös.
p-Wert e - e mpirisches Signifikanznivea u xla u kann die Irrtumswahrsclu-inlirhkoit für de n in der Stichprobe ermi ttelten Wert der P rüfgröjc auch genau lx-sti mmen. F ür die einse itige Fragestullu ng im Beispiel ent nimm t man der z-Talx-lle die Fläche, die links vom Wn t der Priifgriib{' - 2,77 liegt, nämlich :::::: 0.0028. Die Wahi"S1:I If'inlichkeit , in (11'r Suchprobe eine n e-wert kleiner als - 2.77 zu er halt en, wenn in der (I rundgesarntheit die 110 gilt, beträgt also 0. 28'iL Die 1rrtumswa hrsch einlich keit für d ie z1J!ci.~ei tige Frage.~ tcl lJJ1lg Iw trägt im Beisp il'l:::::: 0,00;,0, da hier der Ablehnungsbereich (11'r Xul lhvpot he«. a uf beiden Seiten der Vert eilung liegt. Es muss also die Fl fiche, die links von - 2. i7 liegt , zur Flädu-, die sieh recht s von + 2. 77 lx-tindct , addiert wer(11'11 (0. 0028 + 0. 0028 = O. OO;jÜ). Die \Yah l"sdwinlichkeit in der Srichprohe etuen e-wen zu erh alten , der kleiner als - 2. 77 ode r griit.,e r als + 2. 77 ist , wenn in der Grundgesamt heit die gilt, he rriigt 0. 56 %.
"0
Diese für die P riifgriit.t' Iwrl:'(:hllt'lt' "t'llIpiri sche" lrrt umswahrseheiulir-hkeit wird auch als p- Il 'ert hpzpkhlwL 0 1'1' P-\\"Ht giht dif' n'(jh r.~ fh eiTllifhkeit an, bei Gült igkeit der //0 dm Il ert der Pn"ifgriiß e oder einen mit der /lo nocn tuenioer zu »erc innoronden Welt in der Stichprobe zu ctiuiltcn, Die meist en Statistikprog ramme g (,])(, 11 p-\\'er l(' an. Ist der p- \ \'('rt kleiner als das gewä hlt - Signifikanz nivea u n. dann wird die ;'\'ullnypotht'S1' verworfen. ist der /J- \\"I'rt griiM'r , dann wirrl die ?'l1l1hYJlot hf'St' nich t verworfen. » we rt < 0.05 (hz\\". 0.0 1)
-+
fl n ablehnen
lJ-\\"l'rt 2': O. 05 {lww. 0. 0 1)
-+
110 nicht ablehnen
Statlstik- Progranuue gr-hen häutig ZlI'f'iSl'itigp /J-\\'{'rt l" an. Hier wän- dies VOI", muss der zWI'is!'iligp p-\\"prt halbiert \\"('I"(lpII (p = 0, 00;j(j/2 = O. 0028),
p = 0,00rl6, Liegt eine pinspiligp Fragestellung
286
H IIp1J t"ts~fll"ljf1J "!J
Test e ines Mittelwerts bei unbekanntem u Ist die Standa rdabweichung der G rundgesa mt heit er nic ht bekannt. dann wird diese durch d ie Standardabweichung der St ichprobe u gesc hä tzt (vgl. G lr id ulIIg l 1.G. S.1(3). damit (11'r St andanlfehlr-r des a nthme tischen ~lit t PIs ;'~ bes timmt \\'1' 1'1"11'11 kann , Dir P r üfg riibe (vgl. auc h G tetehnn g 12, 1) ist in diese m FilII (mit df = n - l Freiheit sgra den] t- und nicht e- vertoüt .
] - J10
] -
j1o
I ~-- ~-.-
Ur
-7,;
(12·'1
Da die I-Vf>r teilullg breit er als die z- Vertellung ist , sind di" krit ischen Wf>rl E' hir-r gröse r. Bei groseu Stichproben nähern sieh di e krit ischen , r erte beider Verteilungen a n, Bel St ichproben kleiner a ls" = :~o müssen die Mer kmale in der Grundgesamtheit normalverteil t sein .
12.3 Test s für Mittelwertunt erschiede :\Iit diesen Tests werden Hypothesen übor :\litt"lw.' rt ulIt r rschit'(I,' in der G run dges a mt heit ülwrpriifL Eine These wäre , dass der Umga ng mi t Zah leu Xllinnern leichter fällt als Frauen. Untersuchen können wir die These mit den Daten des IALS 1994. die herelts in Kaphel t,:> verwendet wurden. Wir besch ränken uns auc h hie r auf den deutschon Teil des IALS. Xlänner und Frauen können als zwei Stichproben aufgefasst werden. Eine wichtige Fra ge für di e Auswah l ist, ob t'S sieh um urw bhiingigc oder abhiiugiflc Stichprolx-n ha ndelt. Bei unabhängigen Sti ch pro ben beeinfl usst die Auswahl der Element e der einen Stichprobe die Auswahl (11'1' Elemente der anderen Stichprobe nicht. Bei xtäuner» un d Frauen im 1.-\LS handelt ps sich 1ll1l unabhängige Stichproben. weil (Ht' Answah l von xt äuner» un d Frauen unabhä ngig voneinander erfolgt e. Bei
Test s fü r
21:17
Mjltclwelt " f1le1"s e"i{~le
nI L IH'1lI1 in einer Studie Ehepaare untersucht werden. Mäuuor und Fraueiner St ich probe von Ehepart nern können wiederum ab zwei get renn te St ichpro ben behandelt werden. Xlänuor und Fra uen wer den hier jedoch Pli
nicht llnal lhängig voneinander ausgewäh lt . Die llPil!1'I1 Sth-hprohen sind abhängig ("g i. Ka piu- l 12.3.2).
12.3.1 Test für unabhän gige Stich proben Oie xla thcnuuikkemunissc de r im deu tschen Teil des L\ LS befragt en U:38 Mänuor belaufen sich auf d urchsc hn itt lich I I = 296. 1·1 Punkte. Dip 1124 in Deutschla nd befragten Frauen erzi elen dur chsch nit tl ich I2 = 288 , I-J Pun kte. In der Stichprobe schneiden die 1\ län llt'l" den mach etwas hexse r ab ab die Frauen, I l - J"2 = 2%, 1·1 - 288 . I-I = 8 Pu nkte . Die eigentlich lnteressierenrle Frage ist , ob sich die Mathematikkenntnisse von :-' Iälllwrn und Frauen in der Crundgesaruthelt lllltl'rsd wil\t'll.
1. Null- und Alternativh yp othese formulier en , Signifikan zniveau fest legen Die .-\ 1t erna tivhypot Iwst' II A postuliert in llit'St'lIl Fal I. dass ein Unt prs("" il'l! in den numerischon Fähigkeitr-n von :-' lällllt'fIl IIIItI Frauen bestehen. :-'lit der Ho behaupten wir, das s ps keinen Unterschied zwischen Männ em und Frauen gib t. W ir formulieren also eine ungerichre te .-\Ilernati"hypot ln>se.
/12
bz\\".
/1\ - /12 =0
1II 1 //2
bzw .
/11 - /12 / 0
11I
=
Die Irruuus wah rscholnllchkoit setzen wir mi t ;j% ft'lit. Die \ r a hrs("]w illlichkcit. die lJ o abzulehnen, obwohl diese in der Grundgesamtheit gilt , SI) 1l maximal ;j % bet ragen.
2 . Prüfgr ö ße und Ver teilung der Prüfgröße best immen \reil ~ich Stb-hprobeutuit telwvrte l' nach dem Zentralen C rcuzwertsatz norma 1vern-ilcn. sind :-' 1i t t 1'1\\'(,1"1<1 lfferenze n 11nabhä ngiger St irlll.rol)t'n i'1 - i2 in hinreichend gros en Stichproben eben falls normalverteilt. DeI"
H IIp1J t" ts~ fll"ljf1J"!J
Erwartungswert der Stichprolwllmit tE'II\Nt E'H'rt{'ilung ist die Mit telwertdiffercnz in der Grundgesamtheit Jl I - 111;. Auch hier wird vorausgesetzt , dass d il' S t k h prol )('n1\ lll ra ll~(, Tli lIIul 112 hinreichend g ro b sind. a lso /l l > :lO lind 11 2 > :lO. Ist 11, :$ ao oder Jl 1; :5 ;30. dann müssen c!ir :'Ilprk mall ' in der Gnmd!Je.~ am t heit normalverteilt SPill, dam it dir- Mlnelwendtfferenzen in St ichproben norm alvert eilt sind. DE'r Sta nda rdfehler von .c, - 1:2 wird mi t 0 Ü , - .1', ) IWZI'idlllE'L Er gibt an . wie st ark di e Xlim-lwendtffcrouzcn in Stich proben von der Mit telwer tdifferenz der Grundges amtheit abweichen. Auch hier ist eine konkrete Abweichung (.c l- i 2) - ( /1, - /12) Ilt'i einer brelton Kennworteverteilung (grob" r Stu nda rdfehler] wahrscheinlicher als bei einer schm alen Kennwerteverteilung (klein er Standardfehler]. Dip Pnlfgröße z st andardisiert dip Abweichung der xüuelwendtfferenz 1:, - r 2 von dE'1" durch die Ho postulierten Mit telwertdifferenz der Crundgesanuhcit /1, - /12. indem durch de n Standard fohlcr 0 (1 , - 1 2 ) dividiert wird.
z ~ ,(r,,'_---Ci2,,)_---" {J,, "_-~I'"C'!.)
(". :l)
Da hei G iilt igkeit der gewählten Nullhypothese /11- /12 = 0 ist , vereinfacht sich die Form el zu:
.c, -
X2
(" A)
' ~--- .
° (.1' , - .1'2 )
DE' r St andard/ellter dPl' Mill e/wertdifferenz 0 (.1' , - .1', ) ber echnet sich aus den Verlanzen de, xlcr kmals für beid e Gruppen in der Grundges amtheit .
(12.3 )
Sind die Variauzen o i und o~ in ein Crundges aruthcit unbek annt , werden dlese du rch (li e' Srk-hp robe gf'Sf"hä tz t : = S AQ/(nl - I ) IIl1d a~ = 8 ,IQ/( 1I2 - I )) .
ö;
28!J
(12.0)
Setzt mall Cl cichung 12.0 in Gleichung 12..1 ein. erhä lt man ab Priify röß e:
.rl - .r2
, ~---
aü , -.t~ )
~
(i1 -r2)
~ +~
(12.7)
", ",
Da dit:' Prü fgrii~ t:' !lf>i gro~('1l StkhprollPll standardnormalverteilt ist. können die krit isr-hen Werte der z-Tabelle entnommen worden (\·gl. davu auch den A bschnlt t 7 U t- Tests auf S. 291 ). 3. Ablehnungsberekh der Nullh ypoth ese kennzeichnen Bei einem Signifikanzniveau H IIl 0 = 0, 05 = 5 %, einer 7weisI'itigeu Fra gestellung und einer a-verteilten Priifgrilbe müssen die Ix-iden \ r ,,!"te er mit t e!t werden , die lin ks und recbt s von der z- Verteilung jeweils U.1l25 bzw . 2.5 % der C esa mt fläche a bschneiden. Aus de r c-Talx-lte enrnhnmt man für d ie unten' Grenze 20.025 den \ \'ert - I,UÖ und für die ohere G rellzt' Zo.975 den Wert +1,%. Gilt d ie Ho. dann ist die \Yah rsdll' inlirhkPit. einen zWert in der Sti chprobe kleiner als - l, 9Goder gröscr a ls 1,96 m erhalt en, kleiner als 5 %. "' ir lehnen dif> Xullhy polhl'SI' da her a b, wenn d itOPrüfgröbe kleiner als - 1,9ü oder grösor a ls 1,9ü ist. Dip :\ ullhypothcse wird nicht verworfen . weil 11 die Prüfgröt,e zwischen - 1,U6 und 1.00 liegt.
4. Prü[größe berechnen und Entscheidung über die Nullh ypothese treffen
Die aus den Srichprohen geschä tzt e Varianz der Xlat ln-ma tikkr-n nt nisse bet rägt für xlän ner af = 22·t 5 IIl1d für Fra uen af = 1851( Setzt ma ll die Stic hprobenwerte in Gleichu ng 12.i ein. dann er hält man:
z = 2%. 1·1 - 288, 1·1 = 3.98 . 22·15 938
+ 18""
112~
2!.lU
H IIp1Jt" ts~ fll"ljf1J"!J
Da a.!J8 gröscr als + 1.!J{j ist . kan n die Nullhypot hese verworfen werden. Der Unt erschied in den Ma t hem a tik konnuussen H lII Xlänner u und Fra uen ist sig uifik
Konfide nzint erva fl Auch hier soll zum \'ergleic:h das Konfidenzintervall berechnet werden . Das Konüdonz tnter vall fiir Mit telwertdüferen zen (I)pi hinreic hend gros eu Srir-hproben ] lässt sic h ga nz einfach bes timmen .
Qlx' f1'
.
1.; ,..,,,,,,
I , - 1'2 lx-t rä g t + 8 , der Standa rdfehler OÜ 1 -~2 ) wird du rch G leic hun g IZ.G besttmnn. Set zt mall die wert e ein, resul t iert bei einem e-wcn von 1,9ü für eine Vert r uueuswah rscheluhchkcit von 90 %
8 - 1.% .
22-1;:; 9.18
+
1858 I J:l ·}
4.l
S +I .!Jü ·
22-15 9:18
1858
+ 112.J
11,9 .
Das In te r vall [4 ,I; 11.9J überdeckt mit 90 % ig PI' Wahrschoinltchkett die D tffercnz in den Mathr-mar ikkennt nissen von M än uern und Frauen . Da s 1(0 11fidenzint ervall umscblics t nicht den HIIl der Nullhypothese pos t ulier ten Wer t (li, - Jl2 = 0).
St ati sti sche Signifikanz und prakti sche Bede ut sa mkeit Durch den Test für xliu elwertrlifferenzen wurde ein signi fikanter UnIerschied in den Mat hemattkkenmutss en von Mä nnem u nd Fra uen fest gest eilt. ~ Ii t hohe]" Wa hrschelnltchkcit verfü gen Xl änucr in (\1' 1' Crundgcsa mt hcit üb er bessere F äh igkeiten im Bereich All ta gsmat hematik .
2!H
Sratis t ischo Signifikanz soll te jedoch nicht mi t pra ktisch er ß cdout samk clt verwech selt werden. ln Kapitel i .0 wurde die Stärke des Zusam men ha ngs z wi ~dll'1i dem Geschlecht und de n Kennmissen in Alltagsmat hematik mit 2 1/ quantifiziert, Lt'(liglidl ru nd 0.8 % der Unterschiede in den Xlathemati kkenntnlsse n las-a-n steh durch das Geschlecht erklären. Zur Erklärung der Xlathemntikkenntnlsse der Befragt en im [ALS 1 9[)~ ist das Ge~chlech t pra ktisch l.cdeut nngslos. Zusammenfa ssend kan n ma n lx-lde Befun de auch so ausdrücken: Die et was besseren Mathematikkennt n isse der xtänner in der St kh prohl' Iws tf'lWll mit hohe r \\'ahrsdll:'illlk hkeit auch in der Grundgesa uuheit {Deutschland 1994). St ntistischc Sign ifikanz hängt YO Il zwt-i Faktoren ab: de r Stärke des Effekts und der Gri)M' der Sti chprobe. Ist d it, St ichprobe gro b. da nn ist der St anda rdfehler kloln lind die Keunwcrt cvertellung schmal. Xlit sehr grosen Stichproben lasse n sich des halb ben-its geringe Unterschiode und schwaehe Zusanuucnhänge in der C run-tgesa mtbcit nachweisen. Ein statistisch signifi kantes Ergehnis llIUSS also inh al tlich nicht bedeutsam sein. Umgekehr t ist ein starker Zusam menhang od pr Unt erschied in der Stkhp robe wenig allssagekräftig, wenn er nicht au f die Grundgesamt heit übortragon werden kann - alsos ta tis tisch nicht signifikant ist.
t -Te sts Statistikprogramme führen einen exa kt en 1- un d nicht d en oben augegebe1lE'1l e-Test dur ch . Xllt einem t-Test wird die Unsicherheit berürksichtigt . die mit der Schätzu ng des Standardfehlers dur ch d ie St ichprobendaten verbunden ist. Vor allem bei kleinen Stiohprolu-n ist d ies von Bedeut un g. Bpi grot.I'11 Stichproben - wie im obigen Beispil'1 - macht PS keinen Unters chiod. ob die Ablehnungsbereieho anhand der t- oder der a- Vertoilung omutu-lt werden. ~ I it zunehmender Stichprobengröke 11 nä hert sich die f-\'erteilu ng einer e-Yeru-ilung an. Boi einer t-Verteilung der P rüfgröke müss en die Freiheit sgrade best immt werden. Die Erm it tlun g de r Freiheitsgrade bei einer 1-\ 'ert eilung der P riifgrö bp in Gleidl1lng 12.6 ist aufwändig (vgl. Sachs 2U06. 3.\0). (Das ist auch der G rund. warum in Statlstik- Lehrhüchem a pproxima tiv von eitIP I' a- Vertoüung ausgegangen wird) . Suta ertuittelt mit einem r-Test (für i- aD einen f- \\'"rt von a. 9 i IIPi df = 19IG.i9 Frethoi tsg raden. Die untere G renze des von Stau ausgegebenen 9ilo/rigen Konfidenzin tervalls liegt
ur
lx-i ,1. 1. die (1)(']"(' Grenze tx-i 11.9 - . Die Werr o s ind a lso fast ldenrisr-h mit den ob en berechneten. St at ist ikprogramuu- biet Pli a nkerdem euwn 1- TPS t für ~ li t t elwertw rglf'idll' an , Wf'1lI1 davon ausgegangen werde n kann , dass r\ir' [unbeka nuu.n] Varianzen (]~ und a~ in II('r G rundgesamtheit id..utisch sind . Oh in der Grundgesamt hei t gleiche oder ungleiche \ uneuzen vor!legen . kann d urch r-i nen weiteren Test - den F~ TI>;;t - geprüft werden. l Im Beispiel wird die An na hme gb-icher Varianzen c1.. r Xla rhcmat ikkcn nt uisse für ~[ällllt'r und für Fra uen in der GnuHIgI'Mmtlwit abgelr-hnt. Ist dip Annahme glt'iche r \ 'ar iallzPII gen'clu fertigt , da nn kann a- 2 für be irlt' Gruppen gemeinsam gpSdlätl t werden (AgH'sti lind Finlay 2008,197). Dip Er mitt lun g de r Freiheusgrado ist Iwi Annahme \'011 \ 'arianzhomogf'nität einfa ch (111 = 111 + n 2 ~ 2).
12.3.2 Te st für abhängige Stichproben Ein typisches Beis piel für a hhiingige Stichproben sind \ \"il'd l'rholllllgsllH'Ssungen a n ein und denselben PersOTwII. wie s ie r, n. vorliegen würden. wenn S t udie rende zu np gilln und Zlllll Ende eines St a tistikkurses eine Klau sur schreiben würden. F ür dteso Studierenden h ät te man dann j E'weils zwei Klausur noten. die man wiederum als zwoi Süchproben a uffass en kann - allerdings a ls fJbhiillgige oder gfJ!Ilflrl e Sti chprollCfl. ß .'i abhän gigpn Snrhprohen ist jhlt' der beiden Stirhprohen gleich gr o k rla der \\"I'rt in einer Stichprobe mit einem \\"ert a us der anderen St.ie-hprohe verbunden sein muss. Uns interessiert , o h Statistik kurse S tatistikkenntnisse verbes s er n. Zur Überprüfung der Hypothese haben wir aus a llen Stat jsrikku rsen - da s nl'ispi\'1 ist erfunde n - eine Zufallsstfr-hprohe von :12 Studierenden gezogeu. Zu Semesterbeginn als auch zum Abschluss des Semesters ha ben d il' 32 zufällig a usgewählten St udieren den eine Kla us ur gesch rieben. Als Ind ikat or fü r die Kennt nisse in Sta t istik wird die P unk teza hl in jt'{lt'r Kla usur her a ngezogen . Für j eden Studiorendon liegt " in Paa r H ili :-' 1t'ssIH'rtcn vur, für da s die Differenz d, berech net 1\'\'1"<1 \'11 ka nn : Ein F-T,'st w tzt uorrllah" 'rw ilt" ;\I,'r klllall' in d," Gn uulgt,;;alUlh ,'il (!) \"o, ,,us. " '"il d ip ;\h 'l.h t'wa t.ikkt'lIUIUi,;s\' \"<)11 ;\l iimwfIl (lud Frauen in
d, =
~ '('sswt>rt
in Stkhprolw :2 -
~It>s.~ wf'rt
in Sti dl pro bl' 1 .
ken nzeichnet dabei den Laufindex fiir dlo Paart', der im Beis piel von i = 11 = 32 läu ft. d; gibt hin die Differenz zwischen de r Allzahl dpr Pu nkte in der vweltennnd erst en Kla usur für einen Studieremleu (ein Paa r von ~ rf'SSwl'rtf'll ) an. Dit>S1' Difft,ft'nz wird für alle :32 Studierenden ermittel t .
1
i
= I bis
~ Ia n kan n nun fiir die se gemessenen Differenzen d, das artt hmeüsche Mittel i"d berechnen und die Staudardabwcichuug für die G rundgesa mtheit i:rd sehät7.t'll.
_ Jd
" l:d, i~ 1
= - -
"
t (d; - i"d)2 t7d = '''~"'-,,--~-
(12.9)
(12.10)
Das ari thmetische Xlitt el lH't rägt im Beispiel 13 P un kte, die gf's('häl1 tf' Staudardabwetchung Ci P unkte , also Jd = J:3 und (jd = U. Durchschnittlieh wurden in der zweiten Kla usur also 1:3 P unkte llIP 11f erviolt als in der erst en Kla usur. Geprüft werden soll nun . ob aus der ennit telten durchsch n it t I icheu Difforcnz in der SIichprobe i"d a lieh au f eine durrhsch ni I t I irhe Differenz in 111'1" Crundg-sanu lu-it lid gesrhlossen werd en kan n.
1. Nulf- und Alternativhypothese formulier en , Signifikan zniveeu festl egen Die Alternativhypot hese lautet: .,Dir Statlxri kkennmisse werden durc h d ie Kursteil nahme verbessert .': Als Nullhypothese formuli eren wir: .Di e Stntistikkcnn misse werden d urch die Ku rsteilnahme nicht verbessert.' .Xich t verbesse rt- kann sowohl "gh'k h bll'i1Jf'II" als au ch .ve rscbbchr em- hedenten. Die Xullhypothese gibt hie r also einen Bereich a n. Dips ist im mer
der Fall. wenn die Alternativhypothese gerich tet ist . also eine r-inseirige Fra gest ellung vorlie gt.
Ho ;
J1d :5 0
HA ;
Jld >O
~ [i t li d wird hie r der Mitt elwett der Diff erenzen in de r Orundgcsaunheit bez('id l1lH (im Unterschied zur Diffn Cllz der Mitt eluxrte 111 - 111 heim Tes t fiir un ab hän gtgo Stichproben] .
\\'ir legen die l rrt ums wahrschcinlirh koit (Stgnifikanznivea u] mit a = 0.01 = I % fest. da wir bei einer Ablehnung der X ullhypothe,e sehr slcbcr gehen wolle n. Xlit der formu lierten Null hypothese Jld :5 0 sind meh re re Verteilungen d er G mndgesanuhelt vereinba r. So könntp tn Wahrln-it die durchsdmit t lidnDifferenz l id = 0 Sp ill , sio kiillntl' aber auch Jld = - I sein, Jld = - 2 od er li d = - :1$ 5 etc. lx-n-agen , also völlig lwliphigl' Wer te kleiner null annehmen . Um die kri tischen Wert e best lmnu-n zu können. lx-nötigen wir a ber eine konk rete Anna hme iiber li d. \\'('khl' konkrete Anna hm e iiber d ie G rund gesamthei t bei G ült igkeit diosor Ho soll nun gemacht wt'rd,'u "!
Einseit iger Ablehnungs berei ch Die Lös ung des P roblems is t einfach un d soll ganz allgemei n am Beispiel einer Xormalvert eilung veransrhaulu-ht werden. \\'ir betrarhu-n dle FHidlf' a m recht en Ra nd der Vorteilu ng. da die Alternauvhypothe«. im ß t'ispil'l j a \\"" rt t' griibl'r als nnll postu liert und der Abh-hnungsben-irh der Xullhvporhese (in Gröb" der l rrt um swabrschein li..hkeit o} am rechten Ra nd der Verteilung liegen IllU SS. Eine Grundg es a mtheit . in der 11 = 0 gilt , bewirkt in GO% aller St ichproben einen Mirtelwert grübl'r U. Eine G rundgesa mtheit da gegen , in der r, ß . 11 = - I gilt. produzier t dagegen in GO% aller St ichprohell einen \Yert grö b!.'r als - I. Dies bedeutet. dass (li,· Wahrs cheinlichkeit für einen \ \"prt griiN'r 0 bei der Grundgesa ruthelt mit 11 = 0 ;")0 % be trägt , hl'i de r Grundgesamtholt mi t 11 = - 1 aber geringer als GO% sein muss.
Abbildung 12.4 zeigt zwei Kcnuwertcvcrtcilu ngcn . eiI\(' basierend a uf der Annahme JI = 0 (durchgezogene Linie ). die andere für die' Anna hme
I/ = - 1 (gest richolro Linie). DiE' Wahrscheinlichkelt. lx-i 1I = - I einen Stichprobcnkennvo-r t zu erhalten. der gröbe r als 0 ist , ern spricht gellau de r ganz dunkel S(:h ra lfierlf'1l Fläd lp. Dip ga nz dunkle Fl äche gibt also die Irrt nms wah rscheinliehkett für Werto g rüber un d gle ich nul l an , wenn in de r Grundgesamt heit I/ = - 1 gilt, Bei 11 = 0 ents pricht die Irrtums wah rschelnliclrkelt für den \ r t'rl null aher der gesamten sch ra ffiert en F läche. Die Irrtums wah rscheinlichkelt iSI für einen gogclx-ncn St ichprobenkennwert in eine r Ken nwerteverteil ung mit 11 = 0 griilM'T als für jede Keuuwert everu-ilung in de r 1I < 0 ist.
Abbild ung 12A: IITI umswahrschein lich l e-iten für den \ Vert 0 Iwi vr-rschiedenen Xullhypot hosen 11 :::; 0
'.-, 0.3
\.
0.2
\ \
..... 3
Aus diesem Gru nd wird auch dann.
\\"1'1111
die :\ullhypot ht'Sl' eine n Bereich
a ngibt , dir 1\lllJhypothrS(' I/ = 0 gPt f'Stf't .2 Ge nau d ies ha ben wir bei dem
ein seitigen TE'St eines Xltt n-lwcrt s bon-lt s get a n. Do rt wurde ta tsä chlich die Nullh ypothese 11 = I:t ;i ge testet (vgt. S. 28.3).
2. Prüfgröße und Verteilung der Prüfgröße bestimm en Bpi hinreichend gro ~pn St h-hproben . rl. h. mehr als 3U ~ lpss\\·t'rt paarpn , verteilen sich die ;-j rit hmet Ischen ~ Ii t te l der Diti ere n ZPIl ;-jUS St ich proln-n .rd 2
Ui,'!; Kilt m,tlirli,.h auch fiir {'inp :'\ullhYI'0tllPs, ', di,' null (jl :::: 0) l' '-'''t uliNt .
P;lIPIj
WPrt grijl,c'r oder glp;,.h
2!.l6
H IIp1Jt" ts~ fll"ljf1J"!J
ann ähernd no rma l U111 das arit hmot isrhe ~ Ii tt "l der Differenz der Gru ndgesa mt heit Jl d mit einem Standardfehler VOll (71,,. Bei der Berechnung rler P riifgröw. wird berür-ksk-htigt , wir g ro ~ der ~[i t, telwert de r Differenzen Xd in der Stk-hprobe im \ 'prglt'k h ZUllI Mittelwert der Differen zen in der G rundgesamtheu Jl d (Iwi Giiit igh'i t rler Nullhypothese] ist. Der Unter schied zwischen dem Mi ttelwert der Differen zen in der Stichprobe und der G rundgesa mtheit 1'd - Jl d IIl USS auc h hier an der Breit e der Kennwert everteilung. dem Stnndardjchlcr t! ('S Xlinelwt-rts der Differenzen (11./, relativiert. werden. Ist (11' r St andardfehler U l ,l grot-. [z.B. weil dn StichprolwlIlllllfang gering ist ), dann sind gn lt-.t' Abweichungen .td - Jl d wahrscheinlicher als Iwi kleinem St andardfehler.
Da der Standardfehler (,I J au f Basis der Stichprobe gt>Sdl ät zt wird. ist die Prüfgröke (mit df = 11 - I Freiheitsgraden ) t-vertcilt:
1'd -
Jl d
(12.11)
t ~ -_- .
1Y1.,
Bei der hier gewä hlten Nullhypothese nung zu:
1'd - O
Xd
U :t ./
(11 ./
t ~ _ - ~ _ -
Jl d =
O. vereinfacht sich d ie Beroc h-
(12.12)
Der Standardfehler des ari th metischen Xlittels der Diffe renzen (1 1" beroch sich a us de-m Stichprobenumfang Tl und der Standard abweichung der Differenzen in der Grundgesamtheit .
net
(12.13)
\\'inl d ip Standardabweichung de r G rn ndg('slIllItJwit (1d wie hier du rch die Stir-hprobe gf'Schiitzt (,d (wobe i zur Berechnung von Gd die SAQd d urch 71 - 1 ~ 1f'sslI"prt pai'lr.' dividiert wird ), lautet dte Glf'idl1lllg:
Te,t, für
Mjltclwelt " f1le1", e"i{~le
2!)7
(12.1') Der gl'l:whät7te Standardfehler dl'~ arithmet ischen :\Iit t (,b der Differenzen nun in C leiclumg 12. 12 eingesetz t , womit wir d ie Prüfgriik 1)('rechnen können:
u:t" wird
(l 2.Ei)
3 . Ablehnungsb ereich der Nullh yp othese kennze ichnen I Frviheitsgrarleu r-verteilt . Die Irrtumswahr= 0.01 = 1% fp:-;l geS('tzt. Da die Altomativhypothese eine Vorbesserung der St attstikkennr ntsse lx-haupr et. IIlUs..<; der gesamte Ablehnungsbereich der Nullhypot hese am recht en Rand der t- Vert eilu ng liegen. \Yir suchen also den l-' Yerl . der bei einer Verteilung mit 31 Frolholts graden am rechten Ende der Vorteilung 0. 0 1 der Fläche abschneidet. In der t-Tabelle im Anhang sind im Ko pf de r Tabelle die Flächen . die links von don t-"'ert t'n liegen. Die
P r ü fgrö ~p
ist mit
Tl -
scheinlichkr-it wurde mit
0
Die kritische Grenze losen wir daher Iwi einem 1 'X.igt'll Signifikanznivea u an der Stelle t ( I _0.OI :3 1) ab. Am; der r-Tabclle entnehmen wir für dl = :10 (da die ' Y!'rtt' für eine Verteilung mit dl = 31 in der Ta belle nicht vorliegen] in der Spalt e ( 1 - n ) = O. !)!) den \Yerl 2,4;)7. Dte Wahrseheinliehkott bei Gültigkeit der Ho I-\Yl'rlt' zuerhalten , die g rü ~{'r als 2 A G sind . ist kloiner als 1 %. Soldw Abweichungen sind bei Gülti gkeit der :\'Ililhypot!ws(' also sehr unwah rscheinlich. \Yir lohnon die Nullhypothese daher ab . \\"('1111 die P rüfgröj,c grök r als 2A G ist . Die Xullhvpothes- wird angenommen. wenn die P r iifgröbt' kleiner als l A G ist .
t > 2.4fi
--.
l S 2, ,16
--.
lloa hl('llIlt'll U o n icht ablehnen
4 . Prüfgr öße berechnen und Entsch eidung über d ie Nullh ypothese t reffen
.fd 13 I = -:- = """'6 = 12.26.
~
m
Da 12,26 gri.ibPI" als 2...16 ist , kann die Xullhyputhcse ver worfen werden. Die \ 'prIWSSf'rllllg; in der St atlst ikklausn r du rch den Besuch lies St at ist ikknr ses UIlI durchschnitt lich 13 P unkte ist hOt:hsignifikan t.
12.4
X 2 ~ Test
a uf Unabhän gigkeit
Ein Test für l\il' Unabhängigkeit \'011 zwei dis kre ten Merkmalen ist dpr \2_ Una hhällgigk(,itstPst : 1 Die P rüfgröt-l' dieses Tests ist d as :-'Ia l> ~\ 2 . das wir in Ka pitel 7.3. 1 eingeführt ha ben . ;>. Iit dem \ 2- Una hhä ngigkpiISIf's t wird geprüft , o b zwei x lcrkmalo in der Grundgesamtheit una bhängig sind.
Unn-rsncht wpn Ieu soll de r Znsa lllllwn hang I\\"isdwn dem Gf'schlech t nn d der Einst ell ung 111m Schwa ugersehaftsa bbruch. Im A LLDUS 1906 wur-
den zum Schwangerschaftsa bbruch eine Rei he von Fragen gest ell t. Gefragt wurde unter anderem. ob t'S gesutzlirh möglich oder nicht möglk-h sein sollte, dass eine Fra u eine n Schwangerschaftsabbruch vomehrneu lässt, 1\l1a1>hä ngig davon. \wkhl' (Iründe ste ha t. Das folgl'wip ß l'ispif'1 Iwst:!lrä nkt sich auf Wostdeu tschland.
1. Null- und Alternativh yp othese formulier en, Sig nifika nz niveau fest legen \ rie bei jedem Test werden nmächst ll vpot heen iilwl" die G rundgesamtheit - im ß pis piei also \\'f' stlIl'lltschian d - aufgestellt . \ n r vermuten. dass Frauen eher als xtänner der Meinung sind, r-in Schwangerschaftsablmu-h stIlle legal sein. Dies ist die Alternativhypothese 11,1 . (Hof' eine n Zusammenhan g zwtschon den Iw ir1('11 Merkmalen Geschlecht und Einstellung zum 3
j)" r hi", Iwh,lIId"lt" \ 2_1' '''1 ist "in TI",t für ll""hhillllliW ' Stid'l'roll<'lI . n pi ubhänKill"" Stid'l'rol"'ll miisM'll "",I<'rl' \"p,falorpll lUlK"W"1UI"t m.'rd t'll.
\ 2. T,'st auf U" " bllä" yigkr it
Schwangersr-haftsabbruch pos tulle rt . Die Beha uptung, dass keln Zu-ammenhang zwischen dem Gt's("hlpfhl und der Elnstollung zum Schwangerscheftsabbruch existiert , entspricht dem Inhalt der Nullh ypo these. Die 1/0 lalltet also. dass ein Zusammenhang zwischen beiden Merkmalen in der Grundgesamtheit nicht existiert .
110
Oie Merk male sind st atlxtisch una bhängig .
;
Oie
I/ A ;
~ lrrk lll alt'
sind statist ist:h abhängif(.
Die Nullhypothese soll au f einem Signifikan znivea u de n.
VOll
iJ<;{ getestet wer-
2. Prüfgröße und Verteilung der Prüfgröße bestimmen Wlr haben in Ka pit el 1.1 gesehen, dass bei st atistisch er Unabhängigkeit die prozentuale Verteilung des abhängigen Merk mals für je"t' Ausprägung dos unabhängigen Merkmals identisch ist . Oie bei statist ischer Una bh ängigkelt erwar t e ten H äufig ke it en f di j ) lassen sich nach Gleicbung 7.1 (S. 144) ermittel n:
f, .
chj )
=
Zeilensufllllle · Spaltt'nslllllllle 71
( 11 .16)
Die Ta belle. die (lip erwartete n Häufigkeitr-n beinhal t et , wird a ls Indifferenztabolle bezeichnet. Be! einem \ 2_Tt'S t werden dle erwarteten lläuHgkeiten m it den in der Sliehprolw b eo bachtete n H äufigke it e n fb (ij ) verglichen. Je gfübef die Differenz zwischen beobachtet en und erwarteten \Yt'l"tI'1I f b< ij ) - f C( ij ) , UIll SO s t ärker weichen die beobachteten Ha ufigkeit en vom ~ 10l11'1l statistischer Una bhängigkeit ab. Da die Sum me dPf einfachen Oifferonzeu für a lle Zellen null ist , werden die Differenzen quadrier t. Grö bt'fe Abweichungen worde n hierdurch s t ärkor gewichtet als klotno. D ip quadrtcrte Abweichung in einer Zelle (fb{ii ) - f e(ij ) )2 wird auscrrh-m d urch d ie erwartete H äufig keit f e(ij ) div idiert. da ein t' bestimmt e Abweichun g bei einer kleinen erwarteten Häufigkeit stärker ins Cewicht fallt als bei einer gro ~,e n .
:'IUU
H IIp1J t"ts~fll"ljf1J"!J
Zur Berechnung von -\2 (P riifgröN') werden dio quadriert en und relutiviertcn Abwcichungcn aller Zollen addier t (vg l. Gleichung 7.8).
(1:2.1 7)
, 2 nimmt den , r t'rt null an, wenn beobachtete lind erwart ete Häufigkeiu-n in allen Zellen hereinst i nun en. Es wi rd 11TIlSO grübel", j e weit er hcob.uhtet c und er wartete Häufigkelt en ausein anderfallen. ü
Auch wenn hl'irlt· ~ 1l'l" k lll il ll' in de r Gruudgesamtbcit slil tis tiseh unabhängig sind . kan n 1ll (\ 11 - a ufgründ mfalligl'r Abweichungen der SI ichprobe von der C rundgesamthei t -. nicht davon ausgehen , dass (11r für t-im- St iehprolJl' ormlt tolre X2 _Wl,rt exakt nul l ist. DiE' ., 2_Yertpilung gibt die Wahrschein lichkeil von X2-Wl'rt en bei gegebenen df in St ichproben an, wenn in der G run dgesamth eit die Nullhypothes e gilt. x2 -Vert eilu ng
Die X 2 - Verte ilun g iSI im C egcnsa tz zur z- 111111 1-Verteilung keine symmet rische Verteilung. Ihre FIJrIll nnd Lage ist a bhängig von de r Zahl der Fr e ih eitsgrad e (rif) . \ril' man in Ab bi ldun g 12.5 sieh t , versehiebt sieh die ' ·ert l'ilung mit zunohruenden Frelheitsgruden auf der .r-Aehse weiter nach recht s. Der Mit telwe rt der ,2.'·erlt'i!lIng ents pricht der Zahl der Frelheit sgrade (dJ), während die Varia nz sich ll11S 2 · df er gibt . Die Freiheitsgrade werden bei einem , 2- Unllbhä llgigh· itslt'st aus der Zahl der Spalten lind de r Zahl de r Zf'i1l'1I Lerechner ,
df = (Zahl der Zeilen - I) · (Zahl der Spalten - 1)
(12.18)
Der \ 2_Wf'T l einer Tabelle mit 5 Zf'i1PIl lind ..\ Spalten ha t also (5 - 1) ' (,I - 1) = 12 Freiheitsgrade. Die Freiheusgrade gobeu a n, wie viele der
Zelleninhalte einer Tabelle (bf'i gegebener Rand ven eilung] frri variieren können. bevor d le anderen Zelleninhalte fes tgelegt sind. In einer :1 x 2Tabelle kan n (2 - 1) · (2 - 1) = 1 Zelleninhalt frei variieren. Logt ma n
\ 2. T~31 (1U1
U,,,,bluiuyi!Jkeit
3Ul
X ~ df-l)
u.e
X'l df=31 X ~ d f~ ~ 1
X' ldf ' IO,
0.3
u.z
,,r,.,, , ~ \ ,: \, \ ~
I,,..
~ / -' ,-
o,
....
"," ,
1\ I ", 1 __
;<,
o
1
2
3
..
_
' ........ -"'- .... ./ .. ~ ....
4
~~~
~
(,
7
K
-
~
"'::- __
---
9
10 11 12 1.'
14 15 16 17 I K 19 20
einen Zelleninhalt fest , dann können bei
f'illl'l":1 x z-Tabelle 1'1111' anderen Zellhäufigkelte n als Differenz zu den Ha ndh äufigkelten ermittelt werden.
Die Prüfgr M;p ist al1(>rd inl,'S nur dann \ 2-\'f'rtpilt.. wenn die erwart eten Häufigkeitr-n l eW ) in de n Zellen gro ~ w'nug sind . Als Faustr egelwird angf'gf'bf'll, dass dir er wartete H äufigkeit ! . (iil in je der Zelle gr öße r a ls fü nf ist . Ist dirs nicht der Fall. da nn könne n - sofern dies slunvoll erscheint - Ka tegonen zusammengefasst werden. bevor der T est durchgerührt wird. Ans onsten sollte ein Test fÜI" kleine Zellbesetzungen vorwendet werde n (vgl. Ag rcs t i 1\)90 . S . :J\) -~;j ) .
3, Ablehnungsber eich der Nullhypoth ese kenn zeichn en Bei einem .\2~T(,s l ü;t die Frage, wie wahrscheinlich der beobachtete 011('1" ein noch grüN'r!']" .\ 2'\\'''l"t hei Gü lti gkeit der Xullhypothose ist. DeI" Ablehuungsbcreich hefiude t sieh im mer am recht en Ende der Verteil ung . G('sucht wird also der \ 2. W n l , der um rechten Rand eine F läche dl'l" G r(i~(' o a bsdlllridel. Links vom gesucht en Wf'rt lif'gt 1 - n der Fläche, Der _\ 2_Ta belle entnehmen wir für ein Slgniflkanznl veau von 0 = 0, 05 bei einer Verteilung mit einem Freihei tsgra d in der Spalte ..O.9;J" (I - 0) den \2_\yprt .'3.8 ~ . G ilt in der Grundgesa mtheit die Xullhvpothe,e, dann slnd
;j(J2
X 2_'Y~'rh' grii hl'r a ls 3.8-1 tlll\\'a h rsd ll'illlid ll'r als 5 '1L Oi~' ?'ll l1 hy po t h ~'SI' lohnen wir IH'i otnem Signiftkanznlvenu \'011 5 % und «tnor \ 'I 'r1 1,j[Ullg mit einem Frcihcitsgrnd also ab, wenn in der Stichprobe ein \ 2_Wort gfii N'f a ls :3.8-1 cnnit telt wird . k-hm-n di l' ?'ullhy p ot hl'S(' nicht nh, wenn der \2_ \\'('1'1 dr-r Stk-hprobe kletnor udor gleich 3.8..\ ist , Der Abh-lmuugsben-ich ist in A b bi ld un g 12,6 gruu schraffiert.
,nr
Ab bild ung 12,6: A blt'llllll11gsh l'l'l'id l ineinor x 2 - V~'r tf'iltlllg m it df = l bei ei nem Sig nifikanzniveau von 5 %
" c
X2> :L 8..\
--+
110 ublehnr-n
X2
--+
110 n icht ablehnen
::;
;3.8·1
4. PrüfgröGe berechnen und Entscheidung über d ie Nullh ypoth ese t reffen 12,2 gibt den Zusnmnn-nhang z\\'isd ll'll dom G ('S( '!IIl'd l l u m! drr Eiust elluug zu m Schwangerschuftsabbruch bei den wes t deutschen Bofrugtcn wieder. 35,6 % (377 Will 1058) der ~iiilltll 'r u nd 37,2 % (397 WHl 1067) der Frauen goben an. dass dor Schwangr.rschaftsabbrur-h unabhängig vo n don Motiven einer Fra u lega l sein sollte. In ihrer Eiusn-llu ng zum Schwangors r haftsahbruch unterscheiden sieh Männor uud Fr a uen in 111'1' Sti chprobe also nur gt' ringfiigig, ~ [it dem X2_ Test wird IHm geprüft, o b lwil!t' Xlcrkmalo in der (I rundgesamthcir unabhängig sind , TalH'I1 ~'
3U3
\ 2. T,'st auf U" " bllä" yigkrit
Tabelle 12.2: Kon t inge/lzta llt'lh' - Einstell ung zum Sc hwa ngprSl-:haftsallluuch und Gpschl pfh t
soll te legal sein sollte nicht legal sein
Summe
~ läl\llt'r
Frauen
377
397 G70 IOG7
OS I 1058
Summe 77.J 1351 2125
In Tabolle I:L3 sind d le er warreren Häufigkel ten wiedergegeben . die sieh na ch Gleichu ng 12.lG (5 . 299) lx-rechnen. ßci starist ischer Unabhängigkeit beider Merkmale müsst en 3GA % (38;'1, -1 von 1058) der Fra uen und 3G A % (388.G von IO(7) de r ~ lä n ll n die Mein ung vert reten. ei n Schwangerschaftsahbrnch solle ohne Anga ben \ '011 Grünelen legal soin. Ta belle 12.3: l nditferenzta bolh- ~ Eln stollung zum Schwangerschaftxab.. bruch lind G.'se hlef ht
Xlännor
sollte legal sein sollte nicht legal sei n Sum me Q ue lle: .\ Ll.I ll S I9!lG,
,,~.. td,
385.-1
Gn G 1058
Fra uen :388.u
S lllllllll'
G7S.-l 10G7
1351
77-1
2125
Llt sc h, B
In uns erem Beispie l weichen die in der Stich probe boo ba cht et cu Hä ufigkeit en nicht sehr weit von den erwarteten Häufigkelte n a b. \ 2 berechn et sich nach G leichung 12.17:
(377 - :l8.":i ,4 )2
:2
\
=
385A
+
(:197 - 3RR,6)2 38S.6
+
(68 1 - 6i2 ,6 )2 (670 - 671', 1)2 672,6 + 678,4
= O':jrlS.
,2.
,2.
Da der empirisch e rmittelt e \\"erl \"011 0.5G8 kleiner a ls der kritische \\""rt von 3,8.1 ist , wird di p :\'1I1111YllOt!wse nicht verworfen. ß l'i C ii ltig kou der Xullh ypothnse (und df = 1) ist dir- Wahrsdwinl khkpit sehr grob, in einer Stich probe einen yl..\ Yert von 0 .568 oder gr übl'T zu erhalt en (vgl. Abb ild ung 12.6). Srata erm ittel t einen p-Wert VO ll 0.4 5 = 45 %. Die
3U4
Wa hn;cheinliehkeit . be i Gii lt igkE' it der 110 (und df = 1) in einer Stichprol«eine n , 2_Wert grölwr als 0.568 zu er halten. lx-t rägt .}j y,:;. Zu beachten ist, dass mit dem ,ZoTest zwar die stat istische Una bhä ngigkoit VOll zwei Merk malen in der Grundgesa mtheit über pr üft werden kann . nicht alJPf, \\'11' stark rler Zusamlllf'nhang ist. \\'ie wir wissen (vgl. K
Cramörs V =
0. 508
2125 . (2
1) = O. OHi
Die Stärkt' rles Zusammenha ngs zwischen de m Ges chlecht und der Einstellung zu m Schwangerschaftsabbruch Ist nahe null.
An diesem Beispiel lässt sich die Bedeut ung des Stichprobenumfangs für
die Signifikanz veranschaulichen: Bei einer Verzchnfachung der Zcllhüuftgk eiten von Tabelle 12.2 res ultiert ein zehnfuch gröser er \ 2_\ \'" rt. nämlieh 5. 68. lx-i gleicher Zahl de r Freiheitsgrade. Dieser " 'n t wäre auf dem 3 %~1\ in'a u statistisch sig nifikan t , da e r grö b"r His 3.8 '} ist. Da sieb die P roport ionen nic:ht geändert hab en. bl't rä gt C ramers V auch hin O.Olfi. Der Untersa-hiod zwisch en Xlännorn lind Frauen in der Einst ellung z um Schwangersr-haftsabbruch wäre also immer noch inha lt lich nich t bodo utsam.
Z usam me nfassung
In diesem Kapitel wurden einführend grundlegende Tes tverfuhren vorgestellt . Auch Fiir andere Sttr-hprobenkenuwerre - 1I"1t' Zus ammonha ngsm a j,e oder Rcgrcssionskocfft aicnten - exis tieren s ra tts tischc Tests. Oll' P rüfgr übe gibt hä ufig die Abweichung des P unktsch ätzers vom Pa ra met er de r Ho in Standardfehlern an . wie wir gesehen haben:
..f grol:>e . 0 = -.P~"c " ct='~'hc'=t~"c'_-",P,:'c'='m c;:'="~',:b='T'cG="T'tc'ge'c'c't:..::d'='cl", lo Pru Standardfehler des Punktschätz ers
\ 2. T,'st auf U" " bllä" yigkr it
305
Zur Illust ration Süll auch hie r wieder auf dil' Rr grrssioll au s Kapit el 8 zurflckgegrtlfen werden. Der durch die Stichprobe (n = 20ü2) errechnete Regrcssionskoefftatent der Lesefähigkeit b bet rä gt U,8-1 . b ist de r Punktschä rzcr für den Regressionskoeffizient der C mndgesa mthcit ß. Getestet IWIIlen sol l. ob die Lesekennt nisse zur P rogno se der Mathomatikk ouuuusSI:' gl'f'igllt'l sind (ll",: ß f 0). Die ;\ullhypot lwse postuliert hier, dass drr Regrpssiollsküplfizif'llt der Grllllllgesamt hr it ß gleich null ist . 111}: ß = O. Stata gibt den Srandardfehlor des Regressionsk oeftbtenton mit O'b = 0.01 an. Dir P rüfgröso berechnet sich nach
b- ß
I ~ . - = ab
0,84 - 0 = 8·1. 0.0 1
(12.19)
Diese P rlifgröhe ist mit df = n - 2 = 2002 - 2 I-vert eilt. Bei df = 2060 kann die a-Vertcitung her ungezogen werden. Bei einer ;j %igen Irr t umswahrscheinlichkeit (zweiseitige Fragestellung] wird (H I:' IIy!,otlwsl:' ah gf'lehnt , wenn a > Il/lGI . Da 84 gröbt'r als 1,96 ist , lebneu wir die 110 ab. Das Kon fidenzin tervall wurde in Kapitel 11 (5. 270) berrx-hnet.. Es beinhaltet nicht den \rt'rl der Xullhypothesc.
:JU6
H IIp1Jt" ts~ fll"ljf1J"!J
Aufgaben zu H ypoth esenprüfun g l. Wmm bl'lliit igt man Testverfahren? 2. Ein Bekannt er \'011 Ihnen stellt lUt' Behauptung auf, ds Konfiden zinter vall und int erpretieren Sle dieses. J. Sie möchten für Wt'Stde utst:hlalld un n-rsnchen . ob sieh Frauen und Mauner ideologisch un terschotden. Als I nd ika to r für dit' IH llitisdll' Ideologie zil'lwn Sie die Links-R echt s-Skala heran. die im ALLß US 199B ent halten ist , Auf einer zehnstufigen Skala konnten die Bcfragtcn sich \" 011 I (gunz links) b i,~ 10 (gunz rechts ) einordnen. " 'ir unterstl'lll,tl , dass d ie Links-Recht s-Skala intervallskallert ist , z\\'isdu'll den Skalenpunkten also glf'it:he Ahs tändf' best ehen. Für die 1.083 Frauen (nd wurde ein durchsclmir tlicher Skalenwort von .Tl = 5. DG bei einer Standardabweichung Crl = 1.58 Skalenpunkton ermittelt: fiir die 98i Xläuner (n2) wurde ein durchschult tlichor Skaleuwert von i" 2 = 5.:25 und eint' Standardabweichung \" 011 0- 2 = I. 7,1 Skalen PUlIk t en lx-rechm-t . a ) Formulieren Sie die Null- und Alternat ivhypothese. P rüfen Sie mit einem :;~ Test für ;"!itlt,!lI'I't"tllllh'rschiPll e, ob der Unterschied in de r ideolog ischen Selbs te instufung von Xlännem lind Frauen (.Tl - 1'2 = 0, IH) st atist tsch sig nifikant ist. Logen Sie ein Signiftkanz nivoau von 1 % zug runde. h ) Berech nen Sie au serdem das Konfidenz intervall für die Differen z lief ~ Iit te lwerte für eiHP \ 'ert ra ue nswa hrschei1\1 k-h ke it von 9!J%. 111
Aufg"lJe"
307
welchem Borelch lieg t de r ..wahre' Unterschied zwischen
~ liilllH'rn
und Frauen" c) Berochnon Si" TI!
-1. ßitte prüfen Sie mi t Hilfe des \2 _Tes ts , oh eh- r au f Spil l' 17G dar gp... stellt e Zusammenhang zwisdu' Jl rler Konfessi(ltlszllge hörigkpit 1Il111 (lpr \rilhla],sieht a uf einem Sign ifikanz niveau von (} = O,OG sign ifika nt ist. G. Sie ha ben einen Signifikanztest durchgeführt . E in St atis ti k-Programm gibt einen p-Wert HlII 0.02 1IIl, a ) \relche Entscheidu ng t reffen Sie bei einem Signifikanznivea u H lII Cl = O,O,'j '! Wenll (Hp Entsrheiduug falsch ist - welchen Feh ler hegehen Sie'! b) \reiche Em sehe ldung t re tfeu Sie bei einem Signifikanzniveau von Cl = O,O1"! Wenll (He Entsrheiduug falsch ist - welchen Feh ler hegehen Sie"?
Anhang A Ta b e lle n zur B erech n u ng d er Fläche unte r d e n \Vahrsch e in Iich ke it s vert e ilt1n gen
z-Verteilung ,. W<"l1
.a.s.
.:1.8. •:J.1. ·2. 6.
-:loS. ,'1.4.
.:1.3_ .'2.2. -2.1.
·2.0. - 1.9. . 1.1I. _1.7.
. 1.6. · 1,.$.
,
u
a
,
•
,
....rn ,.- ,''''''' ,- ,,,,,,n ".'" .... , ..... ..... , eeeaa ,. ''''''' ,""U ,"", ...,'" '''"' '''"' ....., ,., 0.00'-"" 0.00.>, ,..... c.... ,..... 0. 00 19
O,OlH'
O. OO I ~
....
0.00111
0.0017
0.0016
.".
0.00.;.;
0,00:;·1
0.00.$
0.0003
0 .00 71
0.0122
O.OOll'Z 0.0101
O,OUH
o.Olll'l
0 ,0119
O.o U 6
0.0132
0,0129
0.012:>
0.0119
O,OIH
0 .0 110
O,OIli6
0.0162
,-.... ,.". Oh.lJli
,..... , o.o.l.j9
,.= ,,om, O.O'll\I
O.f)t ,.6
0.0016
0.(1(1;'&
oml , um: e.... ",m O,ll.lH
,,=~
,...... ,.... O.eHr.
ae'" ''''~ O,(l6....~
,...
0 ,07711
O.D-li/l
''"'' ..... Ob'"
0.0:;.16 0,000:.
0.06111
•
0 ,00 1:;
• , , ...,"'"
....
,
0.001:>
,~ ,
.".
... .... ,.~
0.00.'>'
G.oll6
O,OI:;tl
O.ol~
0.0 1:.0
,~~
0.0197
.... ,=
•
0 ,0014
,. ,.". ,..." ,esca, ,..... ,.,"". ,...,. ..... """" , ,,"". ,., , ,., 0.0111/
,
o.oou
"'''~
om-;o
Gm H
...,- ,.-
0.001')
.... ,,..... ...., ,.... O,00fl 7
O.D1I 3
0 .0110
OJH'6 O .o l~
0.0141 0.018.1
0.6314
0.031)7
, . . .t
,.."
,~
'''''' O.lD1l'
,
o.ow
omn
0.041':'
O.Q-lr.",
O~
0.0:;71
......
OJ)t %
O,07X>
'''''' 0.01'21
O,o.i0#C2
0.071);
,..... '''''' e....,
,.....
, .~
O,07!U
0.0764
0.0 7~
.1 ,3.
o.~
0 ,0').",1
O.Q91 11
O,O'JIOI
- 1,2.
O, IUl 0 ,13:,1
0, l 111 G,III" 0.1 0!l3 O.l3.l.; 0.1314 lI.l m
O .I 11' ~
0.10:;6
O, IO:RI
0 ,1020
0.1211
U2:>l
O.\:U O
0 , 12 10
0 . 1190
O . l~
0 . 1:>3')
0 . 15 1"
0,1492
0 . 1469
O.H-I(;
G. I II H
0 .1711II
0 .1762
0 .1736
0 . 17 11
0.168.;
O,I4Xl 0,1000
0.140 ' G. I6-}';
0.:106'
0 ,211.1.1
0,20(1:;
0 , 1922
0 ,1119 1
O.1ll(i7
0 .;1.1''''
0. 2321
, .~
,.-
O.I!H9
0.2171
0.21411
· l.~.
·1.1.
.1, 0.
.c.s
0.1"""
O.Ill-l1
,.-
~
0 , 1971
o.~l
O. loo.l
"'''''
0, 1110
O.13J"l1
0,1611
·0, 11.
0. 2 119
-0,1'. ·0 .6.
0 .2'20 O.21 U
0 .2 709
0.26 76
0.26-43
0.26 11
0. 2.,711
0.2:; 1()
,.O,Z:.U ""
O.2~ ll.1
0 ,2 4::'1
·0,::'.
O,J(ll\;,
0 ,:\0.'00
O .~1Il 1
0.29.\6
0 ,19 12
O.21177
O.2I1U
O,Ul0
0 .2776
·0 ,4.
O.31t6
O.3 1W
0.3013 0.3312
O.3.1.1ll 0.3.100
0 .32&1
O.3Z.!l<
0.3 192
0 .31 :>6
0 .3 12 1
0,.11121
O,3 1/l:1
O,31,ß
0 ,3 70,
O,Y>69
0,1632
O,3.YH
0 .3.>57
0 _1.;20
0,.14 113
-e.a.
O:2.lli'J
D.n.}/;
·0 .2.
11.4207
O,ll r>ll
O .~l 29
0,4000
0, 40.-.:2
O, ~O13
0 ..1971
0. 39 :\6
O,1lI97
O.:J/I.J9
-0, 1.
0,lr.o2
O . , l ",f,~
O ,~~Zl
0 ,11 /<.1
O,H U
O,HOI
0,. 1.16 1
0. 01.12.",
0. ~~ !16
O,UH
· 0 ,0,
0 ,.;000
O , I ~ I(,()
0 ,~ 9:.JO
O..ll
O, IM O
O, llJ.O l
O,H6 1
0. U1 1
0 ,~ l)ll1
0 ,·16U
30!.l
Tubtllnl zu!" Fliidlt'"benxlm uny
[Fortset zung z- \ 'crt eil tI ng)
,
,
,
.a
s
.s
t
• O/,.l:->,9
z -We"
.0
0 ,0 .
0':>000
0':,01 0
0 .•,011(1
0 ,,';(20
O':,lr,o 0 ,,; 199 O,.W.l fl
0 , 1.
O, :;39~
O ,:; l~
O , :;47~
0,:;:; 17
0 ,:;:;:;7
0 ,:;,;%
0, 56.%
0.52711 0,,56;:;
0 ,:;711
0 ,:;;.">.1
0,2.
0 ,,;70·1
0':,~32
0 ,,; ~7 1
0,:;0 10
O, :;O\~
O, ,;0~ 7
0, _
O,G06,1
0 ,6 103
0,6 1,11
0,.1.
0 ,6 179
0,62 17
0.62~':;
0 .629:1
0,6331
0.63r~
0,6-!0Ii
0,6-1-13
0.6 ·1110
0.6 .'>17
0,.\ .
0,65.."-.1
0,6.'m
O.GG·l~
0 .666 1
0 ,6700
0.67:).6
0 ,6772
o.seoe
0, 68·11
0,6;170
0 ,:;.
0,691 5
0,69 ,',0
0 .691>.:>
0,70 19
O ,70~,~
0 .70AA 0 ,712.1
0.71:;7
0 .7100
0 ,7221
0, 6 .
O, 72~,7
0,73 2'1
0 ,7 3 ~,7
0 .7:;'19
0 ,7673
0.7-11>6 0,779,1
0,7 ;\7
0 ,7.'>1\0
0 .7 3X9 0, 770.1
0, 7422
0, 7 .
0.729 1 0,76 11
0,7 8.;2
0 ,773 '1
0 .7-1.-"1 0, 776 1
O, ,;3 1~
O, ~ .
0, 788 1
0,7910
0 ,7612 0 ,79.19
O,79!;7
0 ,7995
O,~02.1
0,&>,;1
O , W 7~
0,7 82:1 0, 8106
0 .9.
0 .81;\1 0,8 186
0 .82 12
0,82.lll
0.8U>1
0. 8289
0 ,&1 \;
0 ,8310
0 ,8:1Il.;
0 .&1.'19
1.0.
O,M l 3
0.8 1:J1\
0 .8161
0,8-18.;
o ,~';OO
0,8 ,;3 1
O,K»I
0 ,8,77
0 ,8599
O,~621
I, I.
0, 86 -1.1
O ,~&G.',
0 .~61<6
0, ~ 7 0l'C
0 , ~ 729
0 .~7 ,19
0, 8770
0,~ 700
O ,~~ I O
O,8~;1O
1.2.
0 ,1\&19
u.sseo
0.8888
O ,~'J07
0,8925
0.~9H
O,~962
0,8980
0 ,'J0 1:;
1..1.
O,90.'l2
O,!1066
O , 'JO~ 2
0,90')')
0 ,911.;
0,9131
0,91 17
l, ~.
0 ,9192
0,0019 0,9207
0.8997 0 ,9 162
0 .9222
0,02.%
0,92.',1
O.92r.,
O,(Y.HO
0,929'2
0 ,9.106
0 ,9.119
0.9 .1\1,1 0.9,;1).;
0, 9 ,106
0, 9 ,11~
0,9515
0,9 ,;2',
0 ,0·12') 0 ,9,; ,1.;
0 .9 1-1 1 0,951:;
O,1H.'13
0, 9177
1':, .
0 ,9:;'12
0,93 1 ~,
0. 0.157
0 ,0:170
0 .9382
1.6 .
0 ,9,152
0,9l6:1
0 ,917 1
0,91&1
0,9·19.',
t.r.
0 ,(1.;';\
0. 9~>6 ' 1
0 ,9,;91
0,9 ,;99
0,9608
0,961 6
O , 96 2 ~,
0 ,%.1'1
O,(l(;.l l
0,9573 0.%,',(,
O , 9.; ~ 2
1.8.
0.91>6-1
0 .96 71
0.%71\
0 .<)(,;<6
0.~16(l.1
0 ,% \19
0 .0 70(; 0 .(1767
1.(1.
0 ,9 713
O.'I6 'W 0,9 719
0 .9726
0, 9 7:12
0 ,(17.31\ 0 ,974-1
0 ,97.',0
0,97.56
0 .976 1
2 ,0 .
0 ,9 772
0.!1778
0. 071<.1
0 .07!\ll
0.9 7(1.1
0.9798
0 ,980.1
0.9 808
0 ,98 12
0 .98 17
2, 1.
O,(lt\2 1
0,9826
0,98.1-1
0 ,98 3-8
0,98 12
0,91\-16
0.98';0
0,98';1
0,98.; 7 0, (1890
2,2.
0 .91<61
0.986 1
0.98.10 0,98r>8
O,9~TI
0 ,98;:;
O,987~
0,9881
0,988 ·1
0 ,9887
2 ,,1.
0,989.1
0,9896
0 ,!J898
0,9901
0, 9!lO-1
O,9tlO6
0,9900
0,9911
0 ,99 1.1 0,(I'J16
2 ..1. 2 ,,; .
O,!I'lI8
0,(1')20
O,!19'l2
O,9!Y.!';
0,99.11
0,9')32
0,9931
0,(l'}:16
0,9910
0 ,9911
0 ,9916
O,99I~
0,9919
0,9951
0,99.',2
2 ,6.
0 ,99.; .1
0,99 ,·'-,
0,99,·,6
0 ,991.1 O,(Y.I,·,7
0,9927 0,99 1:;
0 ,992')
0,99.18
o,99:n
0,9",;0
0 ,9961
0,9~lG2
O,9n6~
0,'J'J6 ~
2, 7.
O,!I'165
0,9')66
0.9%7
0 ,9(1&1
0,(1')69
0,9970
O,9'J71
O,(Y.Ii'2
0,99 73
0,997 ,1
2,8.
O,(I'J7-I
0,99;:;
0.9976
O,!I'177
0,9977
0.9978
0.997(1
0,997(1
n, (Y.I80
0 ,9981
2, n .
0 ,9981
0,9982
0 .9n82
0,998:l
0 ,998~
0 ,9981
0 ,998,;
0,9985
O,nOi
0 ,9986
/",.,'hil/e: (;"" "" ht ",,·i <1<-, Fläch" l\at\ 'l'il , ci,·,
,,,i...
ci,·,
h,·n - :>c und ,h 'm W"'t z = 1.00 li''gt . In ~l>alt ., am lin lu.'n Rand d", T a be lle s ucht man zun ach st di,' l ", il e mi t dt'm We rt "l. n.- ( Ue, I' u n kt sw ht fü , alle Ziff"m \'On 0 his 9 ). llann s ucht man in di,,,," Zei le d it, Spa lt e m it d"m \\" ,,., ,..11'. Do n kan n l1\an de ' Ta hell,' F Hi" hellam eii ..0,91:;(1" N,"",hlla·". also 97,5 %. ", · W,· ,.,~
ci,"
(;,,",,oh, sc i fe, "e, d," z· \\',- n , d e, lin kssei tig 2,,; % d, " F läch e a hs<-hnt· id ,'1'. Ih" We,." d" , nun innt'1'ha lb de, Tabe lI,' z U . " ,'ht·n ist , b<,trä gl •.o,02,;{''' . \lan find et ihn in d" T 7.<'ile .-I, 9 ,~ u nd d ," ~pa itt· ,,,11'. ,\ 1,., ,,.;It d e r z -\ \ "'n - 1,% lin k..... h ig 2,;% ci" , F läc he ab.
JIU
t-Verteilung o,n
t-!i<.iw (I
", e.rat "'00 ,, ,.,., ,,• ,.- o,.>.w o,m ,,.... , t ..... •, ,,.." , ..... ,,,, ...., "'00 '''' ,.on; "" ,..,,, " ,.... ''= o.... ,.", ,.... "" ,.." ,.." ,.... .... " '.m ,,,. '.- ,,,.., ''''' c..... "'" " " '.m ,.m ,.". ,.... ,...., ,~" ,... 0.1l61 " ,...., '.m c.es ,...., c... , "-n ,."" ,.", ,... ''''' "",; ,."" ,,... ,.... " " 00 0.6.',
0 .510 O.H.; O .U ~
.. ...
0 .1
1.3i6
0.61. 0 ,<>84
...
O.lll6 0 ,76.", 0 ,141
O .~H
OAo.l
u.•
I~ I
0 ,97/1 0 .9.41 , .~
0 ,:;''03
0 ,7111
0 ,.\49
0 .111 0 ,;06 0 ,700
.,~
0,.\1.1 ., ~
O,6'r.' 0.0'; 0 .6'1-1
, .~
O)ln OJl1O
, .~
O.6'J I
.
, ~,
o""u
0 _190
..
O..l')()
,. 00
"
00 00
'00 ' 00
m sec
,-
z- Wrn
... ...
O.6ll7
00
O.l!I9
0,3/17 0,3/1, 0 ..'11\7 0 .3117 0,:186
O.:J./IIi 0. lH6 0.3116 0 ,311.> O.:J/I.;
,~" 0 ";"11
0",,11 0 ,':;"'10
O,6l\.'
0 ,.• :16 0.526 0 .s2,;
0 ,681 0 ,619 0 .619 0 ,6; /1 0,6 711 0 ,677 0.677 0.676 0 .676
0....2... 0";1:, 0,,;11
0 .67'" 0.615 0.67 -1
, ,~
0 _;18 OSV
O ,~r.
0':;':16 0 .~ 1f,
O,ll.W O.ll-ioIl
O.&>' 0J!.i6 0.tL",.l 0.11-;1
O.lll9 0 ,11 11< OM7 O.lll6 0.11-16 O./lU 0.811 0 .8 U 0 .M 2 0.11-12 0 .811
0)<.;
,....
,.,0'
....
, .~
J,Oi!'
..""
,~~
1.190 1,1 :.& LI 3--I 1.1 19
Ll O/i 1. 100
,''''' ...., ,...
...
,
,."
ur.4 1.07"1
....".. ,~,
1.l16;
1,lJ6,.l
..
,~ ,
~
1.009 1,I),j.I\
l. Q,"h;
1,0:.0 1,0"" 1,001., l.001 ~
l.OH 1.0012 1.0012 1,0010 1.0.19 1,0.110 1.0.17
'.=
-
0.%
0.91,;
0.99
0 ,99..
6 .31 4 2.!t1O 2.3.">3
12.106
JI)l21
63.6.'"
..=
, .~
,.",
U 71
,..., .. um ,..., , ,.- ,= ,"', "'" ,= """ , , "."
1=
1,; 61
2.614
,= ,,.= ....
1.7-16 l.n o 1.73--1
..m
1,4;6
"" 2.01 :10
I ,~~
I.9U
I .~I ';
, ~
,..., ..."
1.J7'2 I.."
, X" ,,,,, IMI
1.1'1II
r.sec ,.." 1,1I12 1,ö'9G 1.' ll2
I.,.;:)
1.187 1.2lW.l 1.21\.l 1.28'2 1.2!rl
2 ,119
2. 160 2.HS 2,111 2 ,110 2. 110 2,101
3.IU
3 ,7'OJ" 3 ,499
,~~
.
2.Il21 2.16.4 2 .1111 2.6.;0
,... V iol\.l 2..;67
,,... ,"'" ,..,. , "",
,"00 ,"00
3.0 12 2 ,9;; 2jH , 2.921
"00
,..., 2 .1173
1.69 7
Ul-I 2
2 ,~S '
1 , 7~
aocc
,....
'2,.01 2.6ö1l 1 ,660
1.717
,~
UI6.4
1.6,6 1.67"1 1.li61
'1..'iol 8
1.0'~
,... ,." ,.ees
..r.esa ,.... ,...., r.zsc
2,H7
2 ,49"1 1 ,43.;
1.7 U 1.711
,."
...
2 ~7I
:10,1141
r.roe
1.J19 I..lU. 1.316 1.310
,.....
3.U7
2.1l-l.. '2.11.11 '2.1l19 2 ,lI07 2,M 2 ,78;
,.n,
,.~
1.776
... ...,..,
i.ras
1.7'21
t.aoa
~ ~4 1
,~" ,.=
I.' "
1.32",
,.=
3. 1112
I.~
2. 4:tl 2.103
2.:Jl\1 2..ln
,.....
1,li62
1.9'.10 l.98,
1.6.'io.; I.&.U 1.&1/1 1.6-16
1.911 1 1.97G 1.97'l I,! 'M 1.962
2.:U·1 , "00
1.64'"
1.001I
2,3 26
,.-
2.16-1 2.:1:", 1 2.3 1.;
,.~
1.6.1'1 2 ,6.12 1 .62fio
,.... 2/>01 1 ,.;llIj, 1 ,~1
2 •.; 76
t",., 'hilf. : \V"l[ h," 1_\\"'" _d",..;,I.·\ !ink_itig ''Oll
311
",
, ,• a
e
"
1.0. 2.U
....
a.ee
".
.."
2 .T1' UI
10.66 11,78
15 .12
11, 12
re
"
~
"aan ""
18,42 19';1
19,37
2O.~9
. ..
71:17
10.7'>
10.64 12.0'1
15.81
I'> 16, 99
18,15
19.41
19.3 1 20.4. 21 .61 71.1'6
~..,
21 .1'9 n .~
2U6
2.·•..3.1
1U3
'W
2ll.U 293.,
2ll.1'
2"U I 3 1.110 U .62
.>6..3.1
00
l>:..:U
f06.'110 17;,1<
00
1,·,0
75. 69 116.11 'I!i,!>:l 106.91 1.·>lI,SlI
eoc
:lO'J.!l"
I· \\',' rt
516.09 0.:'21
sec
1'l1 ".
1234 Il.H
".. :ll.i.17
H .16 5l,71
'00
2.7 1 4.61
6 .74 8. 12
M . I.l 'III.l,i.\
100 . 11 161.2'J 2 1.l.10 .,20.9.; 0 .614
~.~
Jl. I3
_16,r,
37,99
11,27
19.21 00 .... . 1.3-1 8:l.26 93.11 103.90 114.66 167 .96
!>II. lG 611.91 19, 7( 90. 41 101.0-,
111.67 16 1.3.:> 1 16.61 '; 26. 10 O.ll,12
2"JO.H .>32.110 1,036
5.99 7.111 9 .49
11.01'
0.975
1l.1t 12. S3
12..;9
0.9'l
1l.:H U .2lI
16 .81 18. -Ill
1~.601
"",
16.0 1 17.;3 19.0'1
1:;'99
18,31
~ .~
13 ,21
H~
19.68
"",
2 ~ ,73
1'>;'1
18..:>.1 19 .M 21,06
..
".~ 2:>.00
2U7 2;,.99
r..J/J 28,87
.20 2ll.H
30.14 31.41 32.61
..
"",
:'1,81
3.">,17 36 .t:l 37.65 -13.17 '>:;.76
63 . " n10
61,:;0 1'9.08
II:.~
» '"
32.01
96.~
101,57
10 1,811 113,l5
.
~
"",
2~ .Tt
26 .12
,.., " "'" n"
~
2 ~ .!H
r..10
..
0.9.,
2.0. 3.'1'SI
".., n "... 71,n n» "'" "'" "'" " ".., ".~::, " " :n.u " ... ".. :n .2l! "'" W." ~..,
." "'" " .» 'sc"
( 1-<>1
U~
13.1'0
I t,O l
FIi<~
... . . .. .....
'''' ,• M ' "u ".., " " "n " " "'" "'" "tr t
..
,.. o.ll-·. ,., , , s.ca e.ea W ' .n '''' U, ....aa s.as '''' ,... ,,,, t, ,." ,,,, s.c u .v. "... ,' ,... 14.0; '" ... " """, ,'-" "" ",U; ... "'" "'" .rr " ,, "n -" "'" " ... , "... ' ''~ o.n
7i. ./9
29.14 "",
"""
~." 21,9.,
".» 2-1, 19 )6,1'6
".., ,,,,
"'" n ...
M.n
ss.ra
3~,81
37 ,16
.1:2.80,
36 .19
M .~
3-1.17 .l .,. -Ill
.J1'" ,!>'
30.19
"'"
36.1'\1
M."
~." W.60' 16 .91'1
M."
W' " U .-lO
H .3l
12 .1'0 H . 18 4.\ .;6 16 .93
.\O.lI'I
.:'>3.61'
w .~
U .64
4:l.!llI
"''''
" .00
~.n
7!A2
16 .15
% .02
1000 .... 112.3.l
19. ./9 91 .9., 10 1.2 1 116 •.12 12lI•.'lO 140 . 11 19M •.' l/j
"." " .Ma
:l:~1 . !l'l
:111.06
S,>1.13
.">63. 1\,'.
I:lU 1 13.;, 8 1 19,J.21 219 ,4., ., 16 ,49
1.91",0
2.3 26
1.&15
16.n
:1l .27
12 1.3-1 11'9.:>11
1,:lM2
10.110 l V II
n .oo
106.63 118. 14 129 .:'>6 18.·• •110
118.50 11:l,.l8 2"l6.0 :l :H O,9 3
. .
, ,,,
0 .99.'".
2."~':16
""';,:l1 2 ,576
'",", ~d/~: ll l,' VO"ll" ht· O""" ~" ,' nt. p, k ht rl..r d<-, , - \"~rt~i l u ,,&. 11", '·Illspr<'<'h."d,' W,·rt d ," ! . V.,\<'ihm& non F" I ,I,·, TRh.·II.· "Illlbl .lch " "" nl<" h .\ h'-Ug der ~'rei hd,"g ,3d" " nd LJi".i. ion du "h .;f."
"."hl
Anhang B Lös u n ge n d er Ü b u n gs a u fg a ben
Forschun gsdesigns 1. Individualdaten beziehen sieh meis t auf Personen, Aggr egatdaten auf Kollek tive. wobei Aggrega tda n-n auf der Zusammenfassung von ~ r('b wert en der ~ li t glil'dt' r der Kolle kti ve la-ruhen. 2. Schliest mall aus einem bestehenden Zllsamlllf'nhallg zwisd wll Arbeitxlosenqucue lind den Stimmanteilen de r Rep ublika ner auf Wahlkrciselx-nc, dass Arbeitslose verstü rkt Rep ubli kaner wählen , so lx-geht maneinen ökologis chen Fehlschluss. Aufgrun d der Aggregatdaten kann T1 Hl Il nich t WÜ#'II , ob tat sik hlieh Arbei tslose d ie Rep ublikaner gewählt haben oder r, n. vor alh-m Nicht-Arbeitslose in ' YahlkrpisPIl mit einer hohen Arbeitslos enquote zur Wah l der Republikaner tendieren. 3. :-' lit Trenddaten lasse n sieh Hypot hes en üb er Yerändenmgen im Aggrega t {Xct tovcrändcr uu gcn} überprüfen. Poneu tuaicn sind aufwändiger zu erhoben un d bergen Pigt'lle P robleme (Panclmortulit ät. IIppräs cntati virä t etc .]. Kausale Hypot hes en sind besser prüfba r. weil Informat ionen übe r die xcirliche Reibenfelge Hili Merk malen vorhau(\P I1 sind . Individuelle Veränderungen können im 7,pit\"prlallf untersuc ht worden. -1. Die Zustimm ung zu ein er traditionelh-n Arbeitsteilun g zwischen Stäunem un d Frauen ging bei westdeu tschen Befragten kontinuierlich zurück und sa nk zwis chen 1982 lind :WU-1 U lll 28 P rozentpunkte bzw. 4U%,
Da hier die Entwicklung eine s Indika tor s üb er mehre re Zelt punkt e bet rachtet wird , handelt es sich um Lä ngsschnittdaten. AllgPgplH'1l sind Veränderungen im Aggrega t (Xett overauderungeu}. Aus diesem G ru nd handelt PS sieh um ein e Trendstud ie. Individuelle verändorungeu lassen sich mit dem ALLß US auc h nicht feststelh-n, da fiir j ('(!., Erhebung eine neue Stichprobe erhoben wird. Besch ränkt mall sieh bei IIN Auswertung auf einen .-\LLß US. so handelt es sich UlIl eine Quer-eh n i t t a nn ivse. 5. Mit einem Experi ment, wenn die Teilnehmer des Exper iment s den \ 'prsllchslwd tnguugen (G ruppen} zufällig z ugotoil t wurden.
3 13
6. Bt'i den Volkszählungsdaten \ '011 1987 hamlelt I'S sich eigentlich um Individualdaten. Da d ip \ 'olkszählungSf'rgphnis.<;p j{"doeh nur in aggrrgierter Form, z. B. auf Gemeinde- oder Krctsebene, von rleu Sratisttsehen Ämtern zugänglich gemacht werden. können wir sie lediglich als Aggregatda ten verwenden.
M essen 1. Messen ist die str ukturtreue Zuordnung von Zahlen W Obj ekten . 2. Xominalskala (GII' ich / Ungleieh) - Ordi nalskala (zusät zlich: Ordnuug) - Intervalls kala (zusiitzlich: glpidlt' Ahst;llule) - Hat tos kala (zlls;ltzlieh: gleiche Verhältnisse] - Absolutskala (zusä tzlic h: na türliche ~ Iab pinl lt>i t ). 3. nominal - erdmal - ra t io - ra tio - nominal - onli nal - ordtnal nomi nal - Intervall. -I. Ant wort (c) ist falsch . Bel Ordin als ka k-n kan n ma ll - im Gpgpnsa t z zu Intervallskalen - nicht davon ausgehen. dass die Abstände zwischen den ein zelneu Skalenwerten gleich grob sind. ;). Die Grüb e des Xlr-ssfehk-rs kan n herer-h net werden. o. Vgl. dazu ausfüh rlich Kap itel 3.3. I. Der Rt'IJr oduzierbllf'kcit.5h J('lJiziw t un d d
Erhebungsmethoden 1. 11.) Diese Frag!' wird die meist en Befrag ten überforder n. Zudem ist der Bogriff .Kostcn'' nicht eindeutig [ Kost en des Studierendon oder der Ilochschule" ]. b ) Hier handelt t' S sich um eine meh rdimensionale Frage, man könnt e lwispit'ls\l"pise durcha us für eine Straffuug des Studiums und gegen die Einführu ng von Studlr-ngehiihn-n sein . A us diesem Grunde sind hier zwei Fragen an gebracht . Event uell kön nt e man ein!' .,wPii. niehe'-Katcgori o ein führ en.
Auh,m y B
3 14
c] Die A nt wort ka tegonon überlappen sie h (,.II1('hr a ls einmal wöchentlieh" bei nhaltet ..zwei- bis d reimal wörhent lich' lind .,tiiglich ") d ) Bei dies er Frage sind die Antwortkategorien all es andere als ersc hiipfpnd. \rkht igf' Ant\\'ortmiigl ichkt:'itell [z. B. Inl t>n 'ss t:' am Fach] fehlen. Hier h if'tf't sich eine Hvhr idfrage an . e ] Aufgrund der doppelten \ 'f'f1Willllllg ist k aum kla r. welc he inh a ltliehe Bedeutung mit der Zustimmung bzw. Ablehnung der Fra ge verbunden ist. Die .$ I,jb nich t", Ka tego ric sollt e nich t die ~ Iit t ('Ipo srrion be i den Antwortkategorien einn ehmen. K re uzt ein Befru g ter hier "w('ib nicht" an, so kann IllIlII sich nicht sicher sein . uh er tutsikhlieh kt>illl' ~ I ('i llllll g hat o df'r v. , ß . de r ~ Ie inllll g ist , dass der ASTA tetlwotso die Metnnng der St udi orenden vert ritt. 1') Diese Frage ist pill' leut ig zu la ng und \'CIr alle m uunöt ig komplizit'rt fonnul tort. g) lüer st im mt alles.
Bel der \'orl if'gl,tult>n Anordnung der Fragen könnte ps zudem passipren. dass ,lif' Frage nach rler IWIII' der Ausbildungskost en ,Ht> Bea ntwortung der d a ra uffolg enden Frage - Einfü h ru ng
\ '011 St udlengehiihn-n beeinfl usst , 2. Gf'Schlos'sf'n e Fragen bieten sieh an . wenn die An twort möglichkeit en bekannt und /oder Iwgn 'n 'l.t sind. r. ß . bei m G l'sc hl,' (:ht (Xla n n ~ Fra u). OIft'IlI' Frage n bieteil sic h an . Wf'1lI1 mall no ch nich t \\'l'i b, welche Antworten kommen könnt en , wenn die Ant wor tmöglichkeiten zu zuhlreich wären "de r wen n ma ll prinzipiell dem Befra gten di e Celcgc uhcit geben möch te a usführlieber oder in Sf'iIWIl eigenen \ror tl'II zu antworten.
~
Tabellen und Graphiken 1. In der Regel werden die Stinuuanteile der Parteien a uf die gtiltigeu Stimmen proxeutuicrt, da dieser Anteil iibt'r d ie Sit zvert elluug im Pa rlamcnt entscheidet . 2. Der Anteil der Stinunen für die :\,SDAP stieg U Ill 103.5 1,;(; Prozr-nt (17.~;.~~.33) lvw. 18,97 P rozent punk te. J. [ in K reis-. Säulen- od er Balk endiag ra m m . da PS sir-h IIIl1 ein nominalskalicrtes Merk mal ha ndelt. 4. Os tdeutsche ßt'fragtP haben insgesamt posi ti ven' Erwartungen bezüglieh der eigenen wir tschaltliehen Lage in einem Ja hr als \\'t 'stdp u tsdll' n l>frag tf' (vgl. die Tabelle a uf Seite .'lIG).
315
lI a h/ergebnis
\\ ',,11 lberecht igtc A ug"K,·I,,·m· S t';nlll,,"Tl \\'HI,lbp(('iliK'ITlg
Ungültige St hurue u
% Ullgült. Sti llllllPll G ü lt ig" Sti lllllU'll K rD USP D SI'D DDI' ZPlIt rll rH
IJn'
DYI' D~ \"P ~SD.\P
SOlist iK"
(H)
·12 .9,j 7.67;; 3.j .225.758 82 % 2,,·1.901
(bi 100 %
o,n 'x
3 1.970.8.37 ~ . "92.ODO
11.902 8 .577.738 1.322 .38.3 t1 2i.9 10 1.0~9 . 1 1l
1.6.'i9.77·1 2.·I.j8.2 16 6A O!).61O -I.i 5:H l6 1
= I OO ~.
\ :1.1 :1 % lJ.o:I % 2 1.r,:I % :1.71''X. 11.1'0 % :\.():\% -1.7:; % i.o:I % \ 1'.:1:1%
I:U',9 '){.
IIU i!) 'x 11.11:1% 1!J.!l7 % :I.IIK% !Ui l 'x 2. 17% :I.l'li %
' ,.72 ')f, 1-1.92 % 11.1I1i %
Unt er den ß t'fra gtl:'lI. dif' ihr e Pigl'IU' wir tsr-haftllche L
Lage- und St reuungsparamet er 1. DiE' Verteilung hat Zlwi Xlodalwert e: J~ ,If" = lOO und .r,II" = l lO: i: = 105: :r = 105,1 ; V = 90; 8 2 = 54G ,09: 8 = 23.37 2. In Land B sind die EinkolllllH' ns lm terschir·de erheblich geringer ausgepräg t , da die Standardabweichung, also die Stn-uung der \rerlt', ge ringer ist als in La nd A . ;3, :r .\I"
= 21, :r ,\/" = 22: i: = 22; i' = 22,75; V = 10: 8 2 = 1.05; 8 = 2,0 1
316
AU!llllly lJ
Z,·jlcnpmzeuk
S1'" /te" pmZ<' U I"
West
0.,1
S""mw
1i:l.:\ 1.7 1.1 Ti7. >l ITi.2 IU.:! 71J.ß
:lli.7 2.lJ 0.7 -12.2 2:\.(i
101),0 1.< 1.' iouo
Tollllp,weut"
w"w"tli"h 1"" M" .·tw" , o,'!;,,'r gl"kblJll'iol'r,J et was sd l1.·.·!Itl' r
~U
li'!.:\
u1.-1
~7.2
I!U i 2>l.D 11.11
17.~ l 17.~ l
lOO.O
cnx 4ifi .K
11.7
nu
II KI.lI
:12.n IIKl.1I
100.0 12 .2 1.:\ WO.O 1.:\ 1.:\ 100.0 1011,0
IiK.l)
:12.11
tcun
71.1 IV! 11.7 Ti2.:1
LU
wesentlich schhvhter
osn Summ.'
Vi
o.n
-17.7 i.n
Die Verteilung hat ZI\'t'i Xlodalwertc, nämlich 11 und 11 Jah re. Dip Hälfte de r Kurs teilnehmer hat das 11. Lebensjahr berei ts erreicht und im Durchschnit t sind die Teilneh mer 11.i5 J ahre a lt. Der älteste und der jüngst e Kursteilnehmer lil'gf'1l 10 J ahre ausoiuander . Die Streuung 11,'r \\,prtp Hogt I/pi 2.01 Jahren. 4. Da der Modalwert grüb,'r als das arithmetische Mlt tel ist , handelt es sieh um eine rechtssteile (Iink ssr-hiufc] Verteilun g. 5. Angemessen sind in diesem Fall Modohoert lind M edirl7l, da ,'S sich ]wi Klaus urnot en um eine ordinalekalierte Varinlile handelt . Dagegt'U ist d ie Berechnung d es arlthmet isrhen Mittels fü r Klaus urnoten im strengen Sinnt' utcbt zulässi g, da die Abstände z\\"isdlt'1l den einzelnen Xoren nicht gleich sind und damit kein Inter vallskalen niveau vorliegt . G. Das arithmet ische Mittel würde bei eine r linksst eil en Verteilun g "Oll .~.\usrt'iN'rn'· nach olx-n verzer rt werden , G ibt ,'S a lso einigt:' sehr hohe ~ Ii('tell, ist das ar ithmetische Xl lu el gr öser als de r Xlodien.
Zu sammenhangsmaße 1.
• Berechnung der P rozentwerte.
317
Zeilell]lI'Q u nte
". kath.
5]liil t ellp rozc71te
44.3 26 A 65.5 43.6 60.0 3U.0 56.8
CDUjCS U SI' D
AND ERE Summe
kat h.
Summe
ss.r
100.0
43.6 34.5 30.1 40.U 26.3 43.2 100.0
ioo.o
:J;J.!~
100.0
:J7.1l
IOU.O 2/:1.4 100.0
Von den Befrag ten . die eine P räferenz für C DU/ CSU ä uN.'rIen, sind ;);),7 % katholisch lind ·U .3 % nicht -ka tholisch. Im \ '(,I"gl('ieh zu allen Befragten (.t:i.1% Katholi ken ]. sind Kat holikenunter r! 1'1I CDU jCSU-Wählt'fn also üb errepräsentiert . 43.6 % alle r Katholiken gplwll an , CDU/ CSU wählen zu wollen. während von a llen Befragten lediglich :J3.8 % {'inp PräfnPlll fiir dir Union spa rt eien ä uM' rn . • Berechnung von \ 2, C, Cramers V 2
(:.?:\ü - ;302,5 1)2
X =
302.5 .1
+
(2\17 - 2:JO,.1ü)2 230..16
+
(:3\)0 - ;m ,7:3)Z 337.73
(:l0" - 2,,7 .27 )2 2;j 7.27
+
(:loS - 2,,3.7:1)2 2:j;1.7J
+
( 17!J - 193.27 j2 193,27
+
= ;'-1..11
c=
5-1.-11
,-,--;:;'-';";=
5-1.4 1 + 157,')
Cramers \ ' =
c'rn"" = V~ -2- = 0 , -10 -1 ~
= 0,18J:
_ 54,--t1 1»75 · (2
7, w i~l'h(,1l der Konfession und de r dWI" Zusammenhang. • Berechnung \"(JIl ),
1)
=
0.186
Wahlah~i ("h t
lH'sl{'ht ein sehwa-
318
A u!luIlylJ
Vorhersa ge der \ r llhla hs ieht durch die Konfess ion :
A = (5:l:3 + 447) - (n O + 268 (533
+ ·IH )
+ 20.5 + 179 )
980 - 888 = O.Om9 = 9.:m % 980 Durch die Ken ntni s der Konfession 1<1SS('1I slrh d ie Fehler bei VorIH'Thagl' der Wahl abs icht UIll 9. 39% verringern. Auch A deutet also auf einen schwachen Zusammenh an g hin .
=
2. " da I'S sich 11 m zwei orduralskallerte Merk male handelt. 1228&13- 932805 1228543 + 932805
2957:18 2 161348
= O.1361'i = 13,68 % Durch die Kenn t nis der Schulbildung der Interviewer lassen sieh die Fehler Iw i P rognose der Schulbildung der Befragt en 11111 knapp 14 % verringern. Es exist iert also tatsächlich ein srh warher Zusammenhang zwischen der Schulbildung der Int er viewer und der Schulbildung der Interviewten. 3. rp bzw. I}, rla die unahh än gige Varlahle (Geschlecht } nominalskallert und dip abh än gig!' (Alter der n efragl l'u ) iuto rvallskaliert ist. DI'r .Trir-k'' zur Lösung ,11'1' A ufgabe bos t e lu dar-in, di p S umme der Abweichungsq uadrate a us der Yarl an z und der Fall zahl zu ermitteln (vgl. For mel 6.8 euf Selte 135): S i lQ 9" S' , IQkQt
2 I}
=
I} =
.1 . 11 <8 -_ $9<5 9
-- ')"6 1" _)° 0 . "" 6"_ 6' _ 0 . 16"'1 .J. ' 3 ., _ ('8 :J '1" :Je
= s i'a t l . IIl1'a ll + ·~ia!l· UKa! l = (282.8!J15· 2:120) + (2m .0079· 1!21 ) = 984770 . 13:'">9
984980. 902 6 - !J8·t/70 ,l359 . 'X 984 980 .!)G2G = 0.0002 = 0.02 0
,j0.0002 = 0.0 1-1
Ein Zusammenhang vwisr-hen dern G pSd llK:ht dt's Int ervie wers lind 11f'1Il Alter IIE's Befragten bt'slPht nicht.
319
i
1 2
,,
",
Xi
l'
1 7 2
:JU
,
~1
, "
17
X 21.2
r=
2 Y 3,2
.e
Xj
8,8 - 1.2 2.8 - 4,2
y
y,
6.2
2.2
a.s - 1.2
0,' - 1,2
( Xi
X)(y; 13.&1 :\:3,.l-1 1,4-1 2.2·1 5.0·1
S AP 55.8
55.8 -
v'H2.8 · 22.8
yl
(X;
r l'
38.44 7i, 4·j 1,4'\ 7,8-1 17,64
S AQ",
t.rz.s
( y;
yl' '1.8-1
l·l,·1·l 1.'\'\
O.()-1 1,·1-1
S AQy 22,8
= 0 9~
'
Zwischen der Zahl der täglich verzehrten Eis nud der Aubt'llt t'lllpl'ratnr lx-steht ein fast perfek ter Zusammenhang. a . a ) richtig. b) falsch
lineare Reg ression l. i\lit einer linearen Regression kann der Ein this s e iner [ode r mehrercr} unahhängiger Variablen auf eine Ilwtrisdll' a hhängige Variable bes timm t werden. 2. a) Bestimmung der Regressionsgleich ung (vg l. V II' Berec hn ung die Arbeitstabellen auf S. 327 und 328):
b = SAP = - 9 ID.59 = - 0 1484 6 \.36. 70 . SAQ... a = fI - b · 1" = 39 ,21 - (-0.1.18-1· 5·1,99) = ,17,37 Die Regressions gleichung lautet also :
.Ie hiihf'r 111'1' P rozent anteil der Katholi ken in
einem Wahlkreis. umso schlechter srhnetdet die SP D a b (negat ives \ 'orzl'id lPll 11I's Iiegrvssions koeffizienten] . Es handelt sieh also um eint' negative
32U
A u!luIlylJ
Bozlehnng. Nimmt der Ant eil der Ka t holiken in r-luem ' Ya hlkre is einen Prozeutpuuk t zu. dann verlieren dir- Sozialdemok raten rund 0.1484 P rozent punk te. In einem (hypo tl ll:'tisd ll'lI) 'Ya hlkrt>is ohne Kat holiken würde dip SP D .J7.37 P rozent der gülügou Stimmen e rhalten. b ) Berechnung dos Dcu-r mtn a rionskoeffizlenten [(2; Hili
.-.2
lt - =
Erk lärt t'- S.-\Q g Gf'salJlt-SAQ~
135,5:3 2G9.20
= -- =
0.50
Dif' nnterschir-dlh-hen \Yahlf'rfolgt> der SP D in den rheinlandpfälzisc hf'll \rahlkreist'n bei der Bundestags wa hl 1994 lassen sich zu 0{) % durch den Ka tholik ena nt eil erklären. (O bwohl dies immer nor-h ein relativ hohes R 2 ist , heg t der " 'N t demlieh uiedrigor als bei Schätzung des Cljlj-Antoils. Zu r Erklä ru ng der Wa hlerge bnisSl' der SP D ist der Ka t holiken a nt eil also ein schlccbteror P r ädik tor als zu r Erklä rung der CDU.Ergebniss('.)
321
,,
c,
,•o .s -;; ,
L ~ ~
=F R~ ~_. ~~ ~~ ~~
~ x ~ ~
==
~ ~ S tt ä ~ ~ ~ g ~ g g '~ ~
x ~
322
Au!luIly lJ
Wa hlkn'is
'i,
:>;ellwi" d Ahrwclh-r KoLI"IL 7.
:1!J.I2 :1!i.1 !l :\li.;; I
Cochem
:1(i. l«i
K n 'lI7.lIad , Bitburg Trier :\Iout alHlur :\hliu7. Wurms Frankenthai l \u lwil/;slta f"l l :\ eustnd t -Speyer Ka iserslau t,'n l Pirmasens Siillpf"l7.
Berechnu ng des Determi nac iOlISk'I{'!fi7.;"ll{ en (tt, (iJ, Ü,l / n, lid /'i.
·12.;;:1 :1:I.7!J
:U.:III
:m.I<:1 :1!J.7·1 -12.;;0 -I2.li2 ,11.7:\
.m.eu
,IV !J -1 11.,,-1 :I!U!J
lXI - I. U2 1. 12 -.1.112 I.-Ix - !.f17
m.tu
:1.:12 - ',.·12 - -I.!J1
I I.ll2 2'1.:11< 2-1.1 1 lJ,:11\ 0 .21\ 1lJ.1l2
21
s.ee
10.11\ (WI 0.2!1 0.1l1
- : I.1 ~ 1
- O.(JI<
0.,,1 - 0.!l0
- nru
se.ia
-I." I
21L: \ 1
1.2:-,
1.12
- 2,21i
um
-.1.1 12 - 2.70
s.oa
".:lO
u.
s.u
- 2.:1'.
una
lJ,r,:\ :1. :I~1
:1.-11 2.r,2 1.:1!1 2.!JIl
1.:\:\ - 0.112
S AQ y 133 .79
3.
"
o.na
I ol l-!
re.ie 2.U I L ll
2.:11\
"
:\.:ll<
7.2!J
s.sa
u.ea
];.:1:; 1.~ I:\
1l.1l1l 1.77 O.lMJ E , S AQy 13.'>.53
• Berechnung a us de n Ein zclmesswcrtcn : SAP
JSAQ, . SAQ.
Irl =
- 910,;;9
7;:i'\:iR':iF',","'" J Gl:lü.70 ·2fi!J,20
= - O. 71
/ 0,50 = 0.7 1
Die Richtung des Zusanuneuhaugs [das Vorzeichen \'0 11 r!) muss bei der Borc-hnu ng a us U1 dein Iicgressionskucffizienten eut nommen werden.
5 tich pro benverfahr e n I . St ichpro bcn sind er hobt ieh schneller und kostengüusrigcr d II rch füh rhar als Vollerhebungen. schwan ken allerdings in ihrer Zusammenset zung zufällig und erla uben dahe r Sehliisse a uf die Grundg esamtheitnur mit ei nor bes t inunten \ Yah rschel nlIchkelt . 2. ~ [ p h rs tll figl's Auswahlverfahren
323
3.
• ß t:'grilft': G rUllllg"S;'llllt lwit = a lle :-. rainzl'r Studierende Auswahlgesamt heit = all e auf der Liste des Studentensekretariates vorzeichnet r-n St ud lorenden undercoveragc = Studierende, d ie sich nach Abfussuug der Liste immatri kuliert haben O\'pn:o\'pragt' = ~w isdll'1J zpit lieh exma trikulir-rt e SIndir-rende • \ 'o rg,' lwlls\l"t' ist' : Einfache, sys tematische Zufallssuch probe. d. h . zufiilligp Auswahl de , ers ten St udier enden. alle weiteren werden in einem bes timmten Intervall er mittel t. Das Stich probeninter vall bet r ägt ~~~ = 28.7:1I. Die zu bestimmende Zufallszahl mu], also zwischen I und 28 liegen (dann erhält man et was mehr als 1.000 St udierende] . W ün lp die ~1tfii1li g gezogene e rste Za hl ij laut e n, dann wiirdf' clpr ij . , der 33.. de r GI. Studierende usw. in dip Sl idlpro bp gelangen.
-1. Zufallsgrs renene \ erfahren bieten die Gewähr, dass j ed es Element der G rundgesamt heit (genauer: der Aus wahlgesam rhuit] die gleiche bzw. eine lx-kannte Wahrsclwinllcbkclt gröN.'1" null hat , in d ie Stichprobe zu gelangen. Ers t dadurch werden Schlüsse au f die Grundgesamtheit möglich.
Wahrse hei nIie hkeits verteilung en 1. Dip e-Tabellc findet sieh in Anh ang A.
z-\Ver t FUirhe lin ks Fliidl (' rechts
-2,78 O.()O27 0,9973
-0,10 OA6()2 0,[,398
1.96 u.an 0,81[,9 0.97[,0 0, 1841 1l.02['0
2. Gesucht: Antei l der z-\ \"t'rlt' zwischen - 2 11m] 2: l' (- '2 S z ::; '2 ) = 1>2 - '1> - 2 = 0,97 72 - 0.0228
= O.9:i·H = 95 ,4·] ';{. 3. Durch Mittelwert li nd Var ianz.
A u/i,m y B
324
-I. Zunächst müssen hier die boiden r - \Yl' rt E' LU und 23 a-r ra nsformiert worden. Alls der e-Ta bello kan n dann die Fläche zwischen den beiden e- t ra ns fomucrten \YI'rH'n ent nommen werden. Gesucht: GröN> der Fl iiche , d ip zwisd lPll 2U lin d 2:3 liegt:
1' (20 < X < 2:3) --
=
P (20 - 20 < Z < 23 -20 ) 4
-
-
4
= /' (0 ::; Z ::; 0,75) = Q'0.7r, - '1'0 = 0.773-1 - 0,5
= 0.273-1 = 27.:H % ~( it wachsendem Stichprobenumfang n. nä hert sich d ie Verteilung von St lr-h prol H'1Itn it t elwert e il einer ;'\ onnal vvrteilung 11. 11. Ü. Lösungsweg analog zu Au fga be -I. Da es s ieh 1111\ eine Stichpro... benmittclwertcvcncilung ha ndelt, muss hier Gl(' idlllllg 10.21 zur zT ra nsform a t ion her an gezogen werden . Ge sucht ; P rozentsa tz der Stichpro benmit telwerte i::, der zwisch en :.Iü.9 und 38,9 Ja hren liegt :
5.
:37,9)
I' (:W.!J < .\. < :.18.9) ~ I' ( :36,9 - :37.9 < Z < :J8.!I . 0.7 0,7
= /' (-t,.l:l ::; Z ::; 1A3) =
4>1,,13 -
_ u 3
= 0.U236 - 0.076·1 = 0,8.172 = 8·1,72 %
7. 11.) fa lsch. b) falsch. t-] fak-h. d ) richtig
Konfidenzintervall e I . Konf i den zlut cr valle sind Bereic he. dir' den gesuchten Pa ra nu-tor !I1'r Grundgesamtheit mi t einr-r gewis sen \Ya hrsd H'i nlich kd t überdecken. 2. • Das Konfi denzint ervall wird g rüN'1".
• Das Konfidenzintervall wird griit,er. • Das Konfidenzintervall wird kleiner .
325
3. Dir Var la nz de r Gru lldgpsalllt lll'it ist unbekannt IIlH! wird durch dip Stidlpro hl-tH!a tr ll W"Sc:hä tz t. Da d il>S tic:hp rollt' sehr grot.. ist, werden die G rt' nzpn a n ha nd einer z- Tabel le und nich t a nha nd einer t-Ta belle abgelesen. Die allgemeine Formellau tet da her :
Berechnun g des zweiseitigen Konfidenzintervalls IlI'i Cl = 0.05: 1477.6S . 1Hi.6S 1&1S,:m - z(l _ ~ ) ' ,,11 474 ~ 11 :5: IS.1s.:m + z(l _ ~ ) ' v' l -H4 1838,.19- 1.9ü· .18,-19 :5 I1 "5 18.18,.19
+ 1,96 · .18,49
1iü2,!.l'j :5: 11 :5: 191:3,8:3
4.
• 99 'Xigps Koufidenzlut ervall fü r den Anteil der e DU ICSU· Wä hler:
lJ. 12.'". · O."'.i,j
12;'11
• 99 'Xi gps Konfiden zinter vall fü r die P DS:
0.0:15 - 2."i'l ·
O.O.1.j ·O.% j <_ 0 < _ 0.0:", 12,0
0.0:3" - 2,5.'\·0.00,,19 "5 0 :5: 0,0.1"
+ 2.',0<:> . o.m". 0.% " 12,.0 + 2,,,8 · 0,00,,\9
0 ,02 158 :5: 0 :5: O,OI8-J 0 .
Das Konfidenzintervall so ll eine Brei te von 1 % aufweisen ( KI B o:: O.Ol ): der Prozent sa tz de r FDP bet rug in der Stichprobe der For-ehun gsgruppe Wahlt'll 1'=0.07: Cl soll ;:)%' llf'tr al-wn. 11
=
4 . 1,% 2 . 0.07 (1 - 0.07) _ 100" 5 0.0J2 - II "
326
A u!luIlylJ
Hypothesenprüfung I.
~ lit Tes t verfahren wird anha ud zufällig gezogener St u-hprotx-n ülwrprü ft , inwie wei t Hypothes en über eine G rundgesanuhett zut retfeud sind. 2. a) Test eines xüttelwonos bot unbekanntem (J . • Null- und Altemat ivhypo rhese fest legen: lind 1l,4 11 > Iin > 52 \ \'od wl1, /10 : 11 = 110 = 52 n = 0, 05. • Priifgrii ~t' und Verteilung der rrü fgrii~e besununen: Die StirhprolH:' ist luureichend gro~ (11 = 1,1-1). Da (1 durc h die Stichprobe geSl 'hiü~t werden muss (0- ), ist die P riifg rü ~(' mit dj = 11 - 1 = 1-13 Frelhet tsgraden t- ven eilt. • Ablehn ungs bereich der :\ullhYllot hpSl' fest legen: Weil die Alterna t .ivhvpothose ger ichtet ist lind g rö~('f(' \\'1'1'w pos tuliert , liegt der gesamte Ablehnungsbereich a m rechten Ftaud de r t-Ven cilung. Dt'1" kriti sche t-""Nt befindet sich da her an de r StPI1" IW.I-al' Den krit ische n I-"'prt entnehnu-n wir der r-Ven etluug mit 150 Freiheit sgr aden (da keine Verteilung mit 143 Freiheitsgraden im Anha ng tabelliert ist ): lOSO, i- o.or» = 1.1)55. Ist der "'nt der Priifgröl.!' grök>1' als I.G55, dan II wird die :\ullhY PollwSI' verworfen: ist der wert kleiner a ls I,G55, d ann wird die Nullhypothese nicht verworfen. • Prüfgrög e berec hnen und übel" die Nullhypothese entscheiden:
1=
67. 6 -,'"12 ' 6 1.5
"JITI
= 3. 0-14
Da 3. 0-14 grökcr a ls 1.655 ist. wird die Nullh ypot hese abgeDer Unterschied ist sta tisti sch signifikant .
11,11111.
b ) Konfidenzintervall (für Il bei unbekann tem (7) berechnen: 6 ~( ./- - 1,.9('l'/fJ:i Gl ,5 ::; /I $ 6-1, ~( + I . .()" 6 1, 5 h ' /fJ:i
57,7 :5 /1 :5 77. 7 ;3,
a)
einer Xfit telwertcdiffereuz bei una bhängigen Stichproben. • Xull- und Alt prn a ti vhypoth f'Sf' fpstl pgpn:
TI~t
Ho:
Il i
=
/1 2
lind
H:I:
Il i
f- 112.
(\ =
0. 01.
327
• P riifgriik un d Verteilung der P riifgriii'.e besuunnen: Dip Stir h proh" 1l sind hin reichend gro i'. . Dil:' P riifgrö i'. p ist hier a-verteilt (vgl. d ir- Anmerkungen in Kapit el 12 zu r-Tests], • Ablehnungsbereich der Xullhypothose bost lmnu-n: Fü r den zweispiligpll Ablehnungsboreich eilt nimm t ma ll für Cl = 0,01 der a-Talx-lh- a n d" 11 Stellen Zo.01 j2 und ZI_0.01/2 die kritischen \\'(']" te - 2. ;) 1S und :1.5~. Die Nullhypot hese wird also a bgelehnt , wenn in der SI ich probe ein z- \\,prt kleine r als - :1. 58 oder grö bpr als 2,58 er mittelt wird. • Prüfgr öko berechnen und üb er die Nullhypo these entscheiden:
_"ce;"0;";, e-,,;5~,:2;,;-', 1.",,2 l0Il3
+ I. n2
=
- 2, 59
9R7
Da de r in de r Stichprobe omu t tclre z-\ r prl - 2. 59 kletner als de r kr itisc he z- \\'I'rl - 2,58 is t [wenn au ch seh r kna pp) . wird die Nullhypothese ab gelehnt . Der Unterschied in der ideelogtsehen Einstellung von Mä nnem lind Fra uen ist also stat istisch sehr signi fikant . h) Konfidenzi ntervall für due ~ li ttelWt'rt l'd i ffl' rl' n z : Die Differenz bt,trägt in den St ir-hproben Xl - X2 = 5. OÜ - 5. 25 = - 0. 19: das Konfiden xlnt orvallberechner sieh nach :
- 0, 19 ± 2. 58 ·
j - ' - + -_i ·t 1 58 2 1083
2 1 98i
Da raus result iert: - 0. 379 1 ::5
11I -
112
::5 - 0, 0009
Die obere G renz e des 9!.1\1f igen Konfidenzintervalls is t ga nz na h am \ r ert der We rt der :\" ll llhy po t hpSl~ ! c) Zur Berechnung von 'I wird d ie Summe eil'!" Abweichungsquad rate für Xlä nner und Frau en (= SAQ9'.' ) und die Sum mt' d er Abweirhuugsqnadrate für Xlänner und Frauen getrennt benöt igt . Da rr = jS AQ /u I ist . ist S AQ = (j 2 . (71 - I ): S AQ!J' . = I. ßG2 • 20 n9 = 5 i Ol . :3:Jß-l S AQ~"rau('n = 1';,8 2 .1082 = 2701. 1048 S AQ.\ länner = 1, 7 ,}2. g,s6 = 2985. 2 136 S A Q~·al = S'AQ ~"rau('n + SAQ'l anm., = 5686.318·}
328
A u!luIlylJ
'I = .fij = j O, 0026 = 0, OJ
Der Zusammenhang zwischen Ix-iden Merkmalen is t zu vern achlässigen! .,I.
:\1111- und Al ternativhypothese fes tlegen: llo: Es gibt kotnon Unters r-hiod im Wahlvorhalt en zwtsehon Katholiken und Nicht- Ka thollkeu. /l A: Die Konfession ha t einen Einfluss auf das Wahlverbal ten. Cl = 0.05 • Pr üfgröj-- lind Verteilung der Priifgfü~t' festl egen: Die P rüfgrük .\2 berechnet sich nach Gleichung 7.8 und ist mit df = (3 - 1)( 2 - 1) = 2 Ffl'i1u'it sgrat h'n .\2-\"l' rt f'ilt . • Ablehnungsbereich der Xullhvporhe«. kenuzeiclmen: Der krttlsebe \ \"er l für ein Signifikanznivea u \"( )J\ O.tl::i lil'gt in einer Verteilung mi t zwei Fn 'ihpitsgl'a dl'll Iwi .\~ ril = 5.!)!1 (Anhang A t' 1lI 1lt' hmen !). •
.\ 2 ::::
.\ 2 >
,\ ~ rl t
:dri'
===?
/10 nicht a blohnen
===?
Ho ab lehnen
• Berechnung der Prüfgröke ,\ 2: Alle erwarteteu \ \"I'ftt' sind gröber als ii , d. h. der Test dar f a ngewendet werden. Vgl. die Berechnung auf S. 3 17.
\ 2 = 5.t4 1 • Entscheidung übvr die X ullhvpothe,e: Da rler gemessene \ 2_\\"l'ft G.t ,.tl griik l' als der kritische \ 2_\\",'r t G.99 ist , wird die ;'\llllhypot lll'sl' verworfen .
5. a ) 1/0 ablohnen. da p p > 0.01. ß -FI' hl{,f
<
0. 0.'"). o - Fehler, b) 1/0 n icht ablehnen. da
Literaturverzeichnis Adomo. T lwndol' w. Pt al. (1900): Tbc AuthoT'i tm'in71 York / London: llarper uud ROll".
Pe r,~ orUlli t y. ;\P \\'
Agn-s t i. Alan (EmG): An Introducno n. to CategO/ical Data A n aIy.~ i.~. York u. a.: \\"ill'~·.
i'\1'W
Agrcsu. Ala n un d Barba ra F inle v (2008): Statistical Method8Jor the Social Seiences. Upper Sal l(J]p Riv-r. i\PI\" J ptsPY: Prentice ll a llv-l. ;\u Oagf'. Alba , Hicha rd . Pore r Schmldt und Martt na Wasmer, Hrs g. (2(KlO): Blickplmkt GesdlschnJt 5. Deutsche lind A usländer: Freund e, Frem de oder Fein de ~ Opladcn /Wiesbaden: \ \"('Std('u tsch" r Verlag. Alie rberk , Kla us R. (19i8): Afeß rü lIem l ltl/d Analyseverjahren - Das Problem ,,8t"jtliger Inter'vallskale7i", in : ZeitschriJI Jür Sozioloyie i (3). S. 199 214. Alllson. Paul D. (2002): Mü sing Data, qu a nti ta tiv !' Applications in t he Soclul Seieures. Oi -13G. T honsand Oaks : Sag t'.
Andr es. Ha ns-J ürgen , .Iaques A . Hagenaa rs lind Steffen K ühnel (I !.l9i) : A ll fll.IJM~ V01l TnlJdlen und kutegon alen Daten, l,og-lil/w l'c Modelle, totenie Kla.~.~ e " I17I1Jiy,'; c, l(Jgi.~ti.~che Regf"Cssion !Hul GSK- A ll,.~ a tz. Berlin j lleidelberg: Springer.
Arbeitskreis Deu tscher Mar kt- lind Sozialfor schungsins t it ut e. Hrsg. (1999): Stichproben-Verjahreu: in der UmJrageJorsclmnq. Eine Darstellung Jür die Praus. Oplade n: Leske + Budric h. Komment ar .
Arbeitskreis Deut scher Mar kt- lind So-tal fors-hnngstnstfuue e. V. (2000) : Jok rcstxri clü 2000. htt p: / /www .adm -ev .de /pdf / J a hre s be r ichLOO . pdf . Ar beitskreis Deutscher Markt- und Soztalforschungsmsutut o P . V. (200G): Jotueet cri clu 2006. http : / /www . adm- ev .de /pdf / Jahresbe ric ht _06 . pdf . Bahhi(' . Ea rl (199i): The Practicc oJ Socia l Resea rch. Belmon t . Ca.: Wadswor th. 8. Auflage.
aao
L i t~rul u nJ e rzeicl' lli~
Back haus. Kla us ('I a l. (2003) : Multio arict c A Tl alyselllcthodCll. EiTl c an· wen dungsorieutie rle Einf iihnm.fl. ß erlill/ Heidelber g: Springer, 11. Auflage. ß al"llt's. Sa muel et aJ. (1979) : Political Ad ioll. lt'estem Dcmo cmcics. ß l'w rly Htlls : Sage.
Mrlih~
Pm ·ticipatirm in Fioe
But tnie. Borne rd et a L. Hrsg. ( Hl!.l9): Ontinc Research. Meth oden; A nwendUlig en lind EI"g eb lli<~<~ e. C ön ingen: Hogrefc. ß äckpl', Gerha rd (2U07): IVfl.~ heijlt hit!· .,geri7l!Jfi igirr":I Millijo b.~ al.~ wuchsen des Segment pl'f:käl'Cl' Beschäf tigung. i n: Bomd r K oller lind Hartmut Seifort. Hrsg.: A tY1l i.~ ch e ß eschäftiglm g • Flc:rib ili.~ i enmg und soziale R isiken. Ber lin: editlon sigma. S. 1117· 12G. Ik-hnke. .Ioachim lind Xathnlio ßchnke (20U6): Gnm dlayCll der statist ischen Daten a7w !yse. W il's badf'lI: VS Verlag. Bennin ghaus. Ha ns (20U5) : Deskriptive Stat ist ik, Eine Einfiihnmg fü r So Zi fl!wi.~s ctw}wftler. \\'il'sbadt'll: \ 'S Verla g. 10. .-\llfla gp.
Bijlcvcld . Cat rien C . .1. 11. und LcoJ . T h. \ 'a1 1 de r Ka mp (1998): Longitudi nal Duta A nalysis. Design, M odels und JfcthOik Lo ndou: Sage. Billlot. .Iaak . Ar-hi rn Koch lind ),Iid ll'l P hili ppe ns (20U7): Unde rstand und fm proving Response Rates. in: Hogor Jowcl l et al. . llrsg.: M eas uring A ttit u de.~ Cross"Natiollally. Lcsso ns from the Europ eon Sociat S Ur'vey. Thonsand Oak s n.u. : Sagt'. S. 113 -1;3::',
Blnlork. 11111Il'l't ;'\P \\'
~ I . (19G7): TO lJ)(I!YIll Tlum-y of Yo rk: John \\' ilpy &: Sous.
Mill o rity- GfY) uJ! -Rel(l l io1l.~,
Bleymüllr-r. Josef. C ünt ber Geh lort lind Herhort Gülicher (200"): fü r lVilt.~ rhafts wÜ$ell$ ch aftle r. München: Vahlen. 14. Auf lage .
St at i.~ tik
Blossfeld. Hans-Pcu-r. Katrin Colsrh lind Götz Rohwer (2007): Eoent History A n a !y.~ i.~ ll!ith Stata. Xlahwah. Xow Jersey lind London: Lawrenec Erlbautu . ß iikpr, Fred (1993) : St (lt i.~W; lertlw (1111 P C. PHJym11Im'!C.~ ch rci b u flyni . Übullgen und Lernziele zu m St a ti.~tiI.7JrogmmmJ!flkct GST.4T. Giit tiugen: Vandenhoock &: Ruprecht . 2. Auflag e.
l, ittmtunwl"Zt' idmis
331
ßöker, Fred (1998): Mehr Statistik lernm am pe. ProgJU m m besehreibllngm. Üblln.qen ulld Lern ziele zum Stntistikproqmmnumkct GSTA T2. C öttiugen: Vamlenhoeek ,'i.: Rupreclu , 2. .\ ufl.
Böltken, Ferdiuand (197G): A uswahll'e, j ahtm . St uuga rt : Tenhne r. ß or tz, J ürgen (2IlO-I): St(lt i.~tik fiir llumon- un d lin rHeidr-lberg: Springer. G. Aufla ge.
So zia lwi.~s rnsch aft le,·.
0 ('1'-
Bor ta , Jürgen llJIII Xicola Döri ng (2U()Ü): Forschunqsmcthodcn 1I11d EvaIUlltÜm. ß I'rlin / ll l>jl!f'J lll'rg: Springer, -I. Auflagt'.
Braun, ~ rkhae! und Puter Ph . ~ l lJh l r r , Hrsg. (199-1 ): ß1icklJ1w kt Ge.~r1lschaft 3. Eillstcllungm und Verhalten der B nndesbilrqer. Opladen : \\'estd put sdwr Verla g.
Braun . ~ Iil'haf'l und Pctcr P h. xlohlcr. Hrsg. (1998): ß1icklJ1m kt Gesellschaft 4. So ziale Ungleichh eit in Desüschlcnd. Opladen: Wes tdeu tscher " erlag. Brosins. Felix (2UU6): S PSS 14. Dünn:
~ II Tr.
Bundesm inisterium de s Innom (20UG): Deutschland beteiligt sich mit einer rcgi.~t Clye.~tiitztcn Ziihlu1tg Im der komm en den Volkszähltmg.~'·lmdc der EU 2U1O/2 011. Pressemitteilunq vom 29. A ugust 2UU6. Bür klm. Wi\lII'! m und Xlarkus Klein (19!.l8) : Wahlen lind Wiihlerverhalten. Ein e Einf ührung. Op11 al. (1980 ): The A m erican Vote1'. Urwbridged Editiorl.
Chtcago. Cltic
Campbell. Donald T. und J ulian C. Sranley (1% 6): Erpe rimental and Quasi- E:rperimentaf De.~ i9 ns [or Icescorcti. Bost on 11. a.: Hong hton :\liffli 11.
Cannines, Ed ward G. und Rlchard A. Zrl1"r (1979): R eliability end Falidity A s,~ esMn en t. B(' \'rrl ~' Hills: Sage , 2. Auflage. Chalmers. Ala n F. (2007): Wege der IVü senschaft . Einjiihnmg in die Wissenschaftstheorie. Ol'rlin/l ll'idelbt'rg: Springer , 6. Auflage.
332
L it~rul u nJerzeicl' lli~
Chan, Sto ve ( Hl97) : In Secreh 0/ Demo cra ue Pence: Pro btcms end Pro mis e, in: M e1'shon lni crnationol Studice Review -l l , S, 59 91.
Clauk, Günt er un d lleinz Eime r (1989): Sl a tj,~tik [ iir SoziO[O!lCIl, PiidfI!I(J!l RIl , P.i.tJcholo!JC7I un d Mediziner. Thu n, Frankfurt: l larr i Deut sch, G. Auflage.
Converse , Jean :-' 1. un d Srnnley P resser (l 98G): Su rvc y Quest ions. Handem/ting the St anda 1'dized Que sti07mai11'. ß l'\"f'rl y Hil ls: Sage. Diekmann , Aud reas (2008) : Em]Jiris ch e So zia[/OI'sclu l1Ig. (,' nmd[a!lcIl , ,\ /ethode n: A nweliduligm . Reinbek bot Hamb urg: Rowohlt , 19. Auflage. Dill ma n. Don A. (I U78): Ma i l aiid Tclq !holle Sm-veys. The Total Design Meth od. j\".,\\. York 11. a.: \\"iley. Dirton . Ha rtmut (I U98): M eh rebcIlC71 an alys e. GrulidlaYr1l und A nwcndullyen des Hiem rchis cli Linea ren Modell.i , Weinheim lind Xlüuchen: .Iuventa.
Dorror-h, flt'in;, (199.J): Meimmg.mwcher-Re]!01t . Wie Um/myccry(:blli.i,i C entstehen; Oötungen: Steidl.
Doctdto. J . F. und S. L. (I aertne r (198G) : Prej ndice, D iscr im ill ll t ioll , und Racism . tlisto ricol Trends crui Cont emJlorary A pproaches. in : .J. F. 00vidio un d S. L. Caert ner, Hrsg.: Prcj udice. Discrimmalion; ond Ra cism. Orlan do: Acadcmic P ress . S. 1-3.J.
Druck man. James :'\. Pt a l. (2006) : Tlie Cl'Owlh und Oeveloll1l1eut 0/ Experimental Research: in Politicul Se iewe. in: A m erierm Polit iCtJl Science Review WOHl, S. 627 G3,j . Dr uwe , Ulr lr-h (199.J): Studien/iihn'f' Po [it ikwü.~ en$ cFw/t. Mün chen: ars una. 2. Auflage.
Eaglv. Alin ' 11 . und Slwll~· Chaikcu (I mJ:3): Th e Psye!w [ogy Fort \\"ort h u.u.: Han'o ur t Braco.
0/ A lt itudes.
Elliot , DaH' (199 1): IVei,llM in.'7 /01' Non-Response. A Survey Itcscarcticr 's Cu ide. Londnn:
ores.
Engel. Uwe und Jost Reinecke (I U9.J): Ptl7lclana[yse. Gn mdlayen . Tee/m ikm . Beispi el e. Bcrl tn: De Gruvn-r.
l, ittmtunwl"Zt' idmis
333
Fahrm eir , Ludwig Pt al. (2UDi ): Stal i.~tik. Der Weg zur Daten analyse. BcrIin /Heidellx-rg: Springer. 6. Auflage.
Falter, J ürgen \r. (19. 7): F:inmrd mehr: Lr'ijlt sich rIfl8 K onecvt der ParleiirImt ijikflt irm (11J/ rlellt.~che Vc rh iiltn i.~ .~ e iibn·trnf/W r Th rrm:ti.~ ch e, mcthodoloqische un rI emllirüche Problem e ein er l'alidirn m g des K onstrukts Parteiiden fijikati on für die ß mtrle.m ']lllblik Deutsctüana. in : 1'0liti._che Vi erl. eljah re.~ schrift (2/ 3) , S. -I'6 -jUU. Falter, .Iürgen W . (1991):
/li t/r ,·.~
Wähler. :-' lü ndlf'lJ: C, 11 . Beck.
Falt er, .Iflrgen W. et al. (1983): A l'lJei t.~ lo.~ igkrit und Na tio lla l.~ ozilllism ll.~. Eine empirische A nalyse des ßeit rag.~ der Mas" enenv erlJ.d osigkeit zu ,ien IFahler/ olgen der NSDA P 19.12 und 19,'],'], in: K ölner Zci t~ ch l'ift jül' Sozi ologie und So zialpsychologi e 3;j{3), S. j2j -j j I. Faulb aum , Frank. Xla rc Deut schmann und xlartfn Kleudgen (2UU3): Computenm teTstiitzte8 Prc teetinq von CA Tl-Fmgebi(qcrl: Das C A PTlQVerjuhr cn: i n: ZUMA -N rl(:hr icht cn j 2. S. 2U :3-1. Fl ick Uwe (20()'j'): Qualitative So zialjm'sclllmg. Roinb r-k: Rowoh lt .
Follm er, Richa rd und :-' h'nno Smid (1998): Ni ehteingetmyene Tclcf onnummelil: E,yeb tl i.~.~ c eines Methodentests. in: Siegfried Gabler, Sablne lIäder und Jü rgen II .P. Hoffmeyor-Zlot ntk. Hrsg.: Telejo 71.~ tieh1J ro lJen in Deutsctüand: Opladen / Wk-sbadcn: Wes tdeutscher Verlag. S. -I:i -[)' . Frev. ß runo S. und l l annclorc \\'t'('k (1981): llal A rbeitslosigkeit de71 A u/ st ie!J dt\~ Nal ionalsozialis7ll u$ bewirkt r, in: Jahrbuch jiiT Nationalökonom i e und Stati.5tik 19G. S. 1-:31. Frey, .Iames 11., (Ierha rd Kun z lind G üuthor Lüsr-ln-n (1990 ): Telej onuinjrag e1/. in der So zialjOl'Mh lmg. Mr tnodcn; Technik en , lJ'l raguII.rJsllm r is. Opladeu: \r('~td ('u tsd\('r Verlag.
Friedrk-hs . J ürgon (1990) : Methoden emp irische r Sozialforsehung. Opladen : westdeutscher Verlag . 1-1. .....uflege.
Frtedrtch«, J ürgen und Hartmut Liidt ke (19ii) : Ttilndl7lj(~ 7ulc ß r ol){lchtUIIg. Einjüh7'1mg in die s(lzial1L'i.~.~ens ehajtliche FeldjOl,,~rI!lmg. \reinheim : Bel t a, :3. .....uflage.
Früh . Wemer (2007) :
lllh alt.~ mwly.~ e.
Konst anz: UYK. 6. Au flage.
334
L iteml urver z('j.. l<" j~
Fuch s, Marok (I U!H) : Umfmgeforsehuug mit Telefon und Com puter, \\"I'in · heim: Beltz. G abler, Siegfried und Sa bine l l üdcr (1998); Problem e bei der A I/wendun.rJ VOll RL D - Veli n/m 'n, in : Sil'gfrif"ll (I abler, Sahi ns ll äde r lind .lürgen I I.P. Hoffmeye r- Zlotnik. Hrsg.: Td rforMtichprolH:fI ifl lJf' u t.~ chl!llul. Oplad t'll j Wil'sIJilrlf'11: Wrs td f'l1l sd lpr Verlag. S. ::iS GS.
Gabler, Sieg fri ed. Sabine Hädcr und Jürgcn II .P. Hoffmcycr-Zlotni k. Hrsg. (199B): Telefo 'k~ tichp rob en in Deutschland, Opladen: Westdeutscher \ 'erlag.
Gabler, Sieg fru-d, .lürgen 11. P. Ilotfmeyer-Zlomi k und Da g ma r Krebs . Hrsg. (199-1); Gewichtung in der UmfragcIJraxis. Opladen: \\"('sldeuts cher Verlag. Gehring. V"'I' w. lind .l ürgon R. wtnklor (19!J/): P arteiidentifikati on, Konaidoiea- end Issueorientierul/gen als Dcu rmaumtcn Ik~ WnhlverIw ltells in O$t- lind n b tdeut."chland, in: Oscar W . C a b ncl. Hrsg.. Politische Oricllti enm gen un d Verh nlt e 1ls wci.~ e ll im vereini,qtcn Dcuts chiand. Upladen: LI's kl>
+ ß ud r ich. S . -173
::i06.
G ESI S . Hrsg. (2007): AUßUS. DIll enhandbuch 2UUG. ZA-A'r, 45UU. Köln
und Xlauuheim. Grümer, Ka rl- Wilholru (l97-1): Beobachtu llg. St u ttgart: Teubner.
Gschwond. Thonras (200::i) : Ökologische Infen!7lZ, in: .Ioachim Bchnk e ct al., H rsg.: Methoden der Poli l ikll'i.~s cnsch aft. N euc rc qualitalille und quantitative Verfahren. Baden- Baden: Nomos. S. 22; - 2] 7. Gschwe nd. Themas und Mare lI o og lw (2008) : SJw uld I Sl ag or Shanld I Go? A ll RXIJ(Ti m elltal Stlilly Oll Voter Rf\~IJ() llsrs ta Prc-electoral Conliti07I$, in: Europeon Journal of Potiucot Research. -I7(;j ), S . 536 - 3;;. Hai sken -D ex ew. .lohn P. und Joachim R. Frick. H rsg. (200::i): DTC. Desktop ComlHmion to the Germa n S ocio-E couomic Panel St udy (GSOE?) . Ve r.~ i o n 8.0 (U' Jdated 10 Wnlle U). Bor ltn: Deutsches Instit ut fü r \\ 'irt sch aftsfcrschu ng.
Hanefeld, VIf' (1987): Das S ozio-ök(!1l1nnische PIl1/c1. GI111ullfl.rJf'ft Imd K ons cptum. Fra nkf1ll"t / X(>\\' York : Cam p us.
l, ittmtunwl"Zt' idmis
ll arkness. J uncr ...... . Fons vun de Vijvr-r lind Pr-tor Mohk-r . Hrsg. (2003): Cross Cultuml Survey Mcihods. Hobok en . :\.1: Wiley. lläder, Sahillf' und ..... xel Glemser (200G) : Stid1lJnJ/u:nz ichun y jiir Tdf/O 71lltllfmYrrl in nc ltt.~ chl(md, tu: ..... nrlreas Diecktunnn, llrsg.: M rthodw der Sl]zialfOl~~ehllllg (Sonderhef t 44 tier K ötner Zcit.~ chrift fü r So ziolo.IJie und Sozialp.~yeho I09ie). Wiesbaden: \ 'S Verlag , 5 .1 48 -1 71.
Häder, Sabine lind Perer Lynn (20U7): Hr nn Rcp res cn totioe ean 11 MultiN ation S ll7'I.lCY bel', in: Rnger Jowell Pt al.. t1rsg.: M caSltri1l9 A tt itudes Cro.~ 8- !\lrlt icm lllly. [,e.58011.5 from th r F,ll ropf'fm 5'odll! Sll nwy. T hons and Oak s
11.
a.: Sage, S. 33 -52.
Ilempel. Carl G. und Paul Oppen hr.lm (1948): Studies in the l,ogie of F,xlllm w ti on , in: Philo.501lhy of Scicncc 15, S. IJ ;j-175. Ingfehart , Honuld (1977): Thc S ilent Revolution. P r tnceton: P duceron University P ress.
.la("01I, Rüdiger 1lI1l1 \\"illy 11. Eirmlu er (200U): A llgemeine Beviilkcn.mgsumfragm. :-' lündH' Il/ Wi E'lI: (Jlrlr-nhourg.
.Ia nctz ko. Dtct mar (UmU) : Stat i.~tiseh c A n wend ungen im Intern et. In Netzumgebmlgcn Dat en erhe ben, ausunrtcn lind praescniicrcn: Xlünchen: Ad dl son- \\"t'sley. King, Gar y S. (1997): A Sol ution to the Ecologieal Infcrcncc Problem. Reconstructinq Indivi dual B r hnoior from A!l,IIregate Da tu. P riuceton. Xew Jersey: P rim-et on Univcrsitv Press.
Kor-h. Achim (1991): Z um Z'lSllIIlfIu." tlum y vrlJl 11Iter vi cul('rmcr /.:1111l1cll 1l111i A 'l.~s ch öJljll ngsq u o t e n, in: Z UMA -Na chriehtcn 15(28), S. 41-;j:.t
Koch. ..u-him (1993): Sozialer lVuudcl als A d ejakt urä cceducatichcr A ussch öpjung. Z um Einfl uß von Verändcn m !lCfl der A ussehöpfungsquot c auf die Zeitrcihm des ALLß US. in : Z UAftl -Nach"ieh tcll 17, S. 8J -113.
Koch...Achhn (1995): G cfiiL~ ch t e Interviellw: E'~J c bn iM,e der l iucroiciocrkOrttmUe heim ALr.n CS 19 94, in: Z UM A -N ll chri cht cll 19 (:30 ) , S . 89 · l U5.
:J:J6
Lit~rulunJe rzeicl'lli~
Koch. Ar-hirn. Sicgfned Gabler lind ~ I iehad Bra un (l99-l): K onzeption un d Dlirchj iihnm g der "A llgem eineIl ß rvölkcn m asltmjm gc der So zialwi.w:rw:}lIIjtcn" (A Un US ) 1994. ZU1\ I:\-.-\rbeitsberir-ht 9-l/11 , 7. U ~L-\ , ~ lan nheim.
Koch , Achim ('I al. (1999): Konzeption und Durchj iihn m g der "Allgemeinen n evölkeru ngMlmj rage der Sozialwiss cn.~chaftell" (A LLn US) J998, ZU ~L\- :\rl ll' il slw r ieh t
99 /0 2,
Z U~ I A ,
Ma nn helm.
Kolrler-, Ulri ch (20U6): Schät zer f ür komplcu Sticlunnb en: in: .loarhim Behnk e et al.. Hrsg.: Methoden der Polit ikwisser~~ cJUljt . Neucrc qualitati ve und IJllImtitativ e Verjahre n. Baden- Baden: Nomos. S. 309 320. Kohler, Ulrich und Fran k!' Kreuter (2008): D a t e rw nllly.~ c m it 5t ata. A llgemrine K onzept e der Dlltew m alyse und ihre pmkti.~ch e A nwendung. ~ 1 (j Il('h t'll/ \ri t'll : O ldcnbourg. 3. Aufl age.
Krämer, walrer (1991): So lilat man mit Statistik. Frankfun / Xcw York: Campus .
Krämer, \\'al tt>r (I99-l): So überzeugt man mi t
Stati.~ tik.
Frankfur t j Now
York : Cam pus .
Krtigener , Sonja (2006 ):
- A ktueller Stllndund in: Fra nk Faulbaum und Chris lo f \\'olf. ll rsg. : Stichpmbenqualitiit in ßevölkeru ng.~ /l mfmge n. Bcnn: rz, S. ;);) GI. RC!J i.~ te1'!Jest iitzt er Zelk~ ".~
En t wi ckl1mgspcr.~pekt ivC1l.
Kromrey. Helmut (200G): Empirische N Luciu s. 11. Auflage.
Sozialfor<~chullg.
Stut tga rt : Lud us
K üh nol. Stoffen und Dag mar K rebs (20( 7): Statistik [ii r die Sozi ulwi.~ ,~CIl schuften: Grllnd lflyCll, Methoden, A lIWCT,dllll.fJCII. R eiubek lll'i Harnburg. Rowohlt, .l. Aufla ge.
Kurz, Karin. Pet cr P rüfer un d ~ ( a rgi t Rexroth ( Hl99): Zu r Validität von Flu ge" in etondordieiertcu: El·hebllngclt. EI"9cb n i.~.~ e des Einsatzes eines kognitiven Prct eetinuroieme. in : ZUMA -Nachriehtm -l.l , S. 83 -108. Lakat os . Imre (l 9 / -l): FlIlsijikatioll lind die MethlJlloltJyie WisMTl.~chajtli eher Fm·$ ch lmg.~lJ1'Og m m m.e. in: Im re Lekatos und Ala n Mu sg ravo, Hrsg.: K ri/il.: und ErkCll n t ll i401't.~ eh ritt. Brau nsch weig : Vieweg, S . 89 -189.
L iltru / un!t'f·u id,,, is
337
l.azars feld. Paul F .. Bernard Bcn-lson lind Haael (land et ( 19GB): Thc Pcople 's Ctioicc. 1I0w th r Votrl· Make» Up llis Ah nd in a Prcsidcntial Cnm· pnigll. Xew York und Loudon: Columbia Univcr sitv P ress. 3. Auf lage. l.a znrs feld . Paul F. unrl Herber t !\[I'll1 pl (1972): G7'OUP Clw m ctrristirs und
Their Inte rrclations, in: Paul F. Laxarsfeld. Ann K. P asanel!a und Morris Rosl' nberg, Il rsg.: Conunuiues ill the Langua.fJ 1' of Socilil Research: New York: T hc Free P ress. S. 22Zt - 237 . Lccln-rt , Yvonne, Pau l Srh roedt cr und Peul L üt tmger (200G): Die Um :;dzurl.q der nildu flg.~kla.$sifika t io ll CA SMliV für die Volb zähltl1lg 197U,
die Mik7'OZC1ISW;- Z II.illlzel'hebulIg 1971 und die Mikm zc lls(;II 1976-2(J(}4. ZUMA -Afrthodenbn l cht 2U(J6/ 12. Man nheim . Z U ~I A . Lp\'Y, Paul und Staulev Lerneshow (19tH ): Smnplifl.fJ of Pop u/ation..<;; Methods ond A ppiicat ums. ;'\ P\\· Yor k 11. a.: Wil{,)', 2. Aufl agt'.
Lit .tle, Rodertck J. A. und Donald B . Rubin (2002): Statist icol A nalysis W ith M issin.q Date. Xew York : W il!')', 2. Auflagt'.
l.on g, J. Sr-ott (1997): Rrgl'es.iion M odd.<; [o r Cat cgoricll/ and Limitcd DeIJcn dcnt Variab/c$. T honsand Oa ks u. a.: SaW'.
Reua te, Kurt 110110 und Peter Hübner (1978): Eillfiill1'llflg in die Methoden der cnlpif'i$rhen So ziologie. Opladen: \\'I's td l'u ls d lPr Verla g, 5. Auflage.
~ Ia)'nt z ,
:>' Ia)'rin g, P hilipp (2007): Qua litnt ive Inhaltsallalyse. Gnlfl d /Ilgcn und Tec hniken. \\'l'inh eim: Deutscher Studienverlag. 9. Au flage. Xlr l ver • .lohn P. und Edward G . Carmiucs ( 1982 ): Uuidiniensional S caliug. Lonrkm: Sage . 2. Auflagt' .
:>. 1('rt('l1 . Klaus (199;; ) : InhaIL<;mw lysc. Einfiihn m .fJ in Theori e, Methode und Praxis. Opladen: Westdeutscher Verlag. 2. A ufla ge.
xfletz ko. Mat t hias und Conu-lia \r{'i ns (1999): Polizei un d Frem denfeind. lichkeit - Ergebnisse ein er ß{'f m gllng in einer «esuieutscnen Potieeiäirckiion., in: M onatsschrift fü r Krimi nnloqic und St m fre cht.<;refol"lll 82 (2). S. 77- 93 . :>. lü l1{'r, Walt or lind '{ossi Shavtt (1998): B ildunq und lJc1'uf im in..stautionellen Kontert. Eine vergleic hew ie St udie in 1.'/ Läfulem . in : ZeiLi chlift fü r Erzicll1m9s wü.~ enschaft 1. S. ZtOl-533.
:J:J8
L it~rul u nJ erzeicl' lli~
Mohlcr . Puter Ph . und \rolfgang Bandille . Hrsg. ( l U9 2) : Blickpunkt Gesellschaft 2. Einstellungen lm d vernolten der Rnnde<~biirger in (ht un d IFcl;t. Upladen: \\'l's tdl' utsdwr \ 'prlag. \\'altl' r pt 11. 1. , IIrsg. (199U): ßl ickpulIk t GrM~llM;haft. Ein,~t dl1t llg w un d Verhalten der' fl undesbürger. Opladen: \ \,ps tdl'u tsd ll'r vor lag.
~liill t'r.
Xoe lle-Xeumann. Eltsabet h und T hemas J'ctorsen (19UG): A lle, nic ht j eder, Einfiih nmg in die Method en der Demoskopi e. München: dt v. O P\I, Karl-D u-ter (2005) : Md lwdolo.rJie der- SozialwisM: n~ rhllft ell. \\'i;oshaden : \'5 Verlag. G. •Auflage. Ort h . Bcmhard ( IU7-1): Einf ührung ill die Theorie des M essen s. St uttgar t: Kohlh am mer . Pappi , Franz U, (197j) : .4 g9,"cgf/ tda te,w'l(I ly,~ e, in: .Iürgcn vau Koolwij k lind Maria \\" i {' k l' n - ~I
Patzelt , \\'l'nll'r J. (20U7): Einfiihrnny in die \\"isseIlSt:haftswrlag Rol h.,. G. Auflagt'.
Po lit ikwisM;1I.~ch aft.
Passan:
Poppe r, Kar! R. (1971): Die EO!Jik dCl" For,5C/lIJlIg. T übingeu. Mohr , Porst , Rolf ( 198;)): Proeie der Umfmgrfo r$ehung. Erh eb/mg und A u.~ wer tl/ng $ozia l wi.~s rn.schaftlicher Umfmgedaten. Stuttgart: Teubuer. POM'r, Ha ns (2001) : n 'i.~$ ftI<~ ch afts th eo rie , Eine rung . Stuttgart: Rcclam.
philo<~oph is('he
Einfüh-
Pri m, Rolf lind Heribert T tlma nn (1997): GnmdllLflen eimT kri ti,~ rh mtionalftl Sozialwi,~,~ ftlschaft. \riesbad l'll: Qut'llp IUIII ~ 1l'~"Pf , 7. Aufluge. Raschk e, .Ioachim (19Ul) : Die Pnri citaqe der Grün en. in : Zciiocschichlc -Il (ßl I- 12). S. 4G-54.
A lj,~
Politik und
Reiuwkc. Jos t (1U9 1): Interviewer- und Refragt en llerh ultell. Thcor ctiectic A n,~ rltzc und m dhodische f(OIlzelJte, 0\1111.011'11: \\'I'stdf'utsdll'r Verlag. Reinecke. .Ios t (200;)): St l'lJktlllyleichllngMlwd elle in den Sozial wüs enscJwften . xlünr-hen: Oldenbourg. Rir sr-rt., J ürgcn (20lJ:l) : Einfiihnmg in die I,agik der ~lülIs tt' r: \\'('St f
Soz itJllJ.'i.~,~ e".~ chaft CII.
l, ittmtunwl"Zt' idmis
33!l
Robinson . \ Yilliam S . ( l g;jO): Ecological Cerrelations aud ß chavior of lndividuals, in : A m cri can Sociological Rw iew 15 , S. 3ö l -3 rl; ,
Rohwer. GülZ lind Ulrk-h Pütt er (2002): Wahrscheinli chkeit. n egriff und Rhet orik in der Sozill lfor,~ dllmg. Wpin lll'im lind ~ liilldle ll: .1l1\'f'1I1a . Rost , J ürgcn (200.J): Lehrbuch Tesltheorie un d Testkonstruktion. Bem 11. a.: Huber. 2. Auflage.
Flucht , Diet er , Pet er Hocke und Dietor On-mus ( 199:)): QUfln titutive l nhaItMJlIal.VM'.' Warum , wo, t/Jlltlll tw d wie wmAe in der n lm rlesreJlubIik protcsticrtv; in: Ulrich \ 'OlL Alemann. Hrsg.: Polit ik1lli.~.~ C1I,~ r:lwftIi che Methoden. Opladen: Wrs td t'u tsd lt'r \ 'erlag, S. 26 1- 29 1.
Sachs, Lotbar (2000): A ugcwllndte St atiMik. ß t'rlini Hpid t'lIlt'rg: Springe r, 12. Aufla gt', San-is. Vikror (199'J ): Einf iihn mg gorich 11. a.: Pa bst .
i ll
die experimentelle /'$ychologie. Len-
Schafer, .1. L. lind .1. W. Graham (2UU2): Mj,~,~ illY Dnt a: Our Vicw of the Stete of thc A rt, in : P$ydw logieal Mcthods ; (2), S. 1.1;-1rt. Seheafter. Riehard L., W illiam xlende nbal t lind Lymau O u (1996): EIem entfll'Y Survey SU1Jlpling. Belruont , Ca.: Wadsworth. 5. Auflage.
Schmit t- Bcck. Hüdtger, Stefan Weick und Bernhard Christopli (2U(){j): Sha ky A uodimcnu: l nrli!.> idual-Ievcl S tability ond Change of Parneonship A m oll.'] West Cerman Voters, 1984-2001, in: E Ul'OllCUII J O!lI"1w l of Politieul Rcseavdv :15(:1 ), S, ,j81 - G08 . Sehn elt. Rainer (1991): Der Einj1Jlji gefälschter In l e rt'ie ill,~ auf Sm'VCyEly ebnisse, in: Zeit,~ ch rift für Soziologie 20( 1). S. 1;; -35. Schnell . Rai ner. Paul B. Hi li und Elkc Esser (:.wU8) : Methoden der empirischeu Soeiolforechunq. :\l iil1eht'T1 i \ Yil'lI: Oldcnbourg, 8..Aufl uge.
Harald (2UOO) : Den Wechse/wiihlem uuf der Svur: Rccall- und Pane/daten im Verglcich, in : .Ia n van Deth. Ha ns Ra ttinger 111I11 Edol t raud Rolle r, Hrsg.: Die Repuhlik f~uf dem Weg zur Norm uIitiit r WflhIllerhlllten und lJOIili.~ch e Einstd lungen nacn acht J ahITli Einheit. Opladen: Lesk e + Bud rich. S. 199 -12G.
SdlOf'II ,
L iteml urver z('j.. l<" j~
Sehnman . Howa rd lind Stnnlev Presser (199G): (JIl C.~ ti07"~ and ..lnswn s in ..lttitudc Sll rllcy,~ , Experim m ts on q u e,~ t i oll Fon II , Wonii ng, and Contezt (Nachdruck). Thonsand Ouk s: Sag e.
Schwarz . Nor bert 1'1 al. (198,j ): ResptJllse !ic/lk,~: F,f fect.'1 of Cfl tr'ljll7'Y RrJ1lYc on Reporterl ß d lllvior muZ COllqHl f'Utive J lJ /l.qm e n t.~ . in: Public O'Jin ioll Qllartel'ly .l9. S. 388 -39;j, Snij ders. Tom A. B. und Rool J. Bos kor (19tl9) : Afllltilevd don 11. a.: Sagt'.
A fl aly.~ i.~.
Lon-
St evens. Stanley S. (19.lG) : On tlie Th rory of Sral (;:,; of Measuremenis. in : Sc ience 10:5. S. G77-G80. Sudmau. Sovmour (1982): A.~kiflg Q lI est io 71.~ . A Pm ct ical Gllide to uonnoirc Design. Sa n Franr-lsco: Jossey- Bass.
Q (j(\~
Teusch . Ulrh-h und Martin Kahl (20m) : Eill Theorem mit Verf allsdatum ? Der 'Dcmn kmtisc lie Frieden ' im Kontext der Glo{mlisien l7l,q. in: Zeitschrif t f ür l nte mationclc ß eziehuflYCfI 8(2), S. 28i -3 2U.
Tur key. Jolm \\'. ( 1977): EXIJlomt/wy Data \\'E'sley.
..l lW /Ysi.~ .
Reading: Addiso n
\ \'agw>r. Gen G. (:!UUG): Di e Macht der Zahlen: in : 360 Gmd. Fcchmaq asin für das Mana gem ent im öffentlichen S CHOf' (5), S. 1.l -15. Wallace. waltcr L . (1971): Tbe Logic of S cien ce ill Soci%gy. Chicago /Xew York: Aldine-At berton. \\'asnw r, ~ la rt i na et al. (HJ96) : h'om el!tiofl lind Durchf ühn l1tg rief' ..All.t]em cin efl ß evölken tflYMlmf m ge der So zifJlw is,~ en~ clwfl e n " (A {,{,D US) 1996. 7.U:'II.\-Arllf'itsherj("ht % / 08. ZU:'Il.\ . Xlannhehn. Wasmcr. Xlnrti na. Evl Schob lind :<'Iiehael Blohm (2007) : Konzeption und Durchf iihn lUg der ..Allgem einen ßC llölkenm.t].~1l7nfmg e der S ozialunssen$chaften '; (..lU DUS) 2006, Z UI\ I:\- ~ I(' th odenb('rich t 2007/ 09, Z U ~I A . Mannh eim. \relH'r. Ma x (1980): Wü'/.~ ch (lft mut Gc:,;d L~ ch(Jft . Gl'lt1utriß der »cretchcnden Soziologie. T üb ingen: Moh r. 5. Aufl age. \\"p!)f'r, Ro hort P. (J 9DU): Itosic Conte nt 2. Aufl age.
A 71 aly.~ i.~. ~j' lI"bury
Park: Sage,
L iltru / un!t'f'u id,,, is
341
Widmaior. Utrtch (1997); Vergleichend e A 99 ,.eg llt da l e fl(maly.~ e, in: Dirk Berg-Schlosser und Ferdi na nd ~ Jiill "r-Rolll n l('l, IIThg.: Vnglcichende Polilikwiss fn8cha!t. Opladcn: Leske + Budrich. 3. Aufla ge, S. l (ß - 118. \rinklpf, J iirgl'll ( 19%): Sozials/f11ktur. JI()lit iM~he Tr(uli/imu,,, lmd Libernli.<mll.~ . F:iru, emuirische l,iilly,~,~thtl i U.~tlllli e zur II/ahln tt wicklun9 in Deutschland 1871 - 19.'1.1. O pladen: Wes tdeutschor \ 'er lag. ~1. (:WOG): IntrodllclOf'Y Economctncs. A Modem Approach. Ciucinna ri. Ohio: South-Wostem Colleg e Publ .
Woold rid gc, .Ieffrey
Zent ralarchiv für empirische Sozia lforsdlll llg ( 1999): A llyemd nc n eviilkcrun.q.~ mJl!rage der Soeialunssenschuftcn, A LLn us 1998. Codebuch ZAN r . 3VVV. Zentralarchi v für Emplrlsche Sozialforschun g an der Universit ät zu Köln; Köln.
Register
13.1
5-Pllllkt(~Z ll~a lll1 "'·llr,,~sll n g
A b b ild u lll/;SVOTheh r ift
12
Abhängifl:(' Sl k hp rulJt'lI .
. . . . 292
,\bhiingig(' \ 'a ria bI(' . .
105
Abld lllU ligsuprc iclJ ,\b,ulm (' lI äufigkcit l'lJ. Absolu tskala
280 101 -15
.
AO:\I-:\laSI{·rs
. .. 2lü
Adres Raudom Agg rt'gill da t" u
21fi I;
.
Agg r" giltio lis lIi\"('all . .
. .. •. 19
Ak'lll;"SZ" TlZ.•• .
. . ••. ., idw
Z" s l i"'" 111I Il'jStpll, I,'" Z
ALLlH; S n-H·hl,'] . . . Alt Nlla t ivhYI'" t ],l'M'. . . . AlIunyllllt i;t der Ikfra gung Arlt hlll{·t isd ,,·s :\Iitl d .. .
!G, 31 . .. 273
A ufwänutrege .
.
. . . 272 88 126 8-1
AU'Gille lt em-Xcnrespouse . Unit-Nonresponse . AUS l"t,iliil'r . . .. Aussrhüpfungsquote . ..\ u,,,",,hl .-\Il, ,,"a hh·illll,'it.. . .-\u, """ hlK' N "' ,t. h,·it
8-1. 198 . ... 198 13-1 . 199 191 19T 196
Halauciertc Frage .. i 8 Balk pudi agn ullu l 110 Ba'i, ,,,,tz prolJlpu, 8 Bpgriffp .. I1 Bmhad ltpt c lIilufigk,·it.<·Il . . . .. 113. 299 lku hadlt ullg . Art pll . . . . 9 1- 93 B,~,hadltuuw;l"'t"K',ri("
lku hadlt un w;sdll'Tlla . Bprll"ul1i·Exp,·rillu'u t Ikrll"u l1i- Tl ll'Url·lll . . . . 1l('Sti mu, t h('itsm at:.
!)3
. .
!)·l
22i 22·1 Yidw
1 )" t l'n l , i r l" t i"" skU('ffi ~.i" l ' t
J- Fd ,lpr. . . . Bimodale Yerteiluug . lIillollli alko,.ffizi" lIt . . Billo lllial ""r1<'ilu"lI; . Blva rla t c Analyse Blind w'!"S uch . , B" x'
2i3, 2il
123 . . 206 . 228 100 ,2 ~
. .. 133 . ... 200
'"
_0 CAPI , . .. . ('puH'r for Su r",'}' D,,,,igll 'lIld .\1...110d"I,,!,:y (e SD.\1) . . 16, 38 \ 2. B"n'('IlllulIg . , . . . .. liiO \. 2 • Y,'rt,'ihlll g . . , , . . .. , 300 ('""" urn'nt Yalidi t y .. . .. 66 Crun l",chs Cl For mel 63
Da r" ll. . . " . , 15 p rceossproduzjeno . . li Da tenniveau sid,e Skalennivea u Ded u kt ion .. . . -1 Ikt" n uillal i""sk"l'ffizi"ll t . . 18·1 U('ut,ehcs Inst it ut für \\' irtsd mftsforschu ng . . .. . Ii. 39 Oid ,t<{Ullkt ioll . .2.19 Diskordant e Pa a rt' .. . lii 8 . .... 2-1 D"I'llI'lbli lllh...·!"SUl·" . .. Dr it t var!a b1"11konr",11,' .. 27 30 Eillf" d,,' Zu ra ll, sti d 'l' cob e . . . Eiust'it ig" Fr" K,'Stl'llullK E mpi rist'I" ", Relativ Erkl ärende \ ·lIri" blc . E rkl iiru"g . E rwar tete Hä ufigkciten E rwa rt ulIW;wt'rt , . " _ Eta-Qu ad rat ('12) E UfOhan lllJ<·tp r. E X-l'o,t-fal ,tu-.\ nunl nun "
. .. 2lN 2i6
,12 . . 1M .. -1 299 , .. 232 , 162 . . . 3i 22
343
Ex ish'lI zauSS"l':e . . .. • i EXJ>('rilll<'lIt . . .. . .. . . 22 Expertmentalgruppe . . . . 22 Explanaudmu .•••. ...• ~i('/'" Erklärung ExphulilTls ••.•••• . .•• . ., ie/'" ErkliirmlK FD Z dpr Hundes agentur für .-\rheit. 39 Fpllll'r I . .-\rt . . . .• ., idu· o - Felrler ~,>1I 1l'r 2. Art. . . . . .• id ,,· /l- Fl' hll'r . .. 20 H'1I1srhlüs w . Fil terfrll!': p. . . . . . . ... 86
Fo rsd llllll'N(rUppe \\"ah l(·I1 . . . . . . . 3i Forschungsgruppe \\"a hl('11 (f G \\·) . . 39 Fr,'il l"itsgrll,I,' \ 2_Tl'st \ 2_\ 'l'rw ih uIK t-Test . I' Yl'fI,()iluul':
300 300
292,206 26 1
G am ma h). .. . . . 156 G"lmartt· S t idl l' ro hl' n ... . 202 G{·rkht,·te lI ypOlh{'S\' . . . . . 2i 6 Ges rli idltl'!l' Stirbprobe 2 11 GI'SrlilosSl'ue FWf(l' . . . . . . . .. i O 22 1 G,'St't z gro~"r Zahlen G ESIS. Abteilung Dat\'lI a IThi\" und D,,t l'lHlIlillysl' 30 G('wklit ulll': I)l.,;i ;(Tll':(·wid lt l1 lJg . . . .. 212 Itt',jresSllll'ut . . . . . .. 200 G nl·G ETAS . .. . .. . 16 G flllld W'Sililltl ll'it . . . 105 GUlI lllllu·SlGll a 5.':; H-O-Sd wllla . .••. . Hiiufigl....it.,"u ' ziihJullg . .. H" lu-- Elf(·kt . H i, to grillll m • .
Hyhr idfn lW' . .
Ilypothp"t'
.
,1. 6 100 . . . 85 .. 113 . . . . 80 .. .... . 2i2
h ui" x
.
18
Imk x quulltntiver \ 'aria tioll lnditlerenatab ellc , ,. Individualdan-n
130 . . 111
huli \"ithw liSliSl'lll'r Ft'llisd llllSS
20 _6 . 10
lnduktiuu
li
IlIf"rI·m "ta ti"ti k . . . . . . 19,) IUltillts\"" litlit ät . . 65 lnstltur für Arbeitsmarkt- mal Berufs-
forschung
1j
llllt'r-Cod<'r-R" li" hilitä t IlItt'n ll' y .. li,Jitiit . . . .. lnt r-rvallxkala. . . . . . . .
O,}, 98 . .. 26 . .. . -11
11It ,.,I"\"il' '',..,rt,lf{'ktl' . . ..
. . . 89
lnt ra-C odr-r-R clia bilität O.) , 98 IP SOS 16 Irr tmll, wa hr",: lwinli..hkl'it 262. 2i3 ltcm . . ·18 IU'IIl-Anatvsc. . . . .. . . 51 IteIH-:'\Olln'Sl'oll," ,id '\ usfiill" J Il-S>ig,~1, ·"' jl'IU. . . .
.
. ... idlC
Zust illllllungsll'ud'·lIt. 11·1 .. 23. 2 1. 191 Kcunwertevcrteilu ug . .. 20j Kleinster quadra tisrh..-r Fehler.••.• iU2 K>irt,Ugr,1l1ll1l
Kall"a lit iit ... .
KlulJl!'(,lIst i..hllrolw .. . . .. . ... . . 212 KOlllp!< 'x" Zufa ll"-, ti ..lJprulJ<' ..••• . . 2 11 KOlIfi rlen Z.interva 11 für I·iu<, :\liTtI·lw(,rt dilfl·f('uz ..• 290 .. 266 fiir ";""11 A" t"il"w(·rt für t'Ült'11 :\l i t t,.[\\"('rt 260,263 für cln ..n Relo\ress iollsk,wffizil'l1t el! 2 jO lutl'r pl'l't ilt i" 1l .... . 261 UlIt! Si" llifilumzt,.,;t .. 282 KOllfid,," ziut<'f\'a IlLJrd t\' . . .. 268 Konk lusion ,idll' Er klärung Konk ordante Pa.pa11<,a " ,. K,J\''' ri>illz . . . . . 160 Kn·isdi>i"';Tam lll . . 112
Kn' UZla l)(·!I(' . . . Kl'it prillllls\"alidit ä t . . . . .
IlH. .
1 ~2
65
Kritischer 1{" tiOlwlislllUS •. . .•••.•... -I
Krilisch er \\'(·rt . ..
... •. 280
Ui"KS""1'1,ittd "si ;;lt Llllnbda (J.).
... . 31 . . . . 153
Laufi ndex . .
.. 101, 120 . 1 12
l.ik" rt , 5kal;, . List" llw"i"" r Fa ll'Hl ss"]'l" ,,s Llstwise ,leIPlioll \ Iatd ,illg . . . . \ "' u ia n \ l phrfad ll"·1l1 ' 1111 ~'I1 . . . . .
. .. ... 18 . . 201 ... . . 20 1
. .. 23 123 . 82 , . . 213 . .... 15 16, 56 .. 15 . .. 16
\1PI1 rstufiw' Zu fa ll"a uswah l . \ !<'r k,,,,, I . . didJOlolllPS , dls krcrcs . ka wgoriilh",; . . . . . kOlltiTlui,·r1id",s ... . ·15 \ h.,-k,,,,,I"'lllsl'räKuTlg . . . . 15 \ h"';''' II. D,·finit ion . . . . . -t2 \ h",;sfpl,jpr ..•id", H,'liah i1ililt , \ ""lid ilill \ h",;sll iw au .... , ~ i"'", 5k" j"lllliw a u, ·1.1 \ INlltiLPo ri"1l . . . . . . .•id", \\'is"' ,u,d ,afl . . . . 122 \ Ioda!l'"l'rl \ lul l1 ugsi1ltl'r\'a ll ........•id ",
Konfidcuziutcrvall Xeuovcräuderuugcn. Xomiuahlcfinitiou ~"'Jli ll a ls lm l a . . .
l'a rw iid"[ll ifilml iOll GI, 8G P"ars,," s r 165 , 188 I'olitl.lllrollll't "r . . . . . . . 37 Polung \"011 Fr"g" ll .. , , .l!J l'olygollzllg 113 PO!,u lal i" lJ . . . . .• i,·hr Gm r"lw",amth"it 1'1'5 -1)' ''' 11': 11
.
2 1-1
I' rii1l1i""" _ , , ., id ", Erklärung P RE- \ I"f,. . 1:'1 3. 156, 162.18-1 P n . li,·liw r "lidit y . . . .. . . 66 Pn ·!<",;t . . 87 l' rillliin.· Tafl'J. . .. 120 Priman·ill!l,·it . . . . . .2 13 Prhuä ruurcrs urhuug
15
P rozentpunk te " ... . Prozent sa tzdifferenz I' roZl'llt llil'rUllgsl"'"i s . . . . . .
103 .
. .. 10 1 I' riifgTÜf,(· . .279. 286 . 288 . 200 . 300 Puuktsrhätzung . . . ,. ..., 25-1
ProZl'l ' t"~·rt l' .
Q uartila bst aud . QUl'rsd mitt <J'",iK'" . QUOI' ·WU1SW,,],I.
.. .. .. . 132 .. .. 31 220
.
Rendvert eilung .
.
32
12 . .. ·1.1
Xormulv ertctluug . :'\ullllypol.h,'sl' . . . :'\llllll'risd "", H",,,ti,, . .
.238 - 2 1 1
Odds . Odds-R" tio Ök" I"Kisd lt' Dat"" Ökologische l uferena Öklllugisd "'r Ft·hlsdllu,,-' . O!fl'll(' Fragt' . . 0 l" 'ra tim,alisi' 'rllllg . . On.lilla lskalll . . .. Overcovera ge
.. 1-t6 .... . I IG 18
,2i2 . .-12
21
.20 79 13. ·11 . . . 11
.. 196
1'-\\','rl . ... . .. .285 .... 156 Paa rvergh-irh l"lll"ld, ,,,;igu .. . .. 32 35 P" nd ld u"'l ""rfahn'll . . , . .. _. . .. . 62
1-15 107
. ••. . lOG
R" " dOlU Di;;it [) ialli ll ;; , Ib ll du", HUllt,· . _. . Raudumisil'rUIlI': . Ba rios"" ]a . . . Rl'" ld,·fill iti oll . . . . R,.'a Jl-Fr" ;;l' . . . . . .
,
2 17 216 . 23 . .. 15 . .. 12 . . . 3G It,~ l n",;s " U'llt .. 20 0 RC'l':ist"q..;t'Sl ützler lA·usus . . . . . . 193 !t"gn "Ssioll.,a llaly,.-. . . . . . 177 Rcgres sions kooffi zh-m •.. . . . 18 0 Hcgres sions kous raute . . , . . . 180 R,'gr("Ssionssd lat zulIg , . . . 183 Relat i",' Hiiufi;;k" it" tl 101 Heli" bilit iit . . 61 BC'pr", h lzil'rbarkC'i lSk,}{'ffh il'lll 59 . 180 Rl",id l1 111l1 . RN roslwkt h·frag:l' , . . . 36
5iiuh"t
.
.. .. .. .. .. .. 110 . 19 1 ..
272
Sr ilti""' 'Ilti<' SU' Ii.'1ik ..........••. ,,,tl l<" fnf'""'1 ,,,,,t..! i"t ik Sri ,.., odo..,>o
u . . . •. • •••. •••••• ••
S kala
2"
12. lö
SbIronni\_ u • ...•...•.............. 13 SbIu,tram.... ." nal~ _ .••...•.•••.... ~ SUllnt. f'a#' ....•...••...• . .••...• 80
SorialoI- F..I'TÜ,...ndl il .••••••••• ••• • öl lJtIIto •••••••••••• 16 " alW'I ••••••••.. 3 :Spal t.... ~ .•...••..•...•... ~ PnB"I,t ,"""",pl-a. S~III .. ·· .. · 13 :S~fl'tr'" ...... 232. 2 U . ZSS. 296 StaPdNda w m ah -rnriIUftIt 2 KI SuriaI~
~.u.et-
S~l ioot iMixoro UWldrw.ml
I:-. 39 191. 196 S' arn prubrn mil l rl~riIUJllt .• 2 1' Slinlulon.- ft,.,.IJUh'W""So-brma ..••••••• :-1
SlarnJlf'1l'lw
t· \'n1ri hlblt
:aH
Tall- ~Iak
Ta llu. . , T~
\ 2 .T~
&lI f
1:.6 :2i2 l' nabhißr;ixJgPil •. .29S
"IW"I" ~ li",-11n"C1c1ilff'n'll:r . :ZS:-. m
"ßt"> ~ lillrlll't'f1
:r.S. 2..."6
rillf'li HI'lU'
ior.,k.,,·flizirnt.... . JQ;) \ ·UfJt"I...., ••••• •• ••••••••••• . . . 2:-3
T''''' · 1(.1 t · \ ·..n..,,"'', T''''I~I ..' i., l ik
TI".,""
62 ~.thr
!' rü f,;n1k
11
Ti .." I60 Tul .. II.ru:t:' '1 II.· ••• . .••••••• •••• . . •• "rh.. I' "lll'I 'llli" rll l '~ I" '" i~ Tr'·lI, ItI,,,,i~lI .... . ... .. •.. ......... .. 31 ·J)-'·lIl,,,·llli rf,..K, ltili t • .••...• ••.• 52 Tu rnll.·' ·r 11 UIIl,hhii"KiK" \ ·" r;,.I,],· ... . •• •.. ••.. 105 Ulld' ·n 1l\"'·I'IlK' · ••. . .•• . . .. . .••. . .• • I !lG
UllK,·ridill 't,· Hn'"'I,,·"' .....,,.... 2:-G
u,mn,·
l lll il ' -'\" ll rl"'l'" tl"'" ••.••• ~idU' .-\ l ll1' l'r, n" I," tlK",'ill ll,'i t , , • . ••• . . • I:';. 19:-
l' rlisl" . .......... . .. . . . . • . . . . . . .. . 120 \ "a1idi tä, 61 \'ariab"' I:i ' ·arianz . . . . . . . .. . . . . . . . . . . . • . 135. 263 \ 'arianz " hl"I" Z ufal ls,-arial>Iom .•... 232 \ 'arianzaufklaru fll! Ar Dl1 l'n11 inal ~"'1 \ 'ariatioo>'k rM'ffizinli , ••• 138 \·~ ..'l:"itl"
131 , .. , ••••... 3S \M ~ '" Koo.6dl-n zinlt"n"a1l " ~~liriI kftt . 2'62. \·~~ , M \ foriow&1al Pn
2"
.-\~ \'~ \'~
,. I93 I93
W~ nfjdJ kIl'il
12 I
fn-qumtiooti'idl Uplaa-
m
W~rscborinlich klE'ibinlt"n..n
WtÜ-nid ll · Kal~
2.J6 tU
I 3
\\-~
: -T rawJormar
M , 2 10. 2 12. 2 1:213 Ar
: · \ "-'naIun,; ZrilPnpro:. ·ut01"
Prozmtl.Ji,prull~'--i.
7....,tra1ardli\· fiir ('Jnpin..ri... Sutialfur· scilUlll! (Z.\ l . . ... . . .... . • •rM G f:SIS m 'lraier Grt'loz ..-rt""'1J' •••••• 236. 2:-S Zio.-ln lTiab'" h r .\lJI..illKiK'· ' ·" ria hf.. Zufall ..... . •• ••• . ••••• •, •• •••••••• 201 ZufaIlSOi'x J!"-nrIl"lI l •• ••••• •• •••• • ••• 202 Zufallsvariabl 2üj Zli :'ll.\ .if l,r Co'III'" rur Sut\, ·)· 1>'",iKll
allli :'I h·t l,," lol' >KY (C'SIH f) Zuo;anllll<'''K''''N ;
Ülwrblit·k .. . . Zust illlllllmg st"Il' !"lIl
.
111
5 1. 72 Z"~'iM'i 'iK" FrHj(' ·stl'lhlll K•••.. ••• •. :.!:-G