М И Н И СТ Е РСТ В О О БРА ЗО В А Н И Я РО ССИ Й СК О Й Ф Е Д Е РА Ц И И В О РО Н Е Ж СК И Й ГО СУ Д А РСТ В Е Н Н Ы Й У...
11 downloads
180 Views
648KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
М И Н И СТ Е РСТ В О О БРА ЗО В А Н И Я РО ССИ Й СК О Й Ф Е Д Е РА Ц И И В О РО Н Е Ж СК И Й ГО СУ Д А РСТ В Е Н Н Ы Й У Н И В Е РСИ Т Е Т
П Р А КТИ Ч Е С КО Е Р У КО В О Д С ТВ О П О
С ТА ТИ С ТИ Ч Е С КО М У А Н А Л И ЗУ В Ф И ЗИ О Л О Г И И Д лястуден товдн евн огоотделен ия 3 курса биолого-почвен н огофакультета поспециальн ости 011600 « Биология»
В О РО Н Е Ж 2003
2
У тверж ден о н аучн о-м етодическим советом биолого-почвен н ого факультета 24 сен тября2002 г. (П ротокол№ 11).
Составители: Рецкий М .И ., Ч ерн ов В .И ., Сем ен ов С.Н ., Сереж ен ко Н .П .
П рактическоеруководство подготовлен о н а кафедрефизиологии человека и ж ивотн ы х биолого-почвен н ого факультета В орон еж ского государствен н ого ун иверситета Реком ен дуется для студен тов3 курса дн евн ого отделен ия биологопочвен н ого факультета, обучаю щ их ся по специальн ости 011600 « Биология» .
3
П Р ЕДИ С Л О ВИ Е М етодическое пособие по статистическом у ан ализу исследован ий в физиологии предн азн ачен о для студен товстарш их курсов, чтобы пом очь н ачин аю щ им исследователям освоить осн овн ы е пон ятия м атем атической статистики и более полн о представить диапазон прим ен ен ия статистических м етодов. В пособии рассм атриваю тся осн овн ы е статистические пон ятия, дан ы краткие описан ия м етодовобработки и ан ализа эм пирических дан н ы х : построен ие статистических оцен ок, парам етрические и н епарам етрические м етоды проверки статистических гипотез, дисперсион н ы й, корреляцион н ы й и регрессион н ы й ан ализ, н екоторы евопросы план ирован ияэксперим ен та. П особие н ачин ается с обзора элем ен тарн ы х (осн овн ы х ) пон ятий м атем атической статистики, а затем болееподробн он а кон кретн ы х прим ерах из различн ы х областей физиологии, биологии и м едицин ы , вклю чая лабораторн ы е и другие виды исследован ий, показан ы отдельн ы е возм ож н ости и области использован ияпрограм м н ого пакета статистической диалоговой систем ы « STADIA» . П редставлен н ы й м атериалиллю стрирован 17 таблицам и и 22 рисун кам и. В прилож ен ии приведен ы таблицы осн овн ы х статистических критериев. Н астоящ ее м етодическое пособие подготовлен о преподавателям и кафедры физиологии человека и ж ивотн ы х биолого-почвен н ого факультета В орон еж ского государствен н ого ун иверситета (М .И . Рецкий) и кафедры ин форм ацион н ы х систем общ ествен н ого здоровья и здравоох ран ен ия В орон еж ской государствен н ой м едицин ской академ ии им . Н .Н . Бурден ко (В .И . Ч ерн ов, С.Н . Сем ен ов, Н .П . Сереж ен ко) н а осн ове опы та проведен ия практических зан ятий со студен там и, вы полн ен ия им и курсовы х и диплом н ы х работ. Рецен зен т – кан дидат биологических н аук, доцен т кафедры биофизики и биотех н ологии С.Г. Резван .
4
С О ДЕР Ж А Н И Е О бщ иесведенияо статистическо м наблюдении................................... 6 И сследован иезависим остей всравн ен ии сэксперим ен тальн ы м и исследован иям и........................................................................................ 6 Связи м еж ду перем ен н ы м и...................................................................... 8 Т ипы ош ибок и м ощ н остькритерия...................................................... 13 С татистическиесравнения.................................................................... 14 t-критерий длян езависим ы х вы борок ................................................... 15 Болееслож н ы егрупповы есравн ен ия.................................................... 16 t-критерий длязависим ы х вы борок....................................................... 17 О цен ка достоверн ости различий м еж ду разм ерам и долей................... 19 О пределен иен еобх одим ого объем а вы борки при альтерн ативн ом варьирован ии призн аков........................................................................ 20 С редниевеличины................................................................................... 21 О пределен иеобъем а вы борки дляполучен иярепрезен тативн ы х средн их величин ..................................................................................... 26 О брабо тка данных выбо ро чно го исследо вания методами о писательно й статистикив слу чаено рмального распределения данных с применением про граммно го пакета STADIA...................................... 26 Краткий о бзо р по нятия«критерий значимо сти» ............................... 31 И м ею тли больш ин ствоперем ен н ы х н орм альн оераспределен ие? ..... 31 О бъем вы борки....................................................................................... 32 П роблем ы изм ерен ия.............................................................................. 32 П арам етрическиеи н епарам етрическием етоды ................................... 32 К раткий обзорн епарам етрических процедур....................................... 32 О писательн ы естатистики...................................................................... 33 Н епараметрическаястатистика............................................................ 34 К акой м етод использовать? .................................................................... 35 К ритерий соответствияП ирсон а (Х И -квадрат) .................................... 36 К ритерий В илкоксон а длясвязан н ы х совокупн остей .......................... 38 К ритерий зн аков...................................................................................... 39 К ритерий М ан н а –У итн и....................................................................... 39 Т естК олм огорова –См ирн ова............................................................... 40 К ритерий К олм огорова –См ирн ова дляодн ой вы борки..................... 40 П роверка статистических гипотез впакетеSTADIA сиспользован ием м етодовн епарам етрической статистики............................................... 43 Ко рреляцио нный анализ........................................................................ 46 О пределен иеобъем а вы борки дляполучен иярепрезен тативн ого коэффициен та корреляции..................................................................... 51 Р егрессио нный анализ............................................................................ 52 Регрессивн ы й ан ализ сиспользован ием пакета STADIA..................... 54
5
Д исперсио нный анализ........................................................................... 57 П роверка зн ачим ости.............................................................................. 58 О сн овн аялогика дисперсион н ого ан ализа............................................ 58 М н огофакторн ы й дисперсион н ы й ан ализ............................................. 58 Главн ы еэффекты . попарн ы е(двух факторн ы е) эффекты взаим одействия....................................................................................... 59 О бщ ий способ описан иявзаим одействий ............................................. 60 О дн офакторн ы й дисперсион н ы й ан ализ впакетеSTADIA................... 61 Д вух факторн ы й дисперсион н ы й ан ализ впакетеSTADIA ................... 64 П рило ж ения.............................................................................................. 67
6
О Б Щ И Е С В Е Д Е Н И Я О С ТА ТИ С ТИ Ч Е С КО М Н А Б Л Ю Д Е Н И И М ассовы еявлен ия, изучаем ы естатистикой, состоятиз одн ородн ы х в определен н ом отн ош ен ии е диниц на б люде ния . Совокупн ость таких отн осительн о одн ородн ы х , н о ин дивидуальн о различн ы х един иц, объедин ен н ы х вотн ош ен ии н екоторы х общ их условий для группового изучен ия, н азы ваетсяс т а т ис т иче с кой с овокупнос т ь ю, а число един иц совокупн ости − об ъе мом с овокупнос т и. Ст а т ист иче с кое на б люде ние предусм атривает сбор сведен ий по заран ееразработан н ом у план у. Ф актический м атериал, содерж ащ ийсявпервичн ы х докум ен тах учета (история болезн и, карта эпидем иологического обследован ия и т. д.), н уж дается в упорядочен ии и систем атизации собран н ы х дан н ы х с тем , чтобы получить из н их ин тересую щ ую ин форм ацию . Э тотпроцесс н азы вается г руппировкой. Группировка предусм атривает расчлен ен ие совокупн ости н а группы , одн ородн ы е по каком у-либо одн ом у призн аку (простая группировка) или по н ескольким призн акам (ком бин ацион н ая группировка). П роцесс группировки н е просто тех н ический прием , а глубоко осм ы слен н ое действие, н аправлен н ое н а получен ие объективн ой и полн оцен н ой ин форм ации с учетом поставлен н ой задачи. Н аиболее прием лем ой форм ой группировки являю тся статистические таблицы , статистические ряды и т. д., когда числовы езн ачен ия призн ака располож ен ы вопределен н ом порядке. Ч т о т ак ое пе р е м е н н ы е ? П ерем ен н ы е− этото, чтом ож н о изм ерять, кон тролировать или что м ож н о изм ен ять в исследован иях . П ерем ен н ы е отличаю тсям н огим и аспектам и, особен н о той ролью , которую он и играю т висследован иях , ш калой изм ерен ияи т.д. И С С Л Е Д О В А Н И Е ЗА В И С И М О С ТЕ Й В С Р А В Н Е Н И И С Э КС П Е Р И М Е Н ТА Л Ь Н Ы М И И С С Л Е Д О В А Н И Я М И
Больш ин ство эм пирических исследован ий дан н ы х м ож н о отн ести к одн ом у из н азван н ы х типов. В исследован ии корреляций (зависим остей, связей) вы н евлияете(или, по крайн ей м ере, пы таетесь н евлиять) н а перем ен н ы е, а только изм еряете их и х отите н айти зависим ости (корреляции) м еж ду н екоторы м и изм ерен н ы м и перем ен н ы м и, н априм ер, м еж ду кровян ы м давлен ием и уровн ем х олестерин а. В эксперим ен тальн ы х исследован иях , н апротив, вы варьируете н екоторы е перем ен н ы е и изм еряете воздействияэтих изм ен ен ий н а другиеперем ен н ы е. Н априм ер, исследовательм ож ет искусствен н о увеличивать кровян ое давлен ие, а затем н а определен н ы х уровн ях давлен ия изм ерить уровен ь х олестерин а. А н ализ дан н ы х вэксперим ен тальн ом исследован ии такж е прих одит к вы числен ию « корреляций» (зависим остей) м еж ду перем ен н ы м и, а им ен н о м еж ду перем ен н ы м и, н а которы е воздействую т, и перем ен н ы м и, н а которы е влияет это воздействие. Т ем н е м ен ее, эксперим ен тальн ы е дан н ы е потен циальн о сн абж аю т н ас более качествен н ой ин форм ацией. Т олько эксперим ен тальн о м ож н о убеди-
7
тельн о доказать причин н ую связь м еж ду перем ен н ы м и. Н априм ер, если обн аруж ен о, что всякий раз, когда изм ен яетсяперем ен н аяA, изм ен яетсяи перем ен н ая B, то м ож н о сделать вы вод — « перем ен н ая A оказы вает влиян ие н а перем ен н ую B» , т.е. м еж ду перем ен н ы м и А и В им еетсяпричин н аязависим ость. Результаты корреляцион н ого исследован ия м огут бы ть проин терпретирован ы вкаузальн ы х (причин н ы х ) терм ин ах н а осн овен екоторой теории, н осам и посебен ем огутотчетливодоказатьпричин н ость. Зависим ы е и н е зависим ы е пе р ем е н н ы е . Н езависим ы м и перем ен н ы м и н азы ваю тся перем ен н ы е, которы е варьирую тся исследователем , тогда как зависим ы еперем ен н ы е− это перем ен н ы е, которы еизм еряю тсяили регистрирую тся. М ож ет показаться, что проведен ие этого различия создает путан ицу втерм ин ологии, поскольку как говорят, что « всеперем ен н ы езависят отчего-н ибудь» . Т ем н ем ен ее, одн аж ды отчетливо проведя это различие, вы пойм ете его н еобх одим ость. Т ерм ин ы зависим ая и н езависим ая перем ен н ая прим ен яю тся восн овн ом вэксперим ен тальн ом исследован ии, где эксперим ен татор м ан ипулирует н екоторы м и перем ен н ы м и, и в этом см ы сле он и « н езависим ы » от реакций, свойств, н ам ерен ий и т.д., присущ их объектам исследован ия. Н екоторы е другие перем ен н ы е, как предполагается, долж н ы « зависеть» от действий эксперим ен татора или от эксперим ен тальн ы х условий. И н ы м и словам и, зависим остьпроявляется вответн ой реакции исследуем ого объекта н а оказан н ое н а н его воздействие. О тчасти в противоречии с дан н ы м разгран ичен ием пон ятий н ах одится использован ие их висследован иях , где вы н е варьируете н езависим ы е перем ен н ы е, а только приписы ваетеобъекты к « эксперим ен тальн ы м группам » , осн овы ваясьн а н екоторы х их априорн ы х свойствах . Н априм ер, если вэксперим ен те м уж чин ы сравн иваю тся с ж ен щ ин ам и отн осительн о числа лейкоцитов(WCC), содерж ащ их ся вкрови, то « П ол» м ож н о н азвать н езависим ой перем ен н ой, а WCC зависим ой перем ен н ой. Ш к алы изм е р е н ий . П ерем ен н ы еразличаю тсятакж етем , « н асколько х орош о» он и м огутбы тьизм ерен ы или, другим и словам и, как м н ого изм еряем ой ин форм ации обеспечивает ш кала их изм ерен ий. О чевидн о, вкаж дом изм ерен ии присутствует н екоторая ош ибка, определяю щ ая гран ицы « количества ин форм ации» , которое м ож н о получить вдан н ом изм ерен ии. Д ругим фактором , определяю щ им количество ин форм ации, содерж ащ ейся вперем ен н ой, является тип ш калы , вкоторой проведен о изм ерен ие. Различаю т следую щ ие типы ш кал: a)н ом ин альн ая; b)порядковая (ордин альн ая); c)ин тервальн ая; d)отн осительн ая(ш кала отн ош ен ия). Соответствен н о им еем четы ре типа перем ен н ы х : (a) н ом ин альн ы е, (b) порядковы е(ордин альн ы е), (c) ин тервальн ы еи (d) отн осительн ы е. Номина ль ные пе ре ме нные использую тся только для качествен н ой классификации. Э то озн ачает, что дан н ы еперем ен н ы ем огутбы ть изм ерен ы только втерм ин ах прин адлеж н ости к н екоторы м , сущ ествен н о различн ы м классам ; при этом вы н е см ож ете определить количество или упорядочитьэти классы . Н априм ер, 2 ин дивидуум а различим ы втерм ин ах пере-
8
м ен н ой А (прин адлеж ат к разн ы м н ацион альн остям ). Т ипичн ы е прим еры н ом ин альн ы х перем ен н ы х − пол, н ацион альн ость, цвет, город и т.д. Ч асто н ом ин альн ы еперем ен н ы ен азы ваю ткатегориальн ы м и. П оря дковые пе ре ме нные позволяю т ран ж ировать (упорядочить) объекты , указав, какиеиз н их вбольш ей или м ен ьш ей степен и обладаю ткачеством , вы раж ен н ы м дан н ой перем ен н ой. О дн ако он и н е позволяю т сказать « н а сколько больш е» или « н а сколько м ен ьш е» . П орядковы е перем ен н ы е ин огда такж е н азы ваю т ордин альн ы м и. Т ипичн ы й прим ер порядковой перем ен н ой − социальн о-экон ом ический статус сем ьи. Т ак, возм ож н о, что уровен ь сем ьи соответствует верх н ем у средн ем у уровн ю вы ш е средн его уровн я, одн ако сказать, что разн ица м еж ду н им и равн а, скаж ем , 18% м ы н е см ож ем . Сам о располож ен иеш калвследую щ ем порядке: н ом ин альн ая, порядковая, ин тервальн аяявляетсях орош им прим ером порядковой ш калы . Инт е рва ль ные пе ре ме нные позволяю тн етолько упорядочивать объекты изм ерен ия, н о и числен н о вы разитьи сравн итьразличиям еж ду н им и. Н априм ер, тем пература, изм ерен н ая вградусах Ф арен гейта или Ц ельсия, образует ин тервальн ую ш калу: тем пература 40 градусоввы ш е, чем тем пература 30 градусов, и увеличен ие тем пературы с 20 до 40 градусоввдвое больш еувеличен иятем пературы от30 до40 градусов. О т нос ит е ль ные пе ре ме нные очен ь пох ож и н а ин тервальн ы е перем ен н ы е. В дополн ен ие ко всем свойствам перем ен н ы х , изм ерен н ы х вин тервальн ой ш кале, их х арактерн ой чертой является н аличие определен н ой точки абсолю тн ого н уля, таким образом , для этих перем ен н ы х являю тся обосн ован н ы м и предлож ен иятипа: x вдва раза больш е, чем y. Т ипичн ы м и прим ерам и ш калотн ош ен ий являю тсяизм ерен ияврем ен и или простран ства. Н априм ер, тем пература по К ельвин у образует ш калу отн ош ен ия, и вы м ож етен етолько утверж дать, чтотем пература 200 градусоввы ш е, чем 100 градусов, н о и что он а вдвое вы ш е. И н тервальн ы е ш калы (н априм ер, ш кала Ц ельсия) н е обладаю т дан н ы м свойством ш калы отн ош ен ия. Зам етим , что вбольш ин стве статистических процедур н е делается различия м еж ду свойствам и ин тервальн ы х ш кали ш калотн ош ен ия. С В Я ЗИ М Е Ж Д У П Е Р Е М Е Н Н Ы М И
Н езависим о от типа, две или более перем ен н ы х связан ы (зависим ы ) м еж ду собой, если н аблю даем ы езн ачен ияэтих перем ен н ы х распределен ы согласован н ы м образом . Д ругим и словам и, перем ен н ы езависим ы , если их зн ачен ия систем атическим образом согласован ы друг с другом в им ею щ их ся н аблю ден иях . Н априм ер, перем ен н ы е « П ол» и « Ч исло лейкоцитов» м огли бы рассм атриваться как зависим ы е, если бы больш ин ство м уж чин им ело вы сокий уровен ь « Ч исло лейкоцитов» , а больш ин ство ж ен щ ин — н изкий « Ч исло лейкоцитов» , или н аоборот. « Рост» связан с « В есом » , потом у что обы чн о вы сокие ин дивиды тяж елее н изких ; « IQ» (коэффициен т ин теллекта) связан с « К оличеством ош ибок» втесте, т.к. лю ди с вы соким зн ачен ием IQ делаю тм ен ьш еош ибок и т.д.
9
Статистическом у н аблю ден ию , представляю щ ем у собой н ачальн ы й этап исследован ия, долж н о уделяться больш ое вн им ан ие, так как от полн оты и качества собран н ы х дан н ы х во м н огом зависят и вы воды . Статистическое н аблю ден ие осущ ествляется как посредством отчетн ости, так и посредством специальн оорган изован н ы х исследован ий. Результатили исх од отдельн ого испы тан ия (статистического н аблю ден ия) н азы вается с об ыт ие м. Реализация его, как правило, возм ож н а при н аличии ком плекса условий, н еобх одим ы х длятого, чтобы дан н оесобы тие произош ло. Ч исловая м ера возм ож н ости осущ ествлен ия определен н ого собы тия вн екотором количестве случаевиз общ его числа возм ож н ы х н азы ваетсяве роя т ност ь ю (р). Е дин ицы совокупн ости обы чн о обладаю т м н огим и призн акам и, которы е им ею т различн ое вы раж ен ие у отдельн ы х един иц. Т ак, н априм ер, больн ы е различаю тся по полу, возрасту, профессии и т. д. П ризн аки, прин им аю щ ие различн ы е зн ачен ия у отдельн ы х един иц совокупн ости, н азы ваю тся ва рь ирующими, а отдельн ы е числовы е зн ачен ия варьирую щ его призн ака − ва риа нт а ми (xi). В арьирован ие − х арактерн ое свойство всего ж ивого. В арьирую щ ие призн аки подразделяю тся н а а т риб ут ивные (ка че с т ве нные ) и количе с т ве нные . П ризн ак н азы вается атрибутивн ы м , если отдельн ы е его зн ачен ия вы раж аю тся ввиде состоян ия, свойстви т. д., присущ их явлен ию (профессиябольн ы х , вид м икроорган изм ов, цветм очи и т. д.). К количествен н ы м отн осят те призн аки, отдельн ы е зн ачен ия (вариан ты ) которы х вы раж аю тсяввидечисел(количество лейкоцитов, титр ан тител, количеством икроорган изм ови т. д.). Располож ен иевариан твпорядкевозрастан ия(ум ен ьш ен ия) их числовы х зн ачен ий, показы ваю щ ее закон ом ерн ость распределен ия един иц изучаем ой совокупн ости, н азы вается ва риа ционным ря дом. В ариацион н ы е ряды , вы раж ен н ы е ввиде целы х чисел, н азы ваю тся дискре т ными, а при вы раж ен ии количествен н ы х призн аковввидеин тервалов− инт е рва ль ными. Д ля обобщ аю щ ей х арактеристики качествен н о одн ородн ы х совокупн остей использую тся с ре дние ве личины, благодаря прим ен ен ию которы х статистика, им ея дело с м ассовы м и явлен иям и, получает возм ож н ость перех одить отедин ичн ого к общ ем у, от случайн ого − к закон ом ерн ом у. О дн ой из таких величин являетсяс ре дня я а риф ме т иче с ка я (обозн ачаем аякак х или М), получ аю щ аяся при делен ии сум м ы одн ородн ы х величин , х арактеризую щ их зн ачен иеопределен н огопризн ака, н а числовариан т. П р им ер . Зн ачен ия вариан т составляю т: 8, 16, 9, 3, 14, 30, 26. Сум м а величин равн а 105, а x =105:7=15. О дн ако средн яя арифм етическая сам а по себен ичего н еговорито том вариацион н ом ряде, из которого он а вы числен а, так как колебан иязн ачен ий вариан твн утри ряда м огутбы тьразличн ы . Н априм ер: 1-й вариацион н ы й ряд: 8, 16, 9, 3, 14, 30, 26; x =15; 2-й вариацион н ы й ряд: 2, 8, 3, 5, 7, 22, 58; x =15. В обоих случаях средн ие арифм етические равн ы , одн ако он и получен ы из рядовс различн ы м разм ах ом . Ра зма х − разн ость м еж ду м акси-
10
м альн ы м и м ин им альн ы м зн ачен ием вариан т. В первом случае разм ах равен 30-3=27, во втором − 58-2=56. Ч ем больш е ин дивидуальн ы е зн ачен ия вариан т различаю тся м еж ду собой, тем больш еон и отличаю тся и от средн ей арифм етической, являю щ ейся цен тром группирован ия вариан т дан н ого ряда. В еличин а отклон ен ия каж дой вариан ты от средн ей арифм етической н азы вается лине йным от клоне ние м ( d ), т. е. d = x − x i . О дн ако при ан ализе степен и отклон ен ия (рассеян ия) вариан т используется с ре дне е ква дра т иче с кое от клоне ние (σ ), так как он о х арактеризует вариацию н е отдельн о взяты х , а всех вариан т ряда. В еличин а σ2 или D н осит н азван ие дис пе рс ии.
∑d
2
∑d
2
, ; при n<30 σ = ± n −1 n где σ − средн ее квадратическое отклон ен ие; d − отклон ен ие вариан т от средн ей арифм етической; n − числовариан т. Совокупн остьзн ачен ий вариан т(xi) и их вероятн остей (р) н азы вается ра с пре де ле ние м. В статистикеизвестен ряд закон овраспределен ияслучайн ы х величин : закон н орм альн ого распределен ия, закон бин ом иальн ого распределен ия, закон П уассон а, распределен иеМ аксвелла и др. Норма ль ное ра спре де ле ние зан им ает важ н ое м есто в статистике. М н огием едико-биологические призн аки, х арактеризую щ иеся н епреры вн ой вариацией, являю тся сум м ой больш ого числа н езависим ы х слагаем ы х и с достаточн ой степен ью точн ости следую т закон у н орм альн ого распределен ия. П ри графическом изображ ен ии распределен ия вариан т получается сим м етричн ая куполообразн ая кривая, им ею щ ая м аксим ум вточке средн ей арифм етической, н азы ваем аякривой норма ль ног о ра спре де ле ния (рис. 1). σ=±
Рис.1. График плотн ости н орм альн огораспределен ия Е сли площ адь, огран ичен н ую кривой н орм альн ого распределен ия, прин ять за 1 (или за 100 %), то м ож н о рассчитать площ адь, заклю чен н ую м еж ду кривой и лю бы м и двум яордин атам и. У стан овлен о, что площ адь м еж ду ордин атам и, проведен н ы м и н а расстоян ии lσ скаж дой сторон ы от x , составляет0,683 всей площ ади. Э то озн ачает, что 68,3 % всех исследован н ы х един иц (частот) отклон яется от x н е более чем н а 1σ, т. е. н ах одится впределах х ± σ. П лощ адь, заклю -
11
чен н аям еж ду ордин атам и, проведен н ы м и н а расстоян ии 2σ отх , составляет0,954, т. е. 95,4 % всех един иц совокупн ости н ах одитсявпределах х ± 2σ. И , н акон ец, 0,997 или 99,7 % всех един иц н ах одятся в пределах х ± 3σ. Т аким образом , то, что н ах одитсявпределах 3σ, отн осится к дан н ом у ряду, то, что за пределам и 3σ, вероятн еевсего, к этом у ряду уж ен еотн осится. Д ля изучен ия закон ом ерн остей вариации при н орм альн ом распределен ии призн аков пользую тся нормирова нным от клоне ние м (t), представляю щ им собой отклон ен ие той или ин ой вариан ты от средн ей арифм етической, отн есен н оек величин есредн егоквадратического отклон ен ия.
t=
x − xi , отсю да x − x i = tσ σ
В еличин а t-критерия х арактеризует распределен ие вы борочн ы х средн их вн орм альн ой ген еральн ой совокупн ости взависим ости отобъем а вы борки, a t-распределен ие зависит только от двух величин : н орм ирован н ого отклон ен ия и числа степен ей свободы п', т. е. числа свободн о варьирую щ их призн аков (n'=n−1). С увеличен ием числа н аблю ден ий tраспределен иебы стро приближ аетсяк н орм альн ом у и уж епри n=30 н еотличается от н его. Следовательн о, для n ≥ 30 величин а t распределяется н орм альн о, тогда как при n<30 (м алаявы борка) распределен иеt зависитот числа н аблю ден ий. Д ля практического использован ия t-распределен ия им еется специальн ая таблица (прилож ен ие 1), вкоторой содерж атся зн ачен ия t для разн ы х уровн ей зн ачим ости и объем а вы борки. П оскольку вариан ты ввариацион н ом ряду распределяю тся впределах трех сигм , то и зн ачен ияt дляотдельн ы х вариан тколеблю тсявпределах ± 3. П ри н орм альн ом распределен ии призн аков, чем ближ е зн ачен ия вариан т к средн ей арифм етической, тем чащ е он и встречаю тся; чем дальш е от средн ей арифм етической, тем реж е частота их появлен ия. Т аким образом , вариацион н ы й ряд с х арактерн ы м для н его располож ен ием больш ин ства вариан т вблизи его цен тральн ой части и рассеян ием к краям ряда является вто ж е врем я и распределен ием вероятн остей. К ак отм ечалось вы ш е, вероятн ость (р) − это числовая м ера объективн ой возм ож н ости осущ ествлен ия определен н ого собы тия вн екотором количестве случаевиз общ его числа возм ож н ы х . О бозн ачивабсолю тн ую числен н ость вариан т через n, числен н ость случаевпоявлен ия ин тересую щ его призн ака через m, доля (р) вариан т, обладаю щ их дан н ы м призн аком , вы разитсяформ улой: n p= m О ставш аяся доля (q) вариан т той ж е совокупн ости при альтерн ативн ой группировке дан н ы х (н априм ер, заболел– н е заболели т. д.) свидетельствует о частоте н епоявлен ия собы тия. П оскольку p+q=l, то вчисловом вы раж ен ии вероятн ость представляет собой число, заклю чен н ое м еж ду 0 и 1 и, стало бы ть, вы раж ен н оевдолях един ицы , а при ум н ож ен ии до-
12
ли н а 100, 1000, 10000, 100000 вы раж ается соответствен н о в процен тах (%), пром илле (%), продецим илле(%), просан тим илле (%). П ри р=1 собы тие н азы вается дос т ове рным, т. е. един ствен н о возм ож н ы м при н аличии ком плекса условий, н еобх одим ы х для его реализации. П ри р=0 собы тие считается не возмож ным. Е сли ж е собы тие вдан н ы х условиях м ож ет произойти и н е произойти, а при м н огократн ы х испы тан иях обязательн о н аступает, то он о н азы вается возмож ным (с луча йным). Т аким образом , количествен н ой х арактеристикой вероятн ости того или ин ого явлен иям ож ет бы ть его отн осительн ая частота. Следовательн о, ввариацион н ом ряду отдельн ы м зн ачен иям вариан т (xi) м ож н о придать соответствую щ ие вероятн ости (р). Сущ ествен н о важ н ы две вероятн ости, числовы е зн ачен ия которы х вдолях един ицы составляю т0,95 и 0,99, или 95% и 99%. О н и н азы ваю тся дове рит е ль ными ве роя т нос т я ми. П ри доверительн ой вероятн ости 0,95 (95%) лю бая случайн о взятая величин а вариацион н ого ряда вслучае н орм альн огораспределен иябудетотклон ятьсяотсредн ей арифм етической н е более чем н а 1,96σ или, н аоборот, с вероятн остью 0,05 (5 %) он а будет н ах одитьсяза пределам и 1,96σ. С вероятн остью ж е, равн ой 0,99 (99%), он а будет отклон яться от х н е более чем н а 2,58σ, или, н аоборот, вероятн ость вы х ода за пределы 2,58σ равн а 0,01 (1 %). О пределен н ы м зн ачен иям вероятн остей соответствую т уровни зна чимос т и (p), свидетельствую щ ие о частоте получен ия случайн ого отклон ен ия от устан овлен н ы х с определен н ой вероятн остью результатов, т. е. в каком процен те случаев (или с какой вероятн остью ) все ж е возм ож н а ош ибка врезультатах , вы водах и т. д. В ероятн ости 0,95 (95 %) соответствуетуровен ьзн ачим ости 0,05 (5%); вероятн ости 0,99 (99%) − 0,01 (1%). П о отн ош ен ию к закон ом ерн остям распределен ия призн аковэто озн ачает, что вы х од за пределы прин яты х гран иц возм ож ен впорядкеслучайн ости с вероятн остью 0,05 (5%) и 0,01 (1 %), т. е. риск ош ибки ввы водах составляет 5 % и 1 % соответствен н о. Статистическоен аблю ден ием ож етох ваты вать всех член овсовокупн ости, а м ож ет огран ичиваться обследован ием лиш ь н екоторой части их . Совокупн ость, из которой отбирается часть ее член овдля изучен ия, н азы вается г е не ра ль ной, а отобран н ая часть − выб орочной, или выб оркой. О бъем ген еральн ой совокупн ости (N) теоретически м ы слится как бескон ечн о больш оем н ож ествоотн осительн о одн ородн ы х един иц. О бъем вы борочн ой совокупн ости (n) м ож ет бы ть различн ы м по величин е, н о н е долж ен бы ть м ен ьш едвух един иц. В ы борочн ы й м етод являетсяосн овн ы м при изучен ии статистической совокупн ости, одн ако, он долж ен датьтакую ин форм ацию , которая позволяла бы судить о состоян ии ген еральн ой совокупн ости, т. е. вы борка долж н а бы ть достаточн о пре дс т а вит е ль ной (ре пре зе нт а т ивной). Репрезен тативн ость вы борки зависит отряда факторов, среди которы х одн ородн остьисх одн ой совокупн ости, объем вы борки, способы отбора един иц и т. д. П ри вы борочн ом обследован ии обы чн о изучается доля един иц, обла-
13
даю щ их тем или ин ы м призн аком (н априм ер, частота обн аруж ен ия стафилококковввоздух е), а такж е средн ий разм ер того или ин ого призн ака у един иц совокупн ости (н априм ер, количество стафилококков в воздух е). П ри этом м еж ду получен н ы м и вы борочн ы м и средн им и возн икаю топределен н ы е расх ож ден ия по отн ош ен ию к средн им для ген еральн ой совокупн ости, т. е. возн икаю тошиб ки. О ш ибки подразделяю тся н а регистрацион н ы е (н еправильн ы й учет дан н ы х ) и ош ибки репрезен тативн ости. О шиб ки ре пре зе нт а т ивнос т и представляю т собой расх ож ден ия м еж ду обобщ аю щ им и показателям и отобран н ой части совокупн ости и всей совокупн ости вцелом при условии правильн ой регистрации дан н ы х . О ш ибки репрезен тативн ости м огут бы ть систем атическим и и случайн ы м и. Сис т е ма т иче с кие ошиб ки возн икаю т при н аруш ен ии прин циповпроведен ия вы борочн ого н аблю ден ия, н априм ер вследствие произвольн ой зам ен ы попавш их ввы борку един иц другим и. Случа йные ошиб ки (ошиб ки выб орки) − это расх ож ден ие м еж ду вы борочн ой средн ей и ген еральн ой средн ей при условии правильн ого отбора и регистрации дан н ы х . О н и возн икаю т всилу того, что вы борочн ая совокупн ость н е воспроизводит точн о ген еральн ую совокупн ость. О величин е возм ож н ого отклон ен ия вы борочн ой средн ей от ген еральн ой средн ей судят по с ре дне й ошиб ке выб орки (s). Д ля устан овлен ия гран иц, вкоторы х н ах одится ген еральн ая средн яя, используется предельн ая ош ибка вы борки (∆); ∆ = t.s. Зн ачен иевероятн ости н аступлен иясобы тия, с которой м ож н о гаран тировать н адеж н ость результатоввы борки, н ах одят по специальн ой таблице (прилож ен ие 1). В н ей приводятся зн ачен ия н орм ирован н ого отклон ен ия (t) и соответствую щ иеим уровн и зн ачим ости (Р) при задан н ом объем евы борки (n). ТИ П Ы О Ш И Б О КИ М О Щ Н О С ТЬ КР И ТЕ Р И Я
Крит иче ска я об ла с т ь − этом н ож ествотаких исх одовн екоторогостатистического эксперим ен та, которы е приводят н ас к отклон ен ию н улевой гипотезы . Е сли н улеваягипотеза справедлива и прин ятуровен ьзн ачим ости α, тосвероятн остью α исх од эксперим ен та попадетвкритическую область; вэтом случаен улеваягипотеза будетош ибочн о отклон ен а и тем сам ы м будетдопущ ен а ошиб ка 1 рода . И н огда возн икаетситуация, когда н улеваягипотеза лож н а, а исх од эксперим ен та н е попалвкритическую область. В таком случае н улеваягипотеза ош ибочн о прин им ается и тем сам ы м допускаетсяошиб ка II рода . Е стествен н о стрем лен ие м ин им изировать вероятн ости ош ибок рассм отрен н ы х типов. Сн иж ая уровен ь зн ачим ости α, м ож н о легко сократить вероятн остьвозн икн овен ияош ибки I рода, н овтаком случаевозрастетвероятн ость ош ибки II рода. В связи с этим вводят пон ятие мощнос т и критерия, которую определяю т как вероятн ость отклон ен ий н улевой гипотезы . Э та вероятн ость зависит от реальн ого зн ачен ия рассм атриваем ого па-
14
рам етра совокупн ости. П оскольку это зн ачен ие заран ее н еизвестн о, рассм атриваю т кривую мощност и, которая показы вает соответствую щ ее зн ачен ие м ощ н ости критерия для каж дого возм ож н ого зн ачен ия парам етра. О чевидн о, что точки идеальн ой кривой м ощ н ости им ею т ордин ату, равн ую един ице, для всех зн ачен ий парам етра, кром етех , которы е соответствую т н улевой гипотезе. Н а практике получить подобн ы й результат н евозм ож н о, н о обы чн о удается повы сить м ощ н ость критерия до лю бого ж елаем ого уровн я, соответствен н оувеличивобъем вы борки. Следует предупредить об опасн ости, связан н ой с прим ен ен ием н ескольких статистических критериевпри ан ализе одн их и тех ж е дан н ы х . Е сли к одн им и тем ж е дан н ы м прим ен яю т два различн ы х критерия для проверки одн ой и той ж ен улевой гипотезы (или двух сх одн ы х гипотез) и в каж дом случае прин им ается уровен ь зн ачим ости, равн ы й, н априм ер, 5%, то вероятн остьтого, что х отябы по одн ом у из критериевн улевая гипотеза будет ош ибочн о отклон ен а, превосх одит 5 %. Следует воспользоваться лиш ьодн им критерием , ж елательн оболеем ощ н ы м . И н огда возн икаетн еобх одим ость проверки двух различаю щ их ся гипотез при использован ии одн их и тех ж е дан н ы х (н априм ер, гипотезы о зн ачен иях средн его и дисперсии н екоторой н орм альн о распределен н ой совокупн ости). Е сли для обоих критериевприн им ается 5 % уровен ь зн ачим ости и обе н улевы е гипотезы справедливы , то вероятн ость ош ибочн ого отклон ен ия х отя бы одн ой из н улевы х гипотез зн ачительн о превосх одит 5 % и частобы ваетблизка к 10 %. С ТА ТИ С ТИ Ч Е С КИ Е С Р А В Н Е Н И Я Реш ен иетой или ин ой задачи н еобх одится, как правило, без сравн ен ия статистических показателей, отображ аю щ их разм еры и количествен н ы е соотн ош ен ия ан ализируем ы х явлен ий. В статистике для этих целей прим ен яется так н азы ваем ая нуле ва я г ипот е за , т. е. предполож ен ие о том , что разн ица м еж ду ген еральн ы м и парам етрам и сравн иваем ы х групп равн а н улю , а различия, которы е н аблю даю тся м еж ду вы борочн ы м и показателям и, н осят случайн ы й х арактер. И стин н ость прин ятой гипотезы проверяется с пом ощ ью крит е рие в зна чимос т и, т. е. специальн о вы работан н ы х случайн ы х величин , фун кции распределен ия которы х известн ы . О бы чн о для каж дого критерия составляю тся таблицы , вкоторы х содерж атся критические величин ы , отвечаю щ ие определен н ом у объем у вы борки и прин яты м уровн ям зн ачим ости. В биологических исследован иях прин им ается 5 % уровен ь зн ачим ости, котором у отвечает н орм ирован н ое отклон ен ие t = 1,96 ( ≈ 2,0) при объем е вы борки больш е 30 един иц вслучае н орм альн ого распределен ия призн аков. Н априм ер, если окаж ется, что Р>0,05, то отвергн уть н улевую гипотезу н ет осн ован ий; при Р<0,05 н улевая гипотеза отвергается, т. е. с вероятн остью более95 % разн ица м еж ду вы борочн ы м и показателям и считается статистически зн ачим ой (достоверн ой). М огут прим ен яться1 % или 0,1 % уровн и зн ачим ости.
15
Д ляопределен иягран иц доверительн огоин тервала вы борочн ой доли (р) определяетсяош ибка вы борки длядоли (sp) и предельн аяош ибка (∆).
p⋅q p⋅q ; при n<30 s p = ± , n n −1 гдеsp − ош ибка вы борки для доли; р − доля вариан т, обладаю щ их изучаем ы м призн аком ; q − доля вариан т, н е обладаю щ их изучаем ы м призн аком ; n − объем вы борки. Ф орм ула предельн ой ош ибки: ∆ = t⋅sp. Следовательн о, гран ицы доверительн ого ин тервала будут н ах одитьсявпределах : p± t⋅sp. Д ругим и словам и, вы борка репрезен тативн а, если получен н ая величин а доли превы ш ает ош ибку вы борки (sp) н а величин у tкритерияпри уровн езн ачим ости Р<0,05 (Р<0,02; Р<0,01; Р<0,001) длядан н огочисла степен ей свободы (п'). П р им е р . И з 52 исследован ий воздуш н ой среды впослеродовы х палатах родильн ого дом а золотисты е стафилококки вы делен ы в16 случаях (рпосл.п. = 30,8%), а из 28 исследован ий воздуш н ой среды впалатах н оворож ден н ы х − в16 (рп.н ов.= 57,1 %). О ш ибки вы борки составят:
sp = ±
30,8 ⋅ (100 − 30,8) = ±6,4 ; 52 57,1⋅ (100 − 57,1) =± = ±9,5. p п.н ов . 28 − 1
spпосл.оп = ± s
Д ляР<0,05 и соответствен н о t=2,0 гран ицы доверительн ого ин тервала для показателя частоты обн аруж ен ия стафилококковвдетских палатах составят: н иж н яя− 30,8-2⋅6,4=18,0, верх н яя− 30,8+2⋅6,4=43,6. П оскольку в палатах н оворож ден н ы х вы полн ен о м ен ьш е30 исследован ий (28), величин а н орм ирован н ого отклон ен ия t берется из прилож ен ия 1 при уровн езн ачим ости Р<0,05 и соответствую щ ем числестепен ей свободы (n’). В приведен н ом прим ере при n = 28-1=27 и уровн е зн ачим ости Р<0,05 t=2,05. Следовательн о, гран ицы доверительн ого ин тервала будут составлять: н иж н яя − 57,1-2,05⋅9,5=37,6; верх н яя− 57,1+2,05⋅9,5=76,6. T-КР И ТЕ Р И Й Д Л Я Н Е ЗА В И С И М Ы Х В Ы Б О Р О К
t-критерий (Стью ден та) является н аиболее часто используем ы м м етодом обн аруж ен ия различиям еж ду средн им и двух вы борок. Н априм ер, tкритерий м ож н о использовать для сравн ен ия средн их показателей группы пациен тов, прин им авш их определен н оелекарство, с кон трольн ой группой, где прин им алось безвредн ое лекарство. Т еоретически, t-критерий м ож ет прим ен яться, даж е если разм еры вы борок очен ь н ебольш ие (н априм ер, n=10, н ом ож н оисследоватьвы борки м ен ьш егоразм ера), если перем ен н ы е н орм альн о распределен ы (вн утри групп), а дисперсии н аблю ден ий вгруппах н е слиш ком различн ы . П редполож ен ие о н орм альн ости м ож н о проверить, исследуя распределен ие (н априм ер, визуальн о с пом ощ ью гисто-
16
грам м ы или критериевсогласия) или прим ен яя какой-либо критерий н орм альн ости. Равен ство дисперсий вдвух группах м ож н о проверить с пом ощ ью F критерия. Е сли условия прим ен им ости t-критерия н е вы полн ен ы , следуетиспользоватьн епарам етрическиеальтерн ативы t-критерия. Р-урове нь зн ачим ости t-критерия равен вероятн ости ош ибочн о отвергн утьгипотезу о равен ствесредн их двух вы борок, когда вдействительн ости эта гипотеза им еет м есто. И н ы м и словам и, он равен вероятн ости ош ибки прин ять гипотезу о н еравен стве средн их , когда вдействительн ости средн ие равн ы . Н екоторы е исследователи предлагаю т, вслучае, когда рассм атриваю тся отличия только в одн ом н аправлен ии (н априм ер, рассм атриваетсяальтерн атива: средн еевпервой группебольш е(м ен ьш е), чем средн еево второй), использоватьоднос т оронне е t-распределен иеи делить р-урове нь двусторон н его t-крит е рия пополам . Д ругие предлагаю т всегда работатьсостан дартн ы м двусторон н им t-крит е рие м. Располож ен ие дан н ы х. Ч тобы прим ен итьt-критерий длян езависим ы х вы борок, требуется, по крайн ей м ере, одн а н езависим ая (г руппирующа я ) перем ен н ая (н априм ер, пол: муж чина /ж е нщина ) и одн а зависим ая перем ен н ая (н априм ер, тестовое зн ачен ие н екоторого показателя - кровян ое давлен ие, число лейкоцитови т.д.). С пом ощ ью специальн ы х зн ачен ий н езависим ой перем ен н ой (эти зн ачен ия н азы ваю тся кода ми, н априм ер, муж чина и ж е нщина ) дан н ы е разбиваю тся н а две группы . М ож н о произвести ан ализ следую щ их дан н ы х с пом ощ ью t-критерия, сравн иваю щ его средн ий уровен ьсуточн оговы делен иян атриясм очой длям уж чин и ж ен щ ин (табл.1). Т аблица 1 Н аблю ден ия П ол Na, м М оль/сутки 111 м уж чин а 1 110 м уж чин а 2 109 м уж чин а 3 102 ж ен щ ин а 4 104 5 ж ен щ ин а средн еедлям уж чин = 110 средн еедляж ен щ ин = 103 Б О Л ЕЕ С Л О Ж Н Ы Е Г Р У П П О ВЫ Е С Р А ВН ЕН И Я
Н а практике часто прих одится сравн ивать более двух групп дан н ы х (н априм ер, им еется ле ка рс т во 1, ле ка рс т во 2 и ус покоит е ль ное ле ка рс т во) или сравн иватьгруппы , создан н ы еболеечем одн ой н езависим ой перем ен н ой (н априм ер, П ол, тип Ле ка рс т ва и Доза ). В таких исследован иях следует использовать дисперсион н ы й ан ализ, которы й м ож н о рассм атривать как обобщ ен ие t-критерия. Ф актически в случае одн офакторн ого сравн ен ия двух групп, дисперсион н ы й ан ализ дает результаты , иден тичн ы е t-критерию . О дн ако, если план сущ ествен н о более слож н ы й, дисперсион н ы й ан ализ предпочтительн ееt-критерия.
17
t-КР И
ТЕ Р И Й Д Л Я ЗА В И С И М Ы Х В Ы Б О Р О К
Вн ут р игр упповая вар иация. Степен ь различия м еж ду средн им и в двух группах зависит от вн утригрупповой вариации (дисперсии) перем ен н ы х . В зависим ости оттого, н асколько различн ы эти зн ачен ия для каж дой группы , « грубаяразн ость» м еж ду групповы м и средн им и показы ваетболее сильн ую или более слабую степен ь зависим ости м еж ду н езависим ой (г руппирующе й) и зависим ой перем ен н ы м и. Н априм ер, если средн ий уровен ь вы делен ия н атрия с м очой равн ялся 110 м М оль/сутки для м уж чин и 103 м М оль/сутки для ж ен щ ин , то разн ость вн утригрупповы х средн их только н а величин у 7 будетчрезвы чайн о важ н ой, когда всезн ачен ияэтого показателя для м уж чин леж ат вин тервале от 111 до 109, а все зн ачен ия для ж ен щ ин - вин тервале 102 - 104. В этом случаем ож н о довольн о х орош о предсказать средн ий уровен ь вы делен ия н атрия с м очой (зн ачен ие зависим ой перем ен н ой) исх одя из пола субъекта (н езависим ой перем ен н ой). О дн ако если та ж е разн ость 7 получен а из сильн о разбросан н ы х дан н ы х (н априм ер, изм ен яю щ их ся в пределах от 0 до 200), то этой разн остью вполн ем ож н опрен ебречь. Т аким образом , м ож н осказать, чтоум ен ьш ен ие внут риг рупповой ва риа ции увеличиваетчувствительн остькритерия. Д ля зависим ы х вы борок t-критерий очен ь полезен втех ситуациях , когда важ н ы й источн ик внут риг рупповой ва риа ции (или ошиб ки) м ож ет бы ть легко определен и исклю чен из ан ализа. Н априм ер, это отн осится к эксперим ен там , вкоторы х две сравн иваем ы е группы осн овы ваю тся н а одн ой и той ж е совокупн ости н аблю ден ий (субъектов), которы е тестировалисьдва ж ды (н априм ер, до и пос ле воздействия, до и пос ле прием а лекарства). В подобн ы х эксперим ен тах зн ачительн ая часть вн утригрупповой изм ен чивости (вариации) вобеих группах м ож ет бы ть объясн ен а ин дивидуальн ы м и различиям и субъектов. Н а сам ом деле, такая ситуация н е слиш ком отличается оттой, когда сравн иваем ы егруппы соверш ен н о н езависим ы , где ин дивидуальн ы е отличия такж е вн осят вклад в дис пе рс ию ошиб ки. О дн ако вслучаен езависим ы х вы борок, вы н ичего н есм ож етеподелатьс этим , т.к. н есм ож етеопределить(или « удалить» ) частьвариации, связан н ую с ин дивидуальн ы м и различиям и субъектов. Е сли та ж е сам ая вы борка тестируется дваж ды , то м ож н о легко исклю чить эту часть вариации. В м есто исследован ия каж дой группы отдельн о и ан ализа исх одн ы х зн ачен ий, м ож н о рассм атривать просто разн ости м еж ду двум я изм ерен иям и (н априм ер, « до прием а лекарства» и « послеприем а лекарства» ) для каж дого субъекта. В ы читаяпервы езн ачен ияиз вторы х (длякаж дого субъекта) и ан ализируя затем только эти "чисты е (парн ы е) разн ости", вы исклю чите ту часть вариации, которая является результатом различия висх одн ы х уровн ях ин дивидуум ов. И м ен н о так и проводятся вы числен ия в tкритерии для зависим ы х вы борок. В сравн ен ии с t-критерием для н езависим ы х вы борок, такой подх од дает всегда « лучш ий» результат (критерий стан овитсяболеечувствительн ы м ).
18
Т еоретические предполож ен ия t-критерия для н езависим ы х вы борок отн осятся такж е к критерию для зависим ы х вы борок. Э то озн ачает, что попарн ы еразн ости долж н ы бы тьн орм альн о распределен ы . Е сли это н евы полн яется, то м ож н о воспользоваться одн им из альтерн ативн ы х н епарам етрических критериев. Располож е н ие дан н ы х. В ы м ож ете прим ен ять t-критерий для зависим ы х вы борок к лю бой пареперем ен н ы х вн аборедан н ы х . Зам етим , прим ен ен ие этого критерия м ало оправдан о, если зн ачен ия двух перем ен н ы х н есопоставим ы . Н априм ер, если вы сравн иваете средн ий уровен ь вы делен ияNa у лю дей ввы боркедои послефизической н агрузки, н оиспользуете различн ы е м етоды вы числен ия количествен н ого показателя или другие един ицы во втором изм ерен ии, то вы соко зн ачим ы е зн ачен ия t-критерия м огут бы ть получен ы искусствен н о, им ен н о за счет изм ен ен ия един иц изм ерен ия. Следую щ ий н абор дан н ы х м ож ет бы ть проан ализирован с пом ощ ью t-критериядлязависим ы х вы борок (табл.2). Т аблица 2 У ровен ьвы делен иян атриясм очой (м М оль/сутки) дои послефизической н агрузки Н аблю ден ия Д он агрузки П ослен агрузки 113 111,9 1 110 109 2 144 143 3 102 101 4 80,9 80 5 средн яяразн остьм еж ду « до» и « после» = 1 Средн яяразн остьм еж ду показателям и вдвух столбцах отн осительн о м ала (d=1) по сравн ен ию с разбросом дан н ы х (от 80 до 143, впервой вы борке). Т ем н ем ен ее, t-критерий для зависим ы х вы борок используеттолько парн ы е разн ости, « игн орируя» исх одн ы е числен н ы е зн ачен ия и их вариацию . Т аким образом , величин а этой разн ости 1 будетсравн иватьсян ес разбросом исх одн ы х зн ачен ий, а с разбросом индивидуа ль ных ра знос т е й, которы й отн осительн ом ал: 0,2 (от0,9 вн аблю ден ии 5 до1,1 вн аблю ден ии 1). В этой ситуации разн ость 1 очен ь больш ая и м ож ет привести к зн ачим ом у t-зн ачен ию . М ат р ицы t-к р ит е р ие в. t-критерий для зависим ы х вы борок м ож ет бы ть вы числен для списковперем ен н ы х и просм отрен далее как м атрица. П ропущ ен н ы едан н ы епри этом обрабаты ваю тсялибо построчн о, либо попарн о, точн о так ж е, как при вы числен ии корреляцион н ы х м атриц. В се те предостереж ен ия, которы е отн осились к использован ию этих м етодовобработки пропусков при вы числен ии м атриц коэффициен тов корреляций, остаю тсявсилепри вы числен ии м атриц t-критериев. В озм ож н о: 1. П оявлен ие артефактов(искусствен н ы х результатов) из-за попарн ого удален ияпропусковвt-критерии;
19
2. В озн икн овен иечисто« случайн о» зн ачим ы х результатов. О Ц Е Н КА Д О С ТО В Е Р Н О С ТИ Р А ЗЛ И Ч И Й М Е Ж Д У Р А ЗМ Е Р А М И Д О Л Е Й
Н а практике, как правило, прих одится сравн ивать двеили н есколько долей м еж ду собой. П оследовательн ость расчетоврассм отрим с использован ием дан н ы х рассм отрен н огон а стр.10 прим ера: 1. О пределяетсяразн ость(d) м еж ду рпосл.п. и рп.н ов.: d = p1-p2; d = 57,l –30,8 = 26,3. 2. В ы числяетсясредн яяош ибка разн ости (sd) поформ уле: Sd = ±
s 2p + s 2p 1 2
. В н аш ем прим ереSd= 11,5.
3. О пределяетсявеличин а t-критерия:
t=
d ; sd
t=
26,3 = 2,29. 11,5
4. П олучен н ая величин а t-критерия сравн ивается с критическим зн ачен ием при уровн е зн ачим ости Р<0,05 (<0,02; <0,01; <0,001) по прилож ен ию 1 с учетом числа степен ей свободы (n’). Ч исло степен ей свободы показы вает количество свободн о варьирую щ их член овстатистической совокупн ости, способн ы х прин им атьлю бы епроизвольн ы езн ачен ия. n'=(n1-1)+(n2-1) В н аш ем прим ере n'= (52-1) + (28-1) =78, т. е. получен н ую величин у t=2,29 н еобх одим о сравн ить с критическим зн ачен ием t-критерия для 78 варьирую щ их призн аков(n>30). Т ак как получен н ая величин а t=2,29 превы ш ает 1,96, разн ость м еж ду сравн иваем ы м и показателям и призн ается достоверн ой. Т аким образом , обсем ен ен н ость золотисты м и стафилококкам и воздух а впалатах н оворож ден н ы х вы ш е н а 26,3 %, чем в послеродовы х палатах (57,1 ± 9,5% и 30,8 ± 6,4 % соответствен н о, Р<0,05). Сравн ительн ом у ан ализу подлеж атрепрезен тативн ы еотн осительн ы е показатели. О дн ако висследовательской практике ин огда прих одится использовать для сравн ительн ого ан ализа и един ичн ы е абсолю тн ы е величин ы , н есм отря н а то, что при переводе их вотн осительн ы е величин ы последн ие оказы ваю тся н епредставительн ы м и. Т ем н е м ен ее, если явлен ие им еетм есто, н есчитаться с н им н ельзя, особен н о вслучаях , когда он о вообщ е н е долж н о встречаться при определен н ы х обстоятельствах (н априм ер, вы делен иепатоген н ы х м икроорган изм ови др.). Д ля х арактеристики отн осительн ой доли (удельн ого веса) части в целом использую тсяэкс т е нс ивные пока за т е ли. О н и вы раж аю тся, как правило, впроцен тах , т. е. вся совокупн ость прин им ается за 100 %, а составляю щ ие ее статистические един ицы определен н ую часть от 100 %. Э кстен сивн ы е показатели ш ироко прим ен яю тся для ан ализа структуры заболеван ий, причин см ерти, возрастн о-половой структуры н аселен ияи т. д. В качестве прим ера м ож н о привести результаты обработки дан н ы х поструктурезаболеваем ости детей взим н е-весен н ий период года (табл.3).
20
П оследовательн остьрасчетов: 1. В ы числяем удельн ы й вес(p1) больн ы х гриппом : 150:178⋅100 = 84,3% 2. О пределяем ош ибку поформ уле:
sp = ±
p⋅q = n
84,3 ⋅ (100 − 84,3) = 2,7. 100
Т аблица 3 Структура заболеваем ости детей взим н е-весен н ий период Заболеван ие В сегослучаев У дельн ы й вес, % Грипп 150 84,3 Сальм он еллез 10 5,6 Скарлатин а 12 6,7 К оклю ш 4 2,3 К орь 2 1,1 Вс е г о 178 100,0 О це нка ре пре зе нт а т ивнос т и доли, ра вной 0 или 100%. В тех случаях , когда получен н ы й при вы борочн ы х исследован иях показатель частоты явлен ияравен 100 % (или 0, что такж еприравн иваетсяк 100 %), это н еозн ачает, что дан н ы й результат м ож н о отн ести ко всей ген еральн ой совокупн ости. О ш ибка вы борки втаких случаях определяетсяпоформ уле:
sp =
t 2 ⋅ 100 n + t2
,
где sp – ош ибка вы борки; t – н орм ирован н ое отклон ен ие; n – объем вы борочн ой совокупн ости. П р им е р . П ри постан овке серологической реакции 35 детям из 2500 дан н ого возраста он а оказалась у всех полож ительн ой (100%). Зн ачит ли это, чтосреди остальн ы х н етдетей сотрицательн ой реакцией? П о прилож ен ию 1 при n>30 и уровн е зн ачим ости 0,05 величин а t=2,0. Следовательн о:
sp =
2 2 ⋅100
= 10,3 35 + 2 2 Т аким образом , среди остальн ы х детей процен тлиц с отрицательн ой реакцией м ож ет бы ть 2500.10,3 = 258 человек, а с полож ительн ой реакцией: (100 –10,3) . 2500 = 2242 человека. О П Р Е Д Е Л Е Н И Е Н Е О Б Х О Д И М О Г О О Б Ъ Е М А В Ы Б О Р КИ П Р И А Л Ь ТЕ Р Н А ТИ В Н О М В А Р Ь И Р О В А Н И И П Р И ЗН А КО В
Стрем лен ие к больш ом у числу исследован ий н е всегда оправдан о, так как убедительн ы е результаты м ож н о получить и при м ин им альн о допустим ом объем ен аблю ден ий. Н еобх одим ы й объем вы борочн ой совокупн ости, обеспечиваю щ ий ее репрезен тативн ость, м ож ет бы ть устан овлен заран ее. П ри альтерн ативн ом распределен ии исх одн ы х дан н ы х , когда воз-
21
м ож н ы только два исх ода (н априм ер, заболел–н езаболели т. д.), н еобх одим ы й объем исследован ий определяетсяпоформ уле:
n=
t2 ⋅ p ⋅ q
, ∆2 где n – н еобх одим ы й объем вы борки; р – показатель частоты явлен ия (доля),%; q = (100 – p),%; t – н орм ирован н ое отклон ен ие; ∆ – предельн ая ош ибка вы борки, %. П р им е р . За период проведен ия исследован ий 936 человек зарегистрирован о 115 человек с н аруш ен иям и фун кции сердечн о-сосудистой систем ы . К акое количество кардиограм м (n) при ∆=3% н еобх одим о проан ализировать для х арактеристики состоян ия сердечн ой деятельн ости у обследован н огокон тин ген та лю дей? П оприлож ен ию 1 при n>30 и Р<0,05 t=2,0. Следовательн о: 4 ⋅ 12,3 ⋅ 87,7 115 ⋅ 100% n= = 479. p= = 12,3%; 936 9 Е сли р и q н еизвестн ы , берется н аибольш ая возм ож н ая величин а произведен ия, т. е. 250 (50 % ⋅50 %): n=
2 2 ⋅ 50 ⋅ 50 = 333 32
С Р ЕДН И Е ВЕЛ И Ч И Н Ы Н аряду с показателям и частоты явлен ий количествен н ая сторон а последн их х арактеризуется с ре дними ве личина ми: с ре дне й а риф ме т иче с кой
х) и с ре дне й г е оме т риче с кой (хгеом.). В рядеслучаевдлях арактеристики разм еровпризн ака прим ен яю тмоду (М о) и ме диа ну (Me). О тличительн ой особен н остью средн их величин является то, что в н их взаим н о погаш аю тся ин дивидуальн ы еразличия призн ака у отдельн ы х един иц изучаем ой совокупн ости, в результате чего представляется возм ож н ость ох арактеризовать общ ие свойства изучаем ы х явлен ий, закон ом ерн ости их развития. Сре дня я а риф ме т иче с ка я получается при делен ии сум м ы одн ородн ы х величин , х арактеризую щ их зн ачен иеопределен н ого призн ака, н а число вариан т. О дн ако преж де чем приступить к ее вы числен ию , н еобх одим о убедиться вотсутствии ввариацион н ом ряду так н азы ваем ы х « вы скакиваю щ их » вариан т, которы евзн ачительн ой степен и м огутискаж ать кон ечн ы ерезультаты . « В ы скакиваю щ ие» вариан ты зн ачительн о отличаю тся по величин е отдругих и н етипичн ы длядан н ого ряда. К ак правило, он и являю тсяследствием ош ибочн ы х записей или погреш н остей в эксперим ен тальн ы х исследован иях . Е сли устан овить достоверн о причин у появлен ия « вы скакиваю щ ей» вариан ты н евозм ож н о, ее исклю чаю т из вариацион н ого ряда путем расчетов. М етодовопределен ия « вы скакиваю щ их » вариан тн есколько.
(
22
Рассм отрим н аиболеепростой из н их . П р им е р . В ш ести пробах сы воротки крови у кры с бы ла определен а активн остьалан ин ам ин отран сферазы (А лА Т ) 8, 12, 16, 32, 140 и 32 Е /л. В дан н ом вариацион н ом ряду обращ аетн а себявн им ан иецифра 140, которая резко отличается по величин е от других и сущ ествен н о влияет н а разм ер средн ей арифм етической ( х=40 с учетом вариан ты 140 и х =20 – без н ее). Е сть осн ован ия проверить вариан ту 140 н а соответствие ее дан н ом у вариацион н ом у ряду. Д ля этого вариан ты располагаю тся впорядке возрастаю щ их зн ачен ий: А ктивн остьА лА Т , Е /л № пробы
8 1
12 2
16 3
32 4
32 5
140 6
Ц ифровы едан н ы еподставляю тсявформ улу: x 6 − x 5 140 − 32 = = 0,818 , x 6 − x1 140 − 8 т. е. вчислителе–разн остьм еж ду м аксим альн ой (140) и предш ествую щ ей ей по величин е (32) вариан там и (порядковы е н ом ера 6 и 5), взн ам ен ателе – разн ость м еж ду величин ам и м аксим альн ой (140) и м ин им альн ой (8) вариан т (порядковы е н ом ера 6 и 1). П олучен н ое зн ачен ие 0,818 оцен ивается по прило ж ению 2. Д лячисла н аблю ден ий 6 и Р<0,05 критический уровен ь составляет 0,560. П оскольку получен н ая величин а 0,818 превы ш ает 0,560, вариан та 140 достоверн о отличается от других и долж н а бы ть исклю чен а из вариацион н огоряда. П рактически н е прих одится прибегать к исклю чен ию м ин им альн ы х зн ачен ий вариан т, так как даж е резкое отличие их от других сущ ествен н о н е влияет н а зн ачен ие средн их величин . О дн ако при н еобх одим ости такие расчеты вы полн яю тсяпоформ уле: x 2 − x1 12 − 8 = = 0,030 x 6 − x1 140 − 8 П олучен н ая вдан н ом случаевеличин а 0,030 зн ачительн о н иж екритическогоуровн я0,560, следовательн о, вариан та исклю чен ию н еподлеж ит. Сре дня я г е оме т риче с ка я прим ен яетсявтех случаях , когда изм ен ен ия вариан т ввариацион н ом ряду происх одят вгеом етрической прогрессии, т. е. каж ды й последую щ ий уровен ьряда, х арактеризую щ ий развитиеявлен ия, прим ерн о равен преды дущ ем у, ум н ож ен н ом у н а н екоторое постоян н оедля дан н ой прогрессии число, н азы ваем оезн ам ен ателем прогрессии. И зм ен ен ие явлен ий вгеом етрической прогрессии им еетм есто вм икробиологической и им м ун ологической практике (разм н ож ен ие м икроорган изм ов, н арастан ие титра ан тители т. д.). Средн яя геом етрическая определяется по форм уле: x геом = n x1 ⋅ x 2 ⋅ x 3 K ⋅ x n , где x геом –средн яягеом етрическая; x1, x2, xn –вариан ты ; n – числочлен оввариацион н огоряда. М е диан а (Me) – вариан та, делящ ая ран ж ирован н ы й вариацион н ы й
23
ряд н а две части, одн а из которы х им еет зн ачен ия вариан т м ен ьш е Me, другая – больш е. П рим ен ен ие м едиан ы особен н о показан о при н есим м етричн ом распределен ии вариан т вряду, а такж е при н ебольш ом числе н аблю ден ий, когда крайн ие вариан ты отличаю тся от остальн ы х и взн ачительн ой степен и м огутопределятьуровен ьсредн ей арифм етической. П ри н ебольш ой вы борке определить м едиан у довольн о легко. Н априм ер, ввариацион н ом ран ж ирован н ом ряду (7, 9, 16, 24, 30, 32, 44), где числовариан тн ечетн ое, м едиан ой являетсясредин н аявариан та 24. В ряду 9, 13, 18, 24, 26, 29, 31, 36, т. е. при четн ом числевариан т, за м едиан у прин им аю т средн ю ю арифм етическую из двух цен тральн ы х вариан т, т. е. (24+26):2=25. П ри распределен ии вы борки ввариацион н ы й ряд м едиан а определяетсяпоформ уле:
n −p s 2 Me = x +i , Me p Me гдехMе –н иж н яягран ица ин тервала, вкотором н ах одитсяMe (при ан ализе ин тервальн ого ряда), или полусум м а соседн их классовы х вариан т пром еж утка, вкотором н ах одитсяMe (при ан ализедискретн ого ряда); ps –число н акоплен н ы х (кум улирован н ы х ) частот, стоящ ее перед м едиан н ы м ин тервалом (классом ); рMе– частота м едиан н ого ин тервала (класса); 1 – классовы й пром еж уток (ин тервал); n –объем вы борки. Расчет м едиан ы вдискретн ом и ин тервальн ом рядах рассм отрим н а прим ерах (табл.4 и 5). П р им е р . Н айти м едиан у ряда распределен ия 146 ш там м овзолотистогостафилококка поспектру устойчивости к 9 ан тибиотикам . Т аблица 4 И сх одн ы едан н ы еи парам етры расчета Me длядискретн огоряда К оличествоан тибиотиков, к кото- Ч ислош там м ов Н акоплен н ы е ры м устойчивы стафилококки (x) (pi) частоты (ps) 1 8 8 2 6 14 (8+6) 3 24 38 (14+24) 4 20 58 (38+20) 5 53 111 (58+53) и т.д. 6 12 7 10 8 5 9 8 n=146 1. Н ах одится м едиан н ы й ин тервал(класс), для чего объем вы борки делитсян а 2 (146:2=73).
24
2. Д ляопределен иям естополож ен ияMe кум улирую тсячастоты ряда pi (графа 3) до числа н акоплен н ы х частот, стоящ их перед м едиан н ы м ин тервалом (ps). ps=111. Т ак как число 73 н ах одится м еж ду ps=58 и ps=111, то величин а н иж н ей гран ицы ин тервала, вкотором н ах одится Me, будет м еж ду 4 и 5 ан тибиотикам и:
x Me =
4+2 = 4,5 . 5
3. Ч астота м едиан н ого класса (рМ е) будет равн а числу ш там м ов, н ах одящ их сявм едиан н ом классе. рМ е=53 4. В еличин а классового ин тервала (i) составляет 1, так как ан тибиотикограм м а изучаласьсин тервалом водин препарат. 5. П олучен н ы езн ачен ияподставляю тсявформ улу:
Me = 4,5 + 1 ⋅
73 − 58 = 4,8. 53
Н езн ачительн о отличается и определен ие Me ин тервальн ого вариацион н огоряда. П р им е р . О пределить н аиболее подверж ен н ую заболеваем ости остры м и киш ечн ы м и ин фекциям и возрастн ую группу н аселен ия согласн о дан н ы м , представлен н ы м втаблице5. Т аблица 5 И сх одн ы едан н ы еи парам етры расчета Me дляин тервальн огоряда В озрастбольн ы х , Ч ислобольн ы х (pi) Н акоплен н ы ечастоты (ps) годы (х ) 0-3 7 7 3-6 82 89 (7+82) 6-9 58 147 (89+58) 9-12 32 179 (147+32) и т.д. 12-15 25 15-18 24 18-21 19 21-24 17 24-27 6 27-30 5 n=275 1. М едиан н ы й ин тервалсоставит: 275:2=137,5 (138). 2. Н акоплен н ы ечастоты , м еж ду которы м и н ах одитсям едиан н ы й ин тервал, равн ы : ps=89 и ps=147. П ри ps=147 гран ицам и ин тервала, вкотором н ах одится М е, является возрастн ая группа 6–9 лет (н иж н яя гран ица х М е=6) при частотерМ е=58. 3. В еличин а классовогоин тервала (i) составляет3 года.
25
Me = 6 + 3 ⋅
138 − 89 = 8,5 58
М ода(М о) –величин а, котораян аиболеечасто встречаетсявдан н ой совокупн ости. К ласс (ин тервал) с н аибольш ей частотой н азы вается м одальн ы м . М ода определяетсяпоформ уле: p 2 − p1 Mo = x н + i ⋅ , 2p 2 − p1 − p3 где х н – н иж н яя гран ица м одальн ого класса (ин тервала); р2 – м одальн ы й класс; p1 – частота класса, предш ествовавш его м одальн ом у; р3 – частота класса, следую щ егоза м одальн ы м ; i –величин а классовогоин тервала. О пределен ие М о рассм отрим для дан н ы х , приведен н ы х втаблице 5. В м одальн ом классе(р2=82) н иж н ей гран ицей будетвозраст3 года (х н =3); частота предш ествую щ его класса pi =7, а следую щ его за м одальн ы м классом рз=58; i=3 года. 82 − 7 Mo = 3 + 3 ⋅ = 5,3 2 ⋅ 82 − 7 − 58 Следовательн о, прим ен ительн о к условиям прим ера среди больн ы х остры м и киш ечн ы м и ин фекциям и н аиболее часто встречались дети ввозрасте5,3 года. К ром е рассм отрен н ы х осн овн ы х числовы х х арактеристик случайн ой величин ы , вн екоторы х случаях вы числяю т и другие числовы е х арактеристики, из которы х важ н ейш им и являю тсяа с имме т рия As и экс це с с Е х. Д ля сим м етричн ого распределен ия каж дом у им ею щ ем уся зн ачен ию случайн ой величин ы слева от Μ соответствует такое зн ачен ие случайн ой величин ы справа от М , которое даетс н им такую ж е (н о с противополож н ы м зн аком ) разн ость и н аблю дается такое ж е число раз. П оэтом у сум м а разн остей (М– xi), ум н ож ен н ы х н а Pi, для сим м етричн ого распределен ия равн а н улю . Э тотрезультатн ем ен яется, если возвести всеразн ости (М– xi) влю бую н ечетн ую степен ь. И м ен н о поэтом у вкачестве показателя асим м етрии прим ен яется м атем атическое ож идан ие куба отклон ен ия случайн ой величин ы отсредн егозн ачен ия. Э тотпоказательделятн а куб средн его квадратическогоотклон ен ия, чтобы получитьбезразм ерн ую величин у. П оказатель Е х х арактеризуеткрутизн у спадан ия распределен ия вобласти егом атем атического ож идан ия. Д ля одн ого из важ н ейш их закон овраспределен ия – закон а Гаусса, плотн ость распределен ия которого изображ ается кривой колоколообразн ой форм ы (см . рис. 1), им еетм естосоотн ош ен ие: i=n
∑ (x i − M) 4
i =1
σ4
= 3,
т. е. длян его Е х =0. В сеостальн ы есим м етричн ы ераспределен ия, таким образом , как бы сравн иваю тся с распределен ием Гаусса: для более остро-
26
верш ин н ы х Е х>0, дляболееплосковерш ин н ы х Е х<0. О П Р Е Д Е Л Е Н И Е О Б Ъ Е М А В Ы Б О Р КИ Д Л Я П О Л У Ч Е Н И Я Р Е П Р Е ЗЕ Н ТА ТИ В Н Ы Х С Р Е Д Н И Х В Е Л И Ч И Н
Д ля обн аруж ен ия закон ом ерн остей изучаем ы х явлен ий н еобх одим достаточн о больш ой объем исследован ий, одн ако он н е м ож ет возрастать бескон ечн о, а долж ен н ах одитьсяврацион альн ы х гран ицах . П оследн иезависятотж елаем ой точн ости н аблю ден ия(допустим ой ош ибки вы борки), а такж е от задан н ого уровн я зн ачим ости, которы й н е долж ен бы ть м ен ее 95%. Н еобх одим ы й объем исследован ий рассчиты ваетсяпоформ уле: t 2 ⋅ σ2 n= , ∆2 гдеn – число н еобх одим ы х исследован ий (объем вы борки); ∆ –предельн ая ош ибка вы борки; σ –средн ееквадратическое отклон ен ие; t – н орм ирован н оеотклон ен ие(2,0 или 3,0). П о указан н ой форм улевозм ож н о определен иеобъем а вы борки только для расчета средн ей арифм етической, т. е. вслучаях , когда рассеян ие вариан тподчин яетсязакон у н орм альн огораспределен ия. О Б Р А Б О ТКА Д А Н Н Ы Х В Ы Б О Р О Ч Н О Г О И С С Л Е Д О В А Н И Я М Е ТО Д А М И О П И С А ТЕ Л ЬН О Й С ТА ТИ С ТИ КИ В С Л У Ч А Е Н О Р М А Л ЬН О Г О Р А С П Р Е Д Е Л Е Н И Я Д А Н Н Ы Х С П Р И М Е Н Е Н И Е М П Р О Г Р А М М Н О Г О П А КЕ ТА STADIA В пакете STADIA довольн о полн о представлен ы м етоды описательн ой статистики, все он и собран ы воедин о в разделе пакета « П арам етрические тесты » блока « Статистики» . П роиллю стрируем их работу н а прим ерах . П р им ер . Бы лизм ерен вм км диам етр50 эритроцитов(табл.6). Т аблица 6 7,49 7,51 7,53 7,55 7,54 7,55 7,55 7,53 7,55 7,55
Д иам етр эритроцитовчеловека, м км 7,7 7,55 7,64 7,53 7,55 7,56 7,55 7,58 7,53 7,52 7,58 7,55 7,57 7,55 7,54 7,55 7,55 7,56 7,53 7,52 7,55 7,55 7,55 7,53 7,55 7,51 7,58 7,55 7,57 7,55
7,62 7,58 7,55 7,55 7,54 7,55 7,55 7,54 7,56 7,55
Д лявы борки диам етровэритроцитоввы числим средн еезн ачен ие, м едиан у, дисперсию , н иж н ю ю и верх н ю ю квартили, а такж е м ин им альн ы й и м аксим альн ы й элем ен ты
27
П одгот овк а дан н ы х. Н ах одясь в редакторе базы дан н ы х пакета, следует ввести дан н ы е таблицы с клавиатуры . Д алее н еобх одим о ввести им я файла для сох ран ен ия дан н ы х , н априм ер « erytr» . Результаты ввода частичн опредставлен ы н а рисун ке2. Ф а йл: erytr Var/Cases Varname 37 38 39 40 41 42 43 44 45 46 47 48 49 50
1/50 x1 7.55 7.51 7.58 7.55 7.55 7.55 7.51 7.58 7.56 7.55 7.55 7.57 7.55 7.55
П е р е м е н н ы х =1 3/0 4/0 x3 x4
2/0 x2
5/0 x5
И зм е р е н и й=50 6/0 7/0 x6 x7
Б Л О К Р Е Д А КТО Р А Д А ННЫ Х F1 П о м о щь F2 П е ч Э кр F3 Ч т е ние F4 Запись F5 А р х ив F6 Рисуно к F7 Оч ист F8 П р е о бр F9 Ст ат ис F10 Вы х о д В во дите в м а тр ицу чи сла + Enter (р а бо та ю т та кже : Enter/ Ins/ Del/ Tab и F-клю чи
Рис.2. П акетSTADIA. Э кран блока редактора дан н ы х сзагруж ен н ой вы боркой Н а запроссистем ы « В ы беритем етод или н аж м итеегоклю ч» следует н аж ать клю ч процедуры « 1=О писательн ая статистика» (рис.3). Н а следую щ ий запрос « У каж итен ом ер ан ализируем ой перем ен н ой (Enter = Bce)» н адо ввести « 1» . В дан н ом случае, когда вфайле только одн а перем ен н ая, м ож н он аж ать« Enter» . Ф а йл:
П е р е м е н н ы х =1
И зм е р е н ий=20
СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы П А Р А М Е ТР И ЧЕ СКИ Е ТЕ СТЫ
1 = О писа те ль н а я ста тисти ка 2 = Гисто гр а м м а и н о р м а ль н о сть 3 = Ко р р е ля ция 4 = Те сты Сть ю де н та и Ф иш е р а НЕ П А Р А М Е ТР И ЧЕ СКИ Е ТЕ СТЫ
5 = Хи-ква др а т 6 = Сдвига (по ло же н ия ) 7 = М а сш та ба (р а ссе я н ия ) 8 = П р о изво ль н ы х а ль те р н а тив 9 = Д ля па р н ы х вы бо р о к А = Ко р р е ля ция (н е за ви сим о сть ) В = Кр о сста буля ция А НА Л И З ВР Е М Е ННЫ Х Р Я Д О В
С = Ко р р е ля цио н н ы й а н а лиз D = Спе ктр а ль н ы й а н а лиз E = Сгла жива н ие и ф иль тр а ция
Д И СП Е Р СИ О ННЫ Й А НА Л И З
G = 1-ф H = 2-ф I = 1-ф J = 2-ф
а кто р н ы а кто р н ы а кто р н ы а кто р н ы
й па р а м е тр иче ский й па р а м е тр иче ский й Кр уска ла -Уо ллиса й Ф р идм а н а
Р Е ГРЕ ССИ О ННЫ Й А НА Л И З
K = Ср а вн е н ие двух р е гр е ссий L = П р о ста я р е гр е ссия (тр е н д) M = М н о же стве н н а я лин е йн а я р е гр е ссия N = П о ш а го ва я р е гр е ссия O = О бщ а я (+ н е лин е йн а я ) р е гр е ссия М НО ГО М Е Р НЫ Е М Е ТО Д Ы
P = Д искр им ин а н тн ы й а н а лиз Q = Кла сте р н ы й а н а лиз R = Ф а кто р н ы й а н а лиз S = Ш ка лир о ва н ие
СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы f10 В ы х о д f1 И н ф о р м а ция f2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м В ы бе р ите м е то д или н а жм ите е го клю ч >>
Рис.3. М ен ю блока статистических м етодов
28
Ре зульт ат ы . Н а экран е появятся зн ачен ия осн овн ы х описательн ы х статистик и запрос систем ы « В ы дать дополн ительн ую статистику» . В ответ н а запрос м ож н о н аж ать « Y» , и тогда програм м а вы ведет остальн ы е описательн ы естатистики (рис.4). Ф а йл: О П И СА ТЕ Л Ь НА Я СТА ТИ СТИ КА
П е р е м е н н ы х =1 П ер ем ен н ы е: х 1
И зм е р е н ий=50
Р а зм е р 50
Ср е дн е е 7.553
О ш . ср е дн 4.579Е -3
Д о ве р . ин т 9.082Е -3
М е диа н а 7.55
В ы бо р . дисп 1.049 Е -3
Ст. о ткл 3.238 Е -2
О ш . ст. о т 3.238 Е -3
Ге н е р . дисп 1.028 Е -3
Ст. о ткл 3.206 Е -2
Д о ве р ит. ин те р ва л 7.317 Е -4 1.629 Е -3
Сум м а 377.6
Сум . ква др 2852
Д исп.сум .кв 5.243 Е -2
m2 1.028E-3
m3 7.319 E-5
m4 3.815 E-6
А ссим м е р ия 2.222
Зн а чим 0
Э ксце сс 3.613
Зн а чим 0.1768
СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м
F10 В ы х о д
На жм ите Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Рис.4. Результатобработки сиспользован ием описательн ой статистики В о встроен н ом справочн икепрограм м ы им ею тся определен ия и сведен ия о н азн ачен иях всех этих описательн ы х статистик. Д ля вы вода дан н ой ин форм ации н а экран (рис.5) следуетн аж атьклавиш у « F1» . Р УБ Р И КА ТО Р
Стр .1
П е ре ме ст и т е ра мк у н а т ре бу е му ю ру бри к у и з н и ж е сле ду ю щ е го сп и ск а с п омощ ь ю к ла ви ш со ст ре лк а ми и н а ж ми т е к ла ви ш у <Enter>. Д ля выхода и з сп ра вк и н а ж ми т е к ла ви ш у .Сн а ча ла же ла т е ль н о озн а к оми т ся с п орядк ом ра бот ы со сп ра вочн и к ом в ра зде ле <Ра бот а со сп ра вочн и к ом> и у зн а т ь <Новост и >. Со ста в систе м ы
На стр о йка и ко пир о ва н ие систе м ы
Э то вы м о же те
П о р я до к диа ло га
Что м о же т ста тистика Ка ко й м е то д а н а лиза вы бр а ть Ста тистиче ские да н н ы е П р о пущ е н н ы е зн а че н ия Ста тистиче ские м е то ды Д иа гн о стика о ш ибо к
В во д и изм е н е н ие да н н ы х Ко м а н да бло ка р е да кто р а да н н ы х П о стр о е н ие гр а ф ико в да н н ы х П р е о бр а зо ва н ие да н н ы х Ср е дства вво да / вы во да и ф а йлы
СП Р А В О ЧНИ К П О СИ СТЕ М Е
f1 Оглавле ние
f2 П е ч ат ь экр ана f3 Вы бо р м е т о да анализа данны х f9 П р е ды д. р азде л f10 Вы х о д
И спо ль зуйте : PgUp/PgDw=листо ва н и е ; стр е лк=вы бо р р а зде ла ; Enter=вх о д в р а зде л.
Рис.5. Главн оеокн осправочн ой систем ы пакета STADIA Ком м е н т ар ии. 1.Ч асть описательн ы х статистик, вы числяем ы х этой процедурой, отн осятся только к вы боркам из н орм альн ого распределен ия. Э то касается разм ера доверительн ого ин тервала для средн его и зн ачен ий кон цовдоверительн огоин тервала длядисперсии. 2. Е сли вблок редактора дан н ы х загруж ен о н есколько перем ен н ы х и н а запрос систем ы « У каж ите н ом ер ан ализируем ой перем ен н ой (Е ntег =
29
все)» В ы н аж али « Enter» , то будут вы числен ы описательн ы е статистики длявсех этих перем ен н ы х . Возм ож н ост и гр афиче ск ого ан ализадан н ы хв пак е т е STADIA П р им е р . Сгруппируем дан н ы епреды дущ его прим ера вдиапазон е от 7,50 м км до 7,60 м км с ш агом группировки 0,01 м км и вы числим частоты попадан ия в получен н ы е ин тервалы группировки. П одготовка дан н ы х осущ ествляетсятак ж е, как впреды дущ ем прим ере. Вы бор пр оце дур ы . В блоке статистических м етодовследует н аж ать клавиш у « 2» , чтобы вы братьпроцедуру « 2=Гистограм м а и н орм альн ость» . Заполн е н ие поле й вводадан н ы х. Н а запрос систем ы « У каж ите число ин тервалови диапазон гистограм м ы (Enter=вы числ.)» н адо ввести требуем ы евприм ерезн ачен ия: 7,5, 7,6, 0,01, и затем н аж ать« Enter» . Ре зульт ат ы . Н а экран епоявитсярезультаты расчетов, вклю чаю щ ие таблицу табуляции частот, зн ачен ия статистик К олм огорова и х и-квадрат (χ2), а такж езаклю чен иесистем ы « Гипотеза 0: Распределен иен еотличаетсяотн орм альн ого» (рис.6). Ф а йл:
П е р е м е н н ы х =1
И зм е р е н ий=50
П ерем ен н ы е: х 1
ГИ СТО ГР А М М А И ТЕ СТ НО Р М А Л Ь НО СТИ .
x
x-ста н д
Ча сто та
%
На ко пл.
7.49 7.518 7.546 7.574 7.602 7.63 7.658 7.686
-1.965 -1.092 -0.2183 0.655 1.528 2.402 3.275 4.148
4 10 29 4 1 1 0
8 20 58 8 2 2 0
4 14 43 47 48 49 49
% 8 28 86 94 96 98 98
Ко лм о го р о в-См ир н о в=0.2964 Зн а чим о сть =1.48Е -10 сте п.сво б=50 Хи-ква др а т=23.18 Зн а чим о сть =0.4382 сте п.сво б=5.5 Гипо те за 0 : Р а спр е де ле н ие н е о тли ча е тся о т н о р м а ль н о го СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм и те Enter=пр о до лжить >>
Рис.6. Результаты процедуры « Гистограм м а и н орм альн ость» В первом столбце таблицы указан правы й кон ец ин тервала группировки, во втором зн ачен ия первого столбца тран сформ ирован ы следую щ им образом : из каж дого элем ен та первого столбца вы читается средн ее зн ачен иевы борки и получен н ая разн ость делитсян а стан дартн ое отклон ен ие вы борки. Следую щ ие четы ре столбца содерж ат частоту, отн осительн ую частоту, н акоплен н ую частоту и отн осительн ую н акоплен н ую частоту соответствен н о. П осле н аж атия « Enter» появится запрос систем ы запрос систем ы « В ы вести график» . П ри ответе « Y» програм м а вы водитгистограм м у и подобран н ую по вы боркекривую плотн ости н орм альн ого распределен ия. Н а экран вы водится запрос вида оформ лен ия графика и вы бора устройства
30
вы вода (рис.7).
Рис.7. Гистограм м а сн алож ен н ы м графиком н орм альн ой кривой П р очие возм ож н ост и. И з других графических м етодовописательн ой статистики впакете STADIA представлен такж ем атричн ы й график, вкотором зн ачен ия каж дой перем ен н ой, н ах одящ ейся втекущ ий м ом ен т вблоке редактора дан н ы х , сгруппирован ы вотдельн ом столбцеграфика с указан ием полож ен иясредн егозн ачен ияи ин тервала стан дартн огоотклон ен ия. Ср авн е н ие дан н ы хдвухвы бор ок с использован ие м пак е т аSTADIA с пр им е н е н ие м t-к р ит е р ия. В качестведан н ы х дляан ализа используем дан н ы ео числелейкоцитов(109/л) крови у двух групп обследуем ы х лиц. Группа 1 9,47 7,41 14,82 3,61 4,59 4,49 9,98 14,89 5,24 7,97 Группа 2 7,40 9,23 7,23 15,41 4,69 6,28 3,70 10,87 14,26 5,54 П одготовим дан н ы е для ан ализа, введя их с клавиатуры вбазу дан н ы х пакета. Сох ран им введен н ы едан н ы евфайлесим ен ем « leu» . Вы бор пр оце дур ы . В м ен ю статистических м етодоввы берем пун кт « 4 = Т есты Стью ден та и Ф иш ера» , далееследуетн аж атьклавиш у « Enter» . Результ ат ы . Результаты ан ализа представлен ы н а рисун ке8. П риводим ы е дан н ы е свидетельствую т об отсутствии различий м еж ду вы боркам и как по их дисперсиям , так и по дан н ы м t-критерия для парн ы х дан н ы х .
31 Ф а йл: КР И ТЕ Р И Й Ф И Ш Е Р А И СТЬ Ю Д Е НТА. Ста тистика Ф и ш е р а =1.067, Ста тистика Сть ю де н та =0.1189,
П е р е м е н н ы х =2 П ерем ен н ы е: х 1 х 2
Зн а чим о сть =0.4621, Зн а чим о сть =0.9025,
Сть ю де н т для па р н ы х да н н ы х =0.8134,
И зм е р е н ий=20
сте п.сво б=9, 9 сте п.сво б=18
Зн а чим о сть =0.5581,
сте п.сво б=9
Гипо те за 0 : Не т р а зличий м е жду вы бо р о чн ы м и ср е дн им и СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм и те Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Рис. 8. Результаты сравн ен иядвух вы борок сиспользован ием пакета STADIA сприм ен ен ием t-критерия. КР А ТКИ Й О Б ЗО Р П О Н Я ТИ Я « КР И ТЕ Р И Й ЗН А Ч И М О С ТИ » Е сли известн о распределен ие н аблю даем ой перем ен н ой, то м ож н о предсказать, как вповторн ы х вы борках равн ого объем а будет« вести себя» используем ая статистика – т.е. каким образом он а будет распределен а. П усть, н априм ер, им еется100 случайн ы х вы борок, из одн ой популяции по 100 взрослы х человек вкаж дой. В ы числим средн ий ростсубъектоввкаж дой вы борке, т.е. н айдем вы борочн оесредн ее. Т огда распределен ие вы борочн ы х средн их м ож н о х орош о аппроксим ировать н орм альн ы м распределен ием (более точн о, t распределен ием Стью ден та с 99 степен ям и свободы ). Т еперь представим , что случайн ы м образом извлечен а ещ е одн а вы борка из ж ителей н екоего города « N» , где, по н аш им представлен иям , прож иваю т лю ди с ростом вы ш е средн его. Е сли средн ий рост лю дей вэтой вы борке попадает вверх н ю ю 95% критическую областьt распределен ия, то м ож н о сделатьобосн ован н ы й вы вод, что ж ители города « N» , действительн о, всредн ем более вы сокие, чем вцелом впопуляции, т.е. этодействительн огород вы соких лю дей. И М Е Ю Т Л И Б О Л Ь Ш И Н С ТВ О П Е Р Е М Е Н Н Ы Х Н О Р М А Л Ь Н О Е Р А С П Р ЕД ЕЛ ЕН И Е?
В рассм отрен н ом прим ере использовался тот факт, что вповторн ы х вы борках равн ого объем ы средн ие зн ачен ия (роста лю дей) будут им еть t распределен ие(с определен н ы м средн им и дисперсией). О дн ако это верн о, если рассм атриваем аяперем ен н ая(рост) им еетн орм альн оераспределен ие, т.е. распределен иелю дей определен н огороста н орм альн ораспределен о. Д ля м н огих изучаем ы х перем ен н ы х н евозм ож н о сказать с уверен н остью , что это действительн о так. Случаи редких болезн ей н е являю тся н орм альн о распределен н ы м и впопуляции, число автом обильн ы х аварий такж е н е является н орм альн о распределен н ы м , как и м н огие другие перем ен н ы е, ин тересую щ иеисследователя.
32 О Б Ъ Е М В Ы Б О Р КИ
Д ругим фактором , часто огран ичиваю щ им прим ен им остькритериев, осн ован н ы х н а предполож ен ии н орм альн ости, является объем или разм ер вы борки, доступн ой для ан ализа. Д о тех пор пока вы борка достаточн о больш ая(н априм ер, 100 или больш ен аблю ден ий), м ож н о считать, что вы борочн оераспределен ие н орм альн о, даж еесли вы н е уверен ы , что распределен ие перем ен н ой в популяции, действительн о, является н орм альн ы м . Т ем н е м ен ее, если вы борка очен ь м ала, то критерии, осн ован н ы е н а н орм альн ости, следуетиспользоватьтолько при н аличии уверен н ости, что перем ен н ая действительн о им еет н орм альн ое распределен ие. О дн ако н ет способа проверитьэтопредполож ен иен а м алой вы борке. П Р О Б Л Е М Ы И ЗМ Е Р Е Н И Я
И спользован ие критериев, осн ован н ы х н а предполож ен ии н орм альн ости, кром е того, огран ичен о точн остью изм ерен ий. Н априм ер, рассм отрим исследован ие, вкотором средн ий баллуспеваем ости (СБУ ) является осн овн ой перем ен н ой. М ож н о ли сказать, что средн яя успеваем ость студен та A вдва раза вы ш е, чем успеваем остьстуден та C? Я вляетсяли различием еж ду средн им баллом студен товB и A сравн им ы м с различием м еж ду студен там и D и C? И н декс СБУ является грубой м ерой, позволяю щ ей только ран ж ироватьстуден товвпорядке« х орош ий» –« плох ой» . Э та общ ая задача изм ерен ий обы чн о обсуж даетсявучебн иках по статистикевтерм ин ах т ипов изме ре ний или шка лы изме ре ния . Н аиболее общ ие статистические м етоды , такие как дисперсион н ы й ан ализ (t-крит е рий), регрессия и т.д. предполагаю т, что исх одн ы е изм ерен ия вы полн ен ы , по крайн ей м ере, вин тервальн ой ш кале, вкоторой ин тервалы м ож н о разум н ы м образом сравн иватьм еж ду собой (н априм ер, B м ин ус A равн яется D м ин ус C). Т ем н е м ен ее, как вдан н ом прим ере, такие предполож ен иячастон еестествен н ы , и дан н ы ескореепросто упорядочен ы (изм ерен ы впорядковой ш кале), чем изм ерен ы точн о. П А Р А М Е ТР И Ч Е С КИ Е И Н Е П А Р А М Е ТР И Ч Е С КИ Е М Е ТО Д Ы
Не па ра ме т риче с кие ме т оды разработан ы для достаточн о часто возн икаю щ их н а практике ситуаций, когда исследователь н ичего н е зн ает о парам етрах исследуем ой вы борки (отсю да и н азван ие м етодов - не па ра ме т риче с кие ). Говоря более специальн ы м язы ком , н епарам етрические м етоды н еосн овы ваю тся н а оцен ке парам етров(таких как средн ее или стан дартн ое отклон ен ие) при описан ии вы борочн ого распределен ия ин тересую щ ей величин ы . П оэтом у эти м етоды ин огда такж ен азы ваю тся с воб одными от па ра ме т ров или с воб одно ра с пре де ле нными. КР А ТКИ Й О Б ЗО Р Н Е П А Р А М Е ТР И Ч Е С КИ Х П Р О Ц Е Д У Р
П о сущ еству, для каж дого парам етрического критерия им еется, по крайн ей м ере, один н епарам етрический ан алог. Э ти критерии м ож н о отн ести к одн ой из следую щ их групп:
33
• критерии различиям еж ду группам и (н езависим ы евы борки); • критерии различиям еж ду группам и (зависим ы евы борки); • критерии зависим ости м еж ду перем ен н ы м и. Различия м е ж ду н е зависим ы м и гр уппам и. О бы чн о, когда им ею тся двевы борки (н априм ер, м уж чин ы и ж ен щ ин ы ), которы евы х отитесравн ить отн осительн о средн его зн ачен ия н екоторой изучаем ой перем ен н ой, вы используете t-критерий для н езависим ы х вы борок. Н епарам етрическим и альтерн ативам и этом у критерию являю тся: крит е рий се рий Ва ль да -Воль ф овица , U-крит е рий Ма нна -У ит ни и двухвыб орочный крит е рий Колмог орова Смирнова . Е сли ан ализируетсян есколько групп, то возм ож н о использован ие дисперсион н ы й ан ализ. Е го н епарам етрическим и ан алогам и являю тся: ран говы й дисперсион н ы й ан ализ Кра ске ла -У оллис а и ме диа нный тест. Различия м е ж ду зависим ы м и гр уппам и. П ри сравн ен ии двух перем ен н ы х , отн осящ иесяк одн ой и той ж евы борке(н априм ер, успех и студен товвн ачале и вкон це сем естра), то обы чн о используется t-крит е рий для за вис имых выб орок. А льтерн ативн ы м и н епарам етрическим и тестам и являю тся: крит е рий зна ков и крит е рий Вилкокс она па рных с ра вне ний. Е сли рассм атриваем ы е перем ен н ы е по природе своей категориальн ы или являю тся категоризован н ы м и (т.е. представлен ы ввиде частот попавш их вопределен н ы е категории), то подх одящ им будет крит е рий χ(хи)-ква дра т . Е сли рассм атривается болеедвух перем ен н ы х , отн осящ их ся к одн ой и той ж е вы борке, то обы чн о используется дисперсион н ы й ан ализ (ANOVA) с повторн ы м и изм ерен иям и. А льтерн ативн ы м н епарам етрическим м етодом является ра нг овый дис пе рс ионный а на лизФ ридма на или Q-крит е рий Кохре на (последн ий прим ен яется, н априм ер, если перем ен н ая изм ерен а вн ом ин альн ой ш кале). Q-критерий К ох рен а используется такж е для оцен ки изм ен ен ий частот(долей). Зависим ост и м е ж ду пе р е м е н н ы м и. Д ля того, чтобы оцен ить зависим ость(связь) м еж ду двум яперем ен н ы м и, обы чн о вы числяю ткоэффициен т корреляции. Н епарам етрическим и ан алогам и стан дартн ого коэффициен та корреляции П ирсон а являю тся статистики Спирме на R, τ(т а у) Ке нда лла и коэф ф ицие нт Га мма . Е сли две рассм атриваем ы е перем ен н ы е по природе своей категориальн ы , подх одящ им и н епарам етрическим и критериям и для тестирован ия зависим ости будут: хи-ква дра т (χ2), Ф и-коэф ф ицие нт , т очный крит е рий Ф ише ра (F). Д ополн ительн о доступен критерий зависим ости м еж ду н ескольким и перем ен н ы м и так н азы ваем ы й коэф ф ицие нт конкорда ции Ке нда лла . П оследн ий часто используется для оцен ки согласован н ости м н ен ий н езависим ы х экспертов. О П И С А ТЕ Л Ь Н Ы Е С ТА ТИ С ТИ КИ
Е сли дан н ы ен еявляю тсян орм альн о распределен н ы м и, а изм ерен ия, влучш ем случае, содерж ат ран ж ирован н ую ин форм ацию , то вы числен ие обы чн ы х описательн ы х статистик (н априм ер, средн его, стан дартн ого отклон ен ия) н е слиш ком ин форм ативн о. Н априм ер, впсих ом етрии х орош о
34
известн о, что восприн им аем ая ин тен сивн ость стим улов (н априм ер, восприн им аем ая яркость света) представляет собой логарифм ическую фун кцию реальн ой ин тен сивн ости (яркости, изм ерен н ой вобъективн ы х един ицах - люкс а х). В дан н ом прим ере обы чн ая оцен ка средн его (сум м а зн ачен ий, делен н ая н а число стим улов) н е дает верн ого представлен ия о средн ем зн ачен ии действительн ой ин тен сивн ости стим ула (в обсуж даем ом прим ерескорееследуетвы числить средн еегеом етрческое). П ри использован ии м етодовне па ра ме т риче с кой с т а т ист ики вы числяется разн ообразн ы й н абор м ер полож ен ия(средн ее, м едиан а м ода и т.д.) и рассеян ия(дисперсия, гарм он ическое средн ее, кван тильн ы й разм ах и т.д.), позволяю щ ий представитьболее« полн ую картин у» дан н ы х . Н Е П А Р А М Е ТР И Ч Е С КА Я С ТА ТИ С ТИ КА Зачем н уж н ы н епарам етрические тесты ? Н иж е перечислен ы н есколько причин , н е позволяю щ их вопределен н ы х случаях использовать тесты , осн ован н ы ен а н орм альн ом распределен ии: 1. Н е все пе р е м е н н ы е им е ю т н ор м альн ое р аспр е де ле н ие Сущ ествует м н ож ество тестов, которы е осн овы ваю тся н а предполож ен ии, что ан ализируем ы е перем ен н ы ен орм альн о распределен ы . Н о бы ваю т случаи, когда встречаю тся перем ен н ы е, распределен ие которы х н е н орм альн ое. Н априм ер, число пож аровн е является н орм альн о распределен н ой величин ой. Сущ ествует м н ож ество перем ен н ы х , которы е н е им ею т н орм альн огораспределен ия, н опредставляю тбольш оеин тересдляучен ы х . 2. М але н ьк ий р азм е р вы бор к и Е сли объем вы борки достаточн о больш ой (н априм ер, 100 н аблю ден ий), то вы м ож ете использовать тесты осн ован н ы е н а предполож ен ии н орм альн ости, даж е если вы н е уверен ы , что исследуем ая перем ен н ая н орм альн ораспределен а впопуляции. Е сли ж еразм ер вы борки н евелик, то преж де чем использовать « н орм альн ы е» тесты , н еобх одим о убедится, что перем ен н ы е распределен ы н орм альн о, поскольку в обратн ом случае результаты получен н ы е с пом ощ ью теста будут н екорректн ы м и. Н о проблем а втом , что как раз м ален ький объем вы борки и н епозволяетубедитьсяв том , чтоперем ен н аявдействительн ости им еетн орм альн оераспределен ие. 3. Н е дост ат очн о ин фор м ат ивн ая ш к алаизм е р е н ия О сн овн ы е тесты , осн ован н ы е н а предполож ен ии о н орм альн ости, требую т, чтобы ан ализируем ы перем ен н ы ебы ли изм ерен ы как м ин им ум в ин тервальн ой ш кале. Н о как бы ть вслучаях , когда перем ен н ая изм ерен а в порядковой ш кале и им еет зн ачен ия типа: « вы сокий» , « средн ий» , « н изкий» (н априм ер, при изм ерен ии уровн явладен ияин остран н ы м язы ком )? И сх одя из этих причин , вы текает потребн ость втестах , с пом ощ ью которы х м ож н о бы ло бы проан ализировать перем ен н ы е, обладаю щ ие всем и тем и н едостаткам и, что бы ли перечислен ы вы ш е. Т ерм ин « н епарам етрические» происх одит оттого, что м ы практически н е зн аем н и каких парам етровисследуем ой популяции. П ри описан ии вы борочн ого распреде-
35
лен ия, н епарам етрическиетесты н еосн овы ваю тсян а таких парам етрах как средн ееили стан дартн оеотклон ен ие. КА КО Й М Е ТО Д И С П О Л Ь ЗО В А ТЬ ?
К аж дая н епарам етрическая процедура вм одулеим еетсвои достоин ства и свои н едостатки. Н априм ер, двух вы борочн ы й крит е рий Колмог орова -Смирнова чувствителен н е только к различию вполож ен ии двух распределен ий, н априм ер, к различиям средн их , н о такж е чувствителен и к форм е распределен ия. Крит е рий Вилкокс она парн ы х сравн ен ий предполагает, что м ож н о ран ж ировать различия м еж ду сравн иваем ы м и н аблю ден иям и. Е сли это н е так, лучш е использовать крит е рий зна ков. В общ ем , если результат исследован ия является важ н ы м (н априм ер, оказы вает ли лю дям пом ощ ь очен ь дорогостоящ ее и болезн ен н ое лечен ие?), то всегда целесообразн о прим ен итьразличн ы ен епарам етрическиетесты . В озм ож н о, результаты проверки (разн ы м и тестам и) будут различн ы . В таком случае следуетпопы таться пон ять, почем у разн ы е тесты дали разн ы е результаты . С другой сторон ы , н епарам етрические тесты им ею т м ен ьш ую статистическую м ощ н ость (м ен ее чувствительн ы ), чем парам етрические критерии, и если важ н о обн аруж ить даж е слабы е отклон ен ия (н априм ер, является ли дан н ая пищ евая добавка опасн ой для лю дей), следует особен н о вн им ательн овы биратьстатистику критерия. Большие м ассивы дан н ы х и н е пар ам е т р иче ск ие м е т оды . Н епарам етрическием етоды н аиболееприем лем ы , когда объем вы борок м ал. Е сли дан н ы х м н ого (н априм ер, n>100), то н е им еет см ы сла использовать н епарам етрическиестатистики. Главн ое состоит втом , что когда вы борки стан овятся очен ь больш им и, то вы борочн ы е средн ие подчин яю тся н орм альн ом у закон у, даж е если исх одн ая перем ен н ая н еявляется н орм альн ой или изм ерен а с погреш н остью . Т аким образом , парам етрические м етоды , являю щ иеся более чувствительн ы м и (им ею т больш ую статистическую м ощ н ость), всегда подх одят для больш их вы борок. Больш ин ство критериев зн ачим ости м н огих н епарам етрических статистик, описан н ы х далее, осн овы ваю тся н а асим птотической теории (больш их вы борок), поэтом у соответствую щ иетесты часто н евы полн яю тся, если разм ер вы борки стан овитсяслиш ком м алы м . П одгон к ар аспр е де ле н ия. В н екоторы х исследовательских проектах м ож н о сформ улировать гипотезы отн осительн о распределен ия рассм атриваем ой перем ен н ой. Н априм ер, перем ен н ы е, зн ачен ия которы х определяю тся бескон ечн ы м числом н езависим ы х факторов, распределен ы по н орм альн ом у закон у: м ож н о предполож ить, что рост ин дивидуум а является результатом воздействия м н огих н езависим ы х факторов, таких как различн ы еген етическиепредрасполож ен н ости, болезн и, перен есен н ы евран н ем возрасте и т.д. К ак следствие, рост им еет тен ден цию к н орм альн ом у распределен ию вн аселен ии. С другой сторон ы , если н аблю даем ы е зн ачен ия перем ен н ой являю тся результатом очен ь редких собы тий, то перем ен н ая будет им еть распределен ие П уа с с она (которое ин огда н азы вается рас-
36
пределен ием редких собы тий). Н априм ер, н есчастн ы еслучаи н а производстве м ож н о рассм атривать как результат пересечен ия ряда н еудачн ы х собы тий (н а ж итейском язы ке стечен ием м аловероятн ы х обстоятельств), поэтом у их частота приближ ен н оописы ваетсяраспределен ием П уассон а. КР И ТЕ Р И Й С О О ТВ Е ТС ТВ И Я П И Р С О Н А (Х И -КВ А Д Р А Т)
К ритерий соответствия(согласия) х и-квадрат(χ2) предлож ен К . П ирсон ом в1900 г. дляпроверки предполож ен ияо н аличии (отсутствии) связи м еж ду явлен иям и. Х и-квадрат–критерий, устан авливаю щ ий соответствие м еж ду теоретическим и и эм пирическим и частотам и распределен ия. Е го вы числен иепроводитсяпоформ уле: χ2 = ∑
( x − y) 2 , y
гдех –реальн ы й ряд; у –теоретически ож идаем ы й ряд. Т аким образом , м атем атически х и-квадрат представляет сум м у частн ы х от делен ия квадратовотклон ен ий фактически получен н ы х дан н ы х от « ож идаем ы х » н а число « ож идаем ы х » . Зн ачен ия х и-квадрат м огут возрастатьот0 до∞. Е сли х = у, т. е. « ож идаем ы е» числа соответствую тфактическим , то χ2 = 0. Т акое полож ен ие подтверж дает правильн ость н улевой гипотезы и свидетельствует об отсутствии различий м еж ду сравн иваем ы м и явлен иям и. П ри исчислен ии критериях и-квадратиспользую тсятолько абсолю тн ы епоказатели, причем группа долж н а состоять н ем ен еечем из 5 н аблю ден ий. В противн ом случаен адлеж итизм ен итьгруппировку исследуем ого м атериала, ум ен ьш ивчисло групп и получивбольш ие числа первон ачальн ы х н аблю ден ий. П р им е р . И м ею тся ли различия вх арактере эпидем ических процессовпри дизен терии и прочих остры х киш ечн ы х ин фекциях (О К И ), если пом есячн оечислобольн ы х бы ло, как представлен овтаблице7. 1. Сум м ируетсяпом есячн оечисло больн ы х обеим и форм ам и заболеван ий (графа 4). 2. О пределяетсяудельн ы й веспом есячн огочисла больн ы х (графа 5). 3. В таблицу 8 зан осятсядан н ы ереальн ого дин ам ического ряда, т. е. зарегистрирован н оечислобольн ы х (графа 3). 4. Рассчиты вается « ож идаем ое» число больн ы х (теоретический дин ам ический ряд) н а осн ован ии дан н ы х таблицы . Д ляян варя: 109 больн ы х дизен терией (всего) составляю т100 %, х больн ы х вян варе − 11,2 %. х = 12,2 Д ляфевраля: 109 больн ы х дизен терией (всего) составляю т100 %, х больн ы х вфеврале − 3,8% х = 4,1
37
Расчетдан н ы х дляпрочих остры х киш ечн ы х ин фекций вян варе: 940 больн ы х О К И (всего) составляю т 100 %, х больн ы х О К И вян варе − 11,2% х = 105,3 Т аблица 7 Ч ислобольн ы х М есяцы В сего П роцен т Д изен терия П рочиеО К И 1
Я н варь Ф евраль М арт А прель М ай И ю нь И ю ль А вгуст Сен тябрь О ктябрь Н оябрь Д екабрь И того:
2
3
4
5
8 10 7 10 8 8 12 10 8 15 7 6 109
110 30 90 40 20 20 120 100 120 100 140 50 940
118 40 97 50 28 28 132 110 128 115 147 56 1049
11,2 3,8 9,2 4,8 2,7 2,7 12,7 10,5 12,2 10,9 14,0 5,3 100,0
П олучен н ы едан н ы езан осятсявграфу 4 таблицы 8. 5. О пределяется разн ость (x–y) м еж ду реальн ы м и теоретически ож идаем ы м числом больн ы х (графа 5). П оскольку получен н ы еотклон ен ия впоследую щ ем возводятсявквадрат, зн аки разн ости н еучиты ваю тся. 6. Разн ость(х–у) возводитсявквадрат(графа 6). 7. К вадрат отклон ен ий теоретических дан н ы х (х–у)2 делится н а « ож идаем ы е» числа (у). П олучен н ы е дан н ы е сум м ирую тся, и эта сум м а представляетсобой величин у χ2 (графа 7). В н аш ем прим ереχ2 = 44,9. Ч ем больш еразн остьм еж ду х и у, тем больш еи зн ачен иеχ2. О цен ка достоверн ости величин ы χ2 проводится по прило ж ению 5 с учетом числа степен ей свободы (n'), представляю щ их собой число клеток таблицы , дан н ы е вкоторы х м огут бы ть свободн о изм ен ен ы без сущ ествен н ы х изм ен ен ий кон ечн ы х результатов: n = (s-1) ⋅ (r-1), гдеs –числограф втаблице7; r –числострок втаблице7. В н аш ем прим ере получен н ая величин а χ2 вы ш е критического уровн я19,68 при Р<0,05 и n = 11 в прило ж ении5. Следовательн о, естьосн ован ияотвергн утьн улевую гипотезу и говоритьосущ ествен н ости различий, а стало бы ть, и н езависим ости х арактера эпидем ического процесса при дизен терии и прочих остры х киш ечн ы х ин фекциях .
38
2
I II III IV V VI VII VIII IX X XI XII I II III IV V VI VII VIII IX X XI XII
8 10 7 10 8 8 12 10 8 15 7 6 110 30 90 40 20 20 120 100 120 100 140 50
12,2 4,1 10,0 5,2 2,9 2,9 13,8 11,4 13,3 11,9 15,3 5,8 105,3 35,7 86,4 45,1 25,4 25,4 119,4 98,7 114,7 102,5 131,6 49,8
П рочиеостры екиш ечн ы е ин фекции (О К И )
(x-y)2
1
(x-y)
М есяцы
« О ж идаем ое» число больн ы х (теоретический дин ам ический ряд) (y) 4
Д изен терия
Н озологические форм ы
Т аблица 8 Зарегистрирован о больн ы х (реальн ы й дин ам ический ряд) (x) 3
( x − y)2 y
5
6
7
4,2 5,9 3,0 4,8 5,1 5,1 1,8 1,4 5,3 3,1 8,3 0,2 4,7 5,7 3,6 5,1 5,4 5,4 0,6 1,3 5,3 2,5 8,4 0,2
17,6 34,8 9,0 23,0 26,0 26,0 3,2 1,9 28,1 9,6 68,9 0,04 22,1 32,5 12,9 26,0 29,2 29,2 0,4 1,7 28,1 6,3 70,6 0,04
1,4 8,5 0,9 4,4 8,9 8,9 0,2 0,2 2,1 0,8 4,5 0 0,2 0,9 0,1 0,6 1,1 1,1 0 0 0,3 0 0,6 0 2 χ =44,9
К ритерий х и-квадрат м ож н о прим ен ять и для оцен ки влиян ия различн ы х факторовн а те или ин ы е процессы и явлен ия. В этих случаях исх одн ой н улевой гипотезой, которая долж н а бы ть или отвергн ута после определен ия величин ы χ2, или, н аоборот, сох ран ен а, является отсутствие влиян иятех или ин ы х факторов. КР И ТЕ Р И Й В И Л КО КС О Н А Д Л Я С В Я ЗА Н Н Ы Х С О В О КУ П Н О С ТЕ Й
Крит е рий Вилкокс она для с вя за нных с овокупнос т е й – это н епарам етрический м етод, которы й используется для оцен ки зн ачим ости различий двух связан н ы х совокупн остей количествен н ы х призн аков. П рактический расчеткритериявклю чаетследую щ иеэтапы :
39
1. Н айти разн ости парн ы х вариан т. 2. О пределить ран ги получен н ы х разн остей (без учета зн аков, пары н аблю ден ий, разн ости которы х оказались равн ы м и н улю , из дальн ейш ей оцен ки исклю чаю тся). 3.О пределитьсум м у ран говполучен н ы х разн остей, им ею щ их один аковы еалгебраическиезн аки, и взятьм ен ьш ую из н их (Т ). 4.У стан овитьдостоверн остьразличий. П ри количестве н аблю ден ий м ен ьш е 26 сравн иваю т н айден н ую сум м у с критическим и зн ачен иям и из таблицы , впротивн ом случае рассчиты ваю тпоспециальн ой форм улеслучайн ую перем ен н ую (u). К ритерий В илкоксон а является болеем ощ н ы м , чем критерий зн аков и м аксим ум -критерий. Е го следует использовать при н аличии у сравн иваем ы х совокупн остей количествен н ы х призн аков зн ачительн ого числа разн остей с противополож ен н ы м и зн акам и. КР И ТЕ Р И Й ЗН А КО В
Кр ит е р ий зн ак ов - это н епарам етрический критерий, которы й осн ован н а оцен керазн ости попарн о сопряж ен н ы х вариан т(н априм ер, до и послелечен ия). У читы ваетсян евеличин а, а н аправлен н остьсдвигов. П рим ен ен иекритерия зн аковн езависитотх арактера распределен иядан н ы х . И зм ен ен ия оцен иваю т в альтерн ативн ой форм е (увеличен ие-ум ен ьш ен ие и т.п., что обозн ачаю т зн акам и "+" и "-", откуда и произош ло н азван ие критерия). Случаи, когда парн ы е н аблю ден ия н е им ею т разн ицы , врасчет н е прин им аю тся. Следует стрем иться, чтобы количество н улевы х разн остей бы ло м ин им альн ы м . Д ля этого н еобх одим о повы ш ать точн ость изм ерен ия показателей, чтообеспечиваетн епреры вн остьвы борочн ы х дан н ы х . П рактическое прим ен ен ие критерия зн аков вклю чает следую щ ие этапы : 1) О пределяется н аправлен н ость изм ен ен ий всравн иваем ы х н аблю ден иях . 2) П одсчиты вается общ ее число парн ы х н аблю ден ий, им ею щ их различия(n). 3) П одсчиты вается м ен ьш ее число одн озн ачн ы х результатовсравн ен ия, обозн ачаем ы х как Z. 4) Z сравн ивается по специальн ой таблице с критическим и зн ачен иям и длядан н огоn. М ощ н ость критерия зн аков огран ичен а и составляет прим ерн о 2/3 м ощ н ости критерияСтью ден та. К ритерий зн аковприлож им как к совокупн остям н епреры вн ы х призн аков, так и для оцен ки различия полуколичествен н ы х призн аков(баллы и т.п.) при достаточн ом числеих градаций. КР И ТЕ Р И Й М А Н Н А – У И ТН И
Област ь пр им е н е н ия критерияМ ан н а-У итн и – ан ализ двух н езависим ы х вы борок. Разм еры этих вы борок м огутразличаться.
40
Н азн аче н ие к р ит е р ия – проверка гипотезы о статистической одн ородн ости двух вы борок. И н огда эту гипотезу н азы ваю т гипотезой об отсутствии эффекта обработки (им ея ввиду, что одн а из вы борок содерж ит х арактеристики объектов, подвергш их ся н екоем у воздействию а другая – х арактеристики кон трольн ы х объектов). Дан н ы е . Рассм атриваю тся две вы борки объем овm и n. Закон распределен ияпервой вы борки F, а второй –G. Допущ е н ия. 1. В ы борки долж н ы бы ть н езависим ы . 2. Закон ы распределен ий F и G н епреры вн ы . Г ипот е за. У тверж ден ие об одн ородн ости вы борок ввведен н ы х вы ш еобозн ачен иях м ож н озаписатьввидеH : F = G. А льт е р н ат ивы . В качестве альтерн атив к Н м огут вы ступать все возм ож н ости F ≠ G. О дн ако критерий М ан н а-У итн и способен обн аруж ивать отн ю дь н е все возм ож н ы е отступлен ия от Н : F = G. Э тот критерий предн азн ачен , в первую очередь, для проверки Н против альтерн ативы F ≤ G (правосторон н яя альтерн атива) или альтерн ативы F ≥ G (левосторон н яя альтерн атива). М ож н о рассм атривать и объедин ен ие обеих возм ож н остей (двусторон н яяальтерн атива). М е т од. К ритерий М ан н а-У итн и повторяет осн овн ы е идеи критерия зн акови вопределен н ом см ы сле является его продолж ен ием . О н осн ован н а попарн ом сравн ен ии результатовиз первой и второй вы борок. ТЕ С Т КО Л М О Г О Р О В А – С М И Р Н О В А
Э тот тест реш аетдве задачи. В случае, если ан ализируется одн а вы борка, то этот тест определяет к какой плотн ости вероятн ости отн осится дан н ая вы борка. Т о есть фун кция плотн ости, получен н ая для дан н ой вы борки, сравн ивается с одн ой или н ескольким и теоретическим и фун кциям и плотн ости, которы е м огут бы ть н орм альн ы м и, и (или) экспон ен циальн ы м и, и (или) К ош и, и (или) равн ом ерн ы м и. В случае, когда ан ализируется две вы борки, то фун кция плотн ости одн ой вы борки сравн ивается с фун кцией плотн ости другой вы борки. И з указан н ого вы ш е сравн ен ия вы водится статистика. В случае одн ой вы борки эта статистика оцен ивает вероятн ость того, что статистика будет такой ж е, как получен н ая величин а, или больш е н ее, если верн а гипотеза, что действительн ая (вы борочн ая) и теоретическая фун кции распределен ия совпадаю т. Д ругим и словам и, если вероятн ость получен а, н априм ер, равн ой 0,40, то отверж ен ие гипотезы о равен стве фун кций распределен ия будет ош ибочн ы м в 40 случаях из 100. П ри двух вы борках проверяетсягипотеза оравен стведвух действительн ы х (вы борочн ы х ) фун кций распределен ий. КР И ТЕ Р И Й КО Л М О Г О Р О В А – С М И Р Н О В А Д Л Я О Д Н О Й В Ы Б О Р КИ
К ритерий К олм огорова-См ирн ова являетсядругим н епарам етрическим критерием . Е гопреим ущ ество перед критерием χ2 связан о с тем , что он прин им ает во вн им ан ие порядок н аблю ден ий. К ритерий предн азн ачен для проверки согласияэм пирической и теоретической фун кций распределен ий.
41
К ритерий К олм огорова-См ирн ова осн овы вается н а статистической м одели, котораяпредполагаетн епреры вн остьраспределен ия, так что вероятн ость совпаден ия вы борочн ы х зн ачен ий равн а н улю . О дн ако н а практике критерий часто прим ен яется к сгруппирован н ы м дан н ы м и дан н ы м вы борок из дискретн ы х распределен ий. В обоих этих случаях учиты вается возм ож н ость появлен ия равн ы х зн ачен ий н аблю ден ий. В дан н ом случае уровен ь зн ачим ости критерия н иж е н ом ин альн ого, и вероятн ость ош ибки второгорода возрастает. К ак критерий χ2, так и критерий К олм огорова-См ирн ова предполагаю т, что распределен ие, фигурирую щ еевн улевой гипотезе, долж н о бы ть полн остью определен о заран ее (н априм ер, он о м ож ет бы ть н орм альн ы м с н улевы м средн им и един ичн ой дисперсией). П ри работе с критерием согласия χ2 н еобх одим о заран ее определить тип распределен ия, а парам етры оцен иваю тся по вы борочн ы м дан н ы м . К ритерий χ2 легко м одифицируется при пом ощ и ум ен ьш ен ия числа степен ей свободы , н о н еизвестн о, какие изм ен ен ия долж н ы бы ть вн есен ы впроцедуру прим ен ен ия критерия К олм огорова-См ирн ова. Н есм отря н а это он ин огда прим ен яется вкачестве критерия при проверке гипотез о закон е распределен ия. Следует учиты вать, что в этом случае истин н ы й уровен ь зн ачим ости будет н есколько н иж ен ом ин альн ого и возрастетвероятн остьош ибок второгорода. П овсей видим ости, этотэффектн ебудетвелик, если число оцен иваем ы х парам етровм алопосравн ен ию собъем ом вы борки. Дан н ы е : вы борка x1, x2, x3, … , xn из n н езависим ы х н аблю ден ий, упорядочен н ы х так, чтоx1< x2< x3< … < xn. Ст ат ист иче ск ая м оде ль: н аблю ден ия н езависим ы и берутся из ген еральн ой совокупн ости, распределен ие которой предполагается н епреры вн ы м . Г ипот е зы : н улеваягипотеза –фун кцияраспределен ияравн а F(x). Вы числе н ие к р ит е р иальн ой ст ат ист ик и: 1. В ы числяю тся кум улятивн ы е разн ости: D1=1-nF(x1), D2=1-nF(x2) и т.д. 2. Н ах одим |Di|max , н аибольш ееабсолю тн оезн ачен иекум улятивн ы х разн остей. 3. В ы числяем зн ачен иекритерияD=(|Di|max)/n П р им е р . Д ан ы 20 н аблю ден ий (табл.9) из н еизвестн ой ген еральн ой совокупн ости. Т аблица 9 0,33 -0,52 -2,41 -1,93 0,46 -0,44 -0,97 -0,38 0,48 1,29 -1,82 -1,23 -0,21 2,66 -1,22 -0,41 -0,95 1,47 -0,83 -0,43 Н еобх одим о проверитьн улевую гипотезу, предполагаю щ ую , что это н орм альн ое распределен ие с н улевы м средн им зн ачен ием и един ичн ой
42
дисперсией. Д ля этого н адо первон ачальн о упорядочить н аблю ден ия по возрастаю щ ей, а затем –вы числитьн аблю даем ы еи ож идаем ы езн ачен ия, которы е м ен ьш екаж дого н аблю ден ияили равн ы ем у. Н еобх одим о такж евы числить абсолю тн оезн ачен иекум улятивн ой разн ицы вовсех н аблю ден иях . П р им е р . Зафиксирован н ое число н аблю ден ий, которы е н е больш е 0,97 равн о 6. О ж идаем ое зн ачен ие равн о: 20F (-0,97) = 3,32. А бсолю тн ое зн ачен иекум улятивн ой разн ости при x=-0,97 равн о6-3,32=2,68. П о дан н ы м составлен н ой таблицы 10 н ах одим м аксим альн ое зн ачен ие|Di| –5,96. Зн ачен иекритериальн ой статистики равн о: 5,96 D= = 0,298 20 П ри пом ощ и таблиц, содерж ащ их сведен ия о табличн ы х зн ачен иях распределен ия, известн о, что критическое зн ачен ие p=0,05 равн о 0,294. Т аким образом , н еобх одим о отклон ить н улевую гипотезу о том , что дан н ое распределен ие является н орм альн ы м с н улевы м средн им и един ичн ой дисперсией. Т аблица 10 Н аблю ден ие Ч ислон аблю ден ий, м ен ьш их или равн ы х xi Разн ость xi |Di| Н аблю даем ое О ж идаем ое -2,41 1 0,16 0,84 -1,93 2 0,54 1,46 -1,82 3 0,69 2,31 -1,23 4 2,19 1,81 -1,22 5 2,22 2,78 -0,97 6 3,32 2,68 -0,95 7 3,42 3,58 -0,83 8 4,07 3,93 -0,52 9 6,03 2,97 -0,44 10 6,60 3,40 -0,43 11 6,67 4,33 -0,41 12 6,82 5,18 -0,38 13 7,04 5,96 -0,21 14 8,34 5,66 0,33 15 12,59 2,41 0,46 16 13,54 2,46 0,48 17 13,69 3,31 1,29 18 18,03 3,03 1,47 19 18,58 0,42 2,66 20 19,92 0,08
43
П Р О В Е Р КА С ТА ТИ С ТИ Ч Е С КИ Х Г И П О ТЕ З В П А КЕ ТЕ STADIA С И С П О Л Ь ЗО В А Н И Е М М Е ТО Д О В Н Е П А Р А М Е ТР И Ч Е С КО Й С ТА ТИ С ТИ КИ
В качестве прим ера используем дан н ы е о содерж ан ии х олестерин а (м М оль/л) в сы воротке крови здоровы х м уж чин различн ы х возрастн ы х групп: 1 группа – лица до 19 лет, вторая группа – лица старш е 30 лет (табл.11). Т аблица 11 Г ру ппа 1 5,50 5,53 5,51 5,46 5,53 5,86 5,73 5,55 5,49 5,48 5,44 5,49 5,71 4,88 5,74 5,44 5,48 5,41 5,77 5,79 5,53 Г ру ппа 2 5,84 6,20 5,93 5,99 5,97 6,31 6,22 6,24 6,33 6,11 6,12 6,18 6,05 5,88 5,97 5,94 6,13 6,21 6,18 6,22 6,24 П риводим ы й н иж ерисун ок 9 иллю стрирует введен н ы е дан н ы евокн ередактора дан н ы х пакета STADIA. Ф а йл: Var/Cases Varname 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
1/21 x1 5.5 5.53 5.51 5.46 5.55 5.86 5.75 5.55 5.49 5.48 5.44 5.49 5.71 4.88 5.74 5.44 5.48 5.41
2/21 x2 5.84 6.2 5.93 5.99 5.97 6.31 6.77 6.24 6.39 6.11 6.17 6.18 6.05 5.88 5.97 5.94 6.13 6.21
П е р е м е н н ы х =2 3/0 x3
4/0 x4
5/0 x5
И зм е р е н ий=42 6/0 x6
7/0 x7
Б Л О К Р Е Д А КТО Р А Д А ННЫ Х F1 П о м о щь F2 П е ч Э кр F3 Ч т е ние F4 Запись F5 А р х ив F6 Рисуно к F7 Оч ист F8 П р е о бр F9 Ст ат ис F0 Вы х о д В во дите в м а тр ицу числа + Enter (р а бо та ю т та кже : Enter/ Ins/ Del/ Tab и F-клю чи
Рис.9. В веден н ы едан н ы епосодерж ан ию х олестерин а всы вороткекрови у двух групп м уж чин А н алогичн о ан ализу вы борки с использован ием м етодовописательн ой статистики для вы х ода в м ен ю осн овн ы х м етодов ан ализа н аж м ем клавиш у F9 и вы берем пун кт « 5 = х и-квадрат» . П ри вы боре пун кта « 0 эм пирич. (одн ородн ость)» н а экран епоявляю тсярезультаты ан ализа (рис.10), свидетельствую щ ие об отсутствии различий враспределен ии вы борочн ы х величин .
44
П ри вы боре пун кта « 1 = теоретич. (согласия)» производится ан ализ согласия вы борочн ого и предполагаем ого статистического распределен ия. Результаты ан ализа приводятсян а рисун ке11. Ф а йл: КР И ТЕ Р И Й ХИ -КВ А Д Р А Т. Хи-ква др а т=6.739 Е -2
П е р е м е н н ы х =2 П ерем ен н ы е: х 1 х 2 Зн а чим о сть =1
И зм е р е н ий=42
сте п.сво б=20
Гипо те за 0: Не т р а зличий м е жду двум я р а спр е де ле н ия м и СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл На жм и те Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Esc В ы х о д с пр е р ы ва н ие м
Рис.10. Результаты ан ализа различий враспределен ии вы борочн ы х величин при вы борепун кта « 0 эм пирич. (одн ородн ость)» Ф а йл: КР И ТЕ Р И Й ХИ -КВ А Д Р А Т. Хи-ква др а т=1.227
П е р е м е н н ы х =2
И зм е р е н ий=42 П ерем ен ны е: х 1 х2
Зн а чим о сть =0.9999
сте п.сво б=20
Гипо те за 0: Не т р а зличий м е жду двум я р а спр е де ле н ия м и СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм и те Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Рис.11. Результаты ан ализа различий враспределен ии вы борочн ы х величин при вы борепун кта « 1 = теоретич. (согласия)» Д алее проан ализируем используем ы е дан н ы е с прим ен ен ием критерияВ илкоксон а. Д ля этого вы берем пун кт « 6 = сдвига (полож ен ия)» раздела н епарам етрических тестов. Результаты ан ализа приведен ы н а рисун ке12. Ф а йл:
П е р е м е н н ы х =2
КР И ТЕ Р И Й СД В И ГА (П О Л О ЖЕ НИ Я) В илко ксо н =232 Z=5.522
Зн а чим о сть =0,
И зм е р е н ий=42
П ерем ен н ы е: х 1 х 2 сте п.сво б=21, 21
Гипо те за 1: Е сть р а зличия м е жду м е диа н а м и вы бо р о к СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм ите Enter=пр о до лжить >>
Рис.12. Результаты ан ализа сприм ен ен ием критерияВ илкоксон а
45
П одан н ы м ан ализа сприм ен ен ием критерияВ илкоксон а м ы долж н ы отвергн утьгипотезу оравен ствем едиан вы борок. Д ля ан ализа дан н ы х прим ера с пом ощ ью критерия К олм огороваСм ирн ова для двух вы борок н еобх одим о вглавн ом м ен ю м етодован ализа избрать пун кт « 8 = произвольн ы х альтерн атив» . Н а рисун ке13 приведен ы результаты прим ен ен иядан н огокритерияк ан ализируем ы м вы боркам . Ф а йл:
П е р е м е н н ы х =2
КР И ТЕ Р И Й КО Л М О ГО Р О В А -СМ И Р НО В А Ко лм о го р о в-См ир н о в=0.9524,
И зм е р е н ий=42 П ер ем ен н ы е: х 1 х 2
Зн а чим о сть =1.068Е -8,
сте п.сво б=21, 21
Гипо те за 1: Е сть ин те гр а ль н ы е р а зличия м е жду вы бо р ка м и СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н и е м На жм ите Enter=пр о до лжить или F2=пе ча ть н а экр а н >>
Рис.13. Результаты ан ализа спом ощ ью критерияК олм огорова-См ирн ова Результаты ан ализа свидетельствую т о н аличии ин тегральн ы х различий м еж ду двум яан ализируем ы м и вы боркам и. П рим ен ен иен епарам етрических тестовдля парн ы х вы борок –пун кт м ен ю « 9 = для парн ы х вы борок» позволяетпроан ализировать вы борочн ы е зн ачен иядлявы борок, получен н ы х при парн ом вы борочн ом исследован ии с использован ием как критерия В илкоксон а, так и критерия зн аков. Результаты ан ализа приведен ы н а рисун ке14. Ф а йл: П А Р НЫ Е КР И ТЕ Р И И СД В И ГА
П е р е м е н н ы х =2
И зм е р е н ий=42
П ерем ен н ы е: х 1 х 2
В илко ксо н =0 Z=-4.015, Зн а чим о сть =0, сте п.сво б=21 Зн а ко в=0 Z=-4.583, Зн а чим о сть =0, сте п.сво б=21
Гипо те за 1: Е сть р а зличия м е жду м е диа н а м и вы бо р о к СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть /в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм ите Enter=пр о до лжить или F2=пе ча ть н а экр а н
Рис.14. Результаты ан ализа при парн ом вы борочн ом исследован ии сиспользован ием критерияВ илкоксон а и критериязн аков. Д ан н ы е критерии такж е подтверж даю т н аличие различий м еж ду м едиан ам и вы борок. В заклю чен ие дан н ого раздела н еобх одим о повторить приводивш еесяран еепредупреж ден иео прим ен ен ии к одн им дан н ы м н ескольких м ето-
46
дован ализа. Е сли к одн им и тем ж е дан н ы м прим ен яю т два различн ы х критерия для проверки одн ой и той ж е н улевой гипотезы (или двух сх одн ы х гипотез) и вкаж дом случаеприн им аетсяуровен ьзн ачим ости, равн ы й, н априм ер, 5%, то вероятн ость того, что х отя бы по одн ом у из критериев н улевая гипотеза будет ош ибочн о отклон ен а, превосх одит 5 %. Следует воспользоватьсялиш ьодн им критерием , ж елательн оболеем ощ н ы м . КО Р Р Е Л Я Ц И О Н Н Ы Й А Н А Л И З М еж ду явлен иям и сущ ествую т две категории причин н о-следствен н ы х связей: ф ункциона ль ные и корре ля ционные . Ф ункциона ль на я свя зь им еетотн ош ен иек каж дом у отдельн ом у н аблю ден ию , является обязательн ой и зависит от физических и х им ических закон ов. Н априм ер, при повы ш ен ии давлен ия н асы щ ен н ого пара увеличивается еготем пература; н агреван ием еталловприводитк их расш ирен ию и т. п. Связь м еж ду явлен иям и, отм ечаю щ аяся н е вкаж дом отдельн ом случае, а при м ассовом сопоставлен ии рассм атриваем ы х призн аков, н азы вается корре ля ционной. В этом случаекакой-либо призн ак (уровен ь заболеваем ости остры м и киш ечн ы м и ин фекциям и) м ож ет бы ть связан главн ы м образом (н о н е обязательн о) с изм ен ен иям и другого призн ака (качество реализуем ы х м олочн ы х продуктов), х отя н а ин тен сивн ость течен ия эпидем ического процесса при остры х киш ечн ы х ин фекциях влияю т и другие факторы : м икробн ая обсем ен ен н ость потребляем ой н аселен ием воды , кулин арн ы х изделий, м играцион н ы епроцессы и др. К орреляцион н аясвязьпроявляется в средн ем для всей совокупн ости н аблю ден ий, а в отн ош ен ии един ичн ы х случаевон а н еполн а и н еточн а. К орреляцион н аязависим остьм еж ду явлен ием м ож етбы тьпрям ой, когда с повы ш ен ием одн ого показателя отм ечается рост другого, и обратн ой, когда с увеличен ием одн ого призн ака другой ум ен ьш ается (н априм ер, чем больш ен аселен ияох вачен опрививкам и, тем н иж еуровен ьзаболеваем ости). П реж де чем изм ерять величин у коэффициен та корреляции, н еобх одим о реш ить вопрос о возм ож н ости причин н о-следствен н ой связи м еж ду изучаем ы м и явлен иям и. П араллельн ое изм ен ен ие статистических показателей сам о по себе ещ е н е говорит о н аличии связи, так как м ож ет бы ть обусловлен о случайн ы м совпаден ием м н огих обстоятельств, н е связан н ы х другсдругом . Ц ифровы е дан н ы е, подвергаю щ иеся корреляцион н ом у ан ализу, долж н ы бы ть сгруппирован ы с учетом особен н остей изучаем ы х явлен ий. В противн ом случае зн ачен ие получен н ого коэффициен та будет заведом о ош ибочн ы м . Э то особен н о касается области ин фекцион н ой патологии, когда от м ом ен та ин фицирован ия, т. е. действия причин ы , до клин ического проявлен ия процесса, т. е. следствия, прох одит ин кубацион н ы й период, длительн ость которого различн а при отдельн ы х заболеван иях . П родолж ительн ость ин кубацион н ого периода и является оптим альн ы м сроком врем ен н ой группировки цифровы х дан н ы х . П ри н еин фекцион н ой патологии в
47
осн ову группировки кладут другие врем ен н ы е призн аки, ин тересую щ ие исследователя. Н априм ер, при изучен ии частоты развития ин фаркта м иокарда у лиц одн ого и того ж е возраста взависим ости от длительн ости курен иям атериалм ож н о группироватьс учетом ин тересую щ ей давн ости курен ия: 1, 2, 3 и т. д. лет. Ме т од ра нг овой корре ля ции н аиболее простой, требую щ ий н езн ачительн ы х затрат врем ен и н а проведен ие вы числен ий. В то ж е врем я он м ен ееточен , даетприблизительн ое представлен ие о х арактереи тесн отесвязи м еж ду явлен иям и. П р им ер . О пределитьвозм ож н ую связьм еж ду уровн ем заболеваем ости остры м и киш ечн ы м и ин фекциям и (О К И ) и качеством реализуем ы х кулин арн ы х изделий, определяем огопом икробн ой обсем ен ен н ости (табл.12). Т аблица 12 П роцен тн еП орядковы ен ом ера Заболева стан дартн ы х (ран ги) Н еделя ем ость пробкулин аргода О КИ н ы х изделий по % н естан м икробн ой об- Заболедартн ой сем ен ен н ости ваем ости продукции 1 2 3 4 5
1 2 3 4 5 6 7 8 9 10 11 12
12,8 11,6 15,4 17,8 12,3 12,5 14,0 20,3 15,6 14,8 11,6 9,3
8,3 5,1 18,0 14,0 11,6 14,2 24,4 25,4 11,6 12,9 14,6 10,0
6 2 9 11 4 5 7 12 10 8 3 1
2 1 10 7 4,5 8 11 12 4,5 6 9 3
d
d2
d 2 сн арастаю щ им итогом
6
7
8
4 16 1 1 1 1 4 16 0,5 0,25 3 9 4 16 0 0 5,5 30,25 2 4 6 36 2 4
16 17 18 34 34,25 43,25 59,25 59,25 89,50 93,50 139,50 133,50
1. О пределяю тся порядковы е н ом ера (ран ги) показателей заболеваем ости (графа 4) и процен та н естан дартн ой продукции (графа 5). Ран г 1 присваиваетсян аим ен ьш им показателям . П ри н аличии н ескольких , равн ы х по величин е показателей (11,6 вграфе 3) их порядковы е н ом ера (ран ги) сум м ирую тся (4+5=9), а сум м а делится н а число один аковы х показателей (вн аш ем прим ере н а 2). О ба показателя им ею т один и тот ж е ран г(4,5), а следую щ ем у повеличин епоказателю (12,9) присваивается6-й ран г. 2. В ы числяетсяразн ость(d) м еж ду ран гам и вотдельн ы ен едели года. Результаты зан осятсявграфу 6. 3. Разн ость м еж ду ран гам и возводится вквадрат, и получен н ы е дан н ы есум м ирую тся(графа 7). В н аш ем прим ере ∑d2 = 133,5.
48
4. П олучен н ы езн ачен ияподставляю тсявформ улу:
6 ⋅ ∑d2 ρ = 1− , n ( n 2 − 1) гдеρ –коэффициен тран говой корреляции; n –число пар коррелируем ы х рядов(вн аш ем прим ере12); ∑d 2 –сум м а разн ости м еж ду ран гам и двух коррелируем ы х рядов; 6 –постоян н ы й коэффициен т. Д лян аш егоприм ера: ρ=0,53. П реж де чем делать заклю чен ие о н аличии корреляцион н ой связи, н еобх одим о убедитьсяврепрезен тативн ости коэффициен та, так как он получен н а осн ове вы борочн ого исследован ия. П редставительн ость коэффициен та ран говой корреляции определяется путем сопоставлен ия его величин ы с критическим и зн ачен иям и, приведен н ы м и вприлож ен ии 3. Е сли получен н ая величин а при задан н ом числе исследован ий окаж ется больш е критического уровн я, будут осн ован ия говорить о н аличии корреляцион н ой связи. В н аш ем прим ерекоэффициен травен 0,53, а критическая величин а при Р<0,05 составляет0,58 дляn=12. Следовательн о, получен н оезн ачен ие коэффициен та н иж е того, при котором м ож н о бы ло бы говорить о н аличии корреляцион н ой связи. М етод лин ейн ой корреляции используется при н аличии прям олин ейн ой связи м еж ду взаим освязан н ы м и призн акам и. П оследовательн ость расчета коэффициен та лин ейн ой корреляции (rх у) рассм отрим н а преды дущ ем прим ере. Д ля этого зан осим дан н ы е граф 1, 2, 3 таблицы 12 в таблицу 13. Т аблица 13 П роцен тн еН еде- Заболевае- стан дартн ы х м ость пробкулилягон да О К И , (x) арн ы х изделий (y)
О тклон ен иеот средн ей арифм етической
dx
dy
К вадратотклон ен ияотсредн ей арифм етической
d x2
d x2 ⋅ d y2
d y2
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9 10 11 12
12,8 11,6 15,4 17,8 12,3 12,5 14,0 20,3 15,6 14,8 11,6 9,3
8,3 5,1 18,0 14,0 11,6 14,2 24,4 25,4 11,6 12,9 14,6 10,0
-1,2 -2,4 1,4 3,8 -1,7 -1,5 0 6,3 1,6 0,8 -2,4 -4,7
-5,9 -9,1 3,8 -0,2 -2,6 0 10,2 11,2 -2,6 -1,3 0,4 -4,2
1,44 5,76 1,96 14,44 2,89 2,25 0 39,69 2,56 0,64 5,76 22,09
34,81 82,81 14,4 0,04 6,76 0 104,04 125,44 6,76 1,69 0,16 17,64
7,08 21,84 5,32 -0,76 4,42 0 0 70,56 -4,16 -1,04 -0,96 19,74
49
1. Сум м ирую тся дан н ы е ряда х (графа 2), и сум м а делится н а число н аблю ден ий. 2. Сум м ирую тся дан н ы е ряда у (графа 3), и сум м а делится н а число н аблю ден ий. 3. О пределяется разн ость (d) каж дого показателя ряда х от средн ей арифм етической ( x =14,0) и ряда у от своей средн ей арифм етической ( y =14,2). П олучен н ы езн ачен иязан осятсясоответствен н овграфы 4 и 5. Результаты будутим етькак полож ительн ы е, так и отрицательн ы езн ачен ия. 4. П олучен н ы е величин ы d x и d y возводятся вквадрат, а результаты зан осятсявграфы 6 и 7, послечегосум м ирую тсядан н ы е. 5. П ерем н ож аю тся показатели d x и d y с учетом полож ительн ы х и отрицательн ы х зн ачен ий (графа 8). П олучен н ы е произведен ия сум м ирую тся. 6. Ц ифровы едан н ы еподставляю тсявформ улу:
rxy = ±
∑ (d x ⋅d y ) ∑ d 2x ⋅ ∑ d 2y
, гдеrх у –коэффициен тлин ейн ой корреляции.
Д лян аш егоприм ера: rxy= ± 0,616 П оскольку получен н ы й коэффициен т определен врезультате вы борочн ого исследован ия, н еобх одим о убедиться встепен и его н адеж н ости. П редставительн ость rxy определяется по прило ж ению 4. К оэффициен т считается представительн ы м , если получен н ая величин а превы ш ает критическоезн ачен иепри Р<0,05 и задан н ом числестепен ей свободы (n’=n-2). В н аш ем прим ере получен н ая величин а 0,616 превы ш ает критический уровен ь0,576 при п'= 10 и Р<0,05. П ри отсутствии таблицы критических зн ачен ий коэффициен та корреляции его представительн ость м ож ет бы ть определен а по величин е средн ей ош ибки Srxy :
( )
Sr
xy
Sr
xy
=±
=±
2 1 − rxy
n 2 1 − rxy
n−2
, при числепарн ы х н аблю ден ий больш е100 или , при числепарн ы х н аблю ден ии м ен ьш е100.
О тн ош ен иевеличин ы коэффициен та корреляции к величин есредн ей ош ибки позволяетн айти зн ачен иеt: rxy ⋅ n n−2 t= t = r пр и n>100, ил и xy 2 2 при n<100. 1 − rxy 1 − rxy В н аш ем прим ере: t=2,471. П о таблице зн ачен ий t-критерия при Р<0,05 и числестепен ей свободы 10 t =2,23.
50
П осле устан овлен ия представительн ости получен н ого зн ачен ия коэффициен та определяется тесн ота связи, вы раж аю щ аяся величин ой от 0 до 1 (табл.14). Т аблица 14 Степен ьсвязи В еличин а коэффициен та М алая(слабая) 0,01 –0,30 Средн яя(ум ерен н ая) 0,31 –0,70 Больш ая(сильн ая) 0,71 –1,00 Степен ь« связан н ости» ввариации двух или н ескольких изучаем ы х явлен ий болееточн оизм еряетсяквадратом коэффициен та корреляции (rх у). Э то зн ачит, чтопри rх у = 0,5 25% изм ен ен ий одн ого призн ака объясн яетсявариацией другого. П ри rх у = 0,3 изм ен чивостьодн ого явлен иязакон ом ерн освязан а с изм ен ен ием другого в10%, при rх у = 0,7 – в50%, при rх у = 0,9 –в81% случаев. Т аким образом , х отякоэффициен ткорреляции и указы ваетн а общ н остьэлем ен товвкоррелируем ы х рядах , н он евсяэта общ н остьобъясн яется закон ом ерн ой связью ввариации призн аков. И з сказан н ого ясн о, что о тесн ой корреляции м ож н оговоритьлиш ьвслучаях , когда rх у н ен иж е0,7. П равильн ая трактовка коэффициен та корреляции предполагает н орм альн оераспределен иесопряж ен н ы х величин коррелируем ы х рядовх и у. О дн ако при м алом числен аблю ден ий и сравн ительн о сильн ой корреляции (rх у=0,5) распределен ие коэффициен та r х у отличается зн ачительн ой асим м етрией отн орм альн огораспределен ия(рис.15). rxy=0
rxy=+0,4
rxy=+0,8
Рис.15. К ривы ераспределен ияэм пирическогокоэффициен та корреляции при n=12 дляразличн ы х зн ачен ий ген еральн огопарам етра rxy (поА .К . М итропольском у, 1971) Следовательн о, эм пирический коэффициен т корреляции н е будет точн ой оцен кой для всей ген еральн ой совокупн ости, если он определен н а м алочислен н ой вы борке и его величин а больш е 0,5. В этих случаях коэффициен т rх у целесообразн о зам ен ить преобразован н ой величин ой z (z — преобразован ие Ф иш ера), связан н ой с коэффициен том корреляции сле-
51
дую щ им образом :
z = 1,15129 lg
1 + rxy 1 − rxy
.
Распределен ие величин ы z является почти н еизм ен н ы м по форм е, так как он а м ало зависит от числен н ости вы борки и зн ачен ия rх у вген еральн ой совокупн ости. П реобразован иеrх у вz проводитсяпоприло ж ению 4, вкотором содерж атсявеличин ы z, соответствую щ иезн ачен иям rх у. Д остоверн остьz определяетсяпоформ уле:
tz = z ⋅ n − 3
П олучен н ая величин а tz сравн ивается с t-критерием Стью ден та при n'=n–2 и Р<0,05. В н аш ем прим ере: rх у = 0,616 соответствует z = 0,72; tz = 2,16. t-критерий Стью ден та при Р<0,05 и n=10 составляет2,23. Зн ачен ие числа z заклю чается ещ евтом , что только с его пом ощ ью м ож н о определить достоверн ость различий м еж ду двум я коэффициен там и корреляции, а такж еобъедин итьдан н ы епон ескольким корреляциям . П р им е р . М еж ду пом есячн ы м и дан н ы м и числа родови числа заболевш их гн ойн о-воспалительн ы м и ин фекциям и н оворож ден н ы х в двух акуш ерских стацион арах получен ы следую щ ие коэффициен ты : rх у = 0,525, rх у= 0,750. Ч исло парн ы х коррелируем ы х величин составляло по 1-м у акуш ерском у стацион ару 60, по 2-м у –72. И м ею тся ли различия м еж ду получен н ы м и коэффициен там и? П оприлож ен ию 4 переводим зн ачен ияrх у вz. z1=0,59; z2=0,97; dz=z1-z2 Средн яяош ибка дляразн ости м еж ду z1 и z2 определяетсяпоформ уле:
Sd П оскольку Sz = ± О тсю да
t=
d
sd
z
=
z
=±
s 2z
1
+ s2
1 , то S z1 = ±0,13; n −3
z2 S z2 = ±0,12; S d z = ±0,18.
0,38 = 2,11. 0,18
П о таблице зн ачен ий t-критерия при Р<0,05 и n'=(n1–2)+(n2–2)=128 t=1,96. П оскольку получен н аявеличин а 2,11 вы ш екритического зн ачен ия, разн остьм еж ду коэффициен там и призн аетсясущ ествен н ой. О П Р Е Д Е Л Е Н И Е О Б Ъ Е М А В Ы Б О Р КИ Д Л Я П О Л У Ч Е Н И Я Р Е П Р Е ЗЕ Н ТА ТИ В Н О Г О КО Э Ф Ф И Ц И Е Н ТА КО Р Р Е Л Я Ц И И
Н еобх одим ы й объем вы борочн ы х исследован ий длязадан н ой точн ости коэффициен та корреляции рассчиты ваетсяпоформ уле: 2 n = t2
+ 3,
z гдеn –иском ы й объем вы борки; t –н орм ирован н оеотклон ен ие; z –преоб-
52
разован н ая величин а эм пирического (осн ован н ого н а опы те) коэффициен та корреляции. П р им е р . П ри корреляцион н ом ан ализе двух рядовиз 12 парн ы х н аблю ден ий получен rх у=0,35. К оэффициен т н епредставителен , так как критическая величин а при Р<0,05 и n’= 12 – 2 = 10 составляет 0,58. Сколько ж е н еобх одим о н аблю ден ий, чтобы при такой зависим ости м еж ду призн акам и получитьрепрезен тативн ы й коэффициен ткорреляции? 1. В еличин а rх у переводится в z, т. е. rх у = 0,35 соответствует z = 0,365.
t z = 0,365 ⋅
12 − 3 = 1,095
2. П о таблице зн ачен ий t-критерия при Р<0,05 и п' = 10 t = 2,23. П оскольку получен н аявеличин а tz = 1,095 н иж е2,23, следовательн о, rх у = 0,35 н епредставителен и н еобх одим о увеличитьобъем вы борки. 3. О пределяется н еобх одим ое число вы борочн ы х исследован ий при Р<0,05 и t = l,96 (числон аблю ден ий больш е30). Т огда: 1,96 2 n= + 3 = 32 0,365 2 Т аким образом , число парн ы х н аблю ден ий (n) н уж н о довести по крайн ей м ере до 32, чтобы с вероятн остью 95 % м ож н о бы ло считать вы борочн ы й коэффициен трепрезен тативн ы м . Р ЕГ Р ЕС С И О Н Н Ы Й А Н А Л И З Регрессион н ы й ан ализ, вотличие откорреляцион н ого, указы ваю щ его лиш ь н а степен ьсвязи ввариации двух или н ескольких перем ен н ы х величин , дает возм ож н ость судить о том , как количествен н о м ен яется один показательпом ереизм ен ен иядругогон а един ицу. П оследовательн ость расчетовкоэффициен та регрессии (R) рассм отрим н а дан н ы х , приведен н ы х втаблице15. В графе3 процен тн естан дартн ы х проб кулин арн ы х изделий зам ен ен количеством м икроорган изм овв1 грам м епродукции. П оскольку изм ен чивы х величин две (х , у) и регрессия является двусторон н ей, соответствен н о будут и два коэффициен та: Rxy, Ryx, которы е вы числяю тсяпоформ улам :
Т аким образом , для определен ия зн ачен ия коэффициен та регрессии н еобх одим озн ать: 1)σ ряда х ; 2)σ ряда у; 3) величин у коэффициен та корреляции (rх у).
53
Т аблица 15 Н еделя года
1 2 3 4 5 6 7 8 9 10 11 12
Заболеваем ость О К И , (x)
12,8 11,6 15,4 17,8 12,3 12,5 14,0 20,3 15,6 14,8 11,6 9,3
Средн ееколичество бактерий в 1 гкулин арн ы х изделий (⋅100), y
17 7 20 25 15 18 25 54 26 20 12 10
О тклон ен иеот средн ей арифм етической
К вадратотклон ен ияотсредн ей арифм етической
dx
dy
d 2x
d 2y
1,2 2,4 -1,4 -3,8 1,7 1,5 0 -6,3 -1,6 -0,8 2,4 4,7
3,8 13,8 0,8 -4,2 5,8 2,8 -4,2 -34,8 -5,2 0,8 8,8 10,8
1,44 5,76 1,96 14,44 2,89 2,25 0 39,69 2,56 0,64 5,76 22,09
14,44 190,44 0,64 17,64 33,64 7,84 17,64 1211,04 27,02 0,64 77,44 116,64
d 2x ⋅ d 2y
4,56 33,12 -1,12 15,96 9,86 4,20 0 219,24 8,32 -0,64 21,12 50,76
О дн ако величин ы R м огутбы тьвы числен ы и вслучаеотсутствияготовы х зн ачен ий σ и rх у.
; Д лян аш егоприм ера: Rxy=0,21; Ryx=3,57. П оскольку коэффициен трегрессии, как и другие статистические показатели, получается врезультате вы борочн ы х исследован ий, н еобх одим о убедиться в репрезен тативн ости вы борки. С этой целью определяется ош ибка вы борки дляR:
Д лян аш егоприм ера SR xy = ±0,08 , SR yx = ±1,30 . Степен ь представительн ости устан авливается по t-критерию при n’=n–2 и уровн езн ачим ости 0,05.
54
t xy =
R xy SR xy
; t yx =
R yx SR yx
.
Д лян аш егоприм ера: txy=2,63; tyx=2,82. П оскольку получен н ы е зн ачен ия t превы ш аю т критический уровен ь 2,23 при Р<0,05 и n'=10, вы борка призн ается репрезен тативн ой. П рим ен ительн о к описан н ой ситуации это дает осн ован ие говорить о том , что увеличен ие м икробн ой обсем ен ен н ости кулин арн ы х изделий н а 1⋅100 бактерий в1 г продукта способствует подъем у заболеваем ости н а 0,21 0/00. В свою очередь, увеличен ие заболеваем ости н а 1 0/00 происх одит при увеличен ии числа м икроорган изм овв1 гкулин арн ы х изделий н а 3,67⋅100. К оэффициен т регрессии х арактеризует только лин ейн ую зависим остьи им еетзн ак « +» при полож ительн ой или « –» отрицательн ой связи. Регрессион н ы й ан ализ н ах одит ш ирокое прим ен ен ие всвязи с тем , что дает возм ож н ость оцен ить количествен н ое изм ен ен ие одн ого показателяпо м ереизм ен ен ияколичествен н ой х арактеристики другого, вто врем я как коэффициен ткорреляции служ ит общ им м ерилом сопряж ен н ой вариации призн аков. В приведен н ом вы ш е прим ере процен т проб кулин арн ы х изделий, н есоответствую щ их ГО СТ у, является более обобщ ен н ой величин ой, чем м ассивн ость м икробн ой обсем ен ен н ости. Н априм ер, число бактерий более 1000 в1 г продукта уж е н е соответствует ГО СТ у, одн ако это м ож етбы тькак 1500, так и 15000 м икроорган изм ов. Д ругим и словам и, н есоответствие н есоответствию розн ь. И если в первом случае пищ евой продуктм ож ети н епривести к подъем у заболеваем ости, то во втором случаетакаявероятн остьочен ьвы сока. М еж ду коэффициен том корреляции и коэффициен том регрессии им еетсяопределен н аясвязь, вы раж аю щ аясяформ улой:
rxy = ± R xy ⋅ R yx . Следовательн о, зн ая коэффициен ты регрессии, легко определить коэффициен ткорреляции. Д лян аш егоприм ера: rх у=± 0,88. Р Е Г Р Е С С И В Н Ы Й А Н А Л И З С И С П О Л ЬЗО В А Н И Е М П А КЕ ТА STADIA
В пакете ш ироко представлен ы различн ы е м етоды регрессион н ого ан ализа, вклю чая простую , м н ож ествен н ую , пош аговую , н елин ейн ую регрессию и др. Следуетсразу обратить вн им ан иен а н есовсем традицион н ую классификацию регрессион н ы х м оделей впакете. Д ля общ его обозн ачен ия м оделей дан н ы х , обрабаты ваем ы х м етодам и регрессион н ого ан ализа, всправочн икепакета используетсятерм ин « Э ксперим ентальны е зависим ости» . П оследние делятся впакете на одн опарам етрическиеи м н огопарам етрические, лин ейн ы е и н елин ейн ы е по парам етрам . П ри этом под одн опарам етрической зависим остью пон им ается произвольн ая фун кция у = f(x), где x – простая действительн ая перем ен н ая. Э то определен ием ож етпривести к путан ице, так как число парам етроввподобн ой за-
55
висим ости м ож ет бы ть лю бое. В частн ости, все полин ом иальн ы е м одели при этом попадаю т впроцедуру « П ростой регрессии» . Скорее, эти зависим остиследовалобы н азватьодн ом ерн ы м и или одн офакторн ы м и. М етодом н аим ен ьш их квадратоввы числим оцен ки парам етроввм одели простой лин ейн ой регрессии для дан н ы х калибровочн ого эксперим ен та. П остроим 95% доверительн ую трубку длясредн его зн ачен ияотклика. П одгот овк а дан н ы х. В ведем в редакторе дан н ы х пакета дан н ы е таблицы 16. Т аблица 16 Var 1 0 0,2 0,4 0,6 0,8 1 Var 2 29,38 110,3 188,8 268,9 348,5 426,4 Вы бор пр оце дур ы . П ри н аж атии клавиш и F9 пакетвы ведетн а экран м ен ю статистических м етодов. Н аж ав« L» , вы берем вн ем пункт« L = П ростаярегрессия(тренд)» . Заполн е н ие поле й вводадан н ы х. Н а запрос пакета « У каж ите н ом ер одн ой или н ом ера двух перем .» укаж ем н ом ера н езависим ой и зависим ой перем ен н ы х , н ах одящ их ся втекущ ий м ом ен т вблоке редактора дан н ы х . (Задан иен ом ера только одн ой перем ен н ой пакетин терпретируеткак ввод зависим ой перем ен н ой, а вкачестве н езависим ой перем ен н ой использует зн ачен ия н атуральн ого ряда. П одобн ое представлен ие часто используется при ан ализе врем ен н ы х рядов.) Д алее програм м а вы даетм ен ю зависим остей, отн есен н ы х впакетек одн опарам етрическим (рис.16). Ф а йл:
П е р е м е н н ы х =2
П Р О СТА Я Р Е ГР Е ССИ Я
П ер ем ен н ы е: х 1 х 2
О дн о па р а м е тр иче ска я р е гр е ссия 0 = лин е йн а я Y=a+b*x 1 = па р а бо ла Y=a+b*x+c*x^2 2 = по лин о м Y=сум {ai*x^i} 3 = сте пе н и . 5 Y=a+b*SQR(x) 4 = ло га р иф м ич Y=a+b*LN(x) 5 = сте пе н н а я Y=a*x^b 6= -“Y=a+b*x^c 7 = экспо н е н та Y=e^(a+b*x) 8= -“Y=e^(a+b/x) 9= -“Y=e^(a+b*SQR(x)) А= -“Y=e^(a+b*x+c*x^2) В= -“Y=a+b*e^(c*x) F10 В ы х о д
F1 И н ф о р м а ция
И зм е р е н ий=12
C = гипе р бо ла Y=a+b/x D = -“Y=1/(a+b/x) E = -“Y=1/(a+b/x) F = -“Y=1/(a+b*SQR(x)) G = -“Y=1/(a+b*LN(x)) H = -“Y=a+1/(b+c*x) I =о птим ум а Y=1/(a+b*x+c*x^2) J= -“Y=X/(a+b*x+c*x^2) K = ло гистич. Y=a+b/(1+e^(c+d*x)) L = син усо ид. Y=a+b*x+c*SIN(d+e*x) М = за да ва е м а я ф о р м уло й N = р о ба сто е сгла жива н ие Хубе р а
СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н и е м
В ы бе р ите м о де ль или н а жм ите е е клю ч >>
Рис.16. М ен ю зависим остей, отн есен н ы х к одн опарам етрическим Д лявы бора простой лин ейн ой регрессии н адо н аж атьклавиш у « 0» . Ре зульт ат ы . Э кран вы вода результатов этой процедуры содерж итчеты реблока ин форм ации. В пе рвом из н их представлен ы оцен ки коэффициен товм одели, их стан дартн ы еош ибки и уровн и зн ачим ости t-отн ош ен ий для проверки ги-
56
потез об отличии соответствую щ их коэффициен товотн уля. Вт орой б лок ин форм ации содерж ит базовую таблицу дисперсион н ого ан ализа, показы ваю щ ую , как общ ая вариация отклика распределяется м еж ду вариацией, обусловлен н ой введен н ой м оделью , и вариацией остатков. Тре т ий б лок ин форм ации содерж ит абсолю тн ую величин у коэффициен та м н ож ествен н ой корреляции R, коэффициен т детерм ин ации R^2, н есм ещ ен н ую оцен ку коэффициен та детерм ин ации R^2прив, а такж е F-отн ош ен ие и его уровен ь зн ачим ости для проверки гипотезы о соответствии вы бран н ой м одели н аблю ден н ы м дан н ы м . Сравн иваяполучен н ы й уровен ьзн ачим ости с пятипроцен тн ы м , систем а делает заклю чен ие об адекватн ости м одели. О братим вн им ан ие, что при вы даче ин форм ации используетсяокруглен ие до четвертой зн ачащ ей цифры , поэтом у близкие к един ице зн ачен ияуказан н ы х коэффициен товпредставлен ы равн ы м и един ице. Ч е т ве рт ый б лок ин форм ации вклю чает введен н ы е пользователем с клавиатуры зн ачен ия н езависим ой перем ен н ой и соответствую щ ие им зн ачен ияпрогн оза, вы числяем ы еспом ощ ью подобран н ой м одели. Т ак, введязн ачен иеX = 0,25 н а запрос систем ы : В ведитеХ -зн ачен ие дляпредсказан ияY, будетполучен осоответствую щ еезн ачен иеY. Д алее процедура предлагает построить график эксперим ен тальн ы х точек и регрессион н ой кривой. Дополн ит е льн ы е возм ож н ост и. Затем пользователю предлагаетсям ен ю дополн ительн ы х возм ож н остей процедуры . К ром езн ачен ий эксперим ен тальн ы х дан н ы х он и содерж атподобран н ы езн ачен иям одели, остатки и их стан дартизирован н ы е зн ачен ия, а такж е стан дартн ы е ош ибки остатков и доверительн ы е ин тервалы для н их (ввиде допустим ого отклон ен ия для 95% уровн ядоверия). П роцедура такж епозволяетвы вести график остатков и сох ран итьостатки вотдельн ой перем ен н ой базы дан н ы х пакета. Ком м е н т ар ии. 1. К оличества н аблю ден ий взависим ой и н езависим ой перем ен н ы х долж н ы бы тьодин аковы м и. 2. Больш ин ство фун кций из списка фун кцион альн ы х зависим остей, обрабаты ваем ы х процедурой « L = П ростая регрессия (трен д)» , являю тся н елин ейн ы м и отн осительн о вх одящ их вн их парам етров. В таких случаях для реш ен ия задачи регрессии возм ож н ы два подх ода. Н аиболее общ ий из н их сводится к прим ен ен ию н елин ейн ого м етода н аим ен ьш их квадратов для н ах ож ден ия оцен ок н еизвестн ы х парам етроввм одели с аддитивн ой ош ибкой. Д ругой, частн ы й м етод, осн ован н а преобразован ии векторовзависим ой и н езависим ой перем ен н ы х таким образом , чтобы преобразован н ая фун кцион альн ая зависим ость бы ла лин ейн ой отн осительн о парам етров. Н априм ер, для фун кции у=1/(а + b/ x ) преобразован ие вектора у вида ui=1/уi переводитеевлин ейн ую отн осительн опарам етровфун кцию . А н алогичн ы е преобразован ия допустим ы для больш ин ства фун кций, указан н ы х в списке. Д ляэтих фун кций процедура « П ростаярегрессия» сн ачала осущ еств-
57
ляет н еобх одим ы е преобразован ия векторовн езависим ой и зависим ой перем ен н ы х x и у, а затем прим ен яетк преобразован н ой м одели стан дартн ы й м етод н аим ен ьш их квадратов для н ах ож ден ия оцен ок парам етров. Н о в связи с этим следует пом н ить, что требован ия аддитивн ости, один аковой распределен н ости и н орм альн ости случайн ой ош ибки отн осятсяк преобразован н ой м одели, а н е к первон ачальн ой. Более того, за исклю чен ием н ескольких частн ы х случаев, сформ улировать статистические требован ия к х арактеру случайн ой ош ибки висх одн ой м одели крайн е трудн о. П оэтом у последую щ ий ан ализ остатковдляпервон ачальн ой м одели н еим еетсм ы сла и н еобх одим о исследовать остатки преобразован н ой м одели. М ы специальн о обращ аем н а это вн им ан ие, так как процедура « П ростаярегрессия» пакета вы водит вдальн ейш ем н а график и предусм атривает возм ож н ость сох ран ен ияостатковтолькодляпервон ачальн ой м одели. 3. Е щ е одн ой особен н остью приведен н ого вы ш е списка фун кций является возм ож н ость задан ия пользователем довольн о ш ирокого н абора алгебраических фун кций. К ак отм ечалось, подбор кон кретн ого вида фун кцион альн ой зависим ости – н аиболее трудн ая и творческая часть задачи регрессии. Н а этой стадии, кром е представлен ий о физической сущ н ости взаим освязи, весьм а полезн о представлять поведен ие различн ы х фун кций н а различн ы х участках их области определен ия. Д остоин ством встроен н ого справочн ика пакета STADIA является краткая классификация различн ы х фун кцион альн ы х зависим остей, представлен н ы х впроцедуре простой регрессии, с точки зрен ия скорости изм ен ен ия (поведен ия производн ы х ), м аксим ум ов, асим птот, периодичн ости и т.п. П ри этом пакетпозволяетбы стро построитьграфики производн ы х , используя процедуры пун кта « Сглаж ивание ифильтрация» . ДИ С П ЕР С И О Н Н Ы Й А Н А Л И З И зм ен ен ие (вариация) случайн ы х величин вы зы вается одн оврем ен н ы м действием целого ряда причин (факторов). Н априм ер, различн ы е парам етры орган изм а (тем пература, артериальн ое давлен ие) изм ен яю тся в зависим ости от врем ен и суток, при н азн ачен ии какого-либо фарм акологического препарата вразличн ы х дозах и т. д. В лиян ие тех или ин ы х факторовн а изучаем ы й призн ак н евозм ож н о вы делить вчистом виде. Н есм отря н а то что при проведен ии опы тов стараю тся сох ран ить условия м аксим альн о одн ородн ы м и, все ж е различн ы е опы ты даю т н есколько н еодин аковы е результаты . О бъясн яется это тем , что н а н их влияю т м н огочислен н ы е случайн ы е обстоятельства, м н огие другие н екон тролируем ы е факторы . П оэтом у возн икает важ н ая задача разлож ен ия общ ей изм ен чивости призн ака н а составн ы е части, с одн ой сторон ы , определяем ы м и кон кретн ы м и факторам и, а с другой – вы зы ваем ы м и случайн ы м и, н екон тролируем ы м и причин ам и. Раздел статистики, изучаю щ ий влиян ие факторов н а изм ен чивость случайн ой величин ы , н азы ваетсядис пе рс ионным а на лизом. Задача диспер-
58
сион н ого ан ализа – вы делить те факторы и их сочетан ия, которы е оказы ваю т влиян ие н а изм ен ен ие случайн ой величин ы . В зависим ости от количества учиты ваем ы х факторовразличаю т одн офакторн ы й и м н огофакторн ы й дисперсион н ы й ан ализ. Д ля того чтобы вы воды при дисперсион н ом ан ализе бы ли обосн ован ы , н еобх одим овы полн ен иеследую щ их условий: 1. И зучаем ы ефакторы долж н ы бы тьн езависим ы м и. 2. Распределен ие вы борочн ы х дан н ы х долж н о соответствовать н ом альн ом у распределен ию или сводиться к н ем у путем соответствую щ их преобразован ий. О сн овн ой це ль ю дис пе рс ионног о а на лиза является исследован иезн ачим ости различиям еж ду средн им и. Е сли вы просто сравн иваетесредн иев двух вы борках , дисперсион н ы й ан ализ даст тот ж е результат, что и обы чн ы й t-критерий для н езависим ы х вы борок (если сравн иваю тся две н езависим ы е группы объектовили н аблю ден ий) или t-критерий для зависим ы х вы борок (если сравн иваю тся две перем ен н ы е н а одн ом и том ж ем н ож ествеобъектовили н аблю ден ий). П Р О В Е Р КА ЗН А Ч И М О С ТИ
П роверка зн ачим ости вдисперсион н ом ан ализе осн ован а н а сравн ен ии ком пон ен ты дисперсии, обусловлен н ой м еж групповы м разбросом (н азы ваем ой с ре дним ква дра т ом эф ф е кт а или MS эф ф е кт ), и ком пон ен ты дисперсии, обусловлен н ой вн утригрупповы м разбросом (н азы ваем ой с ре дним ква дра т ом ошиб ки или MS ошиб ка ; эти терм ин ы бы ли впервы е использован ы вработеEdgeworth, 1885). Е сли верн а н улеваягипотеза (равен ство средн их вдвух популяциях ), то м ож н о ож идать сравн ительн о н ебольш оеразличиевы борочн ы х средн их из-за чисто случайн ой изм ен чивости. П оэтом у, при н улевой гипотезе, вн утригрупповая дисперсия будет практически совпадать с общ ей дисперсией, подсчитан н ой без учета групповой прин адлеж н ости. П олучен н ы е вн утригрупповы е дисперсии м ож н о сравн ить с пом ощ ью F-критерия, проверяю щ его, действительн о ли отн ош ен иедисперсий зн ачим обольш е1. О С Н О В Н А Я Л О Г И КА Д И С П Е Р С И О Н Н О Г О А Н А Л И ЗА
Ц елью дисперсион н ого ан ализа является проверка статистической зн ачим ости различия м еж ду средн им и (для групп или перем ен н ы х ). Э та проверка проводится с пом ощ ью разбиен ия сум м ы квадратовн а ком пон ен ты , т.е. с пом ощ ью разбиен ия общ ей дисперсии (вариации) н а части, одн а из которы х обусловлен а случайн ой ош ибкой (то есть вн утригрупповой изм ен чивостью ), а вторая связан а с различием средн их зн ачен ий. П оследн яя ком пон ен та дисперсии затем используется для ан ализа статистической зн ачим ости различиям еж ду средн им и зн ачен иям и. Е сли это различиезна чимо, н улеваягипотеза от ве рг а е т с я и прин им аетсяальтерн ативн ая гипотеза осущ ествован ии различиям еж ду средн им и.
59 М Н О Г О Ф А КТО Р Н Ы Й Д И С П Е Р С И О Н Н Ы Й А Н А Л И З
П ерем ен н ы е, зн ачен иякоторы х определяю тсяс пом ощ ью изм ерен ий в х оде эксперим ен та (н априм ер, балл, н абран н ы й при тестирован ии), н азы ваю тся за висимыми перем ен н ы м и. П ерем ен н ы е, которы м и м ож н о управлять при проведен ии эксперим ен та (н априм ер, м етоды обучен ия или другие критерии, позволяю щ ие разделить н аблю ден ия н а группы или классифицировать), н азы ваю тсяф а кт ора ми илине за висимыми перем ен н ы м и. Ситуации, когда н екоторое явлен ие полн остью описы вается одн ой перем ен н ой, чрезвы чайн о редки. Н априм ер, если м ы пы таем ся н аучиться вы ращ ивать больш ие пом идоры , следует рассм атривать факторы , связан н ы е с ген етической структурой растен ий, типом почвы , освещ ен н остью , тем пературой и т.д. Т аким образом , при проведен ии типичн ого эксперим ен та прих одитсяим етьдело с больш им количеством факторов. О сн овн ая причин а, по которой использован ие дисперсион н ого ан ализа предпочтительн ееповторн ого сравн ен иядвух вы борок при разн ы х уровн ях факторов с пом ощ ью серий t-критерия, заклю чается втом , что дисперсион н ы й ан ализ сущ ествен н о более эф ф е кт иве н и, для м алы х вы борок, более ин форм ативен . Г Л А В Н Ы Е Э Ф Ф Е КТЫ . П О П А Р Н Ы Е (Д В У Х Ф А КТО Р Н Ы Е ) Э Ф Ф Е КТЫ В ЗА И М О Д Е Й С ТВ И Я
Сущ ествует ещ е одн о преим ущ ество дисперсион н ого ан ализа перед обы чн ы м t-критерием : дисперсион н ы й ан ализ позволяет обн аруж ить эффекты вза имоде йс т вия м еж ду факторам и и поэтом у позволяет проверять болееслож н ы египотезы . Рассм отрим ещ еодин прим ер, иллю стрирую щ ий только что сказан н ое. (Т ерм ин вза имоде йс т вие впервы е бы лиспользован Ф иш ером вработеFisher, 1926) П редполож им , что им еется две группы студен тов, причем псих ологически студен ты первой группы н астроен ы н а вы полн ен ие поставлен н ы х задачи более целеустрем лен н ы , чем студен ты второй группы , состоящ ей из болеелен ивы х студен тов. Разобьем каж дую группу случайн ы м образом пополам и предлож им одн ой половин евкаж дой группеслож н оезадан ие, а другой – легкое. П осле этого изм ерим , н асколько н апряж ен н о студен ты работаю т н ад этим и задан иям и. Средн ие зн ачен ия для этого (вы м ы ш лен н ого) исследован ияпоказан ы втаблице17. Т аблица 17 Степен ьтрудн ости задан ия Ц елеустрем лен н ы е Л ен ивы е Слож н ое 10 5 Л егкое 5 10 К акой вы вод м ож н о сделать из этих результатов? М ож н о ли заклю чить, что: (1) н ад слож н ы м задан ием студен ты трудятсяболеен апряж ен н о; (2) честолю бивы е студен ты работаю т упорн ее, чем лен ивы е? Н и одн о из этих утверж ден ий н е отраж ает сущ н ость систем атического х арактера
60
средн их , приведен н ы х втаблице. А н ализируя результаты , правильн ее бы ло бы сказать, что н ад слож н ы м и задан иям и работаю тупорн еетолько честолю бивы е студен ты , вто врем я как н ад легким и задан иям и только лен ивы еработаю т упорн ее. Д ругим и словам и, х арактер студен тови слож н ость задан ия вза имоде йс т вуя м еж ду собой влияю т н а затрачиваем ое усилие. Э то является прим ером попа рног о вза имоде йс т вия м еж ду х арактером студен тови слож н остью задан ия. Зам етим , что утверж ден ия 1 и 2 описы ваю т г ла вные эф ф е кт ы. О Б Щ И Й С П О С О Б О П И С А Н И Я В ЗА И М О Д Е Й С ТВ И Й
В общ ем случаевзаим одействием еж ду факторам и описы вается ввиде изм ен ен ия одн ого эффекта под воздействием другого. В рассм отрен н ом вы ш е прим ере двух факторн ое взаим одействие м ож н о описать как изм ен ен ие главн ого эффекта фактора, х арактеризую щ его слож н ость задачи, под воздействием фактора, описы ваю щ его х арактер студен та. Д лявзаим одействия трех факторовиз преды дущ его параграфа м ож н о сказать, что н а взаим одействиедвух факторов(слож н ости задачи и х арактера студен та) оказы ваетвлиян ие, н априм ер, и половая прин адлеж н ость испы туем ы х . Е сли изучается взаим одействие четы рех факторов, м ож н о сказать, что взаим одействие трех факторов, изм ен яется под воздействием четвертого фактора, т.е. сущ ествую тразличн ы етипы взаим одействий н а разн ы х уровн ях четвертого фактора. О казалось, что во м н огих областях взаим одействиепяти или даж е больш егоколичества факторовн еявляетсячем -тон еобы чн ы м . Е сли, н априм ер, изм еряю тсяпоказатели состоян ияздоровьястуден тов вн ачале сем естра и вкон це сем естра, то это и есть повторн ы е изм ерен ия. И зучен ие критерия зн ачим ости втаких план ах это логическое развитие одн ом ерн ого случая. Зам етим , что м етоды м н огом ерн ого дисперсион н ого ан ализа обы чн о такж е использую тся для исследован ия зн ачим ости одноме рных факторовповторн ы х изм ерен ий, им ею щ их болеечем два уровн я. Соответствую щ иеприм ен ен иябудутрассм отрен ы поздн еевэтой части. Сум м ы зн аче н ий пе р е м е н н ы х и диспе р сион н ы й ан ализ. Д аж е опы тн ы е пользователи одн ом ерн ого и м н огом ерн ого дисперсион н ого ан ализа часто прих одят взатрудн ен ие, получая разн ы е результаты при прим ен ен ии м н огом ерн ого дисперсион н ого ан ализа, н априм ер, для трех перем ен н ы х , и при прим ен ен ии одн ом ерн ого дисперсион н ого ан ализа к сум м е этих трех перем ен н ы х , как к одн ой перем ен н ой. И дея с уммирова ния перем ен н ы х состоитвтом , что каж дая перем ен н ая содерж итвсебен екоторую истин н ую перем ен н ую , которая и исследуется, а такж еслучайн ую ош ибку изм ерен ия. П оэтом у при усредн ен ии зн ачен ий перем ен н ы х , ош ибка изм ерен ия будет ближ е к 0 для всех изм ерен ий и усредн ен н ое зн ачен ий будет болеен адеж н ы м . Н а сам ом деле, вэтом случаеприм ен ен иедисперсион н ого ан ализа к сум м еперем ен н ы х разум н о и являетсям ощ н ы м м етодом . О дн ако, если зависим ы е перем ен н ы е по своей природе м н огом ерн ы , то сум м ирован иен еум естн о. Н априм ер, пусть зависим ы е перем ен н ы е состоят из четы рех показа-
61
телей ус пе ха в об ще с т ве . К аж ды й показатель х арактеризует соверш ен н о н езависим ую сторон у человеческой деятельн ости (н априм ер, профессион альн ы й успех , преуспеван ие в бизн есе, сем ейн ое благополучие и т.д.). Слож ен иеэтих перем ен н ы х подобн ослож ен ию яблока и апельсин а. Сум м а этих перем ен н ы х н е будет подх одящ им одн ом ерн ы м показателем . П оэтом у с таким и дан н ы м и н уж н о обх одитсякак с м н огом ерн ы м и показателям и вмног оме рном дис пе рс ионном а на лизе . О Д Н О Ф А КТО Р Н Ы Й Д И С П Е Р С И О Н Н Ы Й А Н А Л И З В П А КЕ ТЕ STADIA
В пакете представлен ы следую щ ие м етоды одн офакторн ого ан ализа: н епарам етрическиекритерии К рускала-У оллиса, а такж ем етоды дисперсион н ого ан ализа. О бращ ен иек н им осущ ествляетсяиз раздела « Д исперсион н ы й ан ализ» блока « Статистики» . П р им е р . Д овольн о часто вфизиологии труда оцен ивается влиян ие тех или ин ы х факторовн а производительн ость труда, н априм ер, влиян ие поощ рен ия за вы полн ен н ую работу. В качестве прим ера рассм отрим влиян ие фин ан сового поощ рен ия н а производительн ость труда. С этой целью ш ести одн ородн ы м группам исследуем ы х бы ли предлож ен ы задачи один аковой слож н ости. В се задачи предоставлялись каж дом у член у группы н езависим о отостальн ы х респон ден тов. Группы отличалисьм еж ду собой величин ой ден еж н ого возн аграж ден ия за число правильн о реш ен н ы х задач. П роверим гипотезу об отсутствии эффектов обработки с пом ощ ью критерия К рускала-У оллиса для дан н ы х о влиян ии дан н ого фактора стим улирован иян а производительн остьтруда. П одгот овк адан н ы х. В редакторе базы дан н ы х пакета введем дан н ы епервого столбца таблицы вперем ен н ую х 1, второго –вперем ен н ую х 2 и так далее, как этопоказан о врисун ке17. Ф а йл: stimul
Var/Cases Varname 1 2 3 4 5
П е р е м е н н ы х =6
1/5 x1 10 11 9 13 7
2/5 x2 8 10 16 13 12
3/5 x3 12 17 14 9 16
И зм е р е н ий=30
4/5 x4 12 15 16 16 19
5/5 x5 24 16 22 18 20
6/5 x6 19 18 27 25 24
7/0 x7
Б Л О К Р Е Д А КТО Р А Д А ННЫ Х F1 П о м о щь F2 П е ч Э кр F3 Ч т е ние F4 Запись F5 А р х ив F6 Рисуно к F7 Оч ист F8 П р е о бр F9 Ст ат ис F0 Вы х о д В во дите в м а тр ицу числа + Enter (р а бо та ю т та кже : Enter/ Ins/ Del/ Tab и F-клю чи
Рис.17. В вод получен н ы х результатовв« Блок редактора дан н ы х » Зам е чан ие. П роцедуры одн офакторн ого ан ализа пакета STADIA требую т, чтобы дан н ы е, отвечаю щ ие различн ы м способам обработки (уровн ям фактора), н ах одились вотдельн ы х перем ен н ы х . П ри этом вфайле дан н ы х н едопустим о н аличие посторон н их перем ен н ы х . О тсю да следует, что если м ы х отим провести факторн ы й ан ализ толькодлячасти способовобработки, либо или объедин итьн есколько способовобработки водин , следуетзавести
62
н овы й файлдан н ы х и осущ ествитьвн ем требуем ы епреобразован ия. Вы бор пр оце дур ы . П ослен аж атияклавиш и « F9» програм м а вы ведет н а экран м ен ю статистических м етодов. Н аж авклавиш у « 1» , м ы вы берем пун ктэтогом ен ю « 1-факторн ы й К рускала-У оллеса» . Ре зульт ат ы . Н а экран е появятся зн ачен ия статистики К рускалаУ оллиса (рис.18), м ин им альн ого уровн я зн ачим ости и числа степен ей свободы распределен ия х и-квадрат, которое используется вкачестве асим птотическогоприближ ен ияраспределен иястатистики К рускала-У оллиса. Ф а йл: П е р е м е н н ы х =6 1-Ф А КТО Р НЫ Й Д И СП Е Р С. А НА Л И З КР УСКА Л А -УО Л Л И СА .
Н=21.08,
Зн а чим о сть =7Е -4,
И зм е р е н ий=30
сте п.сво б=5
Гипо те за 1: Е сть влия н ие ф а кто р а н а о тклик F10 В ы х о д
F1 И н ф о р м а ция
СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н и е м
На жм ите Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Рис.18. Зн ачен иястатистики К рускала-У оллиса Сравн ен ие м ин им альн ого уровн я зн ачим ости статистики с фиксирован н ы м уровн ем зн ачим ости 0,05 позволяет систем е сделать заклю чен ие « Е стьвлиян иефактора н а отклик» . Ком м е н т ар ии. 1. П роцедуры н епарам етрического одн офакторн ого ан ализа впакетедопускаю ттакж еввод ввидетаблицы ран говдан н ы х (при ран ж ирован ии по всей совокупн ости). Т о есть м ож н о бы ло использовать дляввода и дан н ы етаблицы . 2. В пакете STADIA отсутствует процедура оцен ки эффектовобработки н епарам етрическим и м етодам и. П р им ер . П роведем одн офакторн ы й дисперсион н ы й ан ализ длядан н ы х прим ера н а стр. 58: проверим н улевую гипотезу об отсутствии эффектовобработки и построим 95% доверительн ы еин тервалы дляэффектовобработки. П одгот овк адан н ы х . См . преды дущ ий прим ер. Вы бор пр оце дур ы . В м ен ю блока статистических м етодовн аж атием клавиш и « G» вы берем пун кт« G = 1-факторн ы й парам етрический» . Результ ат ы . Н а рисун ке 19 приведен а базовая таблица результатов дисперсион н огоан ализа. Ф а йл: П е р е м е н н ы х =6 1-Ф А КТО Р НЫ Й Д И СП Е Р СИ О ННЫ Й А НА Л И З.
И зм е р е н ий=30
И сто чн ик Сум м а ква др . Сте п.сво б Ср е дн .ква др . Сила влия н ия ф а кт.1 590.8 5 118.2 0.1496 о ста т. 224.4 24 9.35 о бщ а я . 815.2 29 28.11 F(ф а кто р )=12.64,
Зн а чим о сть =0,
сте п.сво б=5, 24
63 Гипо те за 1: Е сть влия н ие ф а кто р а н а о тклик F10 В ы х о д
F1 И н ф о р м а ция
СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н и е м
На жм ите Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Рис.19. Базоваятаблица результатовдисперсион н огоан ализа. Н азн ачен ие этого рисун ка − дать ответ н а вопрос о н аличии зн ачим ого влиян ия уровн ей факторов н а исследуем ы й отклик или, другим и словам и, о присутствии эффектов обработки. Д адим определен ия величин , приведен н ы х вэтой таблице. Сн ачала рассм отрим столбец « Сум м а квадр.» . В строке« О бщ ая» указан а общ аясум м а квадратовразн остей н аблю ден ий и их средн его зн ачен ия. В строке« Ф акт.1» приведен вкладвобщ ую сум м у квадратов, обусловлен н ы й различиям и вуровн ях фактора aj. Ч асто эту величин у н азы ваю т с уммой ква д ра т ов ме ж ду г руппа ми. В строке« О стат.» указан вклад вобщ ую сум м у квадратов, вы зван н ы й случайн ой изм ен чивостью дан н ы х вн утри групп. Е го часто н азы ваю т с уммой ква дра т ов внут ри групп. Л егко видеть, что сум м а величин первой и второй строк столбца « Сум м а квадр.» таблицы дисперсион н ого ан ализа дает величин у втретьей строкеэтогостолбца. Т аким образом , см ы слан ализа вариации дан н ы х сводится к вы ясн ен ию разлож ен ия общ ей сум м ы квадратовотклон ен ий н а две части. П ервая из н их ин терпретируетсякак вариация, обусловлен н аявведен н ой м оделью , а вторая–как случайн аяизм ен чивостьдан н ы х вн утри сам ой м одели. В случаесправедливости н улевой гипотезы каж дая из величин впервом столбце таблицы им еет распределен ие σ 2χ2 со своим числом степен ей свободы . Э то числостепен ей свободы указы ваетвторой столбец « Ст. своб» . таблицы дисперсион н огоан ализа. Н акон ец, втретьем столбцетаблицы « Ср.квадр.» н ах одятсячастн ы еот делен ия величин первого столбца н а соответствую щ ие величин ы второго столбца. О тн ош ен иеэтих оцен ок (н орм ирован н ы есредн иеквадраты м еж ду группам и и средн иеквадраты вн утри групп) н оситн азван иеF-от ноше ния и его зн ачен ие, приведен н ое сн изу от таблицы дисперсион н ого ан ализа, как раз и используетсядляпроверки н улевой гипотезы . Справа от F-отн ош ен ия указы вается м ин им альн ы й уровен ь зн ачим ости указан н ой F-статистики (здесь он практически равен н улю ), и числа степен ей свободы соответствую щ его F-распределен ия. К ак обы чн о, если зн ачим ость F-статистики близка к н улю , есть осн ован ие отвергн уть н улевую гипотезу. Систем а сравн ивает уровен ь зн ачим ости F-статистики с 0,05 и н а осн овеэтого сравн ен иявы водитн а экран заклю чен ие« Е стьвлиян иефактора н а отклик» . В четвертой строке таблицы вы водится с ила влия ния ф а кт ора (по Сне д е кору), т.е. величин а. В еличин а силы влиян ия показы вает, какую долю вариации дан н ы х определяетм одель.
64
Д ля дан н ы х прим ера м ы получили, что доля фактора стим улирован иясоставляет14,9% впроизводительн ости. П акет STADIA содерж ит такж е м етоды для м н ож ествен н ы х сравн ен ий, н о оцен ки эффектовобработки он н е дает. В прочем , для получен ия этих оцен ок м ож н о воспользоватьсяпроцедурой О писательн ой статистики для каж дой из перем ен н ы х , отвечаю щ их различн ы м уровн ям фактора. О дн ако следует пом н ить, что эта процедура строит гран ицы доверительн ы х ин тервалов, опираясьн а оцен ки дисперсии по каж дой группен аблю ден ий, а н е по всей их совокупн ости. И з-за отсутствия впакете STADIA возм ож н ости н епосредствен н ой проверки правом ерн ости прим ен ен ия м етодов дисперсион н ого ан ализа, м ы реком ен дуем пользователям по крайн ей м ере проводить сравн ен ие результатовкритерия К рускала-У оллиса и одн офакторн огоан ализа. Д В У Х Ф А КТО Р Н Ы Й Д И С П Е Р С И О Н Н Ы Й А Н А Л И З В П А КЕ ТЕ STADIA
П р им ер . С пом ощ ью критерия Ф ридм ан а проверим н улевую гипотезу об отсутствии эффектовобработки длядан н ы х о зависим ости частоты сам опроизвольн ого дрож ан ия м ы ш ц рук (трем ор) оттяж ести специальн ого браслета, одеваем ого н а запястье. И спы туем ы м (5 групп по 6 человек) предлагалось провести щ уп через лабирин т прибора « Т рем ом етр» , число касан ий оцен ивалосьвбаллах по специальн ой ш кале, при этом н а кистьиспы туем ы х н адевалисьбраслеты различн ой м ассы . П одгот овк а дан н ы х. В редакторе базы дан н ы х пакета введем результаты тестирован ияиспы туем ы х 1 группы вперем ен н ую х 1, второй –в перем ен н ую х 2 и т.д.(рис.20). Ф а йл: tremor
Var/Cases Varname 1 2 3 4 5 6
П е р е м е н н ы х =5
1/6 x1 3.01 3.47 3.35 3.10 3.41 3.07
2/6 x2 2.85 3.43 3.14 2.86 3.32 3.06
3/6 x3 2.62 3.15 3.02 2.58 3.08 2.85
И зм е р е н ий=30
4/6 x4 2.63 2.83 2.71 2.49 2.96 2.50
5/6 x5 2.58 2.70 2.78 2.36 2.67 2.43
6/0 x6
7/0 x7
Б Л О К Р Е Д А КТО Р А Д А ННЫ Х F1 П о м о щь F2 П е ч Э кр F3 Ч т е ние F4 Запись F5 А р х ив F6 Рисуно к F7 Оч ист F8 П р е о бр F9 Ст ат ис F0 Вы х о д В во дите в м а тр ицу чи сла + Enter (р а бо та ю т та кже : Enter/ Ins/ Del/ Tab и F-клю чи
Рис.20. В вод результатовтестирован ияв« Блок редактора дан н ы х » П роцедуры н епарам етрического двух факторн ого ан ализа пакета STADIA одн озн ачн о требую т, чтобы дан н ы е, отвечаю щ ие различн ы м способам обработки (уровн ям фактора), н ах одилисьвотдельн ы х перем ен н ы х . Ч исло н аблю ден ий вкаж дой перем ен н ой долж н о бы ть один аковы м , н аблю ден ия, соответствую щ ие одн ом у блоку, долж н ы стоять в I одн ой строке. К ак и впроцедурах одн офакторн ого ан ализа, н едопустим о н аличие посторон н их перем ен н ы х вфайледан н ы х . Вы бор пр оце дур ы . Н аж ав « F9» , перейдем в блок статистических
65
м етодови вы берем вн ем пун кт« J = 2-факторн ы й Ф ридм ан а» . Э том ож н о сделатьн аж атием клавиш и « I» . Ре зульт ат ы . Э кран вы вода результатовэтой процедуры и содерж ит зн ачен ие статистики Ф ридм ан а (рис.21), ее уровен ь зн ачим ости, вы числен н ы й с пом ощ ью асим птотического распределен ия х и-квадрат, и число степен ей свободы этогораспределен ия. Сравн ивая получен н ы й уровен ь зн ачим ости с фиксирован н ы м (равн ы м 0,05), систем а вы дает сообщ ен ие о н аличии или отсутствии влиян ия фактора н а отклик. Ф а йл: П е р е м е н н ы х =5 2-Ф А КТО Р НЫ Й Д И СП Е Р С. А НА Л И З Ф Р И Д М А НА . S=22.53
Зн а чим о сть =1E-4,
И зм е р е н ий=30
сте п.сво б=4
Гипо те за 1: Е сть влия н ие ф а кто р а н а о тклик СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F10 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм ите Enter=пр о до лжить или F2=пе ча ть экр а н а >>
Рис. 21. Д вух факторн ы й дисперсион н ы й ан ализ. Зн ачен иестатистики Ф ридм ан а П р им е р . П роведем двух факторн ы й дисперсион н ы й ан ализ длядан н ы х прим ера 1: проверим н улевую гипотезу об отсутствии эффектовобработки, оцен им зн ачен ия этих эффектови построим для н их 95% доверительн ы еин тервалы . П одгот овк адан н ы х. См отри прим ер 1. Вы бор пр оце дур ы . В м ен ю статистических м етодоввы берем пун кт « H = 2-факторн ы й парам етрический» (клавиш а « H» ). П оявитсязапрос систем ы « П лан : 0=н еповторяем ы й; 1=повторяем ы й» . П од повторяем ы м (н еповторяем ы м ) план ом эксперим ен та в пакете подразум евается план содерж ащ ий (н е содерж ащ ий) повторн ы е изм ерен ия при каж дом сочетан ии зн ачен ий двух исследуем ы х факторов. К аж ды й из этих план овпредусм атриваетсвою форм у ввода дан н ы х . В частн ости, исх одн ы е дан н ы е эксперим ен та без повторн ы х изм ерен ий долж н ы представлять собой м атрицу разм ером n x k, вкоторой столбцы отвечаю т различн ы м способам обработки (k уровн ям первого фактора), строки отвечаю т различн ы м блокам (n уровн ям второго фактора), а каж ды й элем ен т есть отклик, изм ерен н ы й пои соответствую щ ем сочетан ии уровн ей исследуем ы х факторов. Э тим требован иям вточн ости соответствую тисследуем ы едан н ы е. В рассм атриваем ом прим ере вх оде эксперим ен та проводились повторн ы е н аблю ден ия при каж дом сочетан ии уровн ей фактора. О дн ако в таблице приведен ы только результаты усредн ен ия повторн ы х н аблю де-
66
н ий, а исх одн аяин форм ациян ам н едоступн а. Т о естьн а стадии фиксации дан н ы х бы лосущ ествлен перех од от повторяем ого план а эксперим ен та к н еповторяем ом у. П оэтом у н а запрос систем ы о план еэксперим ен та следуетуказатьн еповторяем ы й план . Ре зульт ат ы . Э кран вы вода результатовэтой процедуры содерж ит базовую таблицу дисперсион н огоан ализа (рис.22). Зн ачен ия F-статистик для каж дого из факторов F (фактор 1) и F (фактор 2) и их уровн и зн ачим ости показы ваю т, что им еетсявлиян иекаж догоиз факторовн а отклик. Ф а йл: П е р е м е н н ы х =5 2-Ф А КТО Р НЫ Й Д И СП Е Р СИ О ННЫ Й А НА Л И З.
Ф а кто р н ы й пла н : н е по вто р я е м ы й И сто чн ик Сум м а ква др . Сте п.сво б Ср е дн .ква др . ф а кт.1 1.801 4 0.4504 ф а кт.2 0.9074 5 0.1815 о ста т. 0.1645 20 8.223Е -3 о бщ а я . 2.873 29 9.908Е -2 F(ф а кто р 1)=54.77, F(ф а кто р 2)=22.07,
Зн а чим о сть =0, Зн а чим о сть =0,
И зм е р е н ий=30
Сила влия н ия 0.9835 0.9364
сте п.сво б=4, 20 сте п.сво б=5, 20
Гипо те за 1: Е сть влия н ие ф а кто р а н а о тклик СТА ТИ СТИ ЧЕ СКИ Е М Е ТО Д Ы F0 В ы х о д F1 И н ф о р м а ция F2 Э кр а н н а пе ча ть / в ф а йл Esc В ы х о д с пр е р ы ва н ие м На жм ите Enter=пр о до лжить >>
Рис.22. Базоваятаблица результатовдисперсион н огоан ализа. Ком м е н т ар ии. К сож ален ию , процедура н е вы числяет оцен ок парам етровдвух факторн ой м одели и их х арактеристик, а такж е н е дает возм ож н ости провести ан ализ остатковм одели н а предм ет проверки адекватн ости используем ого м етода. Э ти обстоятельства ум ен ьш аю т цен н ость этой процедуры , так как во м н огих факторн ы х задачах важ н а им ен н о оцен ка вклада уровн ей фактороввн аблю даем ы й отклик.
67
П Р И Л О Ж ЕН И Я
П рилож ение1 Зн ачен ияt-критерия(поСтью ден ту) Ч исло степен ей свободы (n') 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
0,2 (20,0%) 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,530 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311
У ровн и зн ачим ости (Р) 0,1 0,05 0,02 0,01 0,001 (10,0%) (5,0%) (2,0 %) (1.0%) (0,1%) 2,132 2,776 3,747 4,604 8,61 2,014 2,571 3,365 4,032 6,86 1,943 2,447 3,143 3,707 5,96 1,895 2,365 2,998 3,449 5,31 1,860 2,306 2,896 3,355 5,04 1,833 2,262 2,821 3,250 4,78 1,812 2,228 2,764 3,169 4,59 1,796 2,201 2,718 3,106 4,44 1,782 2,179 2,681 3,055 4,32 1,771 2,160 2,650 3,012 4,22 1,761 2,145 2,624 2,997 4,14 1,753 2,131 2,602 2,947 4,07 1,746 2,120 2,583 2,921 4,02 1,740 2,110 2,567 2,898 3,96 1,734 2,101 2,552 2,878 3,92 1,729 2,093 2,539 2,861 3,88 1,725 2,086 2,528 2,845 3,85 1,721 2,080 2,518 2,831 3,82 1,717 2,074 2,508 2,819 3,79 1,714 2,069 2,500 2,807 3,77 1,711 2,064 2,492 2,797 3,75 1,708 2,060 2,485 2,787 3,73 1,706 2,056 2,497 2,779 3,71 1,703 2,052 2,473 2,771 3,69 1,701 2,048 2,467 2,763 3,67 1,699 2,045 2,462 2,756 3,66
68
30
1,310
1,697
2,042
2,457
2,750
3,64
∞
1,281
1,644
1,957
2,326
2,575
3,29
П рилож ение2 К ритерии дляисклю чен ия« вы скакиваю щ их » вариан т (поН . Больш ову и Н .В . См ирн ову, 1965) У ровен ьдостоверн ости
n
95% 0,941 0,765 0,642 0,560 0,507 0,468 0,437 0,412 0,392 0,376 0,338 0,300 0,277 0,260
3 4 5 6 7 8 9 10 11 12 15 20 25 30
99% 0,988 0,899 0,780 0,698 0,637 0,590 0,555 0,527 0,502 0,482 0,438 0,391 0,362 0,341
П рилож ение3 К ритическиезн ачен иякоэффициен та корреляции ран гов(ρ) n 7 8 9 10 11 12 13 14 15 16
P 0,05 0,78 0,72 0,68 0,64 0,61 0,58 0,56 0,54 0,52 0,50
0,01 0,94 0,88 0,83 0,79 0,76 0,73 0,70 0,68 0,66 0,64
n 24 25 26 27 28 29 30 31 32 33
P 0,05 0,41 0,40 0,39 0,38 0,38 0,37 0,36 0,36 0,36 0,34
0,01 0,52 0,51 0,50 0,49 0,48 0,48 0,47 0,46 0,45 0,45
69
17 18 19 20 21 22 23
0,48 0,47 0,46 0,45 0,44 0,43 0,42
0,62 0,60 0,58 0,57 0,56 0,54 0,53
34 35 36 37 38 39 40
0,34 0,33 0,33 0,33 0,32 0,31 0,31
0,44 0,43 0,43 0,42 0,41 0,41 0,40 П рилож ение4
К ритическиезн ачен иякоэффициен та корреляции (rxy) n'=n-2 5
У ровн и зн ачим ости 5% 1% 0,75 0,87
n' = n-2 27
У ровн и зн ачим ости 5% 1% 0,37 0,47
6
0,71
0,83
28
0,36
0,46
7
0,67
0,80
29
0,36
0,46
8
0,63
0,77
30
0,35
0,45
9
0,60
0,74
35
0,33
0,42
10
0,58
0,71
40
0,30
0,39
11
0,55
0,68
45
0,29
0,37
12
0,53
0,66
50
0,27
0,35
13
0,51
0,64
60
0,25
0,33
14
0,50
0,62
70
0,23
0,30
15
0,48
0,61
80
0,22
0,28
16
0,47
0,59
90
0,21
0,27
17
0,46
0,58
100
0,20
0,25
18
0,44
0,56
125
0,17
0,23
19
0,43
0,55
150
0,16
0,21
20
0,42
0,54
200
0,14
0,18
21
0,41
0,53
300
0,11
0,15
22
0,40
0,52
400
0,10
0,13
23
0,40
0,51
500
0,09
0,12
70
24
0,39
0,50
700
0,07
0,10
25
0,38
0,49
900
0,06
0,09
26
0,37
0,48
1000
0,06
0,09
К ритическиезн ачен иякритерияχ Р
n' 1
0,05 3,8
0,01 6,6
2
6,0
3
n'
2
П рилож ение5
P
18
0,05 28,9
0,01 34,8
9,2
19
30,1
36,2
7,8
11,3
20
31,4
37,6
4
9,5
13,3
21
32,7
38,9
5
11,1
15,1
22
33,9
40,3
6
12,6
16,8
23
35,2
41,6
7
14,1
18,5
24
36,4
43,0
8
15,5
20,1
25
37,7
44,3
9
16,9
21,7
26
38,9
45,6
23,2
27
40,1
47,0
10
18,3
11
19,7
24,7
28
41,3
48,3
12
21,0
26,2
29
42,6
49,6
13
22,4
27,7
30
43,8
50,9
14
23,7
29,1
40
55,8
63,7
15
25,0
30,6
50
67,5
76,2
16
26,3
32,0
60
79,1
88,4
17
27,6
33,4
70
90,5
100,4
71
Составители:
Рецкий М их аилИ саакович Ч ерн овВ иктор И ван ович Сем ен овСергей Н иколаевич Сереж ен коН иколай П етрович
Редактор
Т их ом ирова О .А .