~astx wtoraq
matemati~eskaq statistika A SPORILI ONI O ^EM UGODNO, NA^INAQ S PODLINNOSTI sWQ]ENNOGO PISANIQ I KON^AQ WO...
2 downloads
207 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
~astx wtoraq
matemati~eskaq statistika A SPORILI ONI O ^EM UGODNO, NA^INAQ S PODLINNOSTI sWQ]ENNOGO PISANIQ I KON^AQ WOPROSOM, ^TO NA SAMOM DELE ZNA^IT NADPISX \GARANTIROWANO" NA BANKAH S DVEMOM."
\. . .
m@RI\L sPARK, mISS dVIN bRODI W RASCWETE LET (Muriel
Spark, The prime of Miss Jean Brodie)
x1. pROBLEMA STATISTI^ESKOGO WYWODA lEKCIQ 1
tEORIQ WEROQTNOSTEJ SOZDAET BAZU DLQ POSTROENIQ MODELEJ REALXNYH QWLENIJ, W OSNOWE KOTORYH LEVAT SOOTNOENIQ MEVDU ^ASTOTAMI POQWLENIQ OPREDELENNYH SOBYTIJ. rASPOLAGAQ WEROQTNOSTNOJ MODELX@, MY MOVEM RASS^ITATX WEROQTNOSTI (OTNOSITELXNYE ^ASTOTY) \TIH SOBYTIJ I TEM SAMYM OPTIMIZIROWATX SWOE POWEDENIE W USLOWIQH NEOPREDELENNOSTI. mATEMATI^ESKAQ STATISTIKA STROIT MODELI INDUKTIWNOGO POWEDENIQ W \TIH USLOWIQH NA OSNOWE IME@]IHSQ WEROQTNOSTNYH MODELEJ. oSNOWNAQ PROBLEMA SOSTOIT W TOM, ^TOBY PO NABL@DENIQM \LEMENTARNYH ISHODOW (OBY^NO \TO { ZNA^ENIQ NABL@DAEMYH SLU^AJNYH WELI^IN) DATX METOD WYBORA DEJSTWIJ, PRI KOTORYH ^ASTOTA OIBOK BYLA BY NAIMENXEJ. eSTESTWENNO, \TA PROBLEMA SOPRQVENA S REENIEM SLOVNYH ZADA^ NA \KSTREMUM, NO DAVE W TOM SLU^AE, KOGDA \TI ZADA^I NE UDAETSQ REITX, TEORIQ WEROQTNOSTEJ DAET METOD DLQ RAS^ETA SREDNEJ WELI^INY POTERX, KOTORYE MY BUDEM NESTI, ISPOLXZUQ KONKRETNOE, WYBRANNOE NAMI PRAWILO INDUKTIWNOGO POWEDENIQ. tAKIM OBRAZOM, MATEMATI^ESKAQ STATISTIKA ESTX TEORIQ PRINQTIQ OPTIMALXNYH REENIJ, KOGDA POSLEDSTWIQ OT DEJSTWIJ, PREDPRINIMAEMYH NA OSNOWE \TIH REENIJ, NOSQT SLU^AJNYJ HARAKTER. mATEMATI^ESKAQ STATISTIKA ISPOLXZUET METODY TEORII WE-
ROQTNOSTEJ DLQ RAS^ETA ^ASTOTY \NEPRAWILXNYH" REENIJ ILI, BOLEE OB]O, DLQ WELI^INY SREDNIH POTERX, KOTORYE NEIZBEVNO WOZNIKA@T W USLOWIQH SLU^AJNOSTI, KAK BY MY NI PYTALISX OPTIMIZIROWATX SWOE POWEDENIE W \TIH USLOWIQH. pRIWEDEM DWA PRIMERA, ILL@STRIRU@]IH ZADA^I MATEMATI^ESKOJ STATISTIKI I, OT^ASTI, METODY IH REENIQ, S TEM ^TOBY W POSLEDU@]EM FORMALIZOWATX OB]U@ PROBLEMU STATISTI^ESKOGO WYWODA. p R I M E R 1.1. oPREDELENIE OB]EGO SODERVANIQ SERY W DIZELXNOM TOPLIWE. mY SNOWA OBRA]AEMSQ K PRIMERU 7.2 IZ KURSA TEORII WEROQTNOSTEJ, GDE RE^X LA O WAVNOJ W \KOLOGI^ESKOM OTNOENII HARAKTERISTIKE DIZELXNOGO TOPLIWA { PROCENTNOM SODERVANII \LEMENTARNOJ SERY, KOTORAQ PRI SVIGANII I POSLEDU@]EM SOEDINENII S WODOJ DAET SERNU@ KISLOTU. nEOBHODIMOSTX ISPOLXZOWANIQ METODOW TEORII WEROQTNOSTEJ PRI ATTESTACII DIZELXNOGO TOPLIWA PO \TOJ HARAKTE163
RISTIKE BYLA WYZWANA ZNA^ITELXNYMI RASHOVDENIQMI MEVDU REZULXTATAMI x1 : : : xn PARALLELXNYH I NEZAWISIMYH ISPYTANIJ n PROB IZ PARTII DIZELXNOGO TOPLIWA. eSLI DAVE ISKL@^ITX OIBKI \KSPERIMENTA, SWQZANNYE S NEPRAWILXNYM OPREDELENIEM WESA PROBY I TITROWANIEM, TO WSE RAWNO RAZBROS W PARALLELXNYH ISPYTANIQH BUDET ZNA^ITELXNYM W SILU SLU^AJNOGO HARAKTERA PROCESSA SVIGANIQ PROBY TOPLIWA I WYPADENIQ ^ASTI \LEMENTARNOJ SERY W ZOLU. nO W TAKOM SLU^AE WOZNIKAET ESTESTWENNYJ WOPROS, ^TO VE MY IZMERQEM I ^TO VE \TO ZA HARAKTERISTIKA DIZELXNOGO TOPLIWA, KOTORU@ MY NAZWALI \OB]IM SODERVANIEM SERY"? w PRAKTIKE LABORATORNYH ISPYTANIJ OBY^NO GOWORQT O SREDNEM ZNA^ENII \TOJ HARAKTERISTIKI , I DIZELXX n NOE TOPLIWO ATTESTUETSQ WELI^INOJ x = n;1 1 xk { ARIFMETI^ESKIM SREDNIM REZULXTATOW PARALLELXNYH ISPYTANIJ. |TO I ESTX TO \INDUKTIWNOE POWEDENIE" STATISTIKA W USLOWIQH SLU^AJNOSTI, O KOTOROM MY GOWORILI W NA^ALE LEKCII, I OPRAWDANIE RAZUMNOSTI TAKOGO POWEDENIQ ESTESTWENNO ISKATX W RAMKAH ZAKONA BOLXIH ^ISEL. dEJSTWITELXNO, W PRIMERE 7.2 MY INTERPRETIROWALI REZULXTAT x OPREDELENIQ OB]EGO SODERVANIQ SERY W ODNOJ PROBE KAK REZULXTAT NABL@DENIQ SLU^AJNOJ WELI^INY X RASPREDELENNOJ PO NORMALXNOMU ZAKONU SO SREDNIM I DISPERSIEJ 2 PRI^EM ZNA^ENIE (NEIZWESTNOE \KSPERIMENTATORU) PARAMETRA QWLQLOSX MATEMATI^ESKIM WYRAVENIEM TOJ, NE SOWSEM PONQTNOJ DLQ NAS HARAKTERISTIKI ISPYTUEMOGO TOPLIWA, KOTORAQ NAZYWALASX \OB]IM SODERVANIEM SERY". w RAMKAH \TOJ WEROQTNOSTNOJ MODELI ESTESTWENNO TRAKTOWATX REZULXTATY x1 : : : xn PARALLELXNYH ISPYTANIJ n PROB DIZELXNOGO TOPLIWA KAK NABL@DENIQ n NEZAWISIMYH KOPIJ X1 : : : Xn SLU^AJNOJ WELI^INY X: tERMIN \KOPIQ" W DANNOM SLU^AE UPOTREBLQETSQ DLQ OBOZNA^ENIQ TOGO FAKTA, ^TO KAVDAQ IZ NABL@DAEMYH SLU^AJNYH WELI^IN IMEET TO VE RASPREDELENIE, ^TO I X: tAKIM OBRAZOM, POSTULIRUETSQ, ^TO X1 : : : Xn NEZAWISIMY I ODINAKOWO RASPREDELENY N ( 2) TAK ^TO W SILU ZAKONA BOLXIH ^ISEL PRI NEOGRANI^ENNOM WOZRASTANII OB_EMA ISPYTANIJ n n 1 X : X = n Xk ! P k=1 iTAK, ZAKON BOLXIH ^ISEL GARANTIRUET NAM, ^TO PRI DOSTATO^NO BOLXOM OB_EME ISPYTANIJ MY BUDEM BLIZKI K ISTINNOMU ZNA^ENI@ ISSLEDUEMOJ HARAKTERISTIKI TOPLIWA. oDNAKO NA PRAKTIKE W ZAWOD164
SKIH LABORATORIQH OBY^NO SVIGA@TSQ WSEGO DWE PROBY TOPLIWA, I TOLXKO W ISKL@^ITELXNYH SLU^AQH PRI POWERKE PRIBOROW ILI TESTIROWANII LABORANTOW DELAETSQ ^ETYRE ISPYTANIQ. eSTESTWENNO, PRI n = 2 GOWORITX O ZAKONE \BOLXIH" ^ISEL PROSTO SMENO,{ SLEDUET ISKATX NEKOTORU@ KOLI^ESTWENNU@ HARAKTERISTIKU POSLEDSTWIJ OT NETO^NOJ ATTESTACII PARTII DIZELXNOGO TOPLIWA. lEGKO PONQTX, ^TO W OSNOWU TAKOJ HARAKTERISTIKI SLEDUET POLOVITX OIBKU j X ; j W OCENKE PARAMETRA NO, K SOVALENI@, ZNA^ENIE NAM NEIZWESTNO, A X ESTX SLU^AJNAQ WELI^INA, ^TO OKON^ATELXNO DELAET PROBLEMU PROGNOZA OVIDAEMYH OIBOK PRI ATTESTACII KONKRETNOJ PARTII TOPLIWA NERAZREIMOJ. zDESX NABL@DAETSQ TA VE SITUACIQ, ^TO I PRI POPYTKE PREDSKAZATX STORONU MONETY, KOTORAQ WYPADET PRI EE PODBRASYWANII. tO^NYJ PROGNOZ NEWOZMOVEN, NO METODY TEORII WEROQTNOSTEJ POZWOLQ@T NAM RASS^ITATX, KAK ^ASTO MY BUDEM OIBATXSQ W PROGNOZE PRI DOSTATO^NO DLITELXNOJ IGRE W ORLQNKU. sLEDOWATELXNO, MY DOLVNY REITX ZADA^U O WY^ISLENII WEROQTNOSTI TOGO, ^TO OIBKA W OCENKE BUDET SLIKOM BOLXOJ { PREWOSHODITX NEKOTORU@ PREDPISANNU@ WELI^INU : |TA WEROQTNOSTX P (j X ; j > ) OBY^NO NAZYWAETSQ RISKOM OCENKI X A WEROQTNOSTX P (j X ; j ) PROTIWOPOLOVNOGO SOBYTIQ { NADEVNOSTX@ \TOJ OCENKI. tAKIM OBRAZOM, RISK OCENKI UKAZYWAET ^ASTOTU TEH PARTIJ DIZELXNOGO TOPLIWA, W PASPORTE KOTORYH OB]EE SODERVANIE SERY UKAZANO S NEDOPUSTIMO BOLXOJ OIBKOJ. zNAQ RISK OCENKI, MY MOVEM WY^ISLITX SREDNIE ZATRATY NA WYPLATU REKLAMACIJ PO ISKAM POTREBITELEJ DIZELXNOGO TOPLIWA. wYWESTI FORMULU DLQ WY^ISLENIQ RISKA NE PREDSTAWLQET OSOBOGO TRUDA, ESLI OBRATITXSQ K TEOREME SLOVENIQ DLQ NORMALXNOGO RASPREDELENIQ (PREDLOVENIE 12.2 KURSA tw). wYBORO^NOE SREDNEE X ESTX NORMIROWANNAQ NA n SUMMA NEZAWISIMYH ODINAKOWO RASPREDELENNYH N ( 2) SLU^AJNYH WELI^IN. w SILU TEOREMY SLOVENIQ \TA SUMMA IMEET TAKVE NORMALXNOE RASPREDELENIE, SREDNEE ZNA^ENIE KOTOROGO RAWNO SUMME SREDNIH n A DISPERSIQ RAWNA SUMME DISPERSIJ n2: pRI UMNOVENII NA 1=n SREDNEE UMNOVAETSQ NA TU VE WELI^INU, A DISPERSIQ UMNOVAETSQ NA EE KWADRAT. tAKIM OBRAZOM, X N ( 2=n) NADEVNOSTX OCENKI p p p P (; X ; ) = ( n=) ; (; n=) = 2( n=) ; 1 165
NAPOMNIM, (;x) = 1 ; (x)), A EE RISK p P j X ; j > = 2 1 ; ( n=) : pRI WY^ISLENII RISKA OCENKI NEOBHODIMO ZNATX WELI^INU STANDARTNOGO OTKLONENIQ : nO ZNA^ENIE O^EWIDNO, OSTAETSQ POSTOQNNYM PRI ATTESTACII RAZLI^NYH PARTIJ { \TO PARAMETR, HARAKTERIZU@]IJ TO^NOSTX METODA HIMI^ESKOGO ANALIZA TOPLIWA, I NE IMEET OTNOENIQ K EGO HIMI^ESKOMU SOSTAWU. eSTESTWENNO, ZA DOSTATO^NO KOROTKIJ SROK W LABORATORIQH NAKAPLIWAETSQ BOLXOJ ARHIWNYJ MATERIAL DANNYH ISPYTANIJ RAZLI^NYH PARTIJ TOPLIWA, ^TO POZWOLQET OCENITX ZNA^ENIE S DOSTATO^NO WYSOKOJ TO^NOSTX@. s TEM, KAK \TO DELAETSQ, MY POZNAKOMIMSQ W ODNOJ IZ BLIVAJIH LEKCIJ. iSPOLXZUQ FORMULU RISKA, MY MOVEM OPREDELITX MINIMALXNYJ OB_EM ISPYTANIJ n GARANTIRU@]IJ PREDPISANNU@, DOSTATO^NO MALU@ WELI^INU RISKA. dEJSTWITELXNO, ESLI { ZADANNOE OGRANI^ENIE p NA RISK OCENKI, TO RAZREAQ NERAWENSTWO 2(( n=) ; 1) OTNOSITELXNO PEREMENNOJ n POLU^AEM, ^TO TREBUEMYJ OB_EM ISPYTANIJ OPREDELQETSQ NERAWENSTWOM 0 ;1 12 (1 ; =2) A : n@ (
p R I M E R 1.2. wYQWLENIE \FFEKTA LE^ENIQ. gRUPPA PACIENTOW W KOLI^ESTWE 10 ^ELOWEK, OBLADA@]IH SHOVIMI ANTROPOMETRI^ESKIMI I ANTROPOLOGI^ESKIMI HARAKTERISTIKAMI, PODWERGAETSQ LE^ENI@ PO NEKOTOROJ NOWOJ METODIKE, PODTWERVDENIE ILI OPROWERVENIE \FFEKTIWNOSTI KOTOROJ SOSTAWLQET PREDMET STATISTI^ESKOGO ISSLEDOWANIQ. pOSLE LE^ENIQ DAETSQ TOLXKO KA^ESTWENNOE ZAKL@^ENIE O SOSTOQNII ZDOROWXQ KAVDOGO PACIENTA, TAK ^TO REZULXTAT ISPYTANIQ NOWOJ METODIKI MOVNO PREDSTAWITX W WIDE POSLEDOWATELXNOSTI x1 : : : x10 KOMPONENTY KOTOROJ PRINIMA@T ZNA^ENIQ 1 (POLOVITELXNYJ ISHOD LE^ENIQ) ILI 0 (OTRICATELXNYJ ISHOD). pREDLAGAETSQ SLEDU@]EE STATISTI^ESKOE PRAWILO: NOWAQ METODIKA OB_QWLQETSQ \FFEKTIWNOJ, ESLI xi = 1 DLQ WSEH i = 1 : : : 10 TO ESTX WSE PACIENTY WYZDOROWELI. eSLI VE LE^ENIE HOTQ BY ODNOGO PACIENTA NE PRIWELO K POLOVITELXNOMU ISHODU, NOWAQ METODIKA NE REKOMENDUETSQ K DALXNEJEMU KLINI^ESKOMU ISPOLXZOWANI@. ~TO MOVNO SKA166
ZATX O NADEVNOSTI ILI, KAK GOWORQT MEDIKI, \DOSTOWERNOSTI" TAKOGO PRAWILA INDUKTIWNOGO POWEDENIQ? ~TOBY OTWETITX NA \TOT WOPROS, MY DOLVNY POSTROITX WEROQTNOSTNU@ MODELX PROWODIMYH NABL@DENIJ. eSTESTWENNO PREDPOLAGATX, ^TO W SILU \ODNORODNOSTI" GRUPPY PACIENTOW ONI OBLADA@T ODINAKOWOJ WEROQTNOSTX@ p POLOVITELXNOGO ISHODA LE^ENIQ, I ESLI W PROCESSE LE^ENIQ ONI NE IMELI WOZMOVNOSTI IZLINE TESNOGO OB]ENIQ, TO ISHODY LE^ENIJ MOVNO PREDSTAWITX W WIDE REALIZACII DESQTI NEZAWISIMYH BINARNYH SLU^AJNYH WELI^IN X1 : : : X10 KAVDAQ IZ KOTORYH PRINIMAET ZNA^ENIE 1 S WEROQTNOSTX@ p I ZNA^ENIE 0 S WEROQTNOSTX@ 1;p: tAKIM OBRAZOM, MY PRILI K MODELI ISPYTANIJ W SHEME bERNULLI S WEROQTNOSTX@ p USPENOGO ISHODA. wEROQTNOSTX TOGO, ^TO WSE 10 ISHODOW BYLI USPENYMI RAWNA p10 I ZADAWAQ RAZLI^NYE ZNA^ENIQ p MY MOVEM SUDITX O TOM, KAK ^ASTO WOZMOVNY RAZLI^NYE REZULXTATY APROBACII NOWOGO METODA LE^ENIQ. pREDPOLOVIM SNA^ALA, ^TO NOWAQ METODIKA NE\FFEKTIWNA. pRI TAKOM PREDPOLOVENII ZNA^ENIE p NE DOLVNO PREWOSHODITX WELI^INY 1/2, I MAKSIMALXNOE ZNA^ENIE WEROQTNOSTI SOBYTIQ X1 = 1 : : : X10 = 1 RAWNO 2;10 = 1=1024 < 0 001: |TO O^ENX REDKOE SOBYTIE, I PO\TOMU PREDPOLOVENIE O NE\FFEKTIWNOSTI NOWOJ METODIKI DOLVNO BYTX OTWERGNUTO. pRI \TOM WEROQTNOSTX 2;10 MOVNO INTERPRETIROWATX KAK RISK WNEDRENIQ W MEDICINSKU@ PRAKTIKU NE\FFEKTIWNOGO METODA LE^ENIQ: ISPOLXZUQ PREDLOVENNOE PRAWILO WYBORA MEVDU DWUMQ DEJ-
STWIQMI (WNEDRENIE ILI OTKLONENIE METODIKI) PRI ISPYTANIQH POSLEDU@]IH METODIK, MY RISKUEM W SREDNEM NE BOLEE ^EM ODIN RAZ IZ TYSQ^I WNEDRITX NE\FFEKTIWNYJ METOD LE^ENIQ.
iNTERESNO ZAMETITX, ^TO W PREDPOLOVENII \NEJTRALXNOSTI" NOWOGO METODA (p = 1=2) WEROQTNOSTX L@BOGO ISHODA X1 = x1 : : : X10 = x10 ODINAKOWA I RAWNA 2;10 NO ISHOD X1 = 1 : : : X10 = 1 OBLADAET NAIBOLXEJ WEROQTNOSTX@ PRINQTIQ DEJSTWITELXNO \FFEKTIWNOJ METODIKI, IBO X 10 X 10 x n ; k 1 xk p 10 p 1 (1 ; p) ESLI p > 1=2: sTOLX VE PROSTO PROWERITX, ^TO REZULXTATY ISPYTANIJ, W KOTORYH LE^ENIE TOLXKO ODNOGO PACIENTA OKON^ILOSX NEUDA^EJ, IME@T WEROQTNOSTX p 9(1 ; p) I TAKIE 10 REZULXTATOW x1 : : : x10 S ODNIM xi = 0 I DRUGIMI xj = 1 OBLADA@T BOLXEJ WEROQTNOSTX@, ^EM 167
ISHODY S DWUMQ I BOLEE KOLI^ESTWOM NEUDA^, ESLI W DEJSTWITELXNOSTI p > 1=2: |TO ZAME^ANIE POZWOLQET NAM OPREDELITX STATISTI^ESKOE PRAWILO, OBLADA@]EE NAIBOLXEJ WEROQTNOSTX@ PRINQTIQ W DEJSTWITELXNOSTI \FFEKTIWNOJ METODIKI, NO NE S TAKIM MALYM RISKOM, KAK 2;10: dELO W TOM, ^TO W MEDICINSKOJ PRAKTIKE USTANOWILASX OPREDELENNAQ GRANICA RISKA, RAWNAQ 0.05, I WSE SOBYTIQ, OBLADA@]IE MENXEJ WEROQTNOSTX@, OB_QWLQ@TSQ \REDKIMI" { IMI MOVNO PRENEBRE^X. w SWQZI S \TIM POZWOLIM SEBE WKL@^ITX W OBLASTX PRINQTIQ NOWOJ METODIKI DOPOLNITELXNYE ISHODY S ROWNO ODNIM NEUSPEHOM, I WY^ISLIM RISK TAKOGO STATISTI^ESKOGO PRAWILA PRI p = 1=2: iSPOLXZUQ IZWESTNYE NAM FORMULY BINOMIALXNYH WEROQTNOSTEJ, NAHODIM, ^TO 0 10 1 P @X Xk 9A = p10 + C 110 p 9(1 ; p) 1 I PRI p = 1=2 \TA WEROQTNOSTX RAWNA 2;10(1 + 10) = 11=1024 0 01 ^TO PO-PREVNEMU DOSTATO^NO MALO PO SRAWNENI@ S 0.05. sLEDOWATELXNO, MY MOVEM WKL@^ITX W OBLASTX PRINQTIQ NOWOJ METODIKI E]E C 210 REZULXTATOW ISPYTANIJ, W KOTORYH PRISUTSTWU@T ROWNO DWE NEUDA^I. rISK TAKOWOGO STATISTI^ESKOGO PRAWILA STANOWITSQ RAWNYM 0 10 1 P @X Xk 8A = p10 + C 110 p 9(1 ; p) + C 210 p 8(1 ; p)2 1 I PRI p = 1=2 \TA WEROQTNOSTX RAWNA 2;10(1+10+45) = 56=1024 0:05: |TO KAK RAZ SOOTWETSTWUET PRINQTOJ W MEDICINE NORME RISKA STATISTI^ESKOGO PRAWILA. iTAK, MY REKOMENDUEM NOWU@ METODIKU K DALXNEJEMU ISPOLXZOWANI@ W KLINIKE, ESLI LE^ENIE NE BOLEE ^EM DWUH PACIENTOW IZ DESQTI OKAZALOSX NEUDA^NYM, I PRIMENENIE TAKOGO PRAWILA W ISPYTANIQH DALXNEJIH METODIK MOVET PRIWESTI K PRINQTI@ NE\FFEKTIWNOGO METODA LE^ENIQ W SREDNEM W PQTI SLU^AQH IZ 100. mY RASSMOTRELI DWE TIPI^NYH ZADA^I MATEMATI^ESKOJ STATISTIKI { OCENKA PARAMETROW I PROWERKA GIPOTEZ. eSTESTWENNO, KRUG PROBLEM MATEMATI^ESKOJ STATISTIKI NAMNOGO IRE, NO PRI NADLEVA]EJ TRAKTOWKE PROBLEM BOLXINSTWO IZ NIH SWODITSQ ILI K ZADA^E OCENKI PARAMETROW, ILI K ZADA^E WYBORA ODNOGO IZ NESKOLXKIH ALXTERNATIWNYH WYSKAZYWANIJ OB ISSLEDUEMOM OB_EKTE. oPIRAQSX NA RASSMOTRENNYE PRIMERY, MY MOVEM TEPERX PREDSTAWITX DOSTATO^NO OB]U@ SHEMU STATISTI^ESKOGO WYWODA. 168
lEKCIQ 2
l@BOE STATISTI^ESKOE ISSLEDOWANIE, PROWODIMOE W RAMKAH MATEMATI^ESKOJ STATISTIKI, NA^INAETSQ S OPISANIQ OB_EKTA ISSLEDOWANIQ I FORMALIZACII PROSTRANSTWA D REENIJ d ODNO IZ KOTORYH STATISTIK PRINIMAET NA OSNOWE NABL@DENIJ NEZAWISIMYH KOPIJ SLU^AJNOJ, WOZMOVNO WEKTORNOJ, WELI^INY X HARAKTERIZU@]EJ SOSTOQNIE OB_EKTA W MOMENT PROWEDENIQ NABL@DENIJ. tAK, W PRIMERE S ATTESTACIEJ PARTII DIZELXNOGO TOPLIWA (OB_EKT ISSLEDOWANIQ) D ESTX INTERWAL (0 100) (NAPOMNIM, OB]EE SODERVANIE SERY IZMERQETSQ W PROCENTAH K WESU PROBY), A W PRIMERE S OPREDELENIEM \FFEKTIWNOSTI NOWOGO METODA LE^ENIQ (OB_EKT ISSLEDOWANIQ) PROSTRANSTWO D SOSTOIT IZ DWUH TO^EK: d0 { REENIE O NE\FFEKTIWNOSTI METODA (PRINQTIE \NULEWOJ" GIPOTEZY) I d1 { REENIE O WNEDRENII NOWOGO METODA W LE^EBNU@ PRAKTIKU (PRINQTIE ALXTERNATIWNOJ GIPOTEZY). nAIBOLEE WAVNOJ I, PO-WIDIMOMU, NAIBOLEE SLOVNOJ ^ASTX@ STATISTI^ESKOGO ISSLEDOWANIQ QWLQETSQ \TAP POSTROENIQ WEROQTNOSTNOJ MODELI, KOTORYJ SOSTOIT W SPECIFIKACII SEMEJSTWA P = fP 2 g WOZMOVNYH RASPREDELENIJ NABL@DAEMOJ SLU^AJNOJ WELI^INY X: |TOT \TAP SWQZAN S DOSTATO^NO GLUBOKIM PRONIKNOWENIEM W PRIRODU ISSLEDUEMOGO OB_EKTA I METODA NABL@DENIJ X { ODNOJ MATEMATIKOJ ZDESX, KAK PRAWILO, NE OBOJDEXSQ. sEMEJSTWO P INDEKSIRUETSQ ABSTRAKTNYM PARAMETROM SOWOKUPNOSTX ZNA^ENIJ KOTOROGO NAZYWAETSQ PARAMETRI^ESKIM PROSTRANSTWOM. w PERWOM PRIMERE MY WYQSNILI, ^TO SEMEJSTWO WOZMOVNYH RASPREDELENIJ X ESTX SEMEJSTWO NORMALXNYH RASPREDELENIJ N ( 2) S DWUMERNYM PARAMETROM = ( ) I PARAMETRI^ESKIM PROSTRANSTWOM = R R+: w DALXNEJEM MY PREDPOLOVILI, ^TO ZNA^ENIE IZWESTNO, I SWELI NAE PARAMETRI^ESKOE PROSTRANSTWO K \WKLIDOWOJ PRQMOJ: = R S = : nAKONEC, POSKOLXKU OB]EE SODERVANIE SERY IZMERQETSQ W PROCENTAH, MY DOLVNY OKON^ATELXNO POLOVITX = (0 100:): wO WTOROM PRIMERE MY IMELI DELO S BINARNOJ SLU^AJNOJ WELI^INOJ X PRINIMA@]EJ ZNA^ENIE 1 S WEROQTNOSTX@ p I ZNA^ENIE 0 S WEROQTNOSTX@ 1 ; p: tAKIM OBRAZOM, WEROQTNOSTNAQ MODELX PREDSTAWLQLASX SEMEJSTWOM DWUHTO^E^NYH RASPREDELENIJ B(1 p) S = p I PARAMETRI^ESKIM PROSTRANSTWOM = (0 1): 169
sLEDU@]IJ \TAP STATISTI^ESKOGO ISSLEDOWANIQ SOSTOIT W INTERPRETACII REENIJ d W TERMINAH WYSKAZYWANIJ O SOOTWETSTWU@]IH \TOMU REENI@ ZNA^ENIQH PARAMETRA : |TO NEOBHODIMO SDELATX, ESLI MY POSTAWILI SEBE ZADA^U KOLI^ESTWENNOGO IZMERENIQ POSLEDSTWIJ OT PRINQTIQ NEWERNYH REENIJ, { W NAIH PRIMERAH RISK ISPOLXZUEMYH PRAWIL PREDSTAWLQL SOBOJ FUNKCI@ OT : nETRUDNO PONQTX, ^TO W PERWOM PRIMERE D = A WO WTOROM PRIMERE REENI@ d0 O NE\FFEKTIWNOSTI METODA SOOTWETSTWUET PODMNOVESTWO PARAMETRI^ESKOGO PROcTRANSTWA (0 1=2 ] A ALXTERNATIWNOMU REENI@ d1 OB ISPOLXZOWANII NOWOJ METODIKI SOOTWETSTWUET INTERWAL (1=2 1) WOZMOVNYH ZNA^ENIJ PARAMETRA = p: iMENNO TAKIM OBRAZOM MY SWODIM KONKRETNYE ZADA^I PO ATTESTACII PARTII DIZELXNOGO TOPLIWA I WYQWLENI@ \FFEKTIWNOSTI NOWOGO METODA LE^ENIQ K ABSTRAKTNYM ZADA^AM MATEMATI^ESKOJ STATISTIKI { OCENKE PARAMETRA (SREDNEGO ZNA^ENIQ) NORMALXNOGO ( 2) RASPREDELENIQ I, SOOTWETSTWENNO, RAZLI^ENI@ DWUH GIPOTEZ H0 : 2 (0 1=2 ] I H1 : 2 (1=2 1) O WELI^INE WEROQTNOSTI USPENOGO ISPYTANIQ W SHEME bERNULLI. pARAMETRI^ESKAQ INTERPRETACIQ REENIJ POZWOLQET STATISTIKU ZADATX POTERI L( d) KOTORYE ON NESET OT PRINQTIQ REENIQ d KOGDA PREDSTAWLQET ISTINNOE ZNA^ENIE PARAMETRA. sREDNEE ZNA^ENIE \TIH POTERX W DLINNOM RQDU ODNOTIPNYH STATISTI^ESKIH ISSLEDOWANIJ S ODNIM I TEM VE PRAWILOM PRINQTIQ REENIQ OPREDELQET WELI^INU RISKA, SWQZANNU@ S PRINQTIEM NEPRAWILXNYH REENIJ. tAK, W NAIH PRIMERAH RISK OPREDELQLSQ WEROQTNOSTX@ PRINQTIQ REENIQ, OTSTOQ]EGO DOSTATO^NO DALEKO OT TOGO REENIQ, KOTOROE SOOTWESTWOWALO ISTINNOMU ZNA^ENI@ PARAMETRA, I, SLEDOWATELXNO, FUNKCIQ POTERX OPREDELQLASX INDIKATOROM NEKOTOROGO PODMNOVESTWA W D: |TO TAK NAZYWAEMYE FUNKCII POTERX TIPA 0{1. w PERWOM PRIMERE L( d) = 1 ESLI j d; j > I L( d) = 0 W PROTIWNOM SLU^AE. wO WTOROM PRIMERE L( d) = 1 ESLI PRINIMALOSX REENIE d1 A 2 (0 1=2 ] ILI PRINIMALOSX d0 A 2 (1=2 1) W OSTALXNYH TO^KAH PROIZWEDENIQ PROSTRANSTW D POTERI L( d) POLAGALISX RAWNYMI NUL@. oTMETIM, ^TO W ZADA^E OCENKI PARAMETROW DOWOLXNO ^ASTO ISPOLXZUETSQ KWADRATI^NAQ FUNKCIQ POTERX L( d) = j d ; j2: kAVDOE IZ REENIJ d STATISTIK PRINIMAET NA OSNOWE REZULXTATA x(n) = x1 : : : xn NABL@DENIJ NAD NEZAWISIMYMI KOPIQMI X (n) = (X1 : : : Xn ) SLU^AJNOJ WELI^INY X: sTROITSQ IZMERIMOE OTOBRAVE170
NIE = ( ) PROSTRANSTWA WOZMOVNYH ZNA^ENIJ X (n) W PROSTRANSTWO REENIJ D S POMO]X@ KOTOROGO PRINIMAETSQ REENIE d = (x(n)): |TO OTOBRAVENIE NAZYWAETSQ REA@]EJ FUNKCIEJ ILI STATISTI^ESKIM PRAWILOM. tAK, W PERWOM PRIMERE (X (n) ) = X A WO WTOROM 8 Xn > d < 0 ESLI 1 Xk < 8 (n)
(X ) = > X : d1 ESLI n1 Xk 8 : pOSLEDSTWIQ OT ISPOLXZOWANIQ KONKRETNOJ REA@]EJ FUNKCII W DLINNOM RQDU ODNOTIPNYH STATISTI^ESKIH ISSLEDOWANIJ OPREDELQ@TSQ WELI^INOJ SREDNIH POTERX R( ) = E L( (X (n))) KOTORAQ ZAWISIT OT FUNKCIQ R( ) 2 NAZYWAETSQ FUNKCIEJ RISKA. oSNOWNAQ PROBLEMA MATEMATI^ESKOJ STATISTIKI SOSTOIT W POSTROENII REA@]IH FUNKCIJ , MINIMIZIRU@]IH RAWNOMERNO PO FUNKCI@ RISKA R( ): mY BUDEM REATX \TU PROBLEMU DLQ ZADA^
2
OCENKI PARAMETROW I PROWERKI GIPOTEZ. eSTESTWENNO, BUDUT TAKVE IZU^ATXSQ TRADICIONNYE, WOZMOVNO NE OBLADA@]IE OPTIMALXNYMI SWOJSTWAMI, STATISTI^ESKIE PRAWILA, I W \TOM SLU^AE NAEJ OSNOWNOJ ZADA^EJ BUDET WY^ISLENIE IH FUNKCIJ RISKA. pREDSTAWLENNAQ WYE SHEMA STATISTI^ESKOGO WYWODA WESXMA DALEKA OT OB]NOSTI. bOLXINSTWO STATISTI^ESKIH ZADA^ IMEET DELO S NABL@DENIQMI ODNOWREMENNO ZA NESKOLXKIMI OB_EKTAMI, NAPRIMER, NOWYJ METOD LE^ENIQ PRIMENQETSQ K ODNOJ GRUPPE PACIENTOW, W TO WREMQ KAK DRUGAQ PODWERGAETSQ LE^ENI@ TRADICIONNYM METODOM, I PO DANNYM NABL@DENIJ KOPIJ DWUH SLU^AJNYH WELI^IN DELAETSQ WYWOD O PREDPO^TITELXNOSTI NOWOGO METODA. eSLI MY HOTIM SOKRATITX ^ISLO NABL@DENIJ, NEOBHODIMOE DLQ DOSTIVENIQ ZADANNOJ (MALOJ) WELI^INY RISKA, TO CELESOOBRAZNO NE FIKSIROWATX ZARANEE n A PLANIROWATX PREKRA]ENIE ISPYTANIJ POSLE NABL@DENIQ KAVDOJ KOPII W ZAWISIMOSTI OT POLU^ENNYH RANEE REZULXTATOW. sU]ESTWUET BOLXOJ KLASS ZADA^ UPRAWLENIQ NABL@DENIQMI { OPTIMALXNOGO WYBORA SLU^AJNOJ WELI^INY, NABL@DAEMOJ NA KAVDOM AGE STATISTI^ESKOGO \KSPERIMENTA, A TAKVE PRAWILA PREKRA]ENIQ NABL@DENIJ. wSE \TO DALEKO WYHODIT ZA RAMKI TEH \KRATKIH NA^ATKOW" TEORII STATISTI^ESKIH WYWODOW, KOTORYE BUDUT PREDSTAWLENY W NAEM SEMESTROWOM KURSE. mY ZAWERIM \TOT PARAGRAF NABOROM PROSTEJIH OPREDELENIJ I PONQTIJ, KOTORYE POSTOQNNO ISPOLXZU@TSQ W MATEMATI^ESKOJ STATISTIKE. 171
iTAK, S ISSLEDUEMYM OB_EKTOM, OTNOSITELXNO KOTOROGO MY DOLVNY PRINQTX NEKOTOROE REENIE d 2 D SOOTNOSITSQ NABL@DAEMAQ SLU^AJNAQ WELI^INA X RASPREDELENIE KOTOROJ P IZWESTNO S TO^NOSTX@ DO ZNA^ENIQ PARAMETRA : sEMEJSTWO RASPREDELENIJ P = fP 2 g KAK OBY^NO, NAZYWAETSQ WEROQTNOSTNOJ MODELX@. pUSTX (X A) { IZMERIMOE PROSTRANSTWO ZNA^ENIJ X: w DALXNEJEM BUDET WSEGDA PREDPOLAGATXSQ, ^TO NA SIGMA-ALGEBRE A SU]ESTWUET TAKAQ SIGMA-KONE^NAQ MERA ^TO PRI L@BOM 2 RASPREDELENIE X MOVNO PREDSTAWITX W WIDE INTEGRALA Z P (A) = P(X 2 A) = A f (x j ) d(x) A 2 A OT PLOTNOSTI f (x j ) RASPREDELENIQ X PO MERE : w TAKOM SLU^AE RASPREDELENIE NEZAWISIMYH KOPIJ X (n) = (X1 : : : Xn) SLU^AJNOJ WELI^INY X NA PROIZWEDENII (Xn An) IZMERIMYH PROSTRANSTW (X A) OPREDELQETSQ FUNKCIEJ PLOTNOSTI n fn(x(n) j ) = Y f (xk j )
PO MERE n = | {z } TO ESTX n
P n(An) = P(X
(n)
2 An
)=
Z
k=1
f (x An n
(n)
j dn x n )
(
( )
)
An 2 An:
wEKTOR X (n) = (X1 : : : Xn) NEZAWISIMYH, ODINAKOWO RASPREDELENNYH PO TOMU VE ZAKONU, ^TO I NABL@DAEMAQ SLU^AJNAQ WELI^INA X SLU^AJNYH WELI^IN NAZYWAETSQ SLU^AJNOJ WYBORKOJ OB_EMA n: iZMERIMOE PROSTRANSTWO (Xn An ) ZNA^ENIJ X (n) NAZYWAETSQ WYBORO^NYM PROSTRANSTWOM, A SEMEJSTWO RASPREDELENIJ Pn = fP n 2 g NA \TOM PROSTRANSTWE { STATISTI^ESKOJ STRUKTUROJ (n) ILI STATISTI^ESKIM \KSPERIMENTOM. wEKTOR x = (x1 : : : xn) REZULXTATOW NABL@DENIQ SLU^AJNOJ WYBORKI X (n) NAZYWAETSQ WEKTOROM oPREDELENIE 1.1.
(ILI
SOWOKUPNOSTX@) WYBORO^NYH DANNYH.
zNAQ RASPREDELENIE WYBORKI, MY MOVEM WY^ISLQTX RISK L@BOGO STATISTI^ESKOGO PRAWILA S POMO]X@ n-KRATNOGO INTEGRALA Z Z R( ) = : : : L( (x(n)))fn(x(n) j ) dn(x(n) ): X
X
172
kONE^NO, ESLI UDASTSQ NAJTI RASPREDELENIE G REA@]EJ FUNKCII NA IZMERIMOM PROSTRANSTWE REENIJ (D D) TO WY^ISLENIE RISKA UPRO]AETSQ: Z R( ) = D L( a) dG(a): tAK, W PERWOM PRIMERE S WYBORKOJ IZ NORMALXNOGO ( 2) RASPREDELENIQ REA@]EJ FUNKCIEJ SLUVILO WYBORO^NOE SREDNEE X: bYLO POKAZANO, ^TO X IMEET NORMALXNOE ( 2) RASPREDELENIE, I IMENNO \TO OBSTOQTELXSTWO POZWOLILO NAM NAJTI PROSTOE WYRAVENIE RISKA STATISTI^ESKOGO PRAWILA ^EREZ FUNKCI@ RASPREDELENIQ STANDARTNOGO NORMALXNOGO ZAKONA. tO^NO TAK VE WO WTOROM PRIMERE S WYBOROM IZ DWUHTO^E^NOGO RASPREDELENIQXB(1 p) REA@]AQ FUNKCIQ BYLA OSn NOWANA NA SLU^AJNOJ WELI^INE 1 Xk KOTORAQ IMEET RASPREDELENIE bERNULLI B(n p): rISK NAEGO REA@]EGO PRAWILA PO WYQWLENI@ \FFEKTIWNOSTI METODA LE^ENIQ WYRAVALSQ ^EREZ FUNKCI@ RASPREDELENIQ B(n p): zAMETIM, ^TO FUNKCII OT WYBORO^NOGO WEKTORA X (n) IGRA@T WAVNU@, MOVNO DAVE SKAZATX SAMOSTOQTELXNU@, ROLX W MATEMATI^ESKOJ STATISTIKE. oPREDELENIE 1.2. l@BOE IZMERIMOE OTOBRAVENIE T = T (X (n)) WYBORO^NOGO PROSTRANSTWA (Xn An) W NEKOTOROE IZMERIMOE PROSTRANSTWO (T B) NAZYWAETSQ STATISTIKOJ. sU]ESTWUET DOWOLXNO USTOQWIJSQ UNIWERSALXNYJ NABOR STATISTIK, POSTOQNNO ISPOLXZUEMYH W TEORII I PRAKTIKE STATISTI^ESKOGO WYWODA RASPREDELENIQ \TIH STATISTIK INTENSIWNO IZU^ALISX NA PROTQVENII POSLEDNIH DWUH STOLETIJ. w SLEDU@]EM PARAGRAFE MY POZNAKOMIMSQ S NABOROM STATISTIK, KOTORYE QWLQ@TSQ WYBORO^NYMI ANALOGAMI STANDARTNYH HARAKTERISTIK RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY, A TAKVE RASSMOTRIM STATISTIKI, REDUCIRU@]IE RAZMERNOSTX WYBORO^NOGO WEKTORA DO RAZMERNOSTI PARAMETRI^ESKOGO PROSTRANSTWA BEZ POTERI INFORMACII.
173
x2. wYBORO^NYE HARAKTERISTIKI. dOSTATO^NYE STATISTIKI
lEKCIQ 3
pOSTROENIE WEROQTNOSTNYH MODELEJ W KURSE TEORII WEROQTNOSTEJ OSU]ESTWLQLOSX POSREDSTWOM SPECIFIKACII FUNKCII RASPREDELENIQ ILI FUNKCII PLOTNOSTI NABL@DAEMOJ SLU^AJNOJ WELI^INY X: l@BAQ IZ \TIH FUNKCIJ ODNOZNA^NO OPREDELQET RASPREDELENIE X NA SIGMAALGEBRE A BORELEWSKIH MNOVESTW, POROVDENNOJ INTERWALAMI W PROSTRANSTWE X = R WOZMOVNYH ZNA^ENIJ X I S IH POMO]X@ WY^ISLQLISX TAKIE HARAKTERISTIKI RASPREDELENIQ, KAK SREDNEE, DISPERSIQ, KO\FFICIENTY ASIMMETRII I \KSCESSA, KWANTILI, MODA I PR. w PRIKLADNOJ STATISTIKE SU]ESTWUET TRADICIQ, ILI, MOVNO SKAZATX, OBQZATELXNOE PRAWILO, PREDSTAWLQTX POLU^ENNYE \KSPERIMENTALXNYE DANNYE S POMO]X@ STATISTIK { WYBORO^NYH ANALOGOW \TIH FUNKCIJ I HARAKTERISTIK RASPREDELENIQ X: wYBORO^NYE HARAKTERISTIKI QWLQ@TSQ OCENKAMI ISTINNYH ZNA^ENIJ SWOIH PROOBRAZOW I POZWOLQ@T SUDITX W OB]IH ^ERTAH O HARAKTERE RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY. tAKAQ \OPISATELXNAQ" STATISTIKA OBY^NO NA^INAETSQ S POSTROENIQ WARIACIONNOGO RQDA: WYBORO^NYE DANNYE x1 : : : xn UPORQDO^IWA@TSQ PO WOZRASTANI@ IH ZNA^ENIJ x(1) : : : x(n) I POLU^ENNYJ TAKIM OBRAZOM WEKTOR S NEUBYWA@]IMI KOMPONENTAMI SLUVIT REALIZACIEJ SLU^AJNOGO WEKTORA X(1) : : : X(n) KOTORYJ, SOBSTWENNO, I SLEDUET NAZYWATX WARIACIONNYM RQDOM. kOMPONENTY WARIACIONNOGO RQDA NAZYWA@TSQ PORQDKOWYMI STATISTIKAMI, A X(1) I X(n) { KRAJNIMI ^LENAMI WARIACIONNOGO RQDA. mY UVE STALKIWALISX S PORQDKOWYMI STATISTIKAMI, KOGDA IZU^ALI STRUKTURU PUASSONOWSKOGO PROCESSA I STROILI WEROQTNOSTNU@ MODELX \SLABOGO ZWENA" (RASPREDELENIE wEJBULLA). uPORQDO^ENNYE DANNYE NANOSQTSQ NA OSX ABSCISS, I STROITSQ STUPEN^ATAQ FUNKCIQ, WOZRASTA@]AQ SKA^KAMI WELI^INY 1=n W KAVDOJ TO^KE x(1) : : : x(n): pOSTROENNAQ TAKIM OBRAZOM DISKRETNAQ FUNKCIQ RASPREDELENIQ QWLQETSQ REALIZACIEJ SLU^AJNOJ FUNKCII n X 1 Fn(x) = n I(Xk < x) k=1 174
(I(A) KAK OBY^NO, INDIKATOR SOBYTIQ A) I NAZYWAETSQ \MPIRI^ESKOJ FUNKCIEJ RASPREDELENIQ.
1
x(1)
x(6) x(2) x(4) x(5) x(3) tAKIM OBRAZOM, DISKRETNOE \MPIRI^ESKOE RASPREDELENIE PRIPISYWAET RAWNYE WEROQTNOSTI 1=n KAVDOJ IZ n KOMPONENT WYBORO^NOGO WEKTORA, I PRI KAVDOM FIKSIROWANNOM x 2 R SLU^AJNAQ WELI^INA nFn(x) POD^INQETSQ BINOMIALXNOMU RASPREDELENI@ B(n F (x)) : P (Fn(x) = k=n) = Ckn F k (x)(1 ; F (x))n;k k = 0 1 : : : n: w SILU ZAKONA BOLXIH ^ISEL bERNULLI Fn ! F (x) PRI L@BOM x 2 P R: bOLEE TOGO, TEOREMA gLIWENKO{kANTELLI, UTWERVDENIE KOTOROJ Dn = sup j Fn(x) ; F (x) j ! 0 P x2R
MY PRIWODIM BEZ DOKAZATELXSTWA, UKAZYWAET NA RAWNOMERNOSTX \TOJ SHODIMOSTI NA WSEJ ^ISLOWOJ OSI R: mY ZAKON^IM OBSUVDENIE SWOJSTW \MPIRI^ESKOJ FUNKCII RASPREDELENIQ FORMULIROWKOJ IROKO IZWESTNOGO REZULXTATA a.n. kOLMOGOROWA: + p X1 lim P ( nD < x) = (;1)k e;k x : n!1
2 2
n
k=;1
pOLU^ENNAQ IM FORMULA DLQ ASIMPTOTI^ESKOGO (n ! 1) RASPREDEp LENIQ STATISTIKI nDn HARAKTERIZU@]EJ WELI^INU RASHOVDENIQ MEVDU TEORETI^ESKIM F I \MPIRI^ESKIM Fn RASPREDELENIQMI, ISPOLXZUETSQ DLQ POSTROENIQ KRITERIQ SOGLASIQ WYBORO^NYH DANNYH S PREDPOLOVENIEM, ^TO F QWLQETSQ ISTINNOJ FUNKCIEJ RASPREDELENIQ, IZ KOTOROGO IZWLEKAETSQ WYBORKA (GIPOTEZOJ O TOM, ^TO F ESTX FUNKCIQ RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY X ). 175
iTAK, MY USTANOWILI, ^TO \MPIRI^ESKOE RASPREDELENIE SHODITSQ PO WEROQTNOSTI K ISTINNOMU (ILI, KAK OBY^NO GOWORQT PRIKLADNIKI, TEORETI^ESKOMU) RASPREDELENI@, I TEPERX MOVEM OBRATITXSQ K WY^ISLENI@ MOMENTNYH I KWANTILXNYH HARAKTERISTIK RASPREDELENIQ Fn: eGO NECENTRALXNYE Z k n X ak = x dFn(x) = n1 Xik i=1 R I CENTRALXNYE Z n X 1 k mk = (x ; a1) dFn(x) = n (Xi ; a1)k i=1
R
MOMENTY SLUVAT WYBORO^NYMI ANALOGAMI SOOTWETSTWU@]IH TEORETI^ESKIH MOMENTOW k k = 1 2 : : : I k k = 2 3 : : : I NAZYWA@TSQ WYBORO^NYMI MOMENTAMI.
eSLI TEORETI^ESKIE MOMENTY SU]ESTWU@T, TO W SILU ZAKONA BOLXIH ^ISEL WYBORO^NYE MOMENTY SHODQTSQ PO WEROQTNOSTI K SWOIM TEORETI^ESKIM PROOBRAZAM. sREDI WYBORO^NYH MOMENTOW OSOBOE MESTO ZANIMA@T MOMENTY PERWOGO I WTOROGO PORQDKOW. wYBORO^NYJ MOMENT a1 NAZYWAETSQ WYBORO^NYM SREDNIM I IMEET 2SPECIALXNOE OBOZNA^ENIE X WYBORO^NAQ DISPERSIQ m2 = a2 ; X OBY^NO OBOZNA^AETSQ S 2: sOOTWETSTWU@]IM OBRAZOM OPREDELQ@TSQ WYBORO^NYJ KO\FFICIENT ASIMMETRII g1 = m3 =S 3 I WYBORO^NYJ KO\FFICIENT \KSCESSA g2 = m4=S 4 ; 3: pRI WYBORE IZ m-MERNOGO, m > 1 RASPREDELENIQ \MPIRI^ESKOE RASPREDELENIE TAKVE PRIPISYWAET MASSU n;1 KAVDOMU WYBORO^NOMU (WEKTORNOMU) ZNA^ENI@ Xk = (Xk1 : : : Xkm) k = 1 : : : n: w SOOTWETSTWII S \TIM MY MOVEM OPREDELITX WEKTOR WYBORO^NYH SREDNIH X = (X 1 : : : X m) S KOMPONENTAMI n X X k = n1 Xki k = 1 : : : m
i=1 WYBORO^NU@ KOWARIACIONNU@ MATRICU S = k Skj k S \LEMENTAMI n n X X Skj = n1 (Xki ; X k )(Xji ; X j ) = n1 XkiXji ; X k X j k j = 1 : : : m i=1 i=1 I MATRICU WYBORO^NYH q KO\FFICIENTOW KORRELQCII R = k rkj k S \LEMENTAMI rkj = Skj = Skk Sjj k j = 1 : : : m: sMEANNYE MOMENTY BO-
LEE WYSOKIH PORQDKOW W MNOGOMERNOM SLU^AE OBY^NO NE WY^ISLQ@TSQ. 176
eSLI WYBOR PROISHODIT IZ RASPREDELENIQ, DLQ KOTOROGO SPRAWEDLIWA TEOREMA SLOVENIQ (PREDLOVENIE 12.2 KURSA tw), TO RASPREDELENIE WYBORO^NOGO SREDNEGO USTANAWLIWAETSQ DOSTATO^NO PROSTO. w OB]EM VE SLU^AE MOVNO TOLXKO UTWERVDATX OB ASIMPTOTI^ESKOJ (n ! 1) NORMALXNOSTI \TOJ STATISTIKI PRI USLOWII SU]ESTWOWANIQ WTOROGO MOMENTA U TEORETI^ESKOGO RASPREDELENIQ. aNALOGI^NOE UTWERVDENIE SPRAWEDLIWO I DLQ MOMENTOW L@BOGO k-GO PORQDKA, ESLI U F (x) SU]ESTWUET MOMENT PORQDKA 2k: oBRATIMSQ TEPERX K WYBORO^NYM ANALOGAM KWANTILEJ RASPREDELENIQ F NABL@DAEMOJ SLU^AJNOJ WELI^INY X: nAPOMNIM, ^TO DLQ NEPRERYWNOGO RASPREDELENIQ KWANTILX PORQDKA p OPREDELQLASX KAK REENIE xp URAWNENIQ F (x) = p A W SLU^AE DISKRETNOGO RASPREDELENIQ { KAK NAIBOLXEE x = xp IZ NOSITELQ RASPREDELENIQ, PRI KOTOROM F (xp) p: pOSKOLXKU \MPIRI^ESKOE RASPREDELENIE DISKRETNO, I EGO FUNKCIQ RASPREDELENIQ Fn() WOZRASTAET SKA^KAMI W TO^KAH, SOOTWETSTWU@]IH KOMPONENTAM WARIACIONNOGO RQDA, TO WYBORO^NAQ KWANTILX PORQDKA p POLAGAETSQ RAWNOJ PORQDKOWOJ STATISTIKE X( np ]) GDE x ] KAK OBY^NO, OZNA^AET CELU@ ^ASTX x: eSTESTWENNO, DLQ POWYENIQ TO^NOSTI OCENKI ISTINNOJ KWANTILI xp MOVNO PROWODITX INTERPOLQCI@ MEVDU STATISTIKAMI X( np ]) I X( np ]+1): tAK, WYBORO^NAQ MEDIANA PORQDKA p = 0:5 OBY^NO OPREDELQETSQ , BUDU^I KWANTILX@ KAK X( n=2 ]) + X( n=2 ]+1) =2: ~TO VE KASAETSQ OCENKI MODY RASPREDELENIQ { TO^KI NAIBOLXEGO SGU]ENIQ WYBORO^NYH DANNYH, TO ZDESX NAM PRIDETSQ OBRATITXSQ K WYBORO^NYM ANALOGAM FUNKCII PLOTNOSTI. pRI BOLXIH OB_EMAH NABL@DENIJ WYBORO^NYE DANNYE OBY^NO PODWERGA@TSQ GRUPPIROWKE, PRI \TOM INDIWIDUALXNYE WYBORO^NYE ZNA^ENIQ NE PRIWODQTSQ, A UKAZYWA@TSQ LIX KOLI^ESTWA NABL@DENIJ, POPAWIH W INTERWALY NEKOTOROGO RAZBIENIQ MNOVESTWA X ZNA^ENIJ NABL@DAEMOJ SLU^AJNOJ WELI^INY. pOQSNIM PROCEDURU GRUPPIROWKI NA PRIMERE WYBORKI IZ NEPRERYWNOGO ODNOMERNOGO RASPREDELENIQ, KOGDA X = R: w DEKARTOWOJ SISTEME KOORDINAT OSX ABSCISS RAZBIWAETSQ NA r 2 INTERWALOW (;1 a1] (a1 a2] : : : (ar;2 ar;1] (ar;1 +1) PRI^EM KONE^NYE INTERWALY WYBIRA@TSQ, KAK PRAWILO, ODINAKOWOJ DLINY: ai ; ai;1 = i = 2 : : : r ; 1: wYBORO^NYE DANNYE SORTIRU@TSQ PO INTERWALAM RAZBIENIQ I PODS^ITYWA@TSQ ^ASTOTY ni i = 1 : : : r POPA177
DANIQ DANNYH W KAVDYJ INTERWAL. nAD KAVDYM WNUTRENNIM INTERWALOM RISUETSQ PRQMOUGOLXNIK WYSOTY ni=n TAK ^TO PLO]ADX ni=n KAVDOGO PRQMOUGOLXNIKA S NOMEROM i = 2 : : : r ; 1 SLUVIT REALIZACIEJ ^ASTOTNOJ OCENKI i=n WEROQTNOSTI POPADANIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY X W SOOTWETSTWU@]IJ INTERWAL. zDESX i { STATISTIKA, KOTORU@ MOVNO ZAPISATX S POMO]X@ INDIKATOROW SOBYTIJ Aij = fXj 2 (aX i;1 ai ]g i = 1 : : : r a0 = ;1 ar = +1 j = 1 : : : n A IMENNO i = nj=1 I(Aij ). pOLU^ENNAQ TAKIM OBRAZOM SLU^AJNAQ STUPEN^ATAQ FUNKCIQ, PRINIMA@]AQ NULEWYE ZNA^ENIQ NA KRAJNIH INTERWALAH (;1 a1] (ar;1 +1) I RAWNAQ i=n NA WNUTRENNIH INTERWALAH S NOMERAMI i = 2 : : : r ; 1 NAZYWAETSQ GISTOGRAMMNOJ OCENKOJ fn FUNKCII PLOTNOSTI f (x) x 2 R RASPREDELENIQ X A EE REALIZACIQ (i ZAMENQ@TSQ NA NABL@DAEMYE ^ASTOTY ni i = 1 : : : r) { GISTOGRAMMOJ WYBORKI x(n) : 43 25 4
-2.5 -1.5 -0.5
23 5 0.5
1.5
2.5
w MATEMATI^ESKOJ STATISTIKE SU]ESTWUET RQD TEOREM, USTANAWLIWA@]IH, ^TO PRI OPREDELENNYH USLOWIQH NA PLOTNOSTX f GISTOGRAMMNAQ OCENKA fn(x) !P f (x) PRI L@BOM x 2 R ESLI n ! 1 I ODNOWREMENNO r ! 1 A ! 0 SO SKOROSTX@, ZAWISQ]EJ OPREDELENNYM OBRAZOM OT n I r: w SLU^AE GISTOGRAMMNOJ OCENKI FUNKCII PLOTNOSTI ESTESTWENNO S^ITATX WYBORO^NYM ANALOGOM (OCENKOJ) MODY RASPREDELENIQ X SEREDINU INTERWALA RAZBIENIQ, W KOTOROM GISTOGRAMMA PRINIMAET NAIBOLXEE ZNA^ENIE. zAMETIM TAKVE, ^TO WEKTOR ^ASTOT (1 : : : r ) IMEET MULXTINOMIALXNOE RASPREDELENIE M(r n p) S WEROQTNOSTQMI ISHODOW pi = F (ai) ; F (ai;1) i = 1 : : : r ^TO POZWOLQET NAJTI RASPREDELENIE OCENKI fn(x) PRI L@BOM x 2 R I POSTROITX KRITERIJ SOGLASIQ WYBO178
RO^NYH DANNYH S GIPOTEZOJ O WIDE RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY. |TO IROKO ISPOLXZUEMYJ NA PRAKTIKE KRITERIJ HI-KWADRAT, OSNOWANNYJ NA STATISTIKE (SRAWNITE S KRITERIEM kOLMOGOROWA Dn) 2 r X X 2 = (i ;npnpi) : i 1 aSIMPTOTI^ESKOE RASPREDELENIE \TOJ STATISTIKI MY IZU^IM W PARAGRAFE, POSWQ]ENNOM STATISTI^ESKOJ PROWERKE GIPOTEZ. iTAK, MY RASSMOTRELI OSNOWNYE WYBORO^NYE ANALOGI RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY I EGO OSNOWNYH HARAKTERISTIK. mY WYSKAZALI TAKVE RQD UTWERVDENIJ O RASPREDELENII \TIH STATISTIK, ^TO POZWOLIT NAM W POSLEDU@]EM WY^ISLQTX POSLEDSTWIQ OT IH ISPOLXZOWANIQ W KA^ESTWE REA@]IH FUNKCIJ. dLQ TOGO, ^TOBY UQSNITX, NASKOLXKO WAVNO ZNATX HOTQ BY SREDNEE ZNA^ENIE STATISTIKI, PRETENDU@]EJ NA ROLX REA@]EJ FUNKCII, OBRATIMSQ SNOWA K PRIMERU 1.1 PO ATTESTACII PARTII DIZELXNOGO TOPLIWA, GDE OBSUVDALASX SOPUTSTWU@]AQ PROBLEMA OCENKI DISPERSII 2 NABL@DAEMOJ SLU^AJNOJ WELI^INY X N ( 2): pREDLAGALOSX OCENIWATX 2 PO NAKOPLENNOMU W LABORATORII ARHIWU ISPYTANIJ ATTESTUEMYH PARTIJ DIZELXNOGO TOPLIWA, TO ESTX PO (n) (n) DANNYM BOLXOGO ^ISLA N WYBOROK X1 : : : XN MALOGO OB_EMA n: kAVDAQ i-AQ WYBORKA IZWLEKAETSQ IZ NORMALXNOGO (i 2) RASPREDELENIQ, PRI^EM SREDNIE i MOGUT BYTX RAZLI^NYMI DLQ RAZNYH WYBOROK, i = 1 : : : N NO DISPERSIQ 2 U WSEH WYBOROK ODNA I TA VE. pREDLAGAETSQ SLEDU@]AQ OCENKA 2: w KAVDOJ WYBORKE WY^ISLQETSQ WYBORO^NAQ DISPERSIQ Si2 i =X1 : : : N I ZATEM BERETSQ IH ARIFMETI^ESKOE SREDNEE: ^N2 = (1=N ) N1 Si2: rASPREDELENIE KAVDOJ Si2 NE ZAWISIT OT i i = 1 : : : N POSKOLXKU WYBORO^NAQ DISPERSIQ INWARIANTNA OTNOSITELXNO SDWIGOW Xk ! Xk + a: sLEDOWATELXNO, PREDLAGAEMAQ OCENKA ESTX NORMIROWANNAQ NA N SUMMA NEZAWISIMYH, ODINAKOWO X RASPREDELENNYH 2 SLU^AJNYH WELI^IN { KOPIJ STATISTIKI S = (1=n) n1 (Xk ; X )2 I W SILU ZAKONA BOLXIH ^ISEL ^N2 ! ES 2 PRI NEOGRANI^ENNOM WOZRASP TANII OB_EMA N ARHIWNYH DANNYH. wY^ISLIM \TO MATEMATI^ESKOE OVIDANIE: 0 n 1 X 1 2 ; 2 = n ; 1 2 2 2 2 2 2 2 A ES 2 = E @ X X = + ; X ; = E X ; E n1 k n n 179
POSKOLXKU 2 = EX 2 = DX + E2X A X N ( 2=n): tAKIM OBRAZOM, PREDLAGAEMAQ OCENKA OBLADAET ZNA^ITELXNYM SME]ENIEM PRI MALOM OB_EME n ISPYTANIJ KAVDOJ PARTII DIZELXNOGO TOPLIWA. nAPRIMER, W SLU^AE n = 2 MY ZANIVAEM DISPERSI@ W DWA 2 RAZA, POSKOLXKU ^N2 ! =2: eSTESTWENNO, \TOT DEFEKT LEGKO USTRAP NIM { DOSTATO^NO ISPOLXZOWATX ISPRAWLENNU@ NA SME]ENIE OCENKU ~N2 = (n=(n ; 1))^ N2 : lEKCIQ 4
w ZAWERENII \TOGO PARAGRAFA MY IZU^IM E]E ODIN KLASS ZAME^ATELXNYH STATISTIK, ISPOLXZUQ KOTORYE MOVNO REDUCIROWATX WYBORO^NYE DANNYE TOLXKO K IH ZNA^ENIQM BEZ POTERI INFORMACII. k SOVALENI@, NE WSE STATISTI^ESKIE STRUKTURY OBLADA@T TAKIMI STATISTIKAMI, NO, PO SU]ESTWU, TOLXKO W TEH STRUKTURAH, GDE IME@TSQ DOSTATO^NYE STATISTIKI, WOZMOVNO POSTROENIE OPTIMALXNOGO STATISTI^ESKOGO PRAWILA, NA KOTOROM DOSTIGAETSQ MINIMUM RISKA. iDEQ, SOSTOQ]AQ W TOM, ^TO W OPREDELENNYH SLU^AQH DLQ PRINQTIQ REENIQ BEZ UWELI^ENIQ RISKA DOSTATO^NO ZNATX TOLXKO ZNA^ENIQ NEKOTORYH STATISTIK, A NE WSE WYBORO^NYE DANNYE, NE TREBUET WWEDENIQ SPECIALXNYH MER INFORMACII, SODERVA]EJSQ W WYBORO^NYH DANNYH I STATISTIKAH, { WSE STANOWITSQ QSNYM PRI RASSMOTRENII SLEDU@]EJ PROSTEJEJ ZADA^I, S KOTOROJ MY IMELI DELO W SAMOM NA^ALE KURSA TEORII WEROQTNOSTEJ. pREDPOLOVIM, ^TO MY HOTIM UZNATX WEROQTNOSTX NASLEDOWANIQ DOMINANTNOGO PRIZNAKA W OPYTAH mENDELQ I RASPOLAGAEM REZULXTATAMI x1 : : : xn SKRE]IWANIJ n PAR, GDE, KAK OBY^NO, KAVDOE xi ESTX INDIKATOR NASLEDOWANIQ PRIZNAKA, i = 1 : : : n A SOWOKUPNOSTX WYBORO^NYH DANNYH PREDSTAWLQET REALIZACI@ SLU^AJNOJ WYBORKI X1 : : : Xn IZ DWUHTO^E^NOGO RASPREDELENIQ S FUNKCIEJ PLOTNOSTI f (x j ) = P (X = x) = x(1 ; )1;x OTLI^NOJ OT NULQ TOLXKO W TO^KAH x = 0 I 1. ~ASTOTNAQ OCENKA ^n = T=n WEROQTNOSTI
NASLEDOWANIQ PRIZNAKA X OPRE Xn n DELQETSQ STATISTIKOJ T = 1 Xk WYBORO^NOE ZNA^ENIE t = 1 xk KOTOROJ SOOTWETSTWUET ^ISLU POTOMKOW W \KSPERIMENTE, NASLEDOWAWIH DOMINANTNYJ PRIZNAK. eSTESTWENNO, WOZNIKAET WOPROS, A NELXZQ LI IZWLE^X DOPOLNITELXNU@ INFORMACI@ O WELI^INE PARAMETRA IZ NOMEROW k1 : : : kt WYBORO^NYH DANNYH, PRINQWIH ZNA^ENIE 1? nETRUDNO PONQTX, ^TO \TO WOZMOVNO TOLXKO W TOM SLU^AE, ESLI RASPRE180
DELENIE WYBORO^NOGO WEKTORA X (n) PRI USLOWII, ^TO STATISTIKA T PRINQLA FIKSIROWANNOE ZNA^ENIE t ZAWISIT OT PARAMETRA : dEJST-
WITELXNO, ESLI MY BUDEM NABL@DATX SLU^AJNU@ WELI^INU, KOTORAQ NE IMEET NIKAKOGO OTNOENIQ K INTERESU@]EMU NAS PARAMETRU, TO OTKUDA \TOJ INFORMACII WZQTXSQ? iTAK, NAJDEM USLOWNOE RASPREDELENIE X (n) OTNOSITELXNO T: iSPOLXZUQ FORMULU USLOWNOJ WEROQTNOSTI, POLU^AEM, ^TO (n) Xn (n) V (n) P f X = x g f X = t g k 1 Xn P X = x(n) j T = t = : P 1 Xk = t Xn (n) eSLI ZNA^ENIQ KOMPONENT WEKTORA x TAKOWY , ^TO 6 t TO SO1 xk = Xn (n) (n) BYTIQ X = x I 1 Xk = t O^EWIDNO, NESOWMESTNY, I PO\TOMU W \TOMXSLU^AE USLOWNAQ WEROQTNOSTX RAWNA NUL@ (NE ZAWISIT XnOT ). eSLI n (n) (n) VE 1 xk = t TO SOBYTIE X = x WLE^ET SOBYTIE 1 Xk = t I FORMULA DLQ WY^ISLENIQ USLOWNOJ WEROQTNOSTI UPRO]AETSQ: (n) (n) (n) P X = x P X = x(n) j T = t = P Xn X = t : k 1 tAK KAK Xn Xn (n) x n ; (n) (n) k 1 1 xk P X = x = fn(X j ) =
(1 ; ) Xn P 1 Xk = t = Cnt t(1 ; )n;t TO W SLU^AE Xn1 xk = t USLOWNOE RASPREDELENIE WYBORO^NOGO WEKTORA X (n) OTNOSITELXNO STATISTIKI T IMEET WID
P X (n) = x(n) j T = t = C1t n I TAKVE NE ZAWISIT OT : iTAK, NAI WYKLADKI POKAZYWA@T , ^TO RASPREDELENIE WYBORO^NOXn GO WEKTORA NA \PLOSKOSTI" 1 Xk = t NE ZAWISIT OT I PO\TOMU RASPOLOVENIE ZNA^ENIJ xk = 1 W POSLEDOWATELXNOSTI x1 : : : xn PRI FIKSIROWANNOM KOLI^ESTWE TAKIH ZNA^ENIJ NE NESET INFORMACII O PARAMETRE : oPREDELENIE 2.1. sTATISTIKA T = T (X (n) ) NAZYWAETSQ DOSTATO^NOJ DLQ STATISTI^ESKOJ STRUKTURY P n = fP n 2 g ESLI 181
USLOWNOE RASPREDELENIE WYBORO^NOGO WEKTORA X (n) OTNOSITELXNO STATISTIKI T NE ZAWISIT OT : w OB]EJ TEORII STATISTI^ESKOGO WYWODA W RAMKAH BOLEE OB]EGO OPREDELENIQ STATISTI^ESKOGO PRAWILA USTANAWLIWAETSQ ZAME^ATELXNYJ FAKT: ESLI STATISTI^ESKAQ STRUKTURA OBLADAET DOSTATO^NOJ STATISTIKOJ T TO, KAKOWO BY NI BYLO STATISTI^ESKOE PRAWILO = (X (n) ) WSEGDA SU]ESTWUET PRAWILO = (T ) OSNOWANNOE TOLXKO NA T RISK KOTOROGO SOWPADAET S RISKOM PRAWILA : tAKIM OBRAZOM, POSTROENIE OPTIMALXNYH STATISTI^ESKIH PRAWIL SLEDUET NA^INATX S POISKA DOSTATO^NYH STATISTIK. sLEDU@]AQ TEOREMA DAET KRITERIJ SU]ESTWOWANIQ U STATISTI^ESKIH STRUKTUR DOSTATO^NYH STATISTIK I, ODNOWREMENNO, UKAZYWAET PROSTOJ SPOSOB IH NAHOVDENIQ. tEOREMA 2.1. dLQ TOGO, ^TOBY
T = T (X (n))
BYLA DOSTATO^NOJ STATISTIKOJ DLQ STATISTI^ESKOJ STRUKTURY, OPREDELQEMOJ FUNKCIEJ PLOTNOSTI fn(x(n) j ) NEOBHODIMO I DOSTATO^NO,^TOBY \TA FUNKCIQ DOPUSKALA PREDSTAWLENIE
fn(x(n) j ) = g T (x(n)) h(x(n)) (1) GDE FUNKCIQ h NE ZAWISIT OT PARAMETRA A FUNKCIQ g ZAWISIT OT I ARGUMENTA x(n) TOLXKO ^EREZ ZNA^ENIQ T (x(n) ) STATISTIKI T = T (X (n) )
d O K A Z A T E L X S T W O. TEOREMY MY PROWEDEM TOLXKO DLQ DISKRETNOGO RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ (nWELI^INY , KOGDA FUNK(n) ) (n) CIQ PLOTNOSTI WYBORKI fn(x j ) = P X = x : w SLU^AE NEPRERYWNOGO RASPREDELENIQ SHEMA DOKAZATELXSTWA TA VE, NO PRIDETSQ DELATX ZAMENU W n-KRATNOM INTEGRALE. dOSTATO^NOSTX. pUSTX WYPOLNQETSQ FAKTORIZACIONNOE PREDSTAWLENIE (1) TREBUETSQ POKAZATX, ^TO USLOWNOE RASPREDELENIE X (n) OTNOSITELXNO T NE ZAWISIT OT : kAK I W TOLXKO ^TO RASSMOTRENNOM PRIMERE S DWUHTO^E^NYM RASPREDELENIEM, WOSPOLXZUEMSQ FORMULOJ USLOWNOJ WEROQTNOSTI DLQ WY^ISLENIQ USLOWNOJ PLOTNOSTI X (n) OTNOSITELXNO T: (n) (n) V (n) (n) P f X = x g f T ( X ) = t g P X = x(n) j T (X (n)) = t = : P (T (X (n)) = t) 182
sOBYTIQ, STOQ]IE W ^ISLITELE, BUDUT NESOWMESTNYMI, ESLI T (x(n)) 6= t I W \TOM SLU^AE USLOWNAQ WEROQTNOSTX RAWNA NUL@ (NE ZAWISIT OT ). eSLI VE T (x(n)) = t TO PERWOE PO PORQDKU SOBYTIE W ^ISLITELE WLE^ET WTOROE, I PO\TOMU FORMULA DLQ WY^ISLENIQ USLOWNOJ WEROQTNOSTI UPRO]AETSQ: (n) (n) (n) P X = x P X = x(n) j T (X (n)) = t = P (T (X (n)) = t) : tAK KAK P (X (n) = x(n)) = fn(x(n) j ) TO ISPOLXZUQ PREDSTAWLENIE (1), POLU^AEM, ^TO (NAPOMNIM, T (x(n)) = t) P X (n) = x(n) j T (X (n)) = t = (n) (n) (n) h ( x ) g (T (x )h(x ) = : X X g (T (y(n))h(y(n)) h(y(n)) y(n) : T (y(n))=t
y(n) : T (y(n))=t
tAKIM OBRAZOM, USLOWNOE RASPREDELENIE NE ZAWISIT OT I PO\TOMU STATISTIKA T DOSTATO^NA DLQ P n: nEOBHODIMOSTX. pUSTX STATISTIKA , TAK ^TO USLOW (nT) { DOSTATO^NAQ (n) (n) NOE RASPREDELENIE P X = x j T (X ) = t = K (x(n) t) GDE FUNKCIQ K NE ZAWISIT OT : tREBUETSQ POKAZATX, ^TO W \TOM SLU^AE DLQ FUNKCII PLOTNOSTI WYBORKI SPRAWEDLIWO PREDSTAWLENIE (1). iMEEM fn(x(n) j ) = P X (n) = x(n) = ^ P fX (n) = x(n)g fT (X (n)) = T (x(n))g = P (T (X (n) ) = T (x(n))) P X (n) = x(n) j T (X (n)) = T (x(n)) : mY POLU^ILI PREDSTAWLENIE (1) S g (T (x(n))) = P (T (X (n)) = T (x(n))) I h(x(n)) = K (x(n) T (x(n))): tEOREMA DOKAZANA. rASSMOTRIM NESKOLXKO PRIMEROW NA PRIMENENIQ POLU^ENNOGO KRITERIQ DOSTATO^NOSTI K STATISTI^ESKIM STRUKTURAM, SOOTWETSTWU@]IM WEROQTNOSTNYM MODELQM IZ NAEGO KURSA TEORII WEROQTNOSTEJ. nA^NEM S DWUHTO^E^NOGO RASPREDELENIQ (WYBOR W SHEME bERNULLI), GDE MY NEPOSREDSTWENNYMI WY^ISLENIQMI USLOWNOGO RASPREDELENIQ UBEDILISX W DOSTATO^NOSTI STATISTIKI, REALIZU@]EJ ^ISLO USPENYH ISPYTANIJ, { POSMOTRIM, KAK \TO DELAETSQ S POMO]X@ PREDSTAWLENIQ (1).
183
10: dWUHTO^E^NOE RASPREDELENIE B(1 ) IMEET FUNKCI@ PLOTNOSTI f (x j ) = x(1 ; )1;x OTLI^NU@ OT NULQ TOLXKO W TO^KAH x = 0 I 1. pARAMETRI^ESKOE PROSTRANSTWO \TOGO RASPREDELENIQ = (0 1) A FUNKCIQ PLOTNOSTI SLU-
^AJNOJ WYBORKI
Xn 1
xk (1 ; ) n;
Xn
1 xk : fn(x j ) =
pREDSTAWLENIE (1)XnWYPOLNQETSQ S h(x(n) ) 1 I T (x(n)) = Xn1 xk : sLEDOWATELXNO, T = 1 Xk { DOSTATO^NAQ STATISTIKA. 20: rASPREDELENIE pUASSONA P( ), DLQ KOTOROGO x ; f (x j ) = xe! x = 0 1 : : : = R+ FUNKCIQ PLOTNOSTI WYBORKI Xn Y (n) fn(x j ) = 1 xk e;n = n xk !: (n)
1
sLEDOWATELXNO, W PREDSTAWLENII (1) hY i h(x(n)) = n1 xk ! ;1 I T = Xn1 Xk { DOSTATO^NAQ STATISTIKA. 30: pOKAZATELXNOE RASPREDELENIE E( ) S ( x) 1 f (x j ) = exp ; x 0 = R+ I 8 9 n = < X 1 1 fn(x(n) j ) = n exp :; xk 1 tAKVE OBLADAET DOSTATO^NOJ STATISTIKOJ T = Xn1 Xk : 40: rAWNOMERNOE RASPREDELENIE U(a b), FUNKCIQ PLOTNOSTI KOTOROGO f (x j ) = I ba;b ](ax) OTLI^NA OT NULQ I POSTOQNNA NA OTREZKE a b ] NA ^TO UKAZYWAET STOQ]AQ W ^ISLITELE INDIKATORNAQ FUNKCIQ OTREZKA a b ]: w \TOM 184
RASPREDELENII = (a b) { DWUMERNYJ PARAMETR I PARAMETRI^ESKOE PROSTRANSTWO = f(a b) : (a b) 2 R2 a < bg: sTATISTI^ESKAQ STRUKTURA OPREDELQETSQ FUNKCIEJ PLOTNOSTI Yn (n) fn(x j ) = 1(bI ;a ba])(nxk ) I POSKOLXKU PROIZWEDENIE INDIKATOROW, STOQ]EE W ^ISLITELE \TOJ FUNKCII, PRINIMAET ZNA^ENIE 1 W SLU^AE a 1min x 1max x b kn k kn k
I ZNA^ENIE 0 PRI NARUENII \TIH NERAWENSTW, TO WEKTOR T = ( X(1) X(n) ) KRAJNIH ^LENOW WARIACIONNOGO RQDA QWLQETSQ DOSTATO^NOJ STATISTIKOJ. 50: nORMALXNOE RASPREDELENIE N ( 2). |TO RASPREDELENIE OBLADAET DWUMERNYM PARAMETROM = ( ) S OBLASTX@ ZNA^ENIJ (PARAMETRI^ESKIM PROSTRANSTWOM) = R R+: fUNKCII PLOTNOSTI NABL@DAEMOJ SLU^AJNOJ WELI^INY X I SLU^AJNOJ WYBORKI X (n) OPREDELQ@TSQ SOOTWETSTWENNO KAK 8 9 < (x ; )2 = 1 f (x j ) = p exp :; 2 2 2 I 8 9 n < = X 1 1 fn(x(n) j ) = (2 )n=2 n exp :; 2 2 (xk ; )2 = 1 8
19
0
n n = X 1 exp <; 1 @X 2 2A (2 )n=2 n : 2 2 1 xk ; 2 1 xk + n : (n) pOSLEDNEE WYRAVENIE DLQ PLOTNOSTI Xn X POKAZYWAET Xn 2 , ^TO DWUMERNAQ STATISTIKA T = (T1 T2) S T1 = 1 Xk T2 = 1 Xk DOSTATO^NA DLQ STATISTI^ESKOJ STRUKTURY NORMALXNOGO RASPREDELENIQ. kROME TOGO, 2 2 POSKOLXKU T1 = nX I T2 = n(S + X ) TO FAKTORIZACIONNOE RAWENSTWO (1) UKAZYWAET NA DOSTATO^NOSTX STATISTIK X I S 2 KOTORYE IME@T KONKRETNU@ STATISTI^ESKU@ INTERPRETACI@ I PO\TOMU BOLEE UDOBNY DLQ PRAKTI^ESKOGO ISPOLXZOWANIQ. pONQTNO, ^TO \TO ZAME^ANIE NOSIT OB]IJ HARAKTER: L@BYE WZAIMNO ODNOZNA^NYE PREOBRAZOWANIQ
DOSTATO^NOJ STATISTIKI NASLEDU@T SWOJSTWO DOSTATO^NOSTI. 185
oTMETIM TAKVE, ^TO W SLU^AE IZWESTNOGO (FIKSIROWANNOGO) STATISTI^ESKAQ STRUKTURA IMEET PARAMETRI^ESKOE PROSTRANSTWO, SOWPADA@]EE S OBLASTX@ ZNA^ENIJ PARAMETRA I DOSTATO^NOJ STATISTIKOJ BUDET WYBORO^NOE SREDNEE X: aNALOGI^NOE UTWERVDENIE IMEET MESTO DLQ STATISTIKI S 2 PRI FIKSIROWANNOM : 60: gAMMA-RASPREDELENIE G( a) IMEET FUNKCI@ PLOTNOSTI ( x) 1 ; 1 f (x j ) = a;( ) x exp ; a x > 0 = (a ) a > 0 > 0 TAK ^TO FUNKCIQ PLOTNOSTI WYBORO^NOGO WEKTORA 2
3
8
9
;1 n n = < X Y 1 f (x j ) = an;n( ) 4 xk 5 exp :; a1 xk : 1 1 tOVDESTWO UKAZYWAET X(1) Yn , ^TO DOSTATO^NOJ QWLQETSQ DWUMERNAQ STAn TISTIKA 1 Xk 1XXk ILIXBOLEE UDOBNAQ W WY^ISLITELXNOM OTNO n n ENII STATISTIKA 1 Xk 1 ln Xk : dLQ \TOGO RASPREDELENIQ MOVNO SDELATX TO VE ZAME^ANIE, ^TO I DLQ NORMALXNOGO: PERWAQ KOMPONENTA DOSTATO^NOJ STATISTIKI \OTWE^AET" ZA MASTABNYJ PARAMETR a W TO WREMQ KAK WTORAQ SOOTWETSTWUET PARAMETRU FORMY : 70: bINOMIALXNOE RASPREDELENIE B(m p): |TO DISKRETNOE RASPREDELENIE, SOSREDOTO^ENNOE W TO^KAH x = 0 1 : : : m S FUNKCIEJ PLOT-
NOSTI
f (x j ) = Cmx p x(1 ; p)m;x ZAWISQ]EJ OT DWUMERNOGO PARAMETRA = (m p) PERWAQ KOMPONENTA m KOTOROGO MOVET PRINIMATX TOLXKO ZNA^ENIQ IZ MNOVESTWA N = f1 2 : : :g A WTORAQ KOMPONENTA p 2 (0 1): fUNKCIQ PLOTNOSTI WYBORO^NOGO WEKTORA Xn Xn n Y x nm ; (n) x k 1 xk : fn(x j ) = Cm p 1 (1 ; p) k
k=1
pRIMENENIE KRITERIQ (1) POKAZYWAET, ^TO DLQ STATISTI^ESKOJ STRUKTURY S PARAMETRI^ESKIM PROSTRANSTWOM = N (0 1) DOSTATO^NOJ (n) STATISTIKOJ MOVET BYTX TOLXKO WESX WYBORO^NYJ WEKTOR Xn X NO ESLI = (0 1) (ZNA^ENIE PARAMETRA m IZWESTNO), TO 1 Xk { DOSTATO^NAQ STATISTIKA. 186
80: rASPREDELENIE
RO^NOGO WEKTORA
kOI
C(a b) IMEET FUNKCI@ PLOTNOSTI WYBO-
0 !21;1 n Y x ; a k A fn(x(n) j ) = ;nb;n @1 +
b I W SILU KRITERIQ (1) EGO STATISTI^ESKAQ STRUKTURA OBLADAET TOLXKO TRIWIALXNOJ DOSTATO^NOJ STATISTIKOJ T = X (n) : mY NE BUDEM WYPISYWATX STATISTI^ESKIE STRUKTURY MNOGOMERNYH RASPREDELENIJ W SILU IH ^REZWY^AJNOJ GROMOZDKOSTI, NO NETRUDNO USTANOWITX PO ANALOGII S RASSMOTRENNYMI PRIMERAMI, ^TO U STRUKTURY MULXTINOMIALXNOGO RASPREDELENIQ M(m 1 p) S m 2 ISHODAMI I WEKTOROM p = (p1 : : : pm) WEROQTNOSTEJ SOOTWETSTWU@]IH ISHODOW DOSTATO^NYM BUDET WEKTOR, SOSTOQ]IJ IZ ^ASTOT \TIH ISHODOW W MULXTINOMIALXNOJ SHEME ISPYTANIJ, A U STRUKTURY MNOGOMERNOGO NORMALXNOGO RASPREDELENIQ Nm( ) DOSTATO^NU@ STATISTIKU OBRAZU@T WEKTOR WYBORO^NYH SREDNIH I WYBORO^NAQ KOWARIACIONNAQ MATRICA. nA \TOM ZAWERAETSQ WWODNAQ ^ASTX NAEGO KURSA MATEMATI^ESKOJ STATISTIKI. mY SDELALI POSTANOWKU PROBLEMY STATISTI^ESKOGO WYWODA, PROWELI KLASSIFIKACI@ OSNOWNYH STATISTI^ESKIH STRUKTUR I TEPERX MY GOTOWY K REENI@ KONKRETNYH STATISTI^ESKIH PROBLEM PO OCENKE PARAMETROW RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY I PROWERKE GIPOTEZ, KASA@]IHSQ STRUKTURY PARAMETRI^ESKOGO PROSTRANSTWA \TOGO RASPREDELENIQ. k=1
187
x3. oCENKA PARAMETROW. mETOD MOMENTOW lEKCIQ 5
mY PRISTUPAEM K REENI@ STATISTI^ESKOJ PROBLEMY OCENKI NEIZWESTNOGO ZNA^ENIQ PARAMETRA INDEKSIRU@]EGO SEMEJSTWO P = fP 2 g WOZMOVNYH RASPREDELENIJ NABL@DAEMOJ SLU^AJNOJ WELI^INY X: bUDUT RASSMATRIWATXSQ TOLXKO KONE^NOMERNYE PARAMETRI^ESKIE PROSTRANSTWA = Rk k 1: iNFORMACIQ O ZNA^ENII POSTUPAET NAM W WIDE WYBORO^NYH DANNYH x n = (x : : : xn) { REZULXTATOW NABL@DENIJ n NEZAWISIMYH KOPIJ X n = (X : : : Xn) SLU^AJNOJ WELI^INY X: nAPOMNIM, SEMEJSTWO P MY NAZWALI WEROQTNOSTNOJ MODELX@, A SLU^AJNYJ WEKTOR X n { SLU^AJNOJ WYBORKOJ OB_EMA n: w \TOJ PROBLEME, O KOTOROJ MY NESKOLXKO RAZ UPOMINALI W PREDYDU]EM PARAGRAFE, PROSTRANSTWO REENIJ D SOWPADAET S PARAMETRI^ESKIM PROSTRANSTWOM REA@]AQ FUNKCIQ = (X n ) { STATISTIKA S OBLASTX@ ZNA^ENIJ T = { NAZYWAETSQ OCENKOJ PARAMETRA I OBY^NO OBOZNA^AETSQ n ^n n I TOMU PODOBNOE. fUNKCII POTERX L( d) W PROBLEME OCENIWANIQ OBY^NO WYBIRA@TSQ W WIDE NEUBYWA@]EJ FUNKCII RASSTOQNIQ j d ; j (W \WKLIDOWOJ METRIKE) MEVDU ZNA^ENIEM OCENKI d = ^n(x n ) I ISTINNYM ZNA^ENIEM OCENIWAEMOGO PARAMETRA. ( )
( )
1
1
( )
( )
( )
oSNOWNAQ ZADA^A STATISTI^ESKOJ TEORII OCENIWANIQ SOSTOIT W POSTROENII OCENKI n = n (X (n) ) MINIMIZIRU@]EJ RAWNOMERNO PO 2 FUNKCI@ RISKA
R( ^n) = E L( ^n(X n )): tAKIM OBRAZOM, KAKOWA BY NI BYLA STATISTI^ESKAQ OCENKA ^n DLQ OCENKI n S RAWNOMERNO MINIMALXNYM RISKOM PRI L@BOM 2 SPRAWEDLIWO NERAWENSTWO R( n ) R( ^n): mY RASSMOTRIM ODNO IZ REENIJ \TOJ ZADA^I W SLU^AE OCENKI SKALQRNOGO PARAMETRA ( = R) PRI KWADRATI^NOJ FUNKCII POTERX L( d) = (d ; ) NO SNA^ALA POZNAKOMIMSQ S TRADICIONNO ISPOLXZUEMYMI W STATISTI^ESKOJ PRAKTIKE METODAMI OCENKI PARAMETROW I IZU^IM RASPREDELENIE \TIH OCENOK S CELX@ WY^ISLENIQ IH FUNKCII RISKA. ( )
2
188
kONE^NO, DALEKO NE WSE ISPOLXZUEMYE NA PRAKTIKE METODY PRIWODQT K OPTIMALXNYM OCENKAM, INOGDA BYWAET TRUDNO NAJTI OCENKU, OBLADA@]U@ HOTX KAKIMI-NIBUDX PRIWLEKATELXNYMI SWOJSTWAMI. pONQTNO, ^TO S^ITATX OCENKOJ L@BOE IZMERIMOE OTOBRAVENIE WYBORO^NOGO PROSTRANSTWA Xn W PARAMETRI^ESKOE PROSTRANSTWO NE SOWSEM RAZUMNO, I PO\TOMU MY WWEDEM NEKOTORYE USLOWIQ, KOTORYM DOLVNA UDOWLETWORQTX STATISTIKA ^n ^TOBY PRETENDOWATX NA ROLX OCENKI. rAZRABATYWAQ W DALXNEJEM METODY OCENIWANIQ I PREDLAGAQ KONKRETNYE OCENKI, MY WSEGDA BUDEM PROWERQTX WYPOLNIMOSTX \TIH USLOWIJ. oPREDELENIE 3.1. oCENKA ^n PARAMETRA NAZYWAETSQ i) SOSTOQTELXNOJ, ESLI ^n(X n ) ! P PRI L@BOM 2 KOGDA OB_EM WYBORKI n ! 1 ii) NESME]ENNOJ W SREDNEM, ESLI E ^n(X n ) = KAKOWO BY NI BYLO ZNA^ENIE 2 : nAPOMNIM, ^TO ^n(X n ) ! OZNA^AET, ^TO DLQ L@BOGO " > 0 P ( )
( )
( )
n ^ lim P ( X ) ; > " = 0 n!1 n ( )
ILI, ^TO TO VE,
(n) ^ lim P (X ) ; " = 1: n!1 n
(1)
zDESX, KAK OBY^NO, ZAPISX j ; j DLQ WEKTORNOGO PARAMETRA OZNA^AET RASSTOQNIE MEVDU TO^KAMI I \WKLIDOWA PROSTRANSTWA : w PREDYDU]EM Xn i PARAGRAFE MY POKAZALI, ^TO WYBORO^NYE MOMENTY ai = (1=n) Xj QWLQ@TSQ SOSTOQTELXNYMI OCENKAMI SOOTWETSTWU@]IH \TEORETI^ESKIH" MOMENTOW i = E X i KOTORYE QWLQ@TSQ FUNKCIQMI OCENIWAEMOGO PARAMETRA: i = i() i = 1 2 : : : : |TOT REZULXTAT UKAZYWAET NAM DOWOLXNO PROSTOJ METOD POSTROENIQ SOSTOQTELXNYH OCENOK W SLU^AE SU]ESTWOWANIQ U RASPREDELENIQ P NABL@DAEMOJ SLU^AJNOJ WELI^INY X MOMENTA PORQDKA k GDE k { ^ISLO KOMPONENT : : : k OCENIWAEMOGO PARAMETRI^ESKOGO WEKTORA : 1
2
1
1
1
189
2
pRIRAWNQEM TEORETI^ESKIE MOMENTY WYBORO^NYM I RAZREIM POLU^ENNU@ TAKIM OBRAZOM SISTEMU URAWNENIJ i( : : : k ) = ai i = 1 : : : k OTNOSITELXNO PEREMENNYH : : : k : l@BOE REENIE ^n(a) = (^ n(a) : : : ^kn(a)) a = (a : : : an ) \TOJ SISTEMY NAZYWAETSQ OCENKOJ PO METODU MOMENTOW, I PREVDE, ^EM ISSLEDOWATX SWOJSTWA TAKIH OCENOK, RASSMOTRIM NESKOLXKO PRIMEROW NA PRIMENENIQ METODA 1
1
1
1
MOMENTOW.
w KURSE TEORII WEROQTNOSTEJ, IZU^AQ NOWYE WEROQTNOSTNYE MODELI, MY WSEGDA WY^ISLQLI IH MOMENTNYE HARAKTERISTIKI. nAPRIMER, MY ZNAEM, ^TO SREDNIE ZNA^ENIQ DWUHTO^E^NOGO RASPREDELENIQ B(1 ) RASPREDELENIQ pUASSONA P() I POKAZATELXNOGO RASPREDELENIQ E() RAWNY : sLEDOWATELXNO, WYBORO^NOE SREDNEE X ESTX OCENKA PO METODU MOMENTOW PARAMETRA L@BOGO IZ \TIH RASPREDELENIJ. lEGKO WIDETX, ^TO \TA OCENKA SOSTOQTELXNA I NESME]ENA. tO^NO TAK VE U NORMALXNOGO RASPREDELENIQ N ( ) PARAMETR OZNA^AET SREDNEE ZNA^ENIE, A { DISPERSI@ \TOGO RASPREDELENIQ. sLEDOWATELXNO, WYBORO^NOE SREDNEE X I WYBORO^NAQ DISPERSIQ S ESTX SOSTOQTELXNYE OCENKI SOOTWETSTWU@]IH KOMPONENT I PARAMETRI^ESKOGO WEKTORA = ( ): iSPRAWLQQ SME]ENIE OCENKI S KOMPONENTY POLU^AEM NESME]ENNU@ OCENKU : zAME^ATELXNO TO, ^TO WSE OCENKI QWLQ@TSQ DOSTATO^NYMI STATISTIKAMI, I \TO OBSTOQTELXSTWO, KAK BUDET WIDNO W DALXNEJEM, PREDOPREDELQET IH OPTIMALXNYE SWOJSTWA. rASPREDELENIE OCENKI X LEGKO POLU^ITX, ISPOLXZUQ TEOREMY SLOVENIQ DLQ RASPREDELENIJ B P E I N RASPREDELENIE VE S PRI WYBORE IZ NORMALXNOGO RASPREDELENIQ MY NAJDEM NESKOLXKO POZVE. rASSMOTRIM TEPERX PRIMERY, W KOTORYH PRIHODITSQ REATX SISTEMU URAWNENIJ, I NAJDENNYE OCENKI PO METODU MOMENTOW NE QWLQ@TSQ FUNKCIQMI DOSTATO^NYH STATISTIK. p R I M E R 3. 1. oCENKA PARAMETROW BINOMIALXNOGO RASPREDELENIQ B(m p). pROBLEMA SOSTOIT W OCENKE OBEIH KOMPONENT m I p DWUMERNOGO PARAMETRA = (m p): iZ KURSA TEORII WEROQTNOSTEJ NAM IZWESTNO, ^TO SREDNEE ZNA^ENIE BINOMIALXNOGO RASPREDELENIQ RAWNO mp A DISPERSIQ { mp(1 ; p): pRIRAWNIWAQ \TI TEORETI^ESKIE MOMENTY IH WYBORO^NYM ANALOGAM, POLU^AEM SISTEMU DLQ OPREDELENIQ OCENOK PO METODU MOMENTOW: mp = X mp(1;p) = S : rAZDELIW WTOROE URAWNENIE NA PERWOE, NAHODIM OCENKU p^n = (X ; S )=X PARAMETRA p POSLE ^EGO, OBRA]AQSX K PERWOMU URAWNENI@, NAHODIM OCENKU m^ n = X =(X ; S ) 2
2
2
2
2
2
2
2
2
2
2
190
2
PARAMETRA m: lEGKO POKAZATX, ^TO \TI OCENKI OBLADA@T SWOJSTWOM SOSTOQTELXNOSTI (OB]IJ METOD DOKAZATELXSTWA TAKIH UTWERVDENIJ SMOTRITE W PRIWEDENNOJ NIVE TEOREME 3.1), NO PRI MALYH n WELIKA WEROQTNOSTX POLU^ITX OTRICATELXNYE ZNA^ENIQ OCENOK, OCENKA PARAMETRA m KAK PRAWILO, NE BUDET CELYM ^ISLOM, NAKONEC, MOVNO POKAZATX, ^TO OCENKA pn = X PARAMETRA p BUDET OBLADATX MENXIM KWADRATI^NYM RISKOM, ^EM OCENKA p^n: wSE \TO, KONE^NO, PE^ALXNO, ODNAKO DRUGIE METODY, PRIWODQ]IE K BOLEE TO^NYM OCENKAM, OBLADA@T ZNA^ITELXNYMI WY^ISLITELXNYMI TRUDNOSTQMI. p R I M E R 3. 2. oCENKA PARAMETROW GAMMA-RASPREDELENIQ G( a). u \TOGO DWUHPARAMETRI^ESKOGO RASPREDELENIQ SREDNEE RAWNO a A DISPERSIQ { a : rEENIE SISTEMY URAWNENIJ a = X a = S DAET OCENKI a^n = S =X ^n = X =S KOTORYE, KAK I W PREDYDU]EM Xn YPRIME n RE, NE QWLQ@TSQ FUNKCIQMI DOSTATO^NOJ STATISTIKI Xk Xk I KAK POKAZYWA@T NE SOWSEM PROSTYE WY^ISLENIQ, IH RISKI DALEKI OT WOZMOVNOGO MINIMUMA. tEM NE MENEE, O^EWIDNAQ WY^ISLITELXNAQ PROSTOTA OCENOK PARAMETROW GAMMA-RASPREDELENIQ PO METODU MOMENTOW OBESPE^IWAET IH POPULQRNOSTX W PRAKTI^ESKIH PRIMENENIQH. iZU^IM TEPERX ASIMPTOTI^ESKIE SWOJSTWA OCENOK PO METODU MOMENTOW { USTANOWIM USLOWIQ IH SOSTOQTELXNOSTI I ISSLEDUEM POWEDENIE IH RASPREDELENIJ PRI BOLXIH OB_EMAH WYBOROK. dLQ PROSTOTY MY OGRANI^IMSQ SLU^AEM ODNOMERNOGO PARAMETRA OCENKA KOTOROGO OPREDELQETSQ REENIEM URAWNENIQ () = E X = X I PREDPOLOVIM, ^TO \TO URAWNENIE IMEET EDINSTWENNOE REENIE ^n = h(X ): pONQTNO, ^TO h() = ; () TAK ^TO h( ()) : o WOZMOVNOSTI RASPROSTRANENIQ NAIH REZULXTATOW NA SLU^AJ WEKTORNOGO MY POGOWORIM OTDELXNO. tEOREMA 3.1. eSLI NABL@DAEMAQ SLU^AJNAQ WELI^INA X IMEET KONE^NOE SREDNEE ZNA^ENIE = () I FUNKCIQ h() NEPRERYWNA W OBLASTI ZNA^ENIJ WYBORO^NOGO SREDNEGO X TO ^n = h(X ) QWLQETSQ SOSTOQTELXNOJ OCENKOJ PARAMETRA PO METODU MOMENTOW. d O K A Z A T E L X S T W O. mY WOSPOLXZUEMSQ FORMULOJ (1) W OPREDELENII SOSTOQTELXNOSTI OCENKI I POKAVEM, ^TO DLQ L@BYH " > 0 I > 0 SU]ESTWUET TAKOE N (" ) ^TO DLQ WSEH n > N (" ) WEROQTNOSTX (2) P h(X ) ; " > 1 ; : 2
2
2
2
2
2
1
1
191
1
pOSKOLXKU h( ) = h( ()) = I X ! TO NAM DOSTATO^NO POKAP ZATX, ^TO SWOJSTWO (ILI OPREDELENIE) NEPRERYWNOSTI FUNKCII: h(x) ! h( ) PRI x ! OSTAETSQ SPRAWEDLIWYM PRI ZAMENE OBY^NOJ SHODIMOSTI " ! " NA SHODIMOSTX PO WEROQTNOSTI " ! " TO ESTX X ! WLEP P ^ET h(X ) ! h( ): |TO PO^TI O^EWIDNO, POSKOLXKU SOBYTIE, SOSTOQ]EE P W POPADANII W OKRESTNOSTX NULQ SLU^AJNOJ WELI^INY j X ; j WLE^ET ANALOGI^NOE SOBYTIE DLQ SLU^AJNOJ WELI^INY j h(X ) ; h( ) j NO WSE VE PROWEDEM STROGOE DOKAZATELXSTWO NA QZYKE "" ; ": tAK KAK X ! () A h() { NEPRERYWNAQ FUNKCIQ, TO NAJDUTSQ TAKIE P = (" ) I N = N (" ) ^TO P ( j X ; () j < ) > 1 ; (3) DLQ WSEH n > N I SOBYTIE j X ; () j < POWLE^ET SOBYTIE j h(X ) ; h( ()) j = j h(X ) ; j ": w SILU \TOGO NERAWENSTWO (2) STANOWITSQ SLEDSTWIEM NERAWENSTWA (3). tEOREMA DOKAZANA. aNALIZ DOKAZATELXSTWA POKAZYWAET, ^TO TEOREMA SOSTOQTELXNOSTI OSTAETSQ SPRAWEDLIWOJ W SLU^AE WEKTORNOGO PARAMETRA ESLI WOSPOLXZOWATXSQ OPREDELENIEM NEPRERYWNOSTI WEKTORNOJ FUNKCII OT WEKTORNOGO ARGUMENTA, SWQZAW EGO S RASSTOQNIQMI W \WKLIDOWYH PROSTRANSTWAH ZNA^ENIJ FUNKCII I EE ARGUMENTA. oBRATIMSQ TEPERX K ASIMPTOTI^ESKOMU ANALIZU RASPREDELENIQ OCENKI ^n = h(X ) PRI n ! 1: pONQTNO, ^TO W DANNOM SLU^AE UPOTREBLENIE TERMINA \OCENKA" PRIMENITELXNO K FUNKCII h(X ) NI^EGO OSOBENNO NE DOBAWLQET { RE^X IDET PROSTO OB ASIMPTOTI^ESKOM RASPREDELENII STATISTIKI, IME@]EJ WID FUNKCII OT WYBORO^NOGO SREDNEGO. tEOREMA 3.2. eSLI X n { SLU^AJNAQ WYBORKA IZ RASPREDELENIQ S KONE^NYMI SREDNIM ZNA^ENIEM I DISPERSIEJ A FUNKCIQ h(x) OBLADAET OGRANI^ENNOJ WTOROJ PROIZWODNOJ h00 (x) W NEKOTOROJ OKRESTNOSTI TO^KI x = TO 0 1 p x lim P n h(X ) ; h( ) < x = @ j h0( ) j A : (4) n!1 ( )
2
GDE
() { FUNKCIQ RASPREDELENIQ STANDARTNOGO NORMALXNOGO ZAKONA.
d O K A Z A T E L X S T W O. pONQTNO, ^TO MY DOLVNY WOSPOLXZOWATXSQ CENTRALXNOJ PREDELXNOJ TEOREMOJ (x14 KURSA tw) PRIMENITELXNO K 192
STATISTIKE X = n Xn Xk : x! p lim P n X ; < x = : (5) n!1 sTANDARTNYJ PRIEM ISPOLXZOWANIQ \TOJ TEOREMY PRI ASIMPTOTI^ESKOM ANALIZE FUNKCIJ OT SUMM NEZAWISIMYH, ODINAKOWO RASPREDELENNYH SLU^AJNYH WELI^IN SOSTOIT W \LINERIZACII" TAKIH FUNKCIJ S POMO]X@ FORMULY tEJLORA. w NAEM SLU^AE MY RAZLAGAEM FUNKCI@ h() W OKRESTNOSTI TO^KI X = ISPOLXZUQ TOLXKO DWA ^LENA RAZLOVENIQ: ) h00 + (X ; ) h(X ) = h( ) + (X ; )h0( ) + (X ; 2! GDE 0 1: pEREPIEM \TO RAZLOVENIE W WIDE p p p 0 n h(X ) ; h( ) = n(X ; )h ( ) + n(X2!; ) h00 + (X ; ) PREDSTAWIW TEM SAMYM SLU^AJNU@ WELI^INU pn h(X ) ; h( ) (SM. FORMULU (4)) W WIDE SUMMY DWUH SLU^AJNYH WELI^IN, PERWAQ IZ KOTORYH W SILU FORMULY (5) IMEET PREDELXNOE NORMALXNOE RASPREDELENIE, UKAZANNOE W PRAWOJ ^ASTI (4), A WTORAQ SHODITSQ PO WEROQTNOSTI 00 K NUL@. dEJSTWITELXNO, h + (X ; ) PO USLOWI@ TEOREMY OGRANI^ENO S WEROQTNOSTX@ SKOLX UGODNO BLIZKOJ K EDINICE, NA^INAQ S NEKOTOROGO n: w SILU NERAWENSTWA ~EBYEWA (PREDLOVENIE 6.2 KURSA tw) DLQ L@BOGO " > 0 WEROQTNOSTX p p Epn(X ; ) nDX = p ! 0: P n(X ; ) > " = " " " n pO\TOMU STOQ]IJ PERED h00=2! MNOVITELX, A S NIM I WSE WTOROE SLAGAEMOE, SHODQTSQ PO WEROQTNOSTI K NUL@. uTWERVDENIE TEOREMY TEPERX SLEDUET IZ PREDLOVENIQ 11.1 KURSA tw: ESLI ODNA POSLEDOWATELXNOSTX SLU^AJNYH WELI^IN IMEET NEWYROVDENNOE PREDELXNOE RASPREDELENIE F A WTORAQ SHODITSQ PO WEROQTNOSTI K NUL@, TO PREDELXNOE RASPREDELENIE SUMMY \TIH POSLEDOWATELXNOSTEJ SOWPADAET S F: iTAK, ESLI h(X ) { OCENKA ^n PARAMETRA PO METODU MOMENTOW, TO FORMULA (4) TEOREMY 3.2 PRINIMAET WID 1 0 p x lim P n ^n ; ) < x = @ j h0( ) j A : n!1 1
1
2
2
2
2
193
2
pRIWEDEM PRIMER NA ISPOLXZOWANIE APPROKSIMACII RASPREDELENIQ FUNKCII OT WYBORO^NOGO SREDNEGO NA PRAKTIKE. p R I M E R 3.3. oCENKA NADEVNOSTI IZDELIQ S POKAZATELXNYM RASPREDELENIEM DOLGOWE^NOSTI. pRI WYPUSKE IZDELIJ OBY^NO UKAZYWAETSQ IH GARANTIJNYJ SROK SLUVBY t OTKAZ IZDELIQ DO ISTE^ENIQ SROKA t ^REWAT DLQ POSTAW]IKA RASHODAMI NA REMONT ILI ZAMENU IZDELIQ. ~TOBY PLANIROWATX RASHODY NA TAKOGO RODA REKLAMACII SO STORONY POTREBITELQ, POSTAW]IK DOLVEN ZNATX NADEVNOSTX WYPUSKAEMYH IZDELIJ: H (t ) = P (X > t ): wELI^INA H (t ) UKAZYWAET SREDN@@ DOL@ SREDI WYPU]ENNYH IZDELIJ, KOTORYE MOGUT OTKAZATX ZA GARANTIJNOE WREMQ SLUVBY t : ~TOBY OCENITX H (t ) PROWODQTSQ ISPYTANIQ n IZDELIJ, I PUSTX x : : : xn { NARABOTKI NA OTKAZ ISPYTUEMYH IZDELIJ, TRAKTUEMYE KAK REALIZACII SLU^AJNOJ WYBORKI X n IZ RASPREDELENIQ F ( j ) IZWESTNOGO S TO^NOSTX@ DO ZNA^ENIQ PARAMETRA : nAKONEC, PUSTX NAM IZWESTNO, ^TO DOLGOWE^NOSTX IZDELIJ POD^INQETSQ ZAKONU \OTSUTSTWIQ POSLEDEJSTWIQ", W SILU ^EGO F (x j ) = 1;expf;x=g { POKAZATELXNOE RASPREDELENIE. w TAKOM SLU^AE PROBLEMA SOSTOIT W OCENKE PARAMETRI^ESKOJ FUNKCII h() = expf;t =g: tAK KAK = EX { SREDNQQ NARABOTKA NA OTKAZ, TO ESTESTWENNO OCENITX POSREDSTWOM STATISTIKI X (RABOTAET METOD MOMENTOW), A ZA OCENKU NADEVNOSTI WZQTX STATISTIKU h(X ) = expf;t =X g: pOSKOLXKU NAIBOLXU@, S \KONOMI^ESKOJ TO^KI ZRENIQ, OPASNOSTX PREDSTAWLQET ZAWYENIE NADEVNOSTI, TO NAS W PERWU@ O^EREDX DOLVNA INTERESOWATX ^ASTOTA GRUBYH PREWYENIJ, NAPRIMER , NA NEKOTORU@ ZADANNU@ p WELI^INU ": eSLI POLOVITX = " n TO WEROQTNOSTX, UKAZYWA@]AQ GRUBYH PREWYENIJ , ZAPISYWAETSQ W WIDE R( h(X )) = p^ASTOTU P n h(X ) ; h() > ^TO POZWOLQET NAM NEPOSREDSTWENNO ISPOLXZOWATX APPROKSIMACI@ (4) PRI ISPYTANIQH DOSTATO^NO BOLXOGO ^ISLA IZDELIJ (NASKOLXKO BOLXOGO, \TO { OTDELXNYJ WOPROS, REITX KOTORYJ MOVNO, NAPRIMER, MODELIRUQ WYBORKI IZ POKAZATELXNOGO RASPREDELENIQ S POMO]X@ METODA mONTE-kARLO). iMEEM = h0() = t ; expf;t =g I FORMULA (4) DAET NAM SLEDU@]U@ APPROKSIMACI@ DLQ RISKA OCENKI h(X ) : ( t )! R( h(X )) 1 ; t exp : nETRUDNO POKAZATX, ^TO NAIBOLXEE ZNA^ENIE RISKA DOSTIGAETSQ PRI 0
0
0
0
0
0
0
1
( )
0
0
2
2
0
2
0
0
0
194
= t I RAWNO ( e): w TOM SLU^AE, KOGDA OCENKA IMEET WID FUNKCII OT DWUH I BOLEE WYBORO^NYH MOMENTOW, METOD ASIMPTOTI^ESKOGO ANALIZA EE RASPREDELENIQ TOT VE. nAPRIMER, PUSTX ^n = h(a a ) I FUNKCIQ h UDOWLETWORQET USLOWIQM, ANALOGI^NYM TREBOWANIQM K h W TEOREME 3.2. iSPOLXZUQ FORMULU tEJLORA, PREDSTAWIM h W OKRESTNOSTI TO^KI ( ) W SLEDU@]EM WIDE: h(a a ) = h( ) + (a ; )h0 ( )+ (a ; )h0 ( ) + Op(j a ; j ) GDE a = (a a ) = ( ): lEGKO PROWERQETSQ, ^TO pnj a ; j ! 0 P p TAK ^TO SLU^AJNAQ WELI^INA n (h(a a ) ; h( )) ASIMPTOTI^ESKI NORMALXNA S PARAMETRAMI, KOTORYE WYRAVA@TSQ ^EREZ PERWYE ^ETYRE MOMENTA NABL@DAEMOJ SLU^AJNOJ WELI^INY X: 0
1
2
1
1
2
1
2
1
2
2
1
2
2
1
1
1
1
1
2
2
2
2
2
2
1
195
2
1
2
x4. oCENKA PARAMETROW. mETOD MAKSIMALXNOGO PRAWDOPODOBIQ lEKCIQ 6
mY PRISTUPAEM K IZU^ENI@ BOLEE TO^NOGO METODA OCENKI NEIZWESTNOGO ZNA^ENIQ PARAMETRA. oN PREWOSHODIT METOD MOMENTOW I PRI NALI^II DOSTATO^NYH STATISTIK DAET OPTIMALXNYE OCENKI S TO^KI ZRENIQ KWADRATI^NOGO RISKA. bOLEE TOGO, PRI WYPOLNENII OPREDELENNYH USLOWIJ REGULQRNOSTI \TOT METOD PRIWODIT K ASIMPTOTI^ESKI (n ! 1) OPTIMALXNYM OCENKAM DLQ IROKOGO KLASSA WEROQTNOSTNYH MODELEJ I PRAKTI^ESKI PRI L@BYH FUNKCIQH POTERX. iDEQ METODA SOSTOIT W MATEMATI^ESKOJ FORMALIZACII \RAZUMNOGO" POWEDENIQ ^ELOWEKA W USLOWIQH NEOPREDELENNOSTI. pREDSTAWIM SEBE SITUACI@, ^TO MY OVIDAEM POQWLENIQ ODNOGO IZ NESKOLXKIH SOBYTIJ, WEROQTNOSTI KOTORYH NAM NEIZWESTNY I NAS INTERESU@T NE STOLXKO ZNA^ENIQ \TIH WEROQTNOSTEJ, SKOLXKO TO SOBYTIE, KOTOROE PROISHODIT NAIBOLEE ^ASTO. sITUACIQ OSLOVNQETSQ TEM, ^TO MY RASPOLAGAEM WSEGO ODNIM ISPYTANIEM, W REZULXTATE KOTOROGO PROIZOLO NEKOTOROE SOBYTIE A: kONE^NO, MY PRIMEM REENIE, ^TO A OBLADAET NAIBOLXEJ WEROQTNOSTX@, I WRQD LI MOVNO PREDLOVITX NE^TO BOLEE RAZUMNOE, ^EM TAKOE PRAWILO PRINQTIQ REENIQ. w \TOM I SOSTOIT PRINCIP MAKSIMALXNOGO PRAWDOPODOBIQ, KOTORYJ BUKWALXNO PRONIZYWAET WS@ TEORI@ OPTIMALXNOGO STATISTI^ESKOGO WYWODA. pRIMENENIE \TOGO PRINCIPA K PROBLEME OCENKI PARAMETROW PRIWODIT K SLEDU@]EMU STATISTI^ESKOMU PRAWILU: ESLI x n { REZULXTAT NABL@DENIQ SLU^AJNOJ WYBORKI X n TO ZA OCENKU PARAMETRA SLEDUET BRATX TO EGO ZNA^ENIE, PRI KOTOROM REZULXTAT x n OBLA( )
( )
( )
DAET NAIBOLXIM PRAWDOPODOBIEM.
wY SPROSITE, ^TO TAKOE \PRAWDOPODOBIE" REZULXTATA x n ? dAWAJTE FORMALIZUEM \TO PONQTIE. eSLI NABL@DAETSQ DISKRETNAQ SLU^AJNAQ WELI^INA, TO ESTESTWENNO NAZWATX PRAWDOPODOBIEM REZULXTATA x n PRI FIKSIROWANNOM ZNA^ENII PARAMETRA WEROQTNOSTX EGO NABL@DENIQ W STATISTI^ESKOM \KSPERIMENTE. nO W DISKRETNOM SLU^AE \TA WEROQTNOSTX SOWPADAET SO ZNA^ENIEM FUNKCII PLOTNOSTI W TO^KE x n : P (X n = x n ) = fn(x n j ): sLEDOWATELXNO, OCENKA PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ OPREDELQETSQ TO^KOJ DOSTIVENIQ MAKSIMUMA U FUNKCII PLOTNOSTI SLU( )
( )
( )
196
( )
( )
( )
^AJNOJ WYBORKI, TO ESTX n ^n(X n ) = arg max f j : n X 2 ( )
(1)
( )
rASSMOTRIM SRAZU VE PROSTOJ PRIMER. pUSTX X n { WYBORKA W SHEME bERNULLI, I MY OCENIWAEM WEROQTNOSTX USPENOGO ISHODA. w \TOJ MODELI Xn Xn X n; Xk : n k f (X j ) = (1 ; ) ( )
( )
1
1
dIFFERENCIRUQ \TU FUNKCI@ PO I PRIRAWNIWAQ PROIZWODNU@ Xn NUL@, NAHODIM OCENKU MAKSIMALXNOGO PRAWDOPODOBIQ = (1=n) Xk : |TO { DAWNO ZNAKOMAQ NAM OCENKA WEROQTNOSTI USPEHA W ISPYTANIQH bERNULLI, KOTORU@ MY POLU^ILI S POMO]X@ MOMENTOW I POSTOQNNO ISPOLXZOWALI PRI ILL@STRACII ZAKONA BOLXIH ^ISEL. tEPERX OPREDELIM PRAWDOPODOBIE W SLU^AE WYBORA IZ NEPRERYWNOGO RASPREDELENIQ S FUNKCIEJ PLOTNOSTI (PO MERE lEBEGA) fn(x n j ) x n 2 Rn 2 : pUSTX x n { SOWOKUPNOSTX WYBORO^NYH DANNYH, TO ESTX TO^KA W n-MERNOM WYBORO^NOM PROSTRANSTWE Rn: oKRUVIM \TU TO^KU PRQMOUGOLXNYM PARALLELEPIPEDOM MALOGO RAZMERA, SKAYn VEM, V" = xk ; "=2 xk + "=2]: w SILU TEOREMY O SREDNEM DLQ KRATNOGO INTEGRALA WEROQTNOSTX WEKTOR POPA nTOGO, ^TO WYBORO^NYJ n n DET W \TOT PARALLELEPIPED P X 2 V" fn(x j ) " KOGDA " ! 0: eSLI TRAKTOWATX \TU WEROQTNOSTX, KAK PRAWDOPODOBIE REZULXTATA x n KOTOROE, KONE^NO, ZAWISIT OT WYBORA MALOGO " MY WIDIM, ^TO PROBLEMA MAKSIMIZACII PRAWDOPODOBIQ SWODITSQ K PROBLEME OTYSKANIQ TO^KI DOSTIVENIQ MAKSIMUMA PO WSEM 2 U FUNKCII PLOTNOSTI fn: tAKIM OBRAZOM, I W SLU^AE NEPRERYWNOGO RASPREDELENIQ RAZUMNO NAZWATX PRAWDOPODOBIEM REZULXTATA x n PRI FIKSIROWANNOM ZNA^ENII PARAMETRA OPQTX-TAKI WELI^INU FUNKCII PLOTNOSTI WYBORKI, TO ESTX fn(x n j ), I OPREDELITX OCENKU MAKSIMALXNOGO PRAWDOPODOBIQ TOJ VE FORMULOJ (1). rASSMOTRIM PRIMER NA POSTROENIE TAKOJ OCENKI W SLU^AE WYBORA IZ NEPRERYWNOGO RASPREDELENIQ. pUSTX NABL@DAETSQ SLU^AJNAQ WELI^INA X N ( ) TAK ^TO FUNKCIQ PLOTNOSTI WYBORKI 1
( )
( )
( )
1
( )
( )
( )
( )
( )
2
( 1 X ) 1 n fn(x j ) = (2)n= n exp ; 2 (xk ; ) (n)
2
2
2
197
1
GDE = ( ) { DWUMERNYJ PARAMETR, ZNA^ENIE KOTOROGO NAM NEIZWESTNO. w SOOTWETSTWII S FORMULOJ (1) NEOBHODIMO OTYSKATX TO^KU DOSTIVENIQ MAKSIMUMA FUNKCII fn(X n j ) PO PEREMENNYM 2 R I 2 R : eSTESTWENNO, LOGARIFM \TOJ FUNKCII IMEET TE VE TO^KI \KSTREMUMA, ^TO I SAMA FUNKCIQ, NO LOGARIFMIROWANIE UPRO]AET WYKLADKI, PO\TOMU I]EM MAKSIMUM FUNKCII L( j X n ) = ln fn(X n j ) = ; n2 ln 2 ; n ln ; 21 Xn(Xk ; ) : sOSTAWLQEM URAWNENIQ, OPREDELQ@]IE TO^KI \KSTREMUMA: @ L = 1 Xn(X ; ) = 0 k @ 2 @ L = ; n + 1 Xn(X ; ) = 0: k @ iZ PERWOGO URAWNENIQ SRAZU NAHODIM OCENKU PARAMETRA : ^n = X: pODSTAWLQQ X WMESTO WO WTOROE URAWNENIE, NAHODIM OCENKU : ^n = S (WYBORO^NOE STANDARTNOE OTKLONENIE). o^EWIDNO, (X S ) { TO^KA MAKSIMUMA. tAKIM OBRAZOM, METOD MAKSIMALXNOGO PRAWDOPODOBIQ PRIWODIT K TEM VE OCENKAM X I S PARAMETROW I ^TO I METOD MOMENTOW. tEPERX DADIM STROGOE OPREDELENIE PRAWDOPODOBIQ I RASSMOTRIM E]E NESKOLXKO PRIMEROW, W KOTORYH METOD MAKSIMALXNOGO PRAWDOPODOBIQ DAET OCENKI, OTLI^NYE OT METODA MOMENTOW. oPREDELENIE 4.1. sLU^AJNAQ FUNKCIQ n Y L( j X n ) = f (Xi j ) ( )
+
( )
( )
2
2
1
1
2
2
3
1
2
2
( )
i=1
NA PARAMETRI^ESKOM PROSTRANSTWE NAZYWAETSQ FUNKCIEJ PRAWDOPODOBIQ, A ZNA^ENIE EE REALIZACII L( j x n ) PRI REZULXTATE NABL@DENIQ X n = x n I FIKSIROWANNOM = { PRAWDOPODOBIEM ZNA^ENIQ PRI REZULXTATE x n : l@BAQ TO^KA ^n = ^n (X n ) (STATISTIKA) PARAMETRI^ESKOGO PROSTRANSTWA DOSTAWLQ@]AQ ABSOL@TNYJ MAKSIMUM FUNKCII PRAWDOPODOBIQ, NAZYWAETSQ OCENKOJ MAKSIMALXNOGO PRAWDOPODOBIQ PARAMETRA : pOSKOLXKU FUNKCIQ PRAWDOPODOBIQ PREDSTAWLQET SOBOJ PROIZWEDENIE FUNKCIJ OT TO PRI OTYSKANII EE MAKSIMUMA METODAMI DIFFERENCIALXNOGO IS^ISLENIQ UDOBNEE IMETX DELO S LOGARIFMOM \TOJ ( )
0
( )
( )
0
( )
0
( )
198
FUNKCII. eSTESTWENNO, TO^KI \KSTREMUMA U FUNKCII LOGARIFMI^ESKOGO PRAWDOPODOBIQ
L( j X
(n)
)=
n X i=1
ln f (Xi j )
TE VE, ^TO I U FUNKCII L NO ESLI FUNKCIQ L(j x n ) IMEET NEPRERYWNYE ^ASTNYE PROIZWODNYE PO KOMPONENTAM : : : k PARAMETRI^ESKOGO WEKTORA TO PRO]E DIFFERENCIROWATX L ^EM L: w \TOM SLU^AE SISTEMA URAWNENIJ @ L( j X n ) = 0 i = 1 : : : k (2) @i NAZYWAETSQ URAWNENIQMI PRAWDOPODOBIQ. |TO E]E ODNA RAZNOWIDNOSTX TAK NAZYWAEMYH OCENO^NYH URAWNENIJ, { W PREDYDU]EM PARAGRAFE MY IMELI DELO S URAWNENIQMI METODA MOMENTOW. l@BOE REENIE SISTEMY URAWNENIJ (2), DOSTAWLQ@]EE MAKSIMUM FUNKCII L(jX n ) MOVET RASSMATRIWATXSQ KAK OCENKA PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ. mY NE BUDEM IZU^ATX SLU^AI, KOGDA SISTEMA (2) IMEET NESKOLXKO REENIJ S WOZMOVNO ODINAKOWYMI ZNA^ENIQMI FUNKCII PRAWDOPODOBIQ W \TIH TO^KAH, TAK ^TO TREBU@TSQ DOPOLNITELXNYE APRIORNYE ZNANIQ OTNOSITELXNO WEROQTNOSTNOJ MODELI, POZWOLQ@]IE WYBRATX ODNO IZ \TIH REENIJ. wO WSEH RASSMOTRENNYH NIVE PRIMERAH OCENKA MAKSIMALXNOGO PRAWDOPODOBIQ EDINSTWENNA. p R I M E R 4. 1. oCENKA PARAMETRA POLOVENIQ RAWNOMERNOGO RASPREDELENIQ U(0 ). rAWNOMERNOE NA OTREZKE 0 ] RASPREDELENIE IMEET FUNKCI@ PLOTNOSTI f (x j ) = ; ESLI 0 x I f (x j ) = 0 WNE \TOGO OTREZKA. sLEDOWATELXNO, FUNKCIQ L( j X n ) OTLI^NA OT NULQ I RAWNA ;n TOLXKO W OBLASTI X n = max kn Xk : eE MAKSIMUM PO DOSTIGAETSQ W GRANI^NOJ TO^KE = X n TAK ^TO NAIBOLXEE ZNA^ENIE X n WYBORKI X n ESTX OCENKA MAKSIMALXNOGO PRAWDOPODOBIQ PARAMETRA : lEGKO WIDETX, ^TO OCENKA PO METODU MOMENTOW RAWNA 2X: |TA OCENKA NA PORQDOK HUVE OCENKI MAKSIMALXNOGOPRAWDOPODOBIQ S TO^KI ZRENIQ KWADRATI^NOGO RISKA R( ^n) = E ^n(X n ) ; : pROSTYE WY^ISLENIQ SOOTWETSTWU@]IH MATEMATI^ESKIH OVIDANIJ POKAZYWA@T, ^TO R( 2X ) = O(n; ) W TO WREMQ KAK R( X n ) = O(n; ): ( )
1
( )
( )
1
( )
1
( )
( )
( )
( )
2
( )
1
( )
199
2
dANNYJ PRIMER INTERESEN TEM, ^TO ZDESX FUNKCIQ PRAWDOPODOBIQ NE IMEET GLADKOGO MAKSIMUMA, I IMENNO \TO OBSTOQTELXSTWO, KAK BUDET WIDNO W DALXNEJEM, OBESPE^IWAET TAKOE RAZLI^NOE POWEDENIE RISKA RASSMATRIWAEMYH OCENOK. p R I M E R 4. 2. oCENKA PARAMETROW GAMMA-RASPREDELENIQ G(a ): u \TOGO RASPREDELENIQ FUNKCIQ PLOTNOSTI ( x) 1 ; f (x j ) = a;( ) x exp ; a x > 0 = (a ) OTLI^NA OT NULQ TOLXKO NA POLOVITELXNOJ POLUOSI, I LOGARIFMI^ESKOE PRAWDOPODOBIE 1
L(a j X
(n)
n n X X ) = ;n ln a ; n ln ;( ) + ( ; 1) ln Xk ; a1 Xk : 1
1
sOSTAWLQEM URAWNENIQ PRAWDOPODOBIQ: @ L = ; n + 1 Xn X = 0 k @a a a @ L = ;n ln a ; n ( ) + Xn ln X = 0 k @
GDE ( ) = d ln ;( )=d { TAK NAZYWAEMAQ PSI-FUKCIQ |JLERA. iSKL@^AQ IZ PERWOGO URAWNENIQ PARAMETR a I PODSTAWLQQ POLU^ENNYJ REZULXTAT WO WTOROE, POLU^AEM TRANSCENDENTNOE URAWNENIE 2
1
1
n X 1 ln ; ( ) = ln X ; n ln Xk KOTOROE W SILU SWOJSTWA MONOTONNOSTI FUNKCII ln ; ( ) IMEET EDINSTWENNOE REENIE. pRI ^ISLENNOM REENII \TOGO URAWNENIQ MOVET OKAZATXSQ POLEZNOJ ASIMPTOTI^ESKAQ ( ! 1) FORMULA 1! 1 1 ln ; ( ) = 2 + 12 + O : 1
2
4
p R I M E R 4. 3.
oCENKA PARAMETROW STRUKTURIROWANNOGO SREDNEGO PRI NORMALXNOM RASPREDELENII OTKLIKA. dANNAQ ZADA^A WESXMA ^AS-
TO WOZNIKAET PRI KALIBROWKE KALY PRIBORA. dWE PEREMENNYE x I y SWQZANY LINEJNYM SOOTNOENIEM y = a + bx I DLQ GRADUIROWKI 200
ZNA^ENIJ y NA KALE PRIBORA NEOBHODIMO ZNATX ZNA^ENIQ PARAMETROW a I b \TOJ ZAWISIMOSTI. oDNAKO, DLQ KAVDOGO STANDARTNOGO FIKSIROWANNOGO ZNA^ENIQ x PRIBOR ZAMERQET ZNA^ENIE y S OIBKOJ, TAK ^TO ZAMERY PROISHODQT W RAMKAH WEROQTNOSTNOJ MODELI Y = a + bx + GDE OIBKA IZMERENIQ (SLU^AJNAQ WELI^INA) IMEET NORMALXNOE RASPREDELENIE S NULEWYM SREDNIM I NEKOTOROJ DISPERSIEJ ZNA^ENIE KOTOROJ, KAK PRAWILO, TAKVE NE IZWESTNO. sLU^AJNAQ WELI^INA Y OBY^NO NAZYWAETSQ OTKLIKOM NA ZNA^ENIE REGRESSORA x EE RASPREDELENIE PRI FIKSIROWANNOM x O^EWIDNO NORMALXNO (a + bx ): dLQ OCENKI a I b PROIZWODITSQ n IZMERENIJ OTKLIKA y : : : yn PRI NEKOTORYH FIKSIROWANNYH ZNA^ENIQH x : : : xn REGRESSORA x OPTIMALXNYJ WYBOR KOTORYH, OBESPE^IWA@]IJ NAIBOLXU@ TO^NOSTX I NADEVNOSTX KALIBROWKI, SOSTAWLQET SAMOSTOQTELXNU@ ZADA^U OSOBOJ OBLASTI MATEMATI^ESKOJ STATISTIKI { PLANIROWANIE REGRESSIONNYH \KSPERIMENTOW. mY BUDEM PREDPOLAGATX, ^TO ZNA^ENIQ x : : : xn APRIORI FIKSIROWANY. w TAKOM SLU^AE ZNA^ENIQ y : : : yn PREDSTAWLQ@T REALIZACII n NEZAWISIMYH SLU^AJNYH WELI^IN Y : : : Yn I Yk N (a + bxk ) k = 1 : : : n: sOWMESTNAQ FUNKCIQ PLOTNOSTI Y : : : Yn RAWNA 2
2
1
1
1
1
1
2
1
( 1 X ) 1 n fn(y ) j a b ) = (2)n= n exp ; 2 (yk ; a ; bxk ) ) TAK ^TO LOGARIFMI^ESKAQ FUNKCIQ PRAWDOPODOBIQ, NEOBHODIMAQ DLQ OCENKI PARAMETROW a, b I METODOM MAKSIMALXNOGO PRAWDOPODOBIQ (n)
2
2
IMEET WID
L(a b j Y
(n)
1
2
n X ) = ; n2 ln 2 ; n ln ; 21 (Yk ; a ; bxk ) : 2
2
1
wY^ISLQQ PROIZWODNYE \TOJ FUNKCII PO PEREMENNYM a, b I POLU^AEM URAWNENIQ PRAWDOPODOBIQ n X 1
n X 1
n
2
(Yk ; a ; bxk ) = 0
xk (Yk ; a ; bxk ) = 0
; X(Y ; a ; bx ) n 1
k
k
201
2
= 0:
kONE^NO, \TO O^ENX PROSTAQ SISTEMA URAWNENIJ, REENIE KOTOROJ NE MOVET WYZYWATX KAKIH-LIBO ZATRUDNENIJ, I MY SRAZU PIEM OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ n X 1 m m xY xY ^ ^ a^n = Y ; s x bn = s ^ = n Yk ; a^n ; bnxk x x GDE 2
2
2
2
1
n n n n X X X X x = n1 xk Y = n1 Yk sx = n1 (xk ; x) SY = n1 (Yk ; Y ) n X mx Y = n1 (xk ; x)(Yk ; Y ): lEGKO WIDETX, ^TO OCENKI PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ PARAMETROW a I b SOWPADA@T S IH OCENKAMI PO METODU NAIMENXIH KWADRATOW. w \TOM METODE \WYRAWNIWANIQ" \KSPERIMENTALXNYH DANNYH OCENKI Xn I]UTSQ IZ USLOWIQ MINIMIZACII SUMMY KWADRATOW NEWQZOK: (Yk ; a ; bxk ) PRI^EM POD NEWQZKOJ PONIMAETSQ RAZNOSTX MEVDU OTKLIKOM Y I EGO \TEORETI^ESKIM" SREDNIM ZNA^ENIEM a + bx: 2
1
1
2
1
1
1
2
1
p R I M E R 4. 4.
oCENKA PARAMETROW DWUMERNOGO NORMALXNOGO RASPREDELENIQ: ZADA^I REGRESSII I PROGNOZA. oCENKA PO METODU MAKSI-
MALXNOGO PRAWDOPODOBIQ PQTI PARAMETROW DWUMERNOGO NORMALXNOGO RASPREDELENIQ S FUNKCIEJ PLOTNOSTI 1
f (x y j ) = 2 1p1 ; 1
8 0 2 < ( x 1 1) @ exp : 2(1 2) 12
;
2 1
2
2
2
2 2
19
; 2 (x ; )(y ; ) + (y ; ) A= ; ; NE PREDSTAWLQET OSOBOJ TEHNI^ESKOJ SLOVNOSTI. |TI OCENKI SOWPADA@T S OCENKAMI PO METODU MOMENTOW I, TAKIM OBRAZOM, RAWNY WYBORO^NYM ANALOGAM TEH HARAKTERISTIK DWUMERNOGO NORMALXNOGO RASPREDELENIQ, KOTORYE SOOTWETSTWU@T UKAZANNYM PQTI PARAMETRAM: ^ n = X ^ n = Y ^ n = SX ^ n = SY ^n = r: fORMULY DLQ WY^ISLENIQ WYBORO^NYH SREDNIH X I Y WYBORO^NYH DISPERSIJ S I S A TAKVE WYBORO^NOGO KO\FFICIENTA KORRELQCII r PRIWEDENY W KONCE x2. 1
2
2 1
1
2
1
2 1
2
2 2
202
2 2
2
2 2
2
2
2
pOLU^ENNYE OCENKI ^ASTO ISPOLXZU@TSQ DLQ OCENKI PARAMETROW LINEJNOGO PROGNOZA Y = a + bX ZNA^ENIJ SLU^AJNOJ WELI^INY Y PO REZULXTATAM NABL@DENIJ X: w SLU^AE NORMALXNOGO RASPREDELENIQ LINEJNYJ PROGNOZ OBLADAET SWOJSTWOM OPTIMALXNOSTI S TO^KI ZRENIQ MALOSTI SREDNEJ KWADRATI^NOJ OIBKI I SOWPADAET S KRIWOJ SREDNEJ KWADRATI^NOJ REGRESSII (SM. PREDLOVENIE 10.3 KURSA tw) y = + (x ; ): 2
2
1
1
oDNAKO FORMALXNAQ PODGONKA PROGNOSTI^ESKOJ KRIWOJ S POMO]X@ PRQMOJ LINII ISPOLXZUETSQ I WNE RAMOK NORMALXNOJ MODELI, I W \TOM SLU^AE OCENKI a^n = Y ; r SS X ^bn = r SS SOWPADA@T S OCENKAMI PO METODU NAIMENXIH KWADRATOW: MINIMIZIRUETSQ, KAK I W PRIMERE 4.3, SUMMA KWADRATOW NEWQZOK n X 1
2
2
1
1
(Yk ; a ; bXk ) : 2
hOTQ OCENKI W OBOIH PRIMERAH IME@T ODINAKOWYJ WID, NO REAEMYE W NIH STATISTI^ESKIE PROBLEMY WESXMA RAZLI^NY: W PRIMERE 4.3 OCENIWALISX PARAMETRY NEKOTOROJ FUNKCIONALXNOJ ZAWISIMOSTI S OIBKAMI W NABL@DENIQH OTKLIKA, W TO WREMQ KAK W PRIMERE 4.4 REAETSQ ZADA^A WYQWLENIQ KORRELQCIONNOJ SWQZI I ISPOLXZOWANIQ \TOJ SWQZI DLQ PROGNOZA. lEKCIQ 7
iSSLEDUEM TEPERX ASIMPTOTI^ESKIE SWOJSTWA OCENOK PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ. nA^NEM S WYQSNENIQ DOSTATO^NYH USLOWIJ SOSTOQTELXNOSTI \TIH OCENOK. tAKIE OGRANI^ENIQ NA WEROQTNOSTNU@ MODELX OBY^NO NAZYWA@TSQ USLOWIQMI REGULQRNOSTI, I W DANNOM SLU^AE ONI IME@T SLEDU@]IJ WID. (R1) pARAMETRI^ESKOE PROSTRANSTWO ESTX OTKRYTYJ INTERWAL NA PRQMOJ R: 203
(R2) nOSITELX X RASPREDELENIQ P NABL@DAEMOJ SLU^AJNOJ WELI^INY X NE ZAWISIT OT TO ESTX WSE MNOVESTWA X = fx : f (x j ) > 0g MOVNO S^ITATX ODINAKOWYMI, KAKOWO BY NI BYLO 2 : (R3) rASPREDELENIQ P RAZLI^NY PRI RAZNYH TO ESTX PRI L@BYH 6= 2 IMEET MESTO TOVDESTWO fx : x 2 X f (x j ) = f (x j )g = 0 GDE { MERA, PO KOTOROJ WY^ISLQETSQ PLOTNOSTX f (x j ) RASPREDELENIQ P : 1
2
1
2
1
2
dOKAZATELXSTWO SOSTOQTELXNOSTI OCENOK MAKSIMALXNOGO PRAWDOPODOBIQ, KAK I OCENOK PO METODU MOMENTOW, OPIRAETSQ NA ZAKON BOLXIH ^ISEL, NO PRI \TOM ISPOLXZUETSQ SLEDU@]EE DOSTATO^NO PROSTOE, NO IGRA@]EE BOLXU@ ROLX W TEORII WEROQTNOSTEJ, NERAWENSTWO. lEMMA 4.1. (NERAWENSTWO jENSENA) pUSTX X { SLU^AJNAQ WELI^INA S KONE^NYM MATEMATI^ESKIM OVIDANIEM. eSLI FUNKCIQ g () DWAVDY DIFFERENCIRUEMA I WYPUKLA (g 00 > 0) NA NEKOTOROM INTERWALE, SODERVA]EM NOSITELX RASPREDELENIQ X I MATEMATI^ESKOE OVIDANIE E g(X ) SU]ESTWUET, TO SPRAWEDLIWO NERAWENSTWO E g(X ) g(EX )
PRI^EM ZNAK RAWENSTWA DOSTIGAETSQ TOGDA I TOLXKO TOGDA, KOGDA RASPREDELENIE X SOSREDOTO^ENO W ODNOJ TO^KE (X = const:):
d O K A Z A T E L X S T W O. tAK KAK FUNKCIQ g DWAVDY DIFFERENCIRUEMA, TO SPRAWEDLIWO SLEDU@]EE PREDSTAWLENIE tEJLORA W OKRESTNOSTI TO^KI = EX : g(X ) = g() + (X ; )g0() + (X ; ) g00( + (X ; ))=2 0 < < 1: wY^ISLQQ MATEMATI^ESKOE OVIDANIE OT OBEIH ^ASTEJ \TOGO RAWENSTWA, POLU^AEM E g(X ) = g(EX ) + E(X ; ) g00 ( + (X ; ))=2 g(EX ): zNAK RAWENSTWA WOZMOVEN TOLXKO W SLU^AE E(X ; ) g00( + (X ; )) = 0: nO POSKOLXKU g00 > 0 TO POSLEDNEE RAWENSTWO S NEOBHODIMOSTX@ WLE^ET (X ; ) = 0 TO ESTX X = const: pOKAVEM TEPERX, ^TO SPRAWEDLIWA tEOREMA 4.1 (SOSTOQTELXNOSTX). eSLI FUNKCIQ LOGARIFMI^ESKOGO 2
2
2
2
PRAWDOPODOBIQ
L( j X
(n)
)=
n X k =1
204
ln f (Xk j )
(3)
IMEET EDINSTWENNYJ MAKSIMUM, TO PRI WYPOLNENII USLOWIJ REGULQRNOSTI (R1){(R3) TO^KA ^n DOSTIVENIQ MAKSIMUMA \TOJ FUNKCII (OCENKA MAKSIMALXNOGO PRAWDOPODOBIQ) QWLQETSQ SOSTOQTELXNOJ OCENKOJ PARAMETRA :
d O K A Z A T E L X S T W O. pOKAVEM, ^TO DLQ L@BOGO FIKSIROWANNOGO ^ 2 I L@BOGO " > 0 WEROQTNOSTX P j n ; j < " ! 1: eSLI { ISTINNOE ZNA^ENIE PARAMETRA TO W SILU USLOWIQ (R1) { WNUTRENNQQ TO^KA . tOGDA SFORMULIROWANNAQ WYE ZADA^A SOSTOIT W DOKAZATELXSTWE SLEDU@]EGO UTWERVDENIQ: W NEKOTOROJ "-OKRESTNOSTI ( ; " + ") FUNKCIQ L( j X n ) OBLADAET LOKALXNYM MAKSIMUMOM S WEROQTNOSTX@, STREMQ]EJSQ K EDINICE PRI n ! 1: nO ESLI PROISHODIT SOBYTIE n o An = L( j X n ) > L( " j X n ) TO WNUTRI \TOJ OKRESTNOSTI IMEETSQ TO^KAMAKSIMUMA, I NAM OSTAETSQ TOLXKO POKAZATX, ^TO P (An) ! 1 IBO P j ^n ; j < " P (An): iSPOLXZUQ USLOWIE (R2) I WID FUNKCII L (SM. (3)), PREDSTAWIM NERAWENSTWO, OPREDELQ@]EE SOBYTIE An W WIDE n 1X f (Xk j ") < 0: ln nk f (Xk j ) w SILU ZAKONA BOLXIH ^ISEL hIN^INA LEWAQ ^ASTX \TOGO NERAWENSTWA SHODITSQ PO WEROQTNOSTI K f (Xk j ") E ln (4) f (Xk j ) I DLQ DOKAZATELXSTWA UTWERVDENIQ DOSTATO^NO POKAZATX, ^TO \TO MATEMATI^ESKOE OVIDANIE STROGO MENXE NULQ (KSTATI, DOKAVITE SAMI, ^TO PRI SPRAWEDLIWOSTI USLOWIJ TEOREMY MATEMATI^ESKOE OVIDANIE (4) WSEGDA SU]ESTWUET, W PROTIWNOM SLU^AE ZAKON BOLXIH ^ISEL hIN^INA NE PRIMENIM). tAK KAK g(x) = ; ln x { WYPUKLAQ FUNKCIQ, TO W SILU NERAWENSTWA jENSENA f (X j ") ln E f (X j ") = E ln f (X j ) f (X j ) Z f (x j ") ln f (x j ) f (x j )d(x) = ln 1 = 0 0
0
0
0
0
0
( )
0
( )
0
0
0
( )
0
0
0
0
=1
0
0
0
0
0
0
0
0
0
X
0
0
205
0
0
PRI^EM RAWENSTWO NUL@ PERWOGO ^LENA W \TOJ CEPO^KE NERAWENSTW WOZMOVNO LIX W SLU^AE f (X j ") = const: f (X j ) TO ESTX, POSKOLXKU INTEGRAL OT PLOTNOSTI RAWEN 1, LIX W SLU^AE f (X j ") = f (X j ) ^TO NEWOZMOVNO W SILU USLOWIQ (R3). tAKIM OBRAZOM, MATEMATI^ESKOE OVIDANIE (4) STROGO MENXE NULQ, I SOSTOQTELXNOSTX OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ DOKAZANA. iZU^IM TEPERX ASIMPTOTI^ESKOE RASPREDELENIE OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ. dLQ \TOGO NAM POTREBUETSQ WWESTI DOPOLNITELXNYE USLOWIQ REGULQRNOSTI. 0
0
0
0
(R4) dLQ KAVDOJ TO^KI PARAMETRI^ESKOGO PROSTRANSTWA SU]ESTWUET NEKOTORAQ EE OKRESTNOSTX, W KOTOROJ FUNKCIQ PLOTNOSTI f (x j) TRIVDY DIFFERENCIRUEMA PO PARAMETRU I @f (x j ) (5) @ H (x) @ f (x j ) (6) @ H (x) @ ln f (x j ) H (x) @ PRI^EM FUNKCII H i H INTEGRIRUEMY PO MERE NA NOSITELE X RASPREDELENIQ X I E H (X ) < 1 W NEKOTOROJ OKRESTNOSTI KAVDOJ TO^KI PARAMETRI^ESKOGO PROSTRANSTWA : (R5) fUNKCIQ 0
1
2
2
2
3
3
1
3
2
3
12 Z 0 12 0 @ ln f ( x ) @ ln f ( X ) I () = E @ @ A = @ @ A f (x ) d(x) > 0 X
j
j
j
KAKOWO BY NI BYLO 2 :
eSTESTWENNO, STOLX GROMOZDKIE I, NA PERWYJ WZGLQD, STRANNYE USLOWIQ TREBU@T NEKOTOROGO KOMMENTARIQ. 206
uSLOWIE (R4) OZNA^AET, ^TO SOOTWETSTWU@]IE PROIZWODNYE FUNKCII PLOTNOSTI RAWNOMERNO INTEGRIRUEMY NA X I PO\TOMU MOVNO WYNOSITX PROIZWODNU@ PO ZA ZNAK INTEGRALA. uSLOWIE (R5) TREBUET POLOVITELXNOSTI O^ENX WAVNOJ, S TO^KI ZRENIQ SOSTOQTELXNOSTI STATISTI^ESKOGO WYWODA, HARAKTERISTIKI WEROQTNOSTNOJ MODELI: I () NAZYWAETSQ INFORMACIEJ PO fIERU W TO^KE SODERVA]EJSQ W NABL@DENII SLU^AJNOJ WELI^INY X: eSLI I () = 0 TO WOZNIKA@T NEPREODOLIMYE TRUDNOSTI S PRINQTIEM KORREKTNOGO REENIQ, SOOTWETSTWU@]EGO \TOJ PARAMETRI^ESKOJ TO^KE : pONQTNO, ^TO ANALOGI^NYM OBRAZOM MOVNO OPREDELITX I INFORMACI@ PO fIERU, SODERVA]U@SQ W SLU^AJNOJ WYBORKE X n : 0 1 n @ ln f ( X j ) n A : In() = E @ @ pRIWEDEM NESKOLXKO UTWERVDENIJ, KASA@]IHSQ SWOJSTW INFORMACII PO fIERU. lEMMA 4.2. 1 : pRI WYPOLNENII USLOWIQ (R4) W ^ASTI (6) DLQ WY( )
( )
2
0
^ISLENIQ INFORMACII PO fIERU MOVNO ISPOLXZOWATX FORMULU
f (X j ) : I () = ; E @ ln @ 2
2
2 : pRI WYPOLNENII USLOWIQ (R4) W ^ASTI (5) INFORMACIQ PO fIERU OBLADAET SWOJSTWOM ADDITIWNOSTI In () = nI () { INFORMACIQ, 0
SODERVA]AQSQ W WYBORKE, RAWNA SUMME INFORMACIJ, SODERVA]IHSQ W NABL@DENII KAVDOJ EE KOMPONENTY.
d O K A Z A T E L X S T W O. 1 : uSLOWIE (R4) W ^ASTI (6) OBESPE^IWAET WOZMOVNOSTX SMENY PORQDKA DIFFERENCIROWANIQ I INTEGRIROWANIQ FUNKCII PLOTNOSTI, PO\TOMU 0 0 0 11 00 @ ln f (X j ) = E B@ f (X j ) ; @ f (X j ) A CA = E @ f (X j ) f (X j ) Z Z f00 (x j ) d f (x j )d(x) ; I () = d f (x j )d(x) ; I () = ;I (): f ( x j ) X X 0
2
2
2
2
2
207
2 : iSPOLXZUQ NEZAWISIMOSTX I ODINAKOWU@ RASPREDELENNOSTX KOMPONENT SLU^AJNOJ WYBORKI, POLU^AEM, ^TO 0 Xn 1 @ ln f ( X j ) k A = In() = E @ @ 0
2
1
0 0 12 n X @ ln f ( X ) k A @ @ E B
j
1 X @ ln f (Xi ) @ ln f (Xj ) C A=
j
;6
j
@ @ @ i j 0 1 n X @ ln f ( X j ) k A ; X E @ ln f (Xi j ) E @ ln f (Xj j ) = nI () E @ @ @ @ k i6 j POSKOLXKU, W SILU NERAWENSTWA (5) W USLOWII (R4), MATEMATI^ESKOE OVIDANIE Z f0 (x j ) Z @ ln f ( X j ) d E = f (x j ) f (x j ) d(x) = d f (x j ) d(x) = 0: @ X X k =1
=
2
=1
=
tEPERX PRISTUPIM K WYWODU ASIMPTOTI^ESKOGO RASPREDELENIQ OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ SKALQRNOGO PARAMETRA : tEOREMA 4.2 (ASIMPTOTI^ESKAQ NORMALXNOSTX ). pRI WYPOLNENII n ^ ^ USLOWIJ (R1){(R5) L@BOJ KORENX n = n (X ) URAWNENIQ PRAWDOPODOBIQ @ L( j X n )=@ = 0 ASIMPTOTI^ESKI (n ! 1) NORMALEN SO SREDNIM I DISPERSIEJ (nI ()); TO ESTX q ^ lim P (n ; ) nI () < x = (x): n!1 ( )
( )
1
d O K A Z A T E L X S T W O. eSLI ^n { OCENKA PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ (KORENX URAWNENIQ PRAWDOPODOBIQ), TO IMEET MESTO TOVDESTWO @ L(^n j X n )=@ = 0: iSPOLXZUQ USLOWIE (R4), RAZLOVIM EGO LEWU@ ^ASTX PO FORMULE tEJLORA W OKRESTNOSTI ISTINNOGO ZNA^ENIQ PARAMETRA : @ L(^n j X n )=@ = L0( j X n )+ (^n ; )L00 ( j X n ) + (^n ; ) L000( j X n )=2 = 0 GDE PROIZWODNYE OT FUNKCII PRAWDOPODOBIQ L WY^ISLQ@TSQ PO PARAMETRU A = + (^n ; ) 0 < < 1: ( )
0
( )
0
1
0
0
0
( )
0
0
208
2
( )
1
( )
rAZREIM POLU^ENNOE URAWNENIE OTNOSITELXNO WELI^INY pn(^n ; ) KOTORAQ, SOGLASNO UTWERVDENI@ TEOREMY, DOLVNA IMETX W PREDELE PRI n ! 1 NORMALXNOE RASPREDELENIE SO SREDNIM 0 I DISPERSIEJ I ( ) ]; : pn(^n ; ) = L0( j X n )=pn ;L00( j X n )=n ; (^n ; )L000( j X n )=2n : (7) ~ISLITELX PRAWOJ ^ASTI \TOGO PREDSTAWLENIQ n @ ln f (X j ) X 1 1 k 0 n pn L ( j X ) = pn @ ESTX NORMIROWANNAQ NA pn SUMMA NEZAWISIMYH, ODINAKOWO RASPREDELENNYH SLU^AJNYH WELI^IN S NULEWYMI SREDNIMI I DISPERSIQMI I ( ) > 0 (SM. DOKAZATELXSTWO PUNKTA 2 LEMMY 4.2). tAKIM OBRAZOM, W SILU CENTRALXNOJ PREDELXNOJ TEOREMY ^ISLITELX PRAWOJ ^ASTI (7) ASIMPTOTI^ESKI NORMALEN S \TIMI PARAMETRAMI, I DLQ ZAWERENIQ DOKAZATELXSTWA TEOREMY DOSTATO^NO POKAZATX, ^TO ZNAMENATELX (7) SHODITSQ PO WEROQTNOSTI K POSTOQNNOJ I ( ) I SOSLATXSQ NA PUNKT (2) PREDLOVENIQ 11.1 (TEOREMA TIPA sLUCKOGO) KURSA tw. w SILU ZAKONA BOLXIH ^ISEL I UTWERVDENIQ 1 LEMMY 4.2 PERWOE SLAGAEMOE W ZNAMENATELE (7) ; n1 L00( j X n ) = ; n1 Xn @ ln f@(Xk j ) !P ;E @ ln f@(X j ) = I ( ) TAK ^TO OSTAETSQ POKAZATX, ^TO I WTOROE SLAGAEMOE SHODITSQ PO WEROQTNOSTI K NUL@. tAK KAK PRI WYPOLNENII USLOWIJ (R1){(R3) OCENKA MAKSIMALXNOGO PRAWDOPODOBIQ SOSTOQTELXNA, TO ^n ; ! 0: mNOVITELX PRI \TOJ P RAZNOSTI n @ ln f (X j ) 1 L000( j X n ) = 1 X k n n @ W SILU USLOWIQ (R4), NA^INAQ S NEKOTOROGO n PO ABSOL@TNOJ WELI^INE Xn NE PREWOSHODIT (1=n) H (Xk ) (\TO TO n PRI KOTOROM POPADAET W OKRESTNOSTX TO^KI ). pRIMENQQ K \TOJ SUMME ZAKON BOLXIH ^ISEL, POLU^AEM, ^TO ONA SHODITSQ PO WEROQTNOSTI K E H (X ) < 1 0
0
1
( )
0
0
( )
0
0
( )
1
( )
0
1
0
0
0
0
0
2
( )
2
0
1
0
0
2
2
0
3
( )
1
1
1
3
1
3
1
0
0
3
209
0
I PO\TOMU UKAZANNYJ WYE SOMNOVITELX OGRANI^EN S WEROQTNOSTX@ EDINICA, A WSE WTOROE SLAGAEMOE W ZNAMENATELE PRAWOJ ^ASTI (7) SHODITSQ PO WEROQTNOSTI K NUL@. dOKAZANNAQ TEOREMA, KAK BUDET WIDNO IZ OSNOWNOGO REZULXTATA SLEDU@]EGO PARAGRAFA, USTANAWLIWAET ASIMPTOTI^ESKU@ OPTIMALXNOSTX OCENOK MAKSIMALXNOGO PRAWDOPODOBIQ S TO^KI ZRENIQ KWADRATI^NOGO RISKA.
210
x5. |FFEKTIWNOSTX OCENOK lEKCIQ 8
oBSUVDAQ W NA^ALE NAEGO KURSA OB]U@ PROBLEMU STATISTI^ESKOGO WYWODA, MY GOWORILI O GLAWNOJ ZADA^E MATEMATI^ESKOJ STATISTIKI { POSTROENII REA@]IH PRAWIL n = n(X n ), MINIMIZIRU@]IH RAWNOMERNO PO WSEM 2 FUNKCI@ RISKA R( n): k SOVALENI@, BEZ DOPOLNITELXNYH OGRANI^ENIJ NA KLASS REA@]IH FUNKCIJ \TA ZADA^A NE RAZREIMA. dEJSTWITELXNO, RASSMOTRIM PROBLEMU OCENKI PARAMETRA W KOTOROJ PROSTRANSTWO REENIJ D SOWPADAET S PARAMETRI^ESKIM PROSTRANSTWOM A REA@]AQ FUNKCIQ n = ^n { OCENKA : wOZXMEM W KA^ESTWE OCENKI NEKOTORU@ FIKSIROWANNU@ TO^KU 2 TO ESTX PRI L@BOM REZULXTATE x n STATISTI^ESKOGO \KSPERIMENTA BUDEM PRINIMATX ODNO I TO VE REENIE d = : eSLI FUNKCIQ POTERX OBLADAET TEM ESTESTWENNYM SWOJSTWOM, ^TO L( ) = 0 KAKOWO BY NI BYLO ZNA^ENIE 2 TO RISK TAKOJ OCENKI R( ) = L( ) PRI = RAWEN NUL@. tAKIM OBRAZOM, ESLI MY HOTIM POSTROITX OCENKU S RAWNOMERNO MINIMALXNYM RISKOM W KLASSE WSEWOZMOVNYH OCENOK TO MY DOLVNY NAJTI OCENKU n S FUNKCIEJ RISKA R( n ) 0 I PONQTNO, ^TO TAKOJ OCENKI NE SU]ESTWUET. pO\TOMU MY BUDEM WSEGDA PRI POISKE OPTIMALXNYH REENIJ UKAZYWATX KLASS OCENOK, W KOTORYH I]ETSQ OPTIMALXNOE REENIE. oPREDELENIE 5.1. oCENKA n = n (X n ) NAZYWAETSQ OPTIMALXNOJ ILI OCENKOJ S RAWNOMERNO MINIMALXNYM RISKOM W KLASSE K OCENOK PARAMETRA ESLI DLQ L@BOJ OCENKI ^n 2 K I KAVDOGO 2 IMEET MESTO NERAWENSTWO R( n ) R( ^n): nIVE PREDLAGAETSQ METOD NAHOVDENIQ OPTIMALXNYH OCENOK SKALQRNOGO PARAMETRA PRI KWADRATI^NOJ FUNKCII POTERX W KLASSE NESME]ENNYH OCENOK: E ^n(X n ) = PRI L@BOM 2 R NO PRI DOPOLNITELXNYH OGRANI^ENIQH NA WEROQTNOSTNU@ MODELX I SOOTWETSTWU@]EE SEMEJSTWO RASPREDELENIJ OCENKI. |TI OGRANI^ENIQ ANALOGI^NY TEM USLOWIQM REGULQRNOSTI, KOTORYE MY NAKLADYWALI NA WEROQTNOSTNU@ MODELX PRI IZU^ENII ASIMPTOTI^ESKIH SWOJSTW OCENOK MAKSIMALXNOGO PRAWDOPODOBIQ. mY POKAVEM, ^TO KWADRATI^NYJ RISK L@BOJ NESME]ENNOJ OCENKI, UDOWLETWORQ@]EJ \TIM USLOWIQM, NE MOVET BYTX MENXE nI ()]; { ASIMPTOTI^ESKOJ DISPERSII OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ (SM. TEOREMA 4.2). sLEDOWATELXNO, METOD ( )
0
( )
0
0
0
( )
( )
1
211
0
MAKSIMALXNOGO PRAWDOPODOBIQ DOSTAWLQET ASIMPTOTI^ESKOE REENIE PROBLEMY OPTIMALXNOJ OCENKI. bOLEE TOGO, MY POKAVEM, ^TO PRI NALI^II DOSTATO^NYH STATISTIK METOD MAKSIMALXNOGO PRAWDOPODOBIQ MOVET PRIWESTI I K TO^NOMU REENI@ PROBLEMY RAWNOMERNOJ MINIMIZACII FUNKCII RISKA. sFORMULIRUEM USLOWIQ REGULQRNOSTI, PRI WYPOLNENII KOTORYH BUDET NAHODITXSQ NIVNQQ (DOSTIVIMAQ!) GRANICA KWADRATI^NOGO RISKA OCENKI. nOSITELX X RASPREDELENIQ P NABL@DAEMOJ SLU^AJNOJ WELI^INY X NE ZAWISIT OT 2 (USLOWIE, SOWPADA@]EE S (R2) W x4). (B2) iNFORMACIQ PO fIERU I ( ) STROGO POLOVITELXNA PRI L@BOM 2 (USLOWIE, SOWPADA@]EE S (R5) W x4). (B3) rAWENSTWO Z n n Xn fn(x j ) dn (x ) = 1 MOVNO DIFFERENCIROWATX PO POD ZNAKOM INTEGRALA, TO ESTX Z 0 n n j ) dn (x ) = 0: n fn (x X pO ANALOGII S (R4) W ^ASTI (5) DLQ \TOGO DOSTATO^NO POTREBOWATX SU]ESTWOWANIE TAKOJ INTEGRIRUEMOJ PO MERE FUNKCII H (x) ^TO W NEKOTOROJ OKRESTNOSTI L@BOJ TO^KI 2 WYPOLNQETSQ NERAWENSTWO j @f (x j )=@ j H (x) x 2 X : ^ = ^ (X n ) DOLVNA PRINADLEVATX KLASSU OCENOK K0 (B4) oCENKA n n SREDNEE ZNA^ENIE KOTORYH Z n ^ E n(X ) = Xn ^n(x n )fn(x n j ) dn (x n ) MOVNO DIFFERENCIROWATX PO 2 POD ZNAKOM INTEGRALA. kONE^NO, USLOWIE (B4) TREBUET KOMMENTARIQ. w \WYSOKOJ" TEORII STATISTI^ESKOGO WYWODA PRIWODQTSQ DOSTATO^NYE USLOWIQ NA SEMEJSTWO RASPREDELENIJ fP 2 g NABL@DAEMOJ SLU^AJNOJ WELI^INY X KOTORYE OBESPE^IWA@T WYPOLNENIE USLOWIQ (B4), NO FORMULIROWKA \TIH USLOWIJ I, W OSOBENNOSTI, DOKAZATELXSTWO TOGO, ^TO ONI WLEKUT (B4), NASTOLXKO TEHNI^ESKI I KONCEPTUALXNO SLOVNY, ^TO MOGUT SOSTAWITX PREDMET SPECIALXNOGO KURSA. oDNAKO WSE IZU^AEMYE NAMI W
(B1)
( )
( )
( )
( )
( )
( )
( )
212
( )
( )
KURSE tw WEROQTNOSTNYE MODELI, ZA ISKL@^ENIEM RAWNOMERNOGO RASPREDELENIQ, UDOWLETWORQ@T \TIM USLOWIQM, I PO\TOMU L@BAQ OCENKA IH PARAMETROW PRINADLEVIT KLASSU K0: pREVDE, ^EM POLU^ITX OSNOWNOJ \TEHNI^ESKIJ" REZULXTAT \TOGO PARAGRAFA, WSPOMNIM ODNO ZAME^ATELXNOE NERAWENSTWO IZ KURSA MATEMATI^ESKOGO ANALIZA. |TO { NERAWENSTWO kOI{bUNQKOWSKOGO, KOTOROE W SLU^AE INTEGRALOW lEBEGA PO WEROQTNOSTNOJ MERE P NAZYWAETSQ NERAWENSTWOM {WARCA. pUSTX Y { SLU^AJNAQ WELI^INA S RASPREDELENIEM P I g h { DWE INTEGRIRUEMYE S KWADRATOM PO MERE P FUNKCII NA OBLASTI Y ZNA^ENIJ Y: dLQ \TIH FUNKCIJ IMEET MESTO NERAWENSTWO (E g (Y )h(Y )) E g (Y ) E h (Y ) ILI, ^TO TO VE, 2
2
2
Z
2
Z
Z
g(y)h(y) dP (y) Y g (y)dP (y) Y h (y)dP (y) PRI^EM ZNAK RAWENSTWA DOSTIGAETSQ TOGDA I TOLXKO TOGDA, KOGDA FUNKCII g I h LINEJNO ZAWISIMY: SU]ESTWU@T TAKIE POSTOQNNYE a I b ^TO ag(y) + bh(y) = 0 DLQ PO^TI WSEH y 2 Y PO MERE P: tEOREMA 5.1. (NERAWENSTWO rAO{kRAMERA) pRI WYPOLNENII USLOWIJ (B1){(B4) DLQ KWADRATI^NOGO RISKA L@BOJ OCENKI ^n 2 K0 SPRA2
2
Y
WEDLIWO NERAWENSTWO
E
X ^ ( n
(n)
)
2
; D
( )=d ] X ) dnI ( )
^ n(
2
(n)
(1)
GDE () = E ^n (X (n) ) PRI^EM ZNAK RAWENSTWA MEVDU RISKOM I DISPERSIEJ OCENKI ^n DOSTIGAETSQ NA NESME]ENNYH OCENKAH: () = A ZNAK RAWENSTWA WO WTOROM NERAWENSTWE (1) IMEET MESTO TOGDA I TOLXKO TOGDA, KOGDA SU]ESTWUET TAKAQ PARAMETRI^ESKAQ FUNKCIQ C () 2 ^TO
@ L( j X n ) X ) ; () = C () @ PO^TI NAWERNOE PO MERE P : d O K A Z A T E L X S T W O. pRODIFFERENCIRUEM OBE ^ASTI RAWENSTW Z n n Xn fn(x j ) dn (x ) = 1 ^ ( n
( )
(n)
( )
Z
( )
n n n ^ Xn n(x )fn(x j ) dn (x ) = () ( )
( )
213
( )
(2)
PO PARAMETRU ZANOSQ PROIZWODNYE W LEWYH ^ASTQH POD ZNAKI INTEGRALOW, ^TO MOVNO SDELATX BLAGODARQ USLOWIQM (B3) I (B4). pOLU^ENNYJ REZULXTAT, ISPOLXZUQ USLOWIE (B1), PREDSTAWIM W WIDE Z @ L( j x n ) n n f j ) dn (x ) = 0 n n (x X @ n Z ) n @ L( j x n n 0 ^ n n (x ) X @ fn(x j ) dn(x ) = (): wY^TEM IZ WTOROGO RAWENSTWA PERWOE, UMNOVIW EGO PREDWARITELXNO NA () : @ L( j x n ) Z n n 0 n ^ f j ) dn (x ) = ( ): n n (x ) ; ( ) n (x X @ pRIMENIM K LEWOJ ^ASTI POLU^ENNOGO RAWENSTWA NERAWENSTWO {WARCA, POLAGAQ y = x n Y = Xn g(x n ) = ^n(x n ) ; () h(x n ) = @ L( j x n )=@ dP (y) = fn(x n j )dn(x n ): w REZULXTATE POLU^IM NERAWENSTWO Z n n n ^ ( 0( )) Xn n(x ) ; () fn(x j ) dn (x ) ( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
2
( )
( )
( )
( )
Z
( )
( )
( )
( )
2
( )
( )
( )
0 12 (n) @ L ( j x ) @ A fn(x(n) j ) dn (x(n) ) n
X
(3) @ W KOTOROM ZNAK RAWENSTWA DOSTIGAETSQ TOGDA I TOLXKO TOGDA, KOGDA WYPOLNQETSQ SOOTNOENIE (2). mY POLU^ILI NERAWENSTWA (1), POSKOLXKU PERWOE IZ NIH O^EWIDNO (NA DISPERSII DOSTIGAETSQ MINIMUM WSEWOZMOVNYH SREDNIH KWADRATI^NYH UKLONENIJ SLU^AJNOJ WELI^INY OT POSTOQNNOJ). wTOROE NERAWENSTWO W (1) ESTX SLEDSTWIE NERAWENSTWA (3), IBO PERWYJ INTEGRAL W PRAWOJ ^ASTI (3) RAWEN D ^n A WTOROJ INTEGRAL OPREDELQET FIEROWSKU@ INFORMACI@ In() SODERVA]U@SQ W WYBORKE. nAKONEC, IZ PUNKTA 2 LEMMY 4.2 SLEDUET, ^TO In() = nI (): sLEDSTWIE 5.1. eSLI ^n PRINADLEVIT PODKLASSU K K0 NESME]ENNYH OCENOK KLASSA K0 TO EE KWADRATI^NYJ RISK R( ^n) = D ^n n I ()]; (4) 0
1
PRI^EM ZNAK RAWENSTWA TOGDA I TOLXKO TOGDA, KOGDA WYPOLNQETSQ RAWENSTWO (2) S () = : 214
pONQTNO, ^TO \TO SLEDSTWIE ESTX ^ASTNYJ SLU^AJ DOKAZANNOJ TEOREMY. oNO UKAZYWAET NEKONSTRUKTIWNYJ PUTX K POSTROENI@ NESME]ENNYH OCENOK S RAWNOMERNO MINIMALXNYM RISKOM. dOSTATO^NO WY^ISLITX PROIZWODNU@ W PRAWOJ ^ASTI RAWENSTWA (2) I ZATEM PODBIRATX STATISTIKU ^n = ^n(X n ) I PARAMETRI^ESKU@ FUNKCI@ C () DLQ KOTORYH IMEET MESTO RAWENSTWO @ L( j X n ) n ^ n(X ) ; = C () @ : oBY^NO \TO MOVNO SDELATX W SLU^AE STATISTI^ESKIH STRUKTUR, OBLADA@]IH DOSTATO^NYMI STATISTIKAMI, GDE, W SILU TEOREMY FAKTORIZACII (TEOREMA 2.1 IZ x2), FUNKCIQ PRAWDOPODOBIQ L( j X n ) = g (T (X n ))h(X n ) I POSLEDNEE RAWENSTWO IMEET WID n @ ln g (T (X )) n ^ n(X ) ; = C () : (5) @ nAPRIMER, DLQ POKAZATELXNOGO RASPREDELENIQ S FUNKCIEJ PLOTNOSTI f (x j ) = ; expf;x=g x > 0 FUNKCIQ n ; Xn ln g (X ) = ;n ln ; X EE PROIZWODNAQ X @ ln g (T (X n ))=@ = ;n= + n X= I RAWENSTWO (5) WYPOLNQETSQ PRI C () = =n I ^n = X: tAKIM OBRAZOM, WYBORO^NOE SREDNEE X ESTX NESME]ENNAQ OCENKA S RAWNOMERNO MINIMALXNYM RISKOM DLQ PARAMETRA POKAZATELXNOGO RASPREDELENIQ. nAPOMNIM, ^TO X OCENKA KAK PO METODU MOMENTOW, TAK I PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ. lEGKO PONQTX, ^TO ESLI W (4) DOSTIGAETSQ ZNAK RAWENSTWA, TO ^n { OPTIMALXNAQ OCENKA W KLASSE K NO OBRATNOE, WOOB]E GOWORQ, MOVET I NE WYPOLNQTXSQ { MY NE RASPOLAGAEM UTWERVDENIEM, ^TO L@BAQ OPTIMALXNAQ OCENKA IMEET KWADRATI^NYJ RISK, RAWNYJ n I ()]; : ~TOBY POD^ERKNUTX \TO RAZLI^IE I UKAZATX W DALXNEJEM BOLEE KONSTRUKTIWNYJ METOD POSTROENIQ OPTIMALXNYH OCENOK, WWEDEM E]E ODNO OPREDELENIE, RASSMOTREW BOLEE OB]U@ ZADA^U NESME]ENNOJ OCENKI NEKOTOROJ PARAMETRI^ESKOJ FUNKCII (): ( )
( )
( )
( )
( )
( )
( )
( )
1
( )
1
1
( )
2
1
2
1
215
nESME]ENNAQ OCENKA ^n = ^n(X n ) PARAMETRI^ESKOJ FUNKCII () NAZYWAETSQ\FFEKTIWNOJ W KLASSE K ESLI EE KWADRATI^NYJ RISK R( ^n) = E ^n(X n ) ; () = D ^n(X n ) = 0 ^ =
( ) ] =n I ( ) TO ESTX (SM. TEOREMU 5.1 S ^n ) WYPOLNQETSQ RAn WENSTWO @ L( j X n ) n ^n(X ) ; () = C () @ : (6) oCENKA ^n NAZYWAETSQ ASIMPTOTI^ESKI \FFEKTIWNOJ W KLASSE K0 ESLI E ^n(X n ) () I D ^n(X n ) 0()=n I () KOGDA n ! 1: w SILU TEOREMY 4.2 OCENKA PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ SKALQRNOGO PARAMETRA (W DANNOM SLU^AE () = ) QWLQETSQ ASIMPTOTI^ESKI \FFEKTIWNOJ OCENKOJ W KLASSE K0: pOKAVEM, ^TO ONA DAET REENIE PROBLEMY POSTROENIQ \FFEKTIWNOJ OCENKI W KLASSE K: pUSTX ^n { OCENKA MAKSIMALXNOGO PRAWDOPODOBIQ PARAMETRA : oPREDELIM OCENKU (^n) PARAMETRI^ESKOJ FUNKCII () S POMO]X@ PODSTANOWKI WMESTO EE OCENKI ^n: tEOREMA 5.2. eSLI (^n) ESTX NESME]ENNAQ OCENKA PARAMETRI^ESKOJ FUNKCII () I \FFEKTIWNAQ W KLASSE K OCENKA n PARAMETRI^ESKOJ FUNKCII () SU]ESTWUET, TO PRI WYPOLNENII USLOWIJ REGULQRNOSTI (R1){(R5) I (B3){(B4) PO^TI NAWERNOE n (X n ) = (^n (X n )): oPREDELENIE 5.2.
( )
2
( )
( )
2
( )
( )
( )
( )
( )
( )
d O K A Z A T E L X S T W O. eSLI n { \FFEKTIWNAQ OCENKA () TO ONA UDOWLETWORQET RAWENSTWU (6): n(X n ) ; () = C ()@ L( j X n )=@ (7) KAKOWO BY NI BYLO 2 : nO ESLI ^n { OCENKA PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ, TO @ L(^n j X n )=@ = 0 TAK ^TO RAWENSTWO (7) PRI = ^n PREWRA]AETSQ W RAWENSTWO n(X n ) ; (^n) = 0 PO^TI NAWERNOE PO WEROQTNOSTI P n: iZ DOKAZANNOJ TEOREMY NEMEDLENNO WYTEKAET, ^TO WYBORO^NOE SREDNEE X ESTX \FFEKTIWNAQ (SLEDOWATELXNO, I OPTIMALXNAQ) NESME]ENNAQ OCENKA PARAMETRA TAKIH RASPREDELENIJ, KAK DWUHTO^E^NOE, BINOMIALXNOE PRI IZWESTNOM m pUASSONA, POKAZATELXNOE X ESTX TAKVE NESME]ENNAQ OCENKA S RAWNOMERNO MINIMALXNYM KWADRATI^NYM RISKOM SREDNEGO ZNA^ENIQ NORMALXNOGO ( ) RASPREDELENIQ. ( )
( )
( )
( )
2
216
x6. dOWERITELXNYE INTERWALY lEKCIQ 9
mY RASSMOTRELI NESKOLXKO METODOW POSTROENIQ TO^E^NYH OCENOK DLQ PARAMETROW ZNA^ENIQ KOTORYH OPREDELQ@T RASPREDELENIE NABL@ DAEMOJ SLU^AJNOJ WELI^INY bYL POLU^EN RQD UTWERVDENIJ O RAS PREDELENII TAKIH OCENOK ^TO POZWOLQET SUDITX O NADEVNOSTI OCENKI PRI ZADANNOJ TO^NOSTI TO ESTX WY^ISLQTX WEROQTNOSTI SOBYTIJ WIDA j n X n ; j PRI KAVDOM FIKSIROWANNOM ZNA^ENII PARAMETRA : pOSKOLXKU IMENNO ZNA^ENIE NAM NEIZWESTNO TO TAKOGO RODA WY ^ISLENIQ ZA^ASTU@ LIENY PRAKTI^ESKOGO SMYSLA SLIKOM WELIK RAZMAH W NADEVNOSTI OCENKI n PRI RAZLI^NYH DAVE W SLU^AE KOGDA MY RASPOLAGAEM NEKOTOROJ APRIORNOJ INFORMACIEJ O WOZMOVNOJ OB LASTI ZNA^ENIJ \TOGO PARAMETRA pO\TOMU W RQDE PRAKTI^ESKIH SITU ACIJ PYTA@TSQ REATX OBRATNU@ ZADA^U DLQ FIKSIROWANNOJ NADEV NOSTI SKAVEM ; GDE MALO UKAZATX NEKOTORU@ OBLASTX ZNA^ENIJ ZAWISQ]U@ ESTESTWENNO OT WYBORKI X n KOTORAQ S WEROQTNOSTX@ NE MENXEJ ; NAKRYWAET ISTINNOE NEIZWESTNOE NAM ZNA^ENIE PRI^EM TAKOE NADEVNOSTNOE UTWERVDENIE DOLVNO WYPOLNQTXSQ PRI L@BYH 2 : w TAKOM SLU^AE PO RAZMERAM OBLASTI KOTORYE OPRE DELQ@TSQ WYBORO^NYMI ZNA^ENIQMI x n MOVNO SUDITX O TO^NOSTI TAKOJ INTERWALXNOJ OCENKI n oPREDELENIE 6.1. pODMNOVESTWO n PARAMETRI^ES n X KOGO PROSTRANSTWA NAZYWAETSQ ; DOWERITELXNOJ OBLASTX@ ESLI P n X n 3 ; KAKOWO BY NI BYLO ZNA^ENIE 2 : zADANNOE FIKSIROWANNOE ZNA^E NIE ; NAZYWAETSQ DOWERITELXNYM UROWNEM A NAIMENXEE ZNA ^ENIE LEWOJ ^ASTI NERAWENSTWA PO WSEM 2 DOWERITELXNYM KO\FFICIENTOM w SLU^AE DOWERITELXNAQ OBLASTX WIDA n n n X n X NAZYWAETSQ DOWERITELXNYM INTERWALOM W n KOTOROM RAZLI^A@TSQ NIVNIJ n I WERHNIJ n DOWERITELXNYE PREDELY dOWERITELXNYE INTERWALY WIDA n 1 I ;1 n NAZYWA@TSQ SOOTWETSTWENNO NIVNEJ I WERHNEJ DOWERITELXNYMI GRANICAMI eSTESTWENNO KONFIGURACIQ DOWERITELXNOJ OBLASTI WYBIRAETSQ STA TISTIKOM SOOBRAZUQSX S EE GEOMETRI^ESKOJ NAGLQDNOSTX@ I GLAWNOE ,
-
.
-
,
,
( )
^ (
)
,
-
{
^
,
-
.
-
:
,
, 1
-
,
,
( )
,
1
,
,
,
-
)
-
( )
.
(1
(
( )
= (
)-
,
1
(1)
)
(
1
)
.
=
-
,
(1)
( )
(
( )
)
(
( )
-
{
R
)
,
.
(
)
(
)
.
,
,
,
217
,
-
WOZMOVNOSTX@ GARANTIROWATX DOWERITELXNU@ WEROQTNOSTX w SLU^AE SKALQRNOGO PARAMETRA DOWERITELXNAQ OBLASTX OBY^NO WYBIRAETSQ W WIDE INTERWALA PRI^EM W RQDE SLU^AEW NAPRIMER PRI OCENKE NADEV NOSTI ILI WEROQTNOSTI NEVELATELXNOGO SOBYTIQ W WIDE ODNOSTORON NEGO INTERWALA w SLU^AE MNOGOMERNOGO PARAMETRA OBY^NO STROQTSQ DOWERITELXNYE \LLIPSOIDY ILI PARALLELEPIPEDY sLEDUET OBRATITX OSOBOE WNIMANIE NA PRAWILXNU@ FORMULIROWKU DOWERITELXNOGO UTWERVDENIQ KOTORAQ POD^ERKIWAETSQ W NERAWENSTWE ZAPISX@ n X n 3 WMESTO OBY^NOGO 2 n X n : gOWORITX ^TO ZNA^ENIE PARAMETRA S WEROQTNOSTX@ NE MENXEJ ; PRINAD LEVIT OBLASTI n ZNA^IT SOZNATELXNO WWODITX TRUDQ]IHSQ NA NIWE PRIKLADNOJ STATISTIKI W ZABLUVDENIE dELO W TOM ^TO ZNA^ENIE PA RAMETRA W DANNOJ WEROQTNOSTNOJ MODELI NE QWLQETSQ SLU^AJNOJ WE LI^INOJ \TO POSTOQNNAQ SWOJSTWENNAQ ISSLEDUEMOMU OB_EKTU A PO STOQNNAQ PRINADLEVIT KAKOJ LIBO OBLASTI TOLXKO S WEROQTNOSTX@ EDINICA ILI NOLX wSQ SLU^AJNOSTX ZAKL@^ENA W SAMOJ DOWERITELX NOJ OBLASTI n X n I PO\TOMU PRAWILXNOE DOWERITELXNOE UTWERV DENIE GLASIT OBLASTX n X n S WEROQTNOSTX@, NE MENXEJ ; NAKRYWAET ISTINNOE (NEIZWESTNOE) ZNA^ENIE : w SAMOM NA^ALE NAEGO KURSA MATEMATI^ESKOJ STATISTIKI W PRIME RE S OPREDELENIEM SODERVANIQ OB]EJ SERY W DIZELXNOM TOPLIWE MY STROILI DOWERITELXNYJ INTERWAL FIKSIROWANNOJ IRINY DLQ SRED NEGO ZNA^ENIQ NORMALXNOGO RASPREDELENIQ KOGDA ZANIMALISX PLANI ROWANIEM OB_EMA ISPYTANIJ NEOBHODIMOGO DLQ DOSTIVENIQ ZADANNOJ TO^NOSTI I NADEVNOSTI OCENKI rASSMOTRIM E]E RAZ \TOT PRIMER W SWETE WWEDENNYH PONQTIJ INTERWALXNOJ OCENKI PARAMETRA : dOWERITELXNYJ INTERWAL DLQ SREDNEGO ZNA^ENIQ NORMALXNOGO RASPREDELENIQ PRI IZWESTNOJ DISPERSII iTAK W PRIMERE MY IMELI DELO S WYBORKOJ X n IZ NORMALXNOGO RASPREDELENIQ PRI^EM ZNA^ENIE PARAMETRA NAM BYLO IZWESTNO TAK ^TO W KA^ESTWE NEIZWESTNOGO PARAMETRA WYSTUPALO : nAA ZADA n ^A SOSTOIT W POSTROENII TAKOGO INTERWALA n X n X n ^TO P n n ; PRI L@BOM ZNA^ENII 2 : nAPOMNIM ^TO W \TOM PRIMERE OCENKOJ SLUVILO WYBORO^NOE SREDNEE X NESME]ENNAQ OCENKA S MINIMALXNYM KWADRATI^NYM RISKOM |TA LINEJNAQ OCENKA OBLADAET ZAME^ATELXNYM SWOJSTWOM IN .
,
,
,
-
,
-
.
.
,
(1)
(
( )
)
(
,
( )
)
,
1
-
.
,
-
,
,
,
-
-
.
(
-
( )
)
:
-
( )
(
)
1
-
1.1
-
,
-
,
.
.
0
1
.
( )
1.1
,
2
(
,
)
,
-
(
1
( )
)
(
( )
)
R
,
{
.
-
218
WARIANTNOSTI RASPREDELENIE RAZNOSTI X ; NE ZAWISIT OT I \TO OBSTOQTELXSTWO PODSKAZYWAET NAM PUTX K POSTROENI@ DOWERITELXNOGO INTERWALA dEJSTWITELXNO 0 1 p j X ; j P@ n A ; I ESLI POLOVITX RAWNYM KORN@ URAWNENIQ ; ; TO p ; ESTX pWYBRATX ; = TO INTERWAL X ; = n X = n BUDET ; DOWERITELXNYM INTERWALOM DLQ SREDNEGO ZNA ^ENIQ NORMALXNOGO RASPREDELENIQ PRI IZWESTNOJ DISPERSII : w \TOM PROSTEJEM PRIMERE NA POSTROENIE DOWERITELXNOGO INTER WALA KL@^EWYM MOMENTOM BYLO ISPOLXZOWANIE INWARIANTNOJ SLU^AJ NOJ FUNKCII n ; OT OCENKI n X I PARAMETRA : w PRINCIPE IMENNO NA PODOBNOM WYBORE OPORNOJ FUNKCII H n S PODHODQ]EJ OCENKOJ n PARAMETRA OSNOWANY ISTORI^ESKI PERWYE METODY PO STROENIQ DOWERITELXNYH INTERWALOW I MNOVESTW oPORNAQ FUNKCIQ H PODBIRAETSQ TAKIM OBRAZOM ^TOBY ONA BYLA MONOTONNO WOZ RASTA@]EJ FUNKCIEJ WTOROGO ARGUMENTA I PRI \TOM WEROQTNOSTX P H n X n DLQ NEKOTORYH ZNA^ENIJ DOLVNA OSTAWATXSQ DOSTATO^NO WYSOKOJ BLIZKOJ K EDINICE KAKOWO BY NI BYLO ZNA^E NIE 2 : mY PROILL@STRIRUEM \TOT METOD POSTROENIQ DOWERITELX NYH INTERWALOW S POMO]X@ PODBORA INWARIANTNYH OPORNYH FUNKCIJ NA PRIMERE NORMALXNOGO RASPREDELENIQ STROQ DOWERITELXNYE INTERWALY DLQ KAVDOGO IZ PARAMETROW PRI IZWESTNOM I NEIZWESTNOM ZNA^ENIQH DRUGOGO MEA@]EGO PARAMETRA : wERHNQQ DOWERITELXNAQ GRANICA DLQ DISPERSII NORMALXNOGO RASPREDELENIQ PRI IZWESTNOM SREDNEM pRI WYBORE IZ NORMALXNOGO RASPREDELENIQ S IZWESTNYM SREDNIM ZNA^ENI EM METOD MAKSIMALXNOGO PRAWDOPODOBIQ PRIWODIT K NESME]ENNOJ Xn ; OCENKE n n Xk ; PARAMETRA : iSPOLXZUQ REZULXTATY PREDYDU]EGO PARAGRAFA NETRUDNO POKAZATX ^TO n ESTX NESME]EN NAQ OCENKA S RAWNOMERNO MINIMALXNYM RISKOM pOSKOLXKU W ^EM MY NEODNOKRATNO UBEVDALISX Yk Xk ; = N k : : : n TO ESTESTWENNO RASSMOTRETX W KA^ESTWE OPORNOJ Xn ; FUNKCI@ H n Xk ; : nAJDEM EE RASPREDELENIE :
.
,
= 2(
)
1
2(
=
)
1
=
(1
(1
2)
)
1 = 1
(
+
)-
-
2
(
)
2
-
-
^
^
=
=
(^
,
)
^
-
.
(
)
,
(^ (
( )
)
-
)
(
),
-
-
2
(
(\
2
)
,
")
.
0
.
2
(
^
2
1
=
1
)
-
2 )
(
2
,
,
^
2
-
.
,
(0
1)
,
= (
)
= 1 (^
2
2
) =
2
1
2 )
(
219
.
lEMMA 6.1. eSLI Y1 : : : Yn NEZAWISIMY I ODINAKOWO RASPREDELENY X
PO STANDARTNOMU NORMALXNOMU ZAKONU N (0 RASPREDELENIE G(n=2 2):
TO
n
1)
1
Yk
2
IMEET GAMMA-
d O K A Z A T E L X S T W O pOKAVEM ^TO Y GDE Y N IMEET GAMMA RASPREDELENIE = POSLE ^EGO PROSTO WOSPOLXZUEMSQ TE OREMOJ SLOVENIQ DLQ GAMMA RASPREDELENIQ SM PREDLOVENIE PUNKT KURSA tw fUNKCIQ RASPREDELENIQ Y WY^ISLQETSQ POpFOR p p p MULEp F x P Y < x P ; x < Y < x x ; ; x x ; TAK ^TO EE FUNKCIQ PLOTNOSTI .
-
2
,
G(1 2
(0
2)
-
-
0 5
2(
) =
)
1
fx (
(
) =
(
2
) =
2 d 66 p2 4
dx
.
12.2,
2
).
(
1)
p
Zx
;1
2
(
-
) = (
)
(
) =
3 8 29 < t= 1 77 1=2;1 ;x=2 exp ; e : 2 ; 1 5 = 21=2;(1=2) x
p : mY WIDIM ^TO \TO FUNKCIQ PLOTNOSTI POSKOLXKU = GAMMA RASPREDELENIQ = S PARAMETROM FORMY = I PARA METROM MASTABA a OTKUDA KAK BYLO ZAME^ENO WYE NEMEDLENNO SLEDUET UTWERVDENIE LEMMY gAMMA RASPREDELENIE n= O^ENX ^ASTO ISPOLXZUETSQ W RAZ LI^NYH ZADA^AH MATEMATI^ESKOJ STATISTIKI I ONO POQWILOSX RANX E ^EM GAMMA RASPREDELENIE a OB]EGO WIDA POD NAZWANIEM HIKWADRAT RASPREDELENIE S n STEPENQMI SWOBODY fUNKCIQ RASPREDE LENIQ HI KWADRAT OBY^NO OBOZNA^AETSQ Kn x x > A ^TO KASAETSQ TERMINA STEPENI SWOBODY TO EGO SMYSL PROQSNITSQ PO MERE DRUGIH PRIMENENIJ HI KWADRAT RASPREDELENIQ tEPERX MY MOVEM PEREJTI K NAEJ OSNOWNOJ ZADA^E POSTROENI@ DOWERITELXNYH GRANIC DLQ : eSLI OBRATITXSQ K PRAKTI^ESKOJ STO RONE \TOJ PROBLEMY SM W SWQZI S \TIM PRIMER TO LEGKO PONQTX ^TO STATISTIKA DOLVNA INTERESOWATX TOLXKO WERHNQQ A NE DWUSTO RONNQQ GRANICA NA KOTORU@ ON BUDET ORIENTIROWATXSQ ^TOBY OBEZOPASITX SEBQ OT GRUBYH OIBOK PRI PLANIROWANII STATISTI^ES KOGO \KSPERIMENTA tAKIM OBRAZOM MY DOLVNY SFORMULIROWATX DO WERITELXNOE UTWERVDENIE W FORME n : pONQTNO ^TO NIVNQQ DOWERITELXNAQ GRANICA I DWUSTORONNIE GRANICY DOWERITELXNYJ IN TERWAL KOLX SKORO ONI KOMU TO POTREBU@TSQ STROQTSQ ANALOGI^NYM OBRAZOM w RAMKAH TAKOJ FORMULIROWKI ZADA^I MY DOLVNY RASSMOTRETX ,
;(1 2) =
-
G(1 2
{
2)
= 2
= 1 2
,
-
,
.
-
G(
2
2)
-
,
,
-
G(
-
)
,
.
-
(
\
-
)
0
",
-
.
{
2
(
-
.
1.1),
,
(
2
)
-
,
-
.
,
-
2
2
,
(
),
-
,
.
,
220
-
SOBYTIE
8 Xn 2 < (Xk ; ) 2 2 1 A = :H (^n ) = 2
9 =
WYBIRAQ IZ USLOWIQ P A ; : kAK MY TOLXKO ^TO WYQSNILI \TA WEROQTNOSTX NE ZAWISIT OT I I W SILU LEMMY POSTOQNNAQ OPREDELQETSQ KWANTILX@ HI KWADRAT RASPREDELENIQ S n STEPENQMI SWOBODY KORNEM URAWNENIQ ;Kn ;:XsLEDOWATELXNO WERHNQQ n ; ; DOWERITELXNAQ GRANICA DLQ RAWNA Xk ; =Kn GDE W SOOTWETSTWII S NAIMI STANDARTNYMI OBOZNA^ENIQMI Kn; ESTX KWANTILX HI KWADRAT RASPREDELENIQ S n STEPENQMI SWOBODY iSPOLXZUEMYE W RASSMOTRENNYH PRIMERAH METODY PODBORA OPOR NYH FUNKCIJ OSNOWANNYE NA PRINCIPE INWARIANTNOSTI STATISTIK OCENOK PARAMETROW I OTNOSITELXNO LINEJNYH PREOBRAZOWANIJ POZWOLQ@T ANALOGI^NYM OBRAZOM PODBIRATX TAKIE FUNKCII I W SLU ^AE NEIZWESTNYH ZNA^ENIJ MEA@]EGO PARAMETRA tAK ESLI RASSMAT RIWAETSQ ZADA^A POSTROENIQ DOWERITELXNYH GRANIC DLQ X n PRI NEIZ ; WESTNOM TO ESTESTWENNO OBRATITXSQ K OCENKE S n Xk ; X PARAMETRA ZAME^AQ ^TO EE RASPREDELENIE NE ZAWISIT OT POSKOLX KU KAVDAQ IZ RAZNOSTEJ Xk ; X INWARIANTNA OTNOSITELXNO SDWIGA KOGDA Xk ZAMENQETSQ NA Xk ; k : : : n: eSLI RAZDELITX \TI RAZNOSTI NA TO MY POLU^IM SLU^AJNYE WELI^INY RASPREDELENIE KOTORYH NE ZAWISIT KAK OT TAK I OT I TAKIM OBRAZOM MY PRIHO DIM K INWARIANTNOJ OPORNOJ FUNKCII H S S = : dLQ WYWODA RASPREDELENIQ \TOJ FUNKCII MOVNO OBRATITXSQ K NORMALXNYM SLU^AJNYM WELI^INAM Yk Xk ;X n= k : : : n POSKOLXKU W ^EM LEGKO UBEDITXSQ H S n; Yk ; Y : eSLI OBRATITXSQ K ZADA^E DOWERITELXNOJ INTERWALXNOJ OCENKI PRI NEIZWESTNOM ZNA^ENII TO ZDESX INWARIANTNU@ OPORNU@ FUNK CI@ MOVNO POSTROITX KOMBINIRUQ EE IZ OPORNYH FUNKCIJ ZADA^ I : kAK MY WIDELI PRI REENII \TIH ZADA^ RASPREDELENIQ SLU^AJNYH WELI^IN X ; = I S= NE ZAWISQT OT I I PO\TOMU W KA^EST WE OPORNOJ FUNKCII PRI INTERWALXNOJ OCENKE MOVNO ISPOLXZOWATX OPORNU@ FUNKCI@ OPREDELQEMU@ OTNOENIEM \TIH WELI^IN TO ESTX FUNKCI@ j X ; j=S: oDNAKO DLQ POSTROENIQ DOWERITELXNYH INTERWALOW NA OSNOWE TA KIH FUNKCIJ NAM NEOBHODIMO NAJTI SOWMESTNOE RASPREDELENIE STA TISTIK X I S : mY POLU^IM \TO RASPREDELENIE W SLEDU@]EJ LEKCII (
) = 1
,
6.1
-
{
(1
1
(
) = 1
,
2
)-
1
(
)
2
1
,
-
(
1
-
)
(
,
)
.
-
,
2
(
)
,
-
.
,
-
2
2
2
1
=
1
-
2
(
)
,
,
= 1
,
-
2
(
2
) =
2
2
(0, 1)
= (
,
(
2
2
) =
)
1
1
= 1
(
)
,
2
-
0
,
2
1
0
,
(
)
-
,
,
-
2
,
221
SFORMULIROWAW EGO W WIDE UTWERVDENIQ IZWESTNOGO W MATEMATI^ESKOJ STATISTIKE KAK LEMMA fIERA ,
.
lEKCIQ 10
tEOREMA 6.1. w SLU^AE WYBORA IZ NORMALXNOGO (
RASPREDELENIQ STATISTIKI X I S NEZAWISIMY, X N =n A nS = n; (IMEET HI-KWADRAT RASPREDELENIE S n ; STEPENX@ SWOBODY). d O K A Z A T E L X S T W O pUSTX Y : : : Yn SLU^AJNAQ WYBORKA IZ STAN DARTNOGO NORMALXNOGO RASPREDELENIQ N : pOKAVEM ^TO STATIS TIKI n n X X Yk ; Y Y n Yk I SY k k NEZAWISIMY Y N =n A SY n; : tOGDA UTWERVDENIE TEORE MY BUDET SLEDOWATX IZ TOGO FAKTA ^TO Yk IME@T TO VE RASPRE DELENIE ^TO I Xk k : : : n I SLEDOWATELXNO RASPREDELENIE X SOWPADAET S RASPREDELENIEM Y A RASPREDELENIE SY S RASPRE DELENIEM nS = : wWEDEM SLU^AJNYE WELI^INY 2
2
(
2
)
2
)
2
2
1
1
.
{
1
-
(0
=
1
=
(0
1
)
-
2
=1
2
)
= 1
-
1
,
,
,
(
=1
,
1)
+
-
,
,
+
2
{
-
2
Zk
=
n X
i=1
ckiYi k
= 1
: : : n
KOTORYE OPREDELQ@TSQ ZADANIEM MATRICY k cki k LINEJNYH PRE OBRAZOWANIJ SLU^AJNYH WELI^IN Y : : : Ypn: pUSTX \LEMENTY PERWOJ STROKI \TOJ MATRICY c : : : c n = n A OSTALXNYE \LEMENTY MATRICY WYBEREM TAK ^TOBY PROIZWEDENIE NA TRANSPONIROWAN NU@ MATRICU 0 BYLO EDINI^NOJ MATRICEJ 0 : kAK IZWESTNO TAKOJ WYBOR WOZMOVEN I POLU^ENNAQ TAKIM OBRAZOM MATRICA NAZY WAETSQ ORTONORMIROWANNOJ sLU^AJNYE WELI^INY Z : : : Zn RASPRE DELENY W SOOTWETSTWII S n MERNYM NORMALXNYM ZAKONOM DLQ SPECI FIKACII KOTOROGO DOSTATO^NO NAJTI WEKTOR SREDNIH ZNA^ENIJ \TIH WELI^IN I MATRICU IH KOWARIACIJ sREDNIE ZNA^ENIQ C =
-
1
11 =
C
=
1
= 1
,
C
C
C
: CC
-
= I
,
,
-
.
-
1
-
,
.
mk
=
EZk = E
n X
i=1
ckiYk
=
n X
i=1
222
ckiEYk
= 0
k
: : : n:
= 1
-
dALEE POSKOLXKU SREDNIE ZNA^ENIQ RAWNY NUL@ KOWARIACII \TIH SLU^AJNYH WELI^IN ,
cov(
,
Zk Zj
) =
E(Zk ; mk )(Zj ; mj ) = EZk Zj E
n X i=1
ckicjiYi
2
E
+
n X
6
i=l
=
E
n X
ckiYi
i=1
n X
i=1
cjiYi
=
ckicjl YiYl :
eSLI ZANESTI MATEMATI^ESKIE OVIDANIQ POD ZNAKI SUMM I WSPOMNITX ^TO Y : : : Yn NEZAWISIMY EYi EYi DYi A PRI i 6 l SREDNIE ZNA^ENIQ EYiYl EYiEYl TO POLU^IM ^TO
,
,
1
=
Zk Zj
cov(
2
= 0
=
= 1
= 0
) =
n X
i=1
=
,
ckicji k j
= 1
: : : n:
pOSKOLXKU DLQ ORTONORMIROWANNOJ MATRICY POSLEDNQQ SUMMA RAWNA NUL@ ESLI k 6 j I RAWNA EDINICE ESLI k j TO MY PRIHODIM K ZA KL@^ENI@ ^TO Z : : : Zn NEZAWISIMY I ODINAKOWO RASPREDELENY PO STANDARTNOMU NORMALXNOMU ZAKONU N : tAKIM OBRAZOM ORTONOR MIROWANNYE PREOBRAZOWANIQ SLU^AJNYH WELI^IN Y : : : Yn NE IZMENI LI IH SOWMESTNOE RASPREDELENIE tEPERX PREDSTAWIM NAI STATISTIKI Y I SY W TERMINAH SLU^AJ NYH WELI^IN Z : : : Zn: pOSKOLXKU ,
=
,
,
=
-
1
(0
1)
,
-
-
1
.
-
1
X c iYi pn Yi i i TO Y Z =pn: dALEE ORTONORMIROWANNOE LINEJNOE PREOBRAZOWANIE SOHRANQET Xn SUMMU Xn KWADRATOW KOMPONENT PREOBRAZUEMOGO WEKTORA TO ESTX Zk Yk : sLEDOWATELXNO STATISTIKA SY W NOWYH PERE MENNYH PRIOBRETAET WID n n n X X X SY Z Y ; Y Z ; n n k n k n n Zk : iTAK RASPREDELENIE Y SOWPADAET S RASPREDELENIEM Z =pn A RAS PREDELENIE SY S RASPREDELENIEM SUMMY KWADRATOW n; NEZAWISIMYH W SOWOKUPNOSTI I NEZAWISQ]IH OT Z NORMALXNYH SLU^AJNYH WE LI^IN sLEDOWATELXNO Y I SY NEZAWISIMY Y N =n SY n; SM LEMMU I LEMMA fIERA DOKAZANA
Z
1 =
=
n X
1
n
1
=
=1
=1
,
1
,
2
1
2
=
,
1
=
1
2
2
=
1
1
-
2 1
2
=
1
1
2
2
,
{
1
(0
1
.
(
.
-
1
,
,
6.1),
\
"
223
(0
.
1)
1
-
)
2
1
uSTANOWIW SOWMESTNOE RASPREDELENIE WYBORO^NOGO SREDNEGO I WY BORO^NOJ DISPERSII W SLU^AE WYBORA IZ NORMALXNOGO RASPREDELENIQ MY MOVEM PRISTUPITX K POSTROENI@ DOWERITELXNYH INTERWALOW DLQ KAVDOGO IZ PARAMETROW I PRI NEIZWESTNOM ZNA^ENII DRUGOGO PA RAMETRA : wERHNQQ DOWERITELXNAQ GRANICA DLQ DISPERSII NORMALXNOGO RASPREDELENIQ PRI NEIZWESTNOM SREDNEM |TA GRA NICA NAHODITSQ NAIBOLEE PROSTO POSKOLXKU RASPREDELENIE OPORNOJ FUNKCII 0 1 Xn n n X ; n X X X Xk ; X nS X ; k i @ A Yk ; Y ;ni k ,
-
.
0
3
.
-
,
2
2
=
1
2 )
(
2
2
1
=
=
)
1
=1
=1
2
(
(2)
ESTX HI KWADRAT RASPREDELENIE S n ; STEPENX@ SWOBODY SM TEOREMU sLEDOWATELXNO WERHNQQ ; DOWERITELXNAQ GRANICA OPREDE LQETSQ KWANTILX@ K ; HI KWADRAT RASPREDELENIQ KORNEM URAWNENIQ P nS = ; Kn; ; I DOWERITELXNOE UTWERVDENIE n nS =Kn;; WYPOLNQETSQ S ZADANNOJ WEROQTNOSTX@ ; : : dOWERITELXNYJ INTERWAL DLQ SREDNEGO ZNA^ENIQ NORMALXNOGO RASPREDELENIQ PRI NEIZWESTNOJ DISPERSII w \TOJ ZADA^E MY IMEEM DELO S DWUSTORONNIMI DOWERITELXNYMI GRANICA MI DOWERITELXNYM INTERWALOM I W SOOTWETSTWII S WYBOROM OPOR NOJ FUNKCII j X ; j=S O KOTOROJ MY GOWORILI PERED DOKAZATELXST WOM TEOREMY NAM POTREBUETSQ ZNANIE WEROQTNOSTI SOBYTIQ WIDA j X ; j=S : w NA^ALE WEKA ANGLIJSKIJ MATEMATIK w gOSSET PISAWIJ POD PSEWDONIMOM sTX@DENT NAEL RASPREDELENIE SLU^AJNOJ q p WELI^INY T = GDE N A SLU^AJNAQ WELI ^INA NE ZAWISQ]AQ OT I RASPREDELENNAQ PO ZAKONU HI KWADRAT S STEPENQMI SWOBODY eSTESTWENNO EGO ISSLEDOWANIQ BYLI SWQZANY S PROBLEMAMI STATISTI^ESKOGO WYWODA O SREDNEM ZNA^ENII NORMALX NOGO RASPREDELENIQ PRI NEIZWESTNOJ DISPERSII I sTX@DENT ISKAL RASPREDELENIE OPORNOJ FUNKCII SM W SWQZI S PEREHODOM W ZAPI -
1
6.1).
,
(1
1
=
2
(
2
(
(
.
)-
)
-
-
{
) = 1
1(
2
2
) = 1
1 1(
2
=
)
1
0 4
.
-
(
),
-
-
6.1,
XIX
.
\
,
" (Student), 2
=
(0
1)
2
,
{
-
-
.
,
-
,
(
224
. (2))
-
SI OPORNOJ FUNKCII W TERMINAH Xk K Yk X pn n Yk p p X ; rXn H n; S n; Yk ; Y Yk Xk ; N k : : : n KOTORAQ OTLI^AETSQ OT WYBRANNOJ NAMI OPORNOJ FUNKCII TOLXKO MNO p VITELEM n ; I PO\TOMU TAKVE MOVET BYTX ISPOLXZOWANA W POSTRO ENII DOWERITELXNOGO INTERWALA DLQ PRI NEIZWESTNOM : tO ^TO RASPREDELENIQ Tn; I H SOWPADA@T IZ TEOREMY SLU^AJ p XnSLEDUET NAQ Yk = n N NE ZAWISIT OT Xn WELI^INA W ZNAMENATELE Yk ; Y n; RAZDELIW KOTORU@ NA ZNA^ENIE STEPENI SWOBODY n ; POLU^AEM S n ; : nAJDEM RASPREDELENIE SLU^AJNOJ WELI^INY T KOTOROE NAZYWAET SQ RASPREDELENIEM sTX@DENTA S STEPENQMI SWOBODY ILI t-RASPREDELENIEM sOWMESTNAQ FUNKCIQ PLOTNOSTI NEZAWISIMYH SLU ^AJNYH WELI^IN I RAWNA 9 8 ( v) < u= = ; f u v p v ; ;
: = = TAK ^TO FUNKCIQ RASPREDELENIQ SLU^AJNOJ WELI^INY T q P = < x x p x v= 1 Z Z Z Z f u v du dv dv f u v du: p p )
1
=
1
1 =
1
(0
=
)
(
1)
1
2
= 1
-
1
-
,
,
1
=
1
(
2 )
2
1
1
1 2
=
6.1:
(0
1
-
1)
1
-
.
-
2
=
(
2
1
) =
exp
2
2
S (
(
u <
1
) =
2
2
2
;(
2)
(
)
1
exp
2
) =
=
vx
(
;1
0
)
dIFFERENCIRUQ \TO WYRAVENIE PO x NAHODIM FUNKCI@ PLOTNOSTI RASPREDELENIQ sTX@DENTA x
s (
) =
Z1q
q
v=f x v= v dv (
)
0
=
8 0 19 2 = < v x p 2(+1)=2;(=2) v 2 ;1 exp :; 2 @1 + A dv = 0 +1 0 1 +1 2 ; 2 ; 1 x 2 @1 + A : = p Z1
1
;
+1
2
225
wID POLU^ENNOJ FUNKCII PLOTNOSTI GOWORIT O TOM ^TO RASPRE DELENIE sTX@DENTA MOVNO TRAKTOWATX KAK OBOB]ENIE STANDARTNOGO a b RASPREDELENIQ kOI a b KOTOROE POLU^AETSQ IZ RASPREDELENIQ sTX@DENTA PRI ^ISLE STEPENEJ SWOBODY : |TO SIMMETRI^NOE RASPREDELENIE I PO\TOMU ;x ; x ^TO POZ WOLQET NAM DOWOLXNO PROSTO POSTROITX DOWERITELXNYJ INTERWAL DLQ S POMO]X@ KWANTILI RASPREDELENIQ n; P j Tn; j t ; n; t ; n; ;t n; t ; OTKUDA t ;n; ; = I ; p DOWERITELXNYJ INTERWAL DLQ OPREDELQETSQ PREDELAMI X St= n ; : iTAK MY POSTROILI DOWERITELXNYE PREDELY DLQ PARAMETROW I NORMALXNOGO RASPREDELENIQ tABLICY NORMALXNOGO HI KWADRAT I STX@DENTSKOGO RASPREDELENIJ A TAKVE KWANTILEJ \TIH RASPREDELE NIJ NEOBHODIMYE DLQ ^ISLENNOJ REALIZACII DOWERITELXNYH OCENOK SMOTRITE W KNIGE bOLXEW l n sMIRNOW n w tABLICY MATEMATI ^ESKOJ STATISTIKI m nAUKA KOTORAQ W DALXNEJEM BUDET CI TIROWATXSQ KAK tms e]E RAZ OTMETIM ^TO WOZMOVNOSTX DOWERI TELXNOJ OCENKI \TIH PARAMETROW OPREDELQLASX W OSNOWNOM INWARI ANTNOSTX@ SEMEJSTWA NORMALXNYH RASPREDELENIJ OTNOSITELXNO LI NEJNOJ GRUPPY PREOBRAZOWANIJ tO^NO TAK VE MY MOVEM POSTROITX DOWERITELXNYE PREDELY DLQ PARAMETRA POKAZATELXNOGO RASPREDELE NIQ ILI DLQ PARAMETRA MASTABA GAMMA RASPREDELENIQ PRI IZWESTNOM PARAMETRE FORMY MY WERNEMSQ K \TIM ZADA^AM POZDNEE PRI OBSUVDE NII PROBLEMY OPTIMIZACII DOWERITELXNOJ OCENKI ~TO VE KASAETSQ DRUGIH RASPREDELENIJ TO ZDESX PROBLEMA OSLOVNQETSQ OTSUTSTWIEM INWARIANTNYH OPORNYH FUNKCIJ I NEWOZMOVNOSTX@ POLU^ITX RAS PREDELENIE OCENOK PARAMETRA DLQ KOTOROGO STROQTSQ DOWERITELXNYE PREDELY W QWNOM WIDE tEM NE MENEE SU]ESTWUET DOSTATO^NO OB]IJ PODHOD K DANNOJ PROBLEME OSNOWANNYJ NA ASIMPTOTI^ESKOJ NORMALX NOSTI RASPREDELENIQ OCENOK PO METODU MOMENTOW ILI METODU MAKSI MALXNOGO PRAWDOPODOBIQ pUSTX n n X n ASIMPTOTI^ESKI NORMALXNAQ SO SREDNIM I DISPERSIEJ =n OCENKA PARAMETRA NAPRIMER PRI OPREDELEN NYH USLOWIQH REGULQRNOSTI SM TEOREMU OCENKA MAKSIMALXNOGO PRAWDOPODOBIQ ASIMPTOTI^ESKI NORMALXNA SO SREDNIM I DISPERSIEJ ,
(
= 0
= 1)
C(
-
)
= 1
,
S (
S
(
) = S
1
= S
1
1 (1
1( )
2)
S
(1
1(
) = 1
S (
)
-
1( ) :
) = 2S
1( )
1 = 1
)-
1
,
2
.
,
-
,
-
,
,
.
,
.:
.,
.
.
-
, 1983,
.
-
,
-
,
,
-
-
.
-
-
.
,
-
,
,
.
,
-
.
^
= ^ ( 2
( )
) {
( )
(
(
.
4.2)
226
,
-
tOGDA PRI n ! 1 WEROQTNOSTX 0 1 p j ; j n P @ n A ;! ; PRI L@BOM 2 ESLI ; ; = I MY POLU^AEM ASIMPTOTI^ESKI ; DOWERITELXNOE MNOVESTWO 8 9 < =\ p j ; j n n X n : n : eSLI n ESTX INTERWAL NA PRQMOJ TO MY REILI ZADA^U IN TERWALXNOJ OCENKI PARAMETRA : eSLI VE \TO NEKOTOROE WY^URNOE I NEPRIGODNOE K UPOTREBLENI@ PODMNOVESTWO TO MOVNO POJTI NA DALXNEJIE UPRO]ENIQ ASIMPTOTI^ESKOGO UTWERVDENIQ ZAMENIW W OPREDELENII n PARAMETRI^ESKU@ FUNKCI@ NA EE OCENKU n : dOSTATO^NO POTREBOWATX NEPRERYWNOSTX FUNKCII 2 ^TO BY SSYLAQSX NA TEOREMU sLUCKOGO PREDLOVENIE KURSA tw S
n / n ! UTWERVDATX ^TO PRI n ! 1 P
nI
;1 ).
( )]
^
1
( )
(1
1
=
(1
2)
)-
( )
(
^
) =
:
( )
R,
-
R
,
(^ )
( )
( )
,
(
(^ )
( ))
-
11.1
,
0 ^ (n ) ^ @ p P n ;
1
p n A ;! ; : n n n pROILL@STRIRUEM RABOTU \TOGO METODA NA DWUH POLEZNYH W PRAK TI^ESKOM OTNOENII PRIMERAH : aSIMPTOTI^ESKI DOWERITELXNYJ INTERWAL DLQ WEROQTNOSTI USPEHA W ISPYTANIQH bERNULLI. w SHEME ISPYTANIJ bER NULLI WYBORE IZ RASPREDELENIQ BINARNOJ SLU^AJNOJ WELI^INY X PRINIMA@]EJ ZNA^ENIE USPEH S WEROQTNOSTX@ p I ZNA^ENIE NEUDA^A S WEROQTNOSTX@ ; p OPTIMALXNOJ Xn NESME]ENNOJ OCEN ; KOJ p QWLQETSQ WYBORO^NOE SREDNEE X n Xk ILI ^TO TO VE OTNOSITELXNAQ ^ASTOTA USPENYH ISHODOW W n ISPYTANIQH sTATIS TIKA nX IMEET BINOMIALXNOE RASPREDELENIE n p I \TO POZWOLQET NAS^ITATX TABLICY DOWERITELXNYH PREDELOW DLQ p PRI RAZLI^NYH ZNA^ENIQH DOWERITELXNOGO UROWNQ ; OB_EMA WYBORKI n I ^ISLA USPENYH ISHODOW nx SM NAPRIMER tms ~TO VE DAET ASIMPTO TI^ESKIJ PODHOD K POSTROENI@ DOWERITELXNYH INTERWALOW wYBORO^NOE SREDNEE ASIMPTOTI^ESKI NORMALXNO SO SREDNIM p I DISPERSIEJ p ; p =n: sLEDOWATELXNO ; DOWERITELXNAQ OBLASTX \
^
(^ )
+
1
"
-
.
0 5
-
{
1 (\
(\
")
")
0
1
-
=
1
,
1
,
.
B(
-
)
1
(
.,
,
).
-
?
(1
)
, (1
227
)-
n
q
o
p p j X ; p j p ; p =n : rAZREAQ NERAWENST WA W FIGURNYH SKOBKAH OTNOSITELXNO p POLU^AEM DOWERITELXNYJ IN TERWAL v 0 1 u u n B@X t X ; X CA n n n n n =
:
0
1
(1
)
-
2
+
2
+
(1
)
2
2
+
4
2
KOTORYJ PRI BOLXIH OB_EMAH ISPYTANIJ n MALO OTLI^AETSQ OT DO q WERITELXNOGO INTERWALA X X ; X =n POLU^ENNOGO ZAMENOJ p p ; p NA EE OCENKU X ; X : aSIMPTOTI^ESKI DOWERITELXNYJ INTERWAL DLQ PARAMETRA INTENSIWNOSTI RASPREDELENIQ pUASSONA. rASPREDELENIE pU ASSONA S FUNKCIEJ PLOTNOSTI PO S^ITA@]EJ MERE f x j P X x x =x x : : : INDEKSIRUETSQ POLOVITELXNYM PARAMETROM OPTIMALXNAQ NESME]ENNAQ OCENKA KOTOROGO PO WYBOR KE X n OB_EMA n KAK I W PREDYDU]EM PRIMERE OPREDELQETSQ WYBO RO^NYM SREDNIM X: dLQ RASPREDELENIQ pUASSONA TAKVE SPRAWEDLIWA TEOREMA SLOVENIQ nX n I NA OSNOWE \TOGO MOVNO POSTROITX TO^NYE DOWERITELXNYE PREDELY DLQ TABLICA KOTORYH IMEETSQ W UPOMQNUTOM SBORNIKE tms nO OCENKA X ASIMPTOTI^ESKI NORMALXNA =n ^TO POZWOLQET OPREDELITX ASIMPTOTI^ESKI DOWERITELXNU@ q OBLASTX n f > j X ; j =ng: rEENIE NERAWENSTW W FIGURNYH SKOBKAH OTNOSITELXNO DAET ASIMPTOTI^ESKI DOWERITELX NYJ INTERWAL v u u X n t Xn n : nAKONEC ZAMENQQ EE OCENKOJ X POLU^AEM TAKVE ASIMPTOTI ^ESKI DOWERITELXNYJ NO qKAK POKAZYWA@T ^ISLOWYE RAS^ETY MENEE TO^NYJ INTERWAL X X=n : nA \TOM MY ZAKAN^IWAEM IZLOVENIE PROSTEJIH METODOW POSTROE NIQ DOWERITELXNYH I ASIMPTOTI^ESKI DOWERITELXNYH INTERWALOW NA OSNOWE PODBORA OPORNYH FUNKCIJ o PROBLEME OPTIMALXNOGO INTER WALXNOGO OCENIWANIQ MY POGOWORIM POZDNEE IZU^IW TEORI@ OPTI MALXNOJ PROWERKI GIPOTEZ WYSKAZYWANIJ O WOZMOVNYH ZNA^ENIQH PARAMETRA : oSTAWIESQ LEKCII BUDUT POSWQ]ENY IMENNO \TOJ TEO RII -
(1
2
( ) = 6
(1
)
(1
)
) :
0
-
P( )
(
=
(
) =
e
!
)
(
) =
= 0 1 2
-
( )
,
:
P(
-
)
.
(
)
=
:
0
-
2
+
,
2
2
+
2
4
2
( ) = ,
-
,
,
-
.
-
,
-
{
-
.
228
x7. sTATISTI^ESKAQ PROWERKA GIPOTEZ (KRITERII ZNA^IMOSTI) lEKCIQ 11
w PRILOVENIQH MATEMATI^ESKOJ STATISTIKI SU]ESTWUET OBIRNYJ KLASS ZADA^, W KOTORYH TREBUETSQ PROWERITX ISTINNOSTX NEKOTOROGO WYSKAZYWANIQ OTNOSITELXNO ISSLEDUEMOGO OB_EKTA ILI WYBRATX ODNO IZ ALXTERNATIWNYH REENIJ, KOTOROE OPREDELIT DALXNEJEE POWEDENIE STATISTIKA PO OTNOENI@ K \TOMU OB_EKTU. nAPRIMER, PRI ATTESTACII PARTII DIZELXNOGO TOPLIWA PO OB]EMU SODERVANI@ SERY MY DOLVNY NE TOLXKO DATX TO^E^NU@ OCENKU DANNOJ HARAKTERISTIKI TOPLIWA, NO I PRINQTX REENIE O KA^ESTWE WYPUSKAEMOGO PRODUKTA, KOTOROE POWLE^ET ZA SOBOJ ODNO IZ SLEDU@]IH DEJSTWIJ { ILI OTOSLATX TOPLIWO POTREBITEL@, ILI PROIZWESTI DOPOLNITELXNU@ O^ISTKU TOPLIWA OT WREDNYH PRIMESEJ. tO^NO TAK VE W PRIMERE 1.2 MY STROILI STATISTI^ESKOE PRAWILO, POZWOLQ@]EE PRINQTX ODNO IZ DWUH REENIJ OTNOSITELXNO NOWOGO LE^EBNOGO PREPARATA { ILI PRIZNATX EGO \FFEKTIWNYM I WNEDRITX W LE^EBNU@ PRAKTIKU, ILI ZAPRETITX EGO DALXNEJEE ISPOLXZOWANIE. w ISSLEDOWANIQH, PODOBNYH OPYTAM mENDELQ, ^ASTO NADO PROWERITX GIPOTEZU OTNOSITELXNO PREDPOLAGAEMOGO ZNA^ENIQ WEROQTNOSTI NASLEDOWANIQ DOMINANTNOGO PRIZNAKA. sELEKCIONER, RABOTA@]IJ NAD POLU^ENIEM NOWOGO WIDA PENICY, DOLVEN PODKREPITX SWOE ZAKL@^ENIE O PREWOSHODSTWE NOWOGO WIDA NAD TEM, KOTORYJ UVE ISPOLXZUETSQ W SELXSKOHOZQJSTWENNOJ PRAKTIKE, S POMO]X@ SOPOSTAWLENIQ DANNYH OB UROVAJNOSTI \TIH WIDOW. i TAK DALEE, I TOMU PODOBNOE, { WY SAMI MOVETE PRIWESTI PRIMERY TAKIH ZADA^ PO WYBORU ODNOGO IZ RQDA ALXTERNATIWNYH REENIJ. w NAEM KURSE MATEMATI^ESKOJ STATISTIKI MY RASSMOTRIM ZADA^I, SWQZANNYE TOLXKO S WYBOROM ODNOGO IZ DWUH REENIJ. pUSTX MY WYSKAZYWAEM NEKOTOROE SUVDENIE (ILI PREDPRINIMAEM DEJSTWIE) OB ISSLEDUEMOM OB_EKTE, I PUSTX d0 { REENIE OB ISTINNOSTI \TOGO SUVDENIQ, W TO WREMQ KAK d1 { REENIE O EGO LOVNOSTI. tAKIM OBRAZOM, PROSTRANSTWO REENIJ D W DANNOJ STATISTI^ESKOJ PROBLEME SOSTOIT IZ TO^EK: D = fd0 d1g: dLQ WYBORA ODNOGO IZ REENIJ MY NABL@DAEM SLU^AJNU@ WYBORKU (n) X IZ NEKOTOROGO RASPREDELENIQ P ZNA^ENIE PARAMETRA KOTOROGO NAM NEIZWESTNO. pUSTX { OBLASTX WOZMOVNYH ZNA^ENIJ KOTORU@ 229
MY NAZWALI PARAMETRI^ESKIM PROSTRANSTWOM. w SOOTWETSTWII S PRINQTOJ NAMI W x1 IDEOLOGIEJ STATISTI^ESKOGO WYWODA MY SOPOSTAWLQEM KAVDOMU REENI@ d 2 D OPREDELENNOE PODMNOVESTWO d PROSTRANSTWA TO ESTX INTERPRETIRUEM KAVDOE REENIE W TERMINAH WYSKAZYWANIJ OB ISTINNOM ZNA^ENII PARAMETRA : w NAEJ STATISTI^ESKOJ PROBLEME WYBORA ODNOGO IZ DWUH REENIJ POLOVIM i = di i = 0 1 I WWEDEM RQD PONQTIJ I OPREDELENIJ, ISPOLXZUEMYH PRI REENII \TOJ PROBLEMY. uTWERVDENIE H0 : 2 0 NAZYWAETSQ NULEWOJ GIPOTEZOJ, A UTWERVDENIE H1 : 2 1 { ALXTERNATIWNOJ GIPOTEZOJ ILI (KOROTKO) ALXTERNATIWOJ. gIPOTEZA Hi NAZYWAETSQ PROSTOJ, ESLI SOOTWETSTWU@]EE i SOSTOIT IZ ODNOJ TO^KI PARAMETRI^ESKOGO PROSTRANSTWA W PROTIWNOM SLU^AE Hi NAZYWAETSQ SLOVNOJ GIPOTEZOJ i = 0 1: tAK, W PRIMERE 1.2 S ISPYTANIEM NOWOGO LE^EBNOGO PREPARATA PARAMETR OZNA^AL WEROQTNOSTX USPENOGO LE^ENIQ KAVDOGO PACIENTA, I NULEWAQ GIPOTEZA H0 : = 1=2 O \NEJTRALXNOSTI" PREPARATA ESTX PROSTAQ GIPOTEZA, W TO WREMQ KAK ALXTERNATIWNAQ GIPOTEZA H1 : > 1=2 OB EGO \FFEKTIWNOSTI { SLOVNAQ GIPOTEZA. pRAWILO, PO KOTOROMU PRINIMAETSQ ILI OTWERGAETSQ NULEWAQ GIPOTEZA H0 NAZYWAETSQ KRITERIEM. iNOGDA DOBAWLQETSQ { KRITERIJ SOGLASIQ (S NULEWOJ GIPOTEZOJ), OSOBENNO, KOGDA ALXTERNATIWA H1 OPREDELENA NE SOWSEM ^ETKO I POD H1 PODRAZUMEWAETSQ \WSE OSTALXNOE". w SLU^AE POLNOGO RAWNOPRAWIQ GIPOTEZ GOWORQT O KRITERII RAZLI^ENIQ GIPOTEZ. kRITERIJ OPREDELQETSQ ZADANIEM OSOBOGO PODMNOVESTWA S WYBORO^NOGO PROSTRANSTWA Xn KOTOROE NAZYWAETSQ KRITI^ESKOJ OBLASTX@: ESLI WYBORO^NYE DANNYE x(n) POPADA@T W \TU OBLASTX, TO NULEWAQ GIPOTEZA H0 OTKLONQETSQ I PRINIMAETSQ ALXTERNATIWNOE REENIE { SPRAWEDLIWA H1: oBLASTX A = S c = Xn n S NAZYWAETSQ OBLASTX@ PRINQTIQ NULEWOJ GIPOTEZY. nAM BUDET UDOBNO PROWODITX SPECIFIKACI@ KRITI^ESKOJ OBLASTI W WIDE EE INDIKATORNOJ FUNKCII ' = '(X (n) ) KOTORAQ NAZYWAETSQ KRITI^ESKOJ FUNKCIEJ ILI, POSKOLXKU ONA OPREDELQET STATISTI^ESKOE PRAWILO PROWERKI GIPOTEZY, PROSTO KRITERIEM. iTAK, FUNKCIQ '(X (n) ) ESTX BINARNAQ SLU^AJNAQ WELI^INA, PRINIMA@]AQ ZNA^ENIE 1, ESLI PROIZOLO SOBYTIE X (n) 2 S I ZNA^ENIE 0, ESLI PROIZOLO PROTIWOPOLOVNOE SOBYTIE X (n) 2 A: pONQTNO, ^TO MATEMATI^ESKOE OVIDANIE E'(X (n) ) OZNA^AET WEROQTNOSTX OTKLONENIQ GIPOTEZY H0: 230
w RASSMATRIWAEMOJ STATISTI^ESKOJ PROBLEME WELI^INA RISKA, SWQZANNAQ S OTKLONENIEM WERNOJ GIPOTEZY, OBY^NO SOOTNOSITSQ S FUNKCIEJ POTERX TIPA 1 { 0: POTERI S^ITA@TSQ RAWNYMI 1, ESLI PRINQTA GIPOTEZA Hi A W DEJSTWITELXNOSTI 2 1;i i = 0 1 ESLI VE PRINQTA Hi I 2 i i = 0 1 TO POTERI POLAGA@TSQ RAWNYMI NUL@. lEGKO WIDETX, ^TO WELI^INA RISKA PRI L@BOM ZNA^ENII PARAMETRA MOVET BYTX OPREDELENA S POMO]X@ FUNKCII m() = E '(X (n)) = P (X (n) 2 S ) KOTORAQ NAZYWAETSQ FUNKCIEJ MO]NOSTI KRITERIQ ': |TA FUNKCIQ UKAZYWAET, KAK ^ASTO MY OTKLONQEM NULEWU@ GIPOTEZU, KOGDA { ISTINNOE ZNA^ENIE PARAMETRA, I HOROIM SLEDUET S^ITATX TOT KRITERIJ, U KOTOROGO FUNKCIQ m() PRINIMAET BLIZKIE K NUL@ ZNA^ENIQ W OBLASTI 0 I BLIZKIE K EDINICE { W OBLASTI 1: w SWQZI S \TIM WWODQTSQ DWE KOMPONENTY FUNKCII RISKA: () = m() PRI 2 0 I () = 1 ; m() PRI 2 1: fUNKCIQ () 2 0 NAZYWAETSQ WEROQTNOSTX@ OIBKI PERWOGO RODA { ONA UKAZYWAET OTNOSITELXNU@ ^ASTOTU OTKLONENIQ GIPOTEZY H0 KOGDA ONA W DEJSTWITELXNOSTI WERNA ( 2 0). fUNKCIQ () 2 1 NAZYWAETSQ WEROQTNOSTX@ OIBKI WTOROGO RODA { ONA UKAZYWAET OTNOSITELXNU@ ^ASTOTU PRINQTIQ GIPOTEZY H0 KOGDA ONA LOVNA (WERNA ALXTERNATIWNAQ GIPOTEZA H1 : 2 1): zAMETIM, ^TO FUNKCIQ MO]NOSTI m() W OBLASTI 1 TRAKTUETSQ KAK WEROQTNOSTX OTKLONENIQ GIPOTEZY H0 KOGDA W DEJSTWITELXNOSTI WYBOR IDET IZ RASPREDELENIQ S ALXTERNATIWNYM ZNA^ENIEM 2 1 I PO\TOMU ^ASTX m() PRI 2 NAZYWAETSQ MO]NOSTX@ KRITERIQ ': lEGKO PONQTX, ^TO PRI FIKSIROWANNOM OB_EME NABL@DENIJ n NEWOZMOVNO ODNOWREMENNO MINIMIZIROWATX WEROQTNOSTI OBEIH OIBOK, { DLQ UMENXENIQ WEROQTNOSTI OIBKI PERWOGO RODA () = P (X (n) 2 S ) 2 0 NEOBHODIMO UMENXITX KRITI^ESKU@ OBLASTX S ^TO PRIWEDET K UWELI^ENI@ OBLASTI A PRINQTIQ NULEWOJ GIPOTEZY I, SLEDOWATELXNO, K UWELI^ENI@ WEROQTNOSTI OIBKI WTOROGO RODA (u) = Pu(X (n) 2 A) u 2 1: zDESX WOZNIKAET TAKAQ VE SITUACIQ, ^TO I W PROBLEME POSTROENIQ OCENKI PARAMETRA S RAWNOMERNO MINIMALXNYM RISKOM, { TAKIE OCENKI SU]ESTWU@T TOLXKO W OPREDELENNOM KLASSE STATISTI^ESKIH PRAWIL, NAPRIMER, W KLASSE NESME]ENNYH OCENOK. oDNAKO, DAVE I POMIMO ZADA^I PROWERKI GIPOTEZ S MINIMALXNOJ WEROQTNOSTX@ OIBKI, I NAMNOGO RANXE SOZDANIQ OB]EJ TEORII NAIBOLEE MO]NYH KRITERIEW W STATISTI^ESKOJ PRAKTIKE SLOVILSQ SLEDU@]IJ PODHOD K UPRAWLENI@ RISKOM KRITERIQ. 231
pREDPOLOVIM, ^TO OTKLONENIE GIPOTEZY H0 KOGDA ONA W DEJSTWITELXNOSTI WERNA, PRIWODIT K BOLEE TQVKIM POSLEDSTWIQM, ^EM EE PRINQTIE PRI SPRAWEDLIWOSTI ALXTERNATIWY. w TAKOM SLU^AE MY ZAINTERESOWANY W PERWU@ O^EREDX KONTROLIROWATX WEROQTNOSTX OIBKI PERWOGO RODA. s \TOJ CELX@ ZARANEE FIKSIRUETSQ (WYBIRAETSQ) NEKOTORYJ UROWENX WYE KOTOROGO WEROQTNOSTX OIBKI PERWOGO RODA NE DOPUSTIMA, I KRITI^ESKAQ OBLASTX S (KRITERIJ ') OPREDELQETSQ TAKIM OBRAZOM, ^TO () KAKOWO BY NI BYLO 2 0: |TO OGRANI^ENIE NA WEROQTNOSTX OIBKI PERWOGO RODA NAZYWAETSQ UROWNEM ZNA^IMOSTI, A SAM KRITERIJ ' DLQ KOTOROGO WYPOLNQETSQ \TO OGRANI^ENIE, { KRITERIEM UROWNQ : nAIBOLXEE ZNA^ENIE WEROQTNOSTI OIBKI PERWOGO RODA = sup () 2 NAZYWAETSQ RAZMEROM KRITERIQ ' I ESLI = TO GOWORQT O KRITERII ' RAZMERA . w \TOM WYBORE OGRANI^ENIQ IMENNO NA WEROQTNOSTX OIBKI PERWOGO, A NE WTOROGO RODA PROQWLQETSQ TIPI^NAQ ASIMMETRIQ W PRAKTI^ESKOJ CENNOSTI GIPOTEZY I ALXTERNATIWY. nAPRIMER, ESLI PROWERQETSQ \FFEKTIWNOSTX NOWOGO LEKARSTWENNOGO PREPARATA, TO NULEWOJ GIPOTEZE DOLVNO SOOTWETSTWOWATX REENIE O EGO NE\FFEKTIWNOSTI, IBO, OTKLONIW \TU GIPOTEZU, KOGDA ONA WERNA, MY WNEDRIM W LE^EBNU@ PRAKTIKU BESPOLEZNOE ILI WREDNOE LEKARSTWO, ^TO PRIWEDET K BOLEE TQVKIM POSLEDSTWIQM, ^EM OTKLONENIE W DEJSTWITELXNOSTI \FFEKTIWNOGO PREPARATA. nO ESLI MY I]EM ZOLOTO, ANALIZIRUQ SOSTAW KERNOW PRI BURENII PREDPOLAGAEMOGO MESTOROVDENIQ, TO ESTESTWENNO PRINQTX ZA NULEWU@ GIPOTEZU UTWERVDENIE O NALI^II ZOLOTA, IBO OTKLONIW EE, KOGDA ONA WERNA, MY POTERQEM NAMNOGO BOLXE, ^EM STOIMOSTX NESKOLXKIH DOPOLNITELXNYH ANALIZOW, UDOSTOWERQ@]IH, ^TO ZOLOTO W RAZBURENNOJ MESTNOSTI OTSUTSTWUET. sLEDUET TAKVE OBRATITX OSOBOE WNIMANIE NA OB]U@ METODOLOGI@ PROWERKI GIPOTEZ, OTRAVAEMU@ W WYBORE MALOGO ZNA^ENIQ UROWNQ : eSLI NAI WYBORO^NYE DANNYE POPADA@T W OBLASTX S S ISKL@^ITELXNO MALOJ WEROQTNOSTX@, TO ESTESTWENNO PREDPOLOVITX, ^TO TO UTWERVDENIE, KOTOROE PRIWELO K \TOMU MALOWEROQTNOMU SOBYTI@, NE SOOTWETSTWUET ISTINE I OTKLONITX EGO. pOSTUPAQ TAKIM OBRAZOM, MY BUDEM TERQTX W DEJSTWITELXNOSTI WERNU@ GIPOTEZU H0 KRAJNE REDKO 0
232
{ NE BOLEE, ^EM W 100% SLU^AEW.
pROSTEJIJ METOD POSTROENIQ KRITERIEW ZNA^IMOSTI SOSTOIT W ISPOLXZOWANII SOSTOQTELXNYH OCENOK TESTIRUEMOGO PARAMETRA : rASSMOTRIM PROSTEJIJ SLU^AJ: { SKALQRNYJ PARAMETR, WEROQTNOSTNAQ MODELX NE SODERVIT DRUGIH (MEA@]IH) PARAMETROW I PROWERQETSQ PROSTAQ GIPOTEZA H0 : = 0 PRI ALXTERNATIWE H1 : 6= 0 GDE 0 { NEKOTOROE, APRIORI FIKSIROWANNOE ZNA^ENIE PARAMETRA (NAPRIMER, W OPYTAH mENDELQ PROWERQETSQ GIPOTEZA: WEROQTNOSTX NASLEDOWANIQ DOMINANTNOGO PRIZNAKA RAWNA 0 = 3=4). eSLI ^n = ^n(X (n)) { SOSTOQTELXNAQ pOCENKA DISPERSIQ KOTOROJ STREMITSQ K NUL@ PRI n ! 1 KAK O(1= n) TO ESTESTWENNO KRITI^ESKU@ OBLASTX POp ^ OPREDELITX SREDSTWOM NERAWENSTWA nj n(X (n) ) ; 0 j > C: wEROQTNOSTX p ^ (n) OIBKI PERWOGO RODA TAKOGO KRITERIQ (0 C ) = P ( nj n(X ) ; 0 j > C ) I PRIRAWNIWAQ \TU WEROQTNOSTX ZADANNOMU UROWN@ ZNA^IMOSTI NAHODIM KRITI^ESKU@ KONSTANTU p ^C =(n)C () KAK KWANTILX RASPREDELENIQ SLU^AJNOJ WELI^INY nj n(X ) ; 0 j TAKOJ WYBOR C PRIWODIT K KRITERI@ UROWNQ : eSLI (6= 0) { NEKOTOROE ALXTERNATIWNOE ZNA^ENIE PARAMETRA, TO, W SILU SOSTOQTELXNOSTI OCENKI, p nj ^n(X (n) ) ; 0 j ! 1 I PO\TOMU WEROQTNOSTX OIBKI WTOROGO ROP DA () = P (pnj ^n(X (n) ) ; 0 j > C ()) ! 0 KOGDA n ! 1: tAKIM OBRAZOM, MY POLU^AEM KRITERIJ ZADANNOGO UROWNQ OBLADA@]IJ K TOMU VE SWOJSTWOM SOSTOQTELXNOSTI { EGO WEROQTNOSTX OIBKI WTOROGO RODA STREMITSQ K NUL@ PRI NEOGRANI^ENNOM WOZRASTANII OB_EMA WYBORKI n: sFORMULIRUEM TEPERX OSNOWNU@ ZADA^U TEORII STATISTI^ESKOJ PROWERKI GIPOTEZ: TREBUETSQ NAJTI TAKOJ KRITERIJ ' UROWNQ KOTORYJ RAWNOMERNO PO WSEM 2 1 MAKSIMIZIRUET MO]NOSTX m() ILI, ^TO TO VE, RAWNOMERNO PO 2 1 MINIMIZIRUET WEROQTNOSTX OIBKI WTOROGO RODA (): mY UKAVEM METOD POSTROENIQ TAKIH RAWNOMERNO NAIBOLEE MO]NYH KRITERIEW ZADANNOGO UROWNQ W SLEDU@]EM PARAGRAFE, A POKA OBRATIMSQ K ILL@STRACIQM WWEDENNYH PONQTIJ I POSTROENI@ NAIBOLEE ^ASTO ISPOLXZUEMYH NA PRAKTIKE KRITERIEW, KASA@]IHSQ PROWERKI GIPOTEZ O ZNA^ENIQH PARAMETROW NORMALXNOGO RASPREDELENIQ. 10: pROWERKA GIPOTEZY O WELI^INE SREDNEGO ZNA^ENIQ NORMALXNOGO RASPREDELENIQ PRI IZWESTNOJ DISPERSII. rASSMOT0
233
RIM SNA^ALA NAIBOLEE ^ASTO WSTRE^A@]U@SQ W PRAKTI^ESKIH PRIMENENIQH MATEMATI^ESKOJ STATISTIKI ZADA^U PROWERKI SLOVNOJ GIPOTEZY H0 : 0 PRI SLOVNOJ ALXTERNATIWE H1 : > 0 O SREDNEM ZNA^ENII NORMALXNOGO ( 2) RASPREDELENIQ PRIXIZWESTNOM ZNA^En 2 ; 1 NII DISPERSII : wYBORO^NOE SREDNEE X = n 1 Xk ESTX OPTIMALXNAQ OCENKA NEIZWESTNOGO ZNA^ENIQ I PO\TOMU, W SOOTWETSTWII S TOLXKO ^TO PREDLOVENNYM METODOM POSTROENIQ SOSTOQTELXNYH KRITERIEWp, RASSMOTRIM KRITERIJ, OTWERGA@]IJ NULEWU@ GIPOTEZU H0 KOGDA n(X ; 0) > C ILI, ^TO TO VE, X > C POSKOLXKU ZNA^ENIQ 0 I n FIKSIROWANY I IZWESTNY. pOSTOQNNAQ C DOLVNA WYBIRATXSQ PO ZADANNOMU UROWN@ ZNA^IMOSTI OGRANI^IWA@]EMU MAKSIMALXNOE ZNA^ENIE WEROQTNOSTI OIBKI PERWOGO RODA. tAK KAK PRI WYBORE IZ NORMALXNOGO ( 2) RASPREDELENIQ STATISTIKA X N ( 2=n) TO FUNKCIQ MO]NOSTI \TOGO KRITERIQ C ; p ! ; C p ! m( ) = P(X > C ) = 1 ; n = n : lEGKO WIDETX, ^TO m( ) { STROGO WOZRASTAET S ROSTOM TAK ^TO RAZMER KRITERIQ C ; p ! 0 = max m ( ) = m ( 0) = 1 ;
n : pRIRAWNIWAQ RAZMER KRITERIQ UROWN@ ZNA^IMOSTI NAHODIM KRIp TI^ESKOE ZNA^ENIE C () = 0 + ;1(1 ; ) = n: wEROQTNOSTX OIBKI WTOROGO RODA NAEGO KRITERIQ RAZMERA 0 1 p C ( ) ; ( ) = P(X C ()) = @
nA = ! ; p 0 ; 1 (1) n + (1 ; ) > 0 UBYWAET S ROSTOM PO MERE EE OTHODA OT GRANI^NOGO ZNA^ENIQ 0: nAIBOLXEE ZNA^ENIE ( ) DOSTIGAETSQ W TO^KE = 0 I RAWNO 1 ; : |TO ZNA^ENIE NE ZAWISIT OT RAZMERA WYBORKI n I PO\TOMU TREBU@TSQ DOPOLNITELXNYE SOOBRAVENIQ PRI PLANIROWANII OB_EMA NABL@DENIJ. oBY^NO ISPOLXZUETSQ METOD WWEDENIQ TAK NAZYWAEMOJ ZONY BEZRAZLI^IQ { INTERWALA ( 0 1 ) KOTORYJ WYBIRAETSQ IZ TEH SOOBRAVENIJ, ^TO PRI ISTINNOM ZNA^ENII 2 ( 0 1) PRINQTIE NULEWOJ GIPOTEZY 0
234
H0 NE PRIWODIT K SLIKOM TQVELYM POSLEDSTWIQM. oDNAKO PRI ISTINNOM 1 WEROQTNOSTX PRINQTIQ H0 DOLVNA BYTX POD KONTROLEM I NE PREWOSHODITX NEKOTOROGO PREDPISANNOGO ZNA^ENIQ : |TO OBSTOQTELXSTWO POZWOLQET SPLANIROWATX OB_EM WYBORKI n OPREDELIW EGO IZ NERAWENSTWA ( 1) : iSPOLXZUQ FORMULU (1) DLQ ( ) NAHODIM, ^TO OB_EM WYBORKI n = n( 0 1) NEOBHODIMYJ DLQ RAZLI^ENIQ GIPOTEZ 0 I 1 S ZADANNYMI OGRANI^ENIQMI I NA WEROQTNOSTI OIBOK PERWOGO I WTOROGO RODA, RAWEN NAIMENXEMU CELOMU n UDOWLETWORQ@]EMU NERAWENSTWU h ;1 i (1 ; ) + ;1(1 ; ) 2 2 n
: ( 1 ; 0)2
aNALOGI^NYM METODOM STROITSQ KRITERIJ DLQ PROWERKI PROSTOJ GIPOTEZY H0 : = 0 PRI SLOVNOJ ALXTERNATIWE H1 : 6= 0: w \TOJ ZADA^E ESTESTWENNO OPREDELITX KRITI^ESKU@ OBLASTX POSREDSTWOM NERAWENSTWA j X ; 0 j > C: fUNKCIQ MO]NOSTI TAKOGO KRITERIQ " C + ; p ! ;C + ; p ! # 0 0 m( ) = 1 ; n ; n
STROGO UBYWAET PRI < 0 WOZRASTAET PRI > 0 I PRI = 0 RAWNA WEROQTNOSTI OIBKI PERWOGO RODA. tAKIM OBRAZOM, KRITI^ESKAQ KONSTANTA C = C () OPREDELQETSQ PO ZADANNOMU UROWN@ ZNA^IMOSTI IZ URAWNENIQ ;C p ! # " " C p ! p # C m( 0) = 1 ; n ; n = 2 1 ; ( n = 1 ; OTKUDA C () = ;1(1 ; =2) =pn: lEKCIQ 12
20: pROWERKA GIPOTEZY O WELI^INE DISPERSII NORMALXNOGO RASPREDELENIQ PRI NEIZWESTNOM SREDNEM ZNA^ENII. |TO TIPI^NAQ ZADA^A KONTROLQ ZA WELI^INOJ SLU^AJNOJ OIBKI W PARALLELXNYH NABL@DENIQH NEKOTOROJ HARAKTERISTIKI ISSLEDUEMOGO OB_EKTA. tAK KAK PREWYENIE HARAKTERISTIKI SLU^AJNOJ POGRENOSTI NAD NEKOTORYM NOMINALOM 0 W SLU^AE, KOGDA MY UTWERVDAEM 0 235
WLE^ET BOLEE SERXEZNYE POSLEDSTWIQ, ^EM NEOPRAWDANNYE PRETENZII K SLIKOM BOLXOMU RAZBROSU W DANNYH, TO SLEDUET PRINQTX ZA NULEWU@ GIPOTEZU > 0: pROWERKA \TOJ GIPOTEZY PROWODITSQ PRI ESTESTWENNOJ ALXTERNATIWE H1 : 0 PRI^EM MY NE ZNAEM ZNA^ENIQ MEA@]EGO PARAMETRA { SREDNEGO ZNA^ENIQ NORMALXNOGO RASPREDELENIQ, IZ KOTOROGO PROIZWODITSQ WYBOR. kAK NAM IZWESTNO, WYBORO^NAQ DISPERSIQ S 2 = n;1 Xn1 (Xk ; X )2 ESTX SOSTOQTELXNAQ OCENKA 2 EE RASPREDELENIE NE ZAWISIT OT A SLU^AJNAQ WELI^INA nS 2= 2 IMEET HI-KWADRAT RASPREDELENIE S n ; 1 STEPENX@ SWOBODY. tAKIM OBRAZOM, RAZUMNO RASSMOTRETX KRITERIJ S KRITI^ESKOJ OBLASTX@ nS 2 < C: fUNKCIQ MO]NOSTI TAKOGO KRITERIQ 0 2 1 C ! nS C @ A m( ) = P 2 2 = Kn;1 2 MONOTONNO UBYWAET S ROSTOM PO\TOMU NAIBOLXEE ZNA^ENIE WEROQTNOSTI OIBKI PERWOGO RODA DOSTIGAETSQ PRI = 0 I KRITI^ESKOE ZNA^ENIE C () KRITERIQ TREBUEMOGO RAZMERA OPREDELQETSQ IZ URAW ; 2 NENIQ Kn;1 C 0 = : iTAK, C () = 02Kn;;11() WEROQTNOSTX OIBKI WTOROGO RODA 0 2 1 2
( ) = P nS > C () = 1 ; Kn;1 @ 02 Kn;;11()A 0 MONOTONNO UBYWAET PO MERE OTHODA ISTINNOGO ZNA^ENIQ OT NOMINALA
0: 30: pROWERKA GIPOTEZY O WELI^INE SREDNEGO ZNA^ENIQ NORMALXNOGO RASPREDELENIQ PRI NEIZWESTNOJ DISPERSII (ODNOWYBORO^NYJ KRITERIJ sTX@DENTA). wY, NAWERNOE, OBRATILI WNI-
MANIE, ^TO PRI POSTROENII KRITERIEW ZNA^IMOSTI MY PO SU]ESTWU ISPOLXZUEM METODY POSTROENIQ DOWERITELXNYH MNOVESTW? |TO, DEJSTWITELXNO, TAK { MEVDU ZADA^AMI DOWERITELXNOJ OCENKI I PROWERKI GIPOTEZ SU]ESTWUET MNOGO OB]EGO, I, REIW ODNU ZADA^U, MY SRAZU VE POLU^AEM REENIE DRUGOJ. w KONCE \TOGO PARAGRAFA MY FORMALIZUEM \TOT PARALLELIZM, A POKA BUDEM ISPOLXZOWATX EGO NA INTUITIWNOM UROWNE: PREDLAGAETSQ ISPOLXZOWATX DLQ PROWERKI GIPOTEZ O SREDNEM ZNA^ENII NORMALXNOGO RASPREDELENIQ STATISTIKU sTX@DENTA. rASSMOTRIM SNA^ALA ZADA^U PROWERKI SLOVNOJ GIPOTEZY H0 : 0 PRI SLOVNOJ ALXTERNATIWE H1 : > 0: tAK KAK WYBORO^NOE SRED236
NEE X ESTX SOSTOQTELXNAQ OCENKA ZNA^ENIQ TO STATISTIKA sTX@DENTA p T = X ;S 0 n ; 1 OPOSREDSTWENNO, ^EREZ WYBORO^NYE DANNYE, HARAKTERIZUET UDALENNOSTX ISTINNOGO SREDNEGO ZNA^ENIQ OT GRANICY 0 RAZDELQ@]EJ GIPOTEZU I ALTERNATIWU. pO\TOMU PREDLAGAETSQ OTWERGATX NULEWU@ GIPOTEZU 0 ESLI T > C WYBIRAQ C KAK OBY^NO, PO ZADANNOMU UROWN@ ZNA^IMOSTI : dLQ REENIQ POSLEDNEJ ZADA^I NEOBHODIMO ISSLEDOWATX POWEDENIE FUNKCII MO]NOSTI m( ) = P (T > C ) KRITERIQ T > C: eSLI MY POKAVEM, ^TO m( ) ESTX MONOTONNO WOZRASTA@]AQ FUNKCIQ ARGUMENTA PRI L@BOM FIKSIROWANNOM ZNA^ENII ARGUMENTA TO NAIBOLXEE ZNA^ENIE WEROQTNOSTI OIBKI PERWOGO RODA ( ) = m( : ) 0 PRI KAVDOM FIKSIROWANNOM BUDET DOSTIGATXSQ W TO^KE = 0: sLEDOWATELXNO, RAZMER KRITERIQ W TAKOM SLU^AE BUDET RAWEN (SM. PUNKT 40 PREDYDU]EGO PARAGRAFA) = m( 0 ) = P (T > C ) = 1 ; Sn;1(C ) GDE S ( ) { FUNKCIQ RASPREDELENIQ sTX@DENTA S STEPENQMI SWOBODY. tAKIM OBRAZOM, MY POLU^IM SWOBODNYJ OT NEIZWESTNOGO ZNA^ENIQ KRITERIJ T > C () TREBUEMOGO RAZMERA S KRITI^ESKOJ KONSTANTOJ C () = Sn;;11(1 ; ): |TO I ESTX TO STATISTI^ESKOE PRAWILO, KOTOROE OBY^NO NAZYWAETSQ KRITERIEM sTX@DENTA ILI t-KRITERIEM. pOKAVEM TEPERX, ^TO WEROQTNOSTX (FUNKCIQ MO]NOSTI) P (T > C ) MONOTONNO WOZRASTAET S ROSTOM PRI L@BYH FIKSIROWANNYH ZNA^ENIQH I C: s \TOJ CELX@ PREDSTAWIM STATISTIKU T W SLEDU@]EM WIDE: p p T = X S; n ; 1 + ; 0 S n ; 1: eSLI { SREDNEE ZNA^ENIE NORMALXNOGO RASPREDELENIQ, IZ KOTOROGO PROISHODIT WYBOR, TO PERWOE SLAGAEMOE W \TOM PREDSTAWLENII ESTX STX@DENTOWSKAQ SLU^AJNAQ WELI^INA S n ; 1 STEPENX@ SWOBODY. wTOROE SLAGAEMOE ESTX PROIZWEDENIE PARAMETRI^ESKOJ FUNKCII ( ) = p ( ; 0) n ; 1= NA POLOVITELXNU@ SLU^AJNU@ WELI^INU =S RASPREDELENIE KOTOROJ NE ZAWISIT OT I : pRI FIKSIROWANNOM FUNKCIQ ( ) WOZRASTAET S ROSTOM I PRI \TOM WSE WTOROE SLAGAEMOE WOZRASTAET, ^TO WLE^ET UWELI^ENIE WEROQTNOSTI SOBYTIQ PERESKOKA STATISTIKOJ T POROGA C TO ESTX WEROQTNOSTI SOBYTIQ T > C: 0
237
iTAK, MY POSTROILI KRITERIJ PROWERKI ODNOSTORONNEJ GIPOTEZY 0 PRI ODNOSTORONNEJ ALXTERNATIWE > 0: fUNKCIQ MO]NOSTI \TOGO KRITERIQ ZAWISIT p OT I TOLXKO ^EREZ PARAMETRI^ESKU@ FUNKCI@ = ( ; 0) n ; 1= KOTORAQ NAZYWAETSQ PARAMETROM NEp CENTRALXNOSTI. rASPREDELENIE STATISTIKI T = (X ; 0) n ; 1=S PRI PROIZWOLXNYH I ^EREZ KOTOROE WYRAVAETSQ FUNKCIQ MO]NOSTI KRITERIQ sTX@DENTA, NAZYWAETSQ NECENTRALXNYM RASPREDELENIEM sTX@DENTA S n ; 1 STEPENX@ SWOBODY TABLICY \TOGO RASPREDELENIQ, ZAWISQ]EGO OT PARAMETRA NECENTRALXNOSTI MOVNO NAJTI W tms. pONQTNO, ^TO POSTROENIE KRITERIQ PROWERKI PROSTOJ GIPOTEZY = 0 PRI DWUSTORONNEJ (SLOVNOJ) ALXTERNATIWE 6= 0 NE WYZYWAET PRINCIPIALXNYH ZATRUDNENIJ. |TO KRITERIJ S KRITI^ESKOJ OBLASTX@ j T j > C GDE KRITI^ESKAQ KONSTANTA C = C () = Sn;;11(1 ; =2): 40: sRAWNENIE SREDNIH ZNA^ENIJ DWUH NORMALXNYH RASPRE-
DELENIJ S OB]EJ NEIZWESTNOJ DISPERSIEJ (DWUHWYBORO^NYJ KRITERIJ sTX@DENTA). pUSTX X I Y { NEZAWISIMYE SLU^AJNYE WE-
LI^INY, PRI^EM X N ( 1 2) A Y N ( 2 2) TAK ^TO DX = DY: pO DWUM NEZAWISIMYM WYBORKAM X (n) = (X1 : : : Xn ) I Y (m) = (Y1 : : : Ym) (WOZMOVNO, RAZNOGO OB_EMA) TREBUETSQ PROWERITX GIPOTEZU ODNORODNOSTI H0 : 1 = 2 PRI ALXTERNATIWE H1 : 1 > 2: tIPI^NYJ PRIMER TAKOJ ZADA^I { WYQWLENIE \FFEKTA NOWOGO METODA LE^ENIQ NA GRUPPE IZ n PACIENTOW POSREDSTWOM SRAWNENIQ S KONTROLXNOJ GRUPPOJ IZ m PACIENTOW, LE^ENIE KOTORYH PROWODITSQ PO STAROJ METODIKE. |TA ZADA^A QWLQETSQ DLQ NAS NESKOLXKO NOWOJ, POSKOLXKU DO SIH POR MY IMELI DELO TOLXKO S ODNOJ WYBORKOJ. tEM NE MENEE, ONA SWODITSQ K TOJ, ^TO MY TOLXKO ^TO RASSMOTRELI W 30 S POMO]X@ SLEDU@]IH POSTROENIJ. rASSMOTRIM SNA^ALA RAZNOSTX WYBORO^NYH SREDNIH X ; Y : |TA STATISTIKA IMEET NORMALXNOE RASPREDELENIE SO SREDNIM E(X ; Y ) = 1 ; 2 I DISPERSIEJ D(X ; Y ) = DX + DY = 2(n;1 + m;1): sLEDOWATELXNO, PRI SPRAWEDLIWOSTI NULEWOJ GIPOTEZY 1 = 2 SLU^AJNAQ WELI^INA X ; Y s nm
= n+m 238
IMEET STANDARTNOE NORMALXNOE RASPREDELENIE N (0 1): dALEE, NORMIROWANNYE WYBORO^NYE DISPERSII nSX2 = 2 I mSY2 = 2 NEZAWISIMY I RASPREDELENY PO ZAKONU HI-KWADRAT S n ; 1 I m ; 1 STEPENQMI SWOBODY SOOTWETSTWENNO. tAK KAK DLQ HI-KWADRAT RASPREDELENIQ, KAK ^ASTNOGO SLU^AQ GAMMA-RASPREDELENIQ MESTO TEOREMA SLOVENIQ, TO 2 , IMEET SLU^AJNAQ WELI^INA = nSX + mSY2 = 2 IMEET HI-KWADRAT RASPREDELENIE S n + m ; 2 STEPENQMI SWOBODY. tAKIM OBRAZOM, MY PRIHODIM K DWUHWYBORO^NOJ STATISTIKE sTX@DENTA v u u
X ; Y t nm(n + m ; 2) Tnm = q =q 2 n+m =(n + m ; 2) nSX + mSY2 RASPREDELENIE KOTOROJ PRI SPRAWEDLIWOSTI NULEWOJ GIPOTEZY ESTX RASPREDELENIE sTX@DENTA S n + m ; 2 STEPENQMI SWOBODY. kAK I W SLU^AE ODNOWYBORO^NOGO KRITERIQ sTX@DENTA W 30 NETRUDNO POKAZATX, ^TO PRI L@BYH FIKSIROWANNYH C I FUNKCIQ MO]NOSTI DWUHWYBORO^NOGO KRITERIQ sTX@DENTA Tnm > C ESTX MONOTONNO pWOZRASTA@]AQ FUNKCIQ PARAMETRA NECENTRALXNOSTI = ( 1 ; 2) n + m ; 2= TAK ^TO KRITI^ESKAQ KONSTANTA C OPREDELQETSQ PO ZADANNOMU UROWN@ ZNA^IMOSTI IZ URAWNENIQ P (Tnm > C ) = 1 ; Sn+m;2(C ) = I RAWNA KWANTILI RASPREDELENIQ sTX@DENTA: C () = Sn;+1m;2(1 ; ): pONQTNO, ^TO PRI ALXTERNATIWE H1 : 1 6= 2 KRITI^ESKAQ KONSTANTA C () = Sn;+1m;2(1 ; =2): pRI ISPOLXZOWANII \TOGO KRITERIQ SLEDUET OBRATITX OSOBOE WNIMANIE NA PREDPOLOVENIE O RAWENSTWE DISPERSIJ NABL@DAEMYH SLU^AJNYH WELI^IN: X2 = Y2 : zADA^A SRAWNENIQ SREDNIH DWUH NORMALXNYH RASPREDELENIJ S NERAWNYMI DISPERSIQMI I S GARANTIROWANNYM OGRANI^ENIEM NA WEROQTNOSTX OIBKI PERWOGO RODA NAZYWAETSQ PROBLEMOJ bERENSA{fIERA. iZWESTNO LIX ASIMPTOTI^ESKOE REENIE \TOJ PROBLEMY PRI BOLXIH n I m: 50: sRAWNENIE DISPERSIJ DWUH NORMALXNYH RASPREDELENIJ PRI NEIZWESTNYH SREDNIH (KRITERIJ fIERA). nEZAWISIMYE WYBORKI X (n) I Y (m) BERUTSQ IZ SOOTWETSTWU@]IH NORMALXNYH RASPREDELENIJ N ( 1 12) I N ( 2 22) OTNOSITELXNO PARAMETROW KOTOROGO PROWERQETSQ GIPOTEZA 12 = 22 PRI ALXTERNATIWE 12 > 22 S MEA@]IMI PARAMETRAMI 1 I 2: w \TOJ ZADA^E ESTESTWENNO RASSMOTRETX KRITERIJ, OSNOWANNYJ NA 239
STATISTIKE F = nSX2 =mSY2 KOTORAQ RASPREDELENA KAK 2n;1 12 : 2m;1 22 fUNKCIQ MO]NOSTI KRITERIQ F > C (KOTORYJ NAZYWAETSQ KRITERIEM fIERA ILI F -KRITERIEM) 0 21 0 2 1 2
m @ 12 A = P (F > C ) = P @ 2n;1 > C 22 A 2 m;1 1 ESTX MONOTONNO WOZRASTA@]AQ FUNKCIQ OTNOENIQ DISPERSIJ 12= 22: dLQ EE WY^ISLENIQ NEOBHODIMO ZNATX RASPREDELENIE OTNOENIQ DWUH NEZAWISIMYH SLU^AJNYH WELI^IN, RASPREDELENNYH PO ZAKONU HI-KWADRAT S n ; 1 I m ; 1 STEPENQMI SWOBODY. |TO TAK NAZYWAEMOE RASPREDELENIE fIERA Fn;1m;1 PLOTNOSTX KOTOROGO n+m;2 n; ;1 ; x fn;1m;1(x) = ; n;1 ;2 m;1 n m; x > 0 ( x + 1) 2 2 WY^ISLQETSQ STOLX VE PROSTO, KAK \TO MY DELALI PRI WYWODE RASPREDELENIQ sTX@DENTA. tABLICY RASPREDELENIQ fIERA MOVNO NAJTI W tms. kRITI^ESKAQ KONSTANTA C KRITERIQ fIERA ZADANNOGO RAZMERA OPREDELQETSQ KAK KWANTILX \TOGO RASPREDELENIQ: C () = Fn;;11m;1(1 ; ): mY ZAWERIM ILL@STRACI@ METODOW POSTROENIQ KRITERIEW S POMO]X@ SOSTOQTELXNYH OCENOK TESTIRUEMOGO PARAMETRA PRIMEROM, W KOTOROM NE WSEGDA RAZMER KRITERIQ SOWPADAET S ZADANNYM UROWNEM ZNA^IMOSTI. 60: pROWERKA GIPOTEZY O WEROQTNOSTI USPEHA W ISPYTANIQH bERNULLI. rASSMOTRIM ZADA^U PROWERKI GIPOTEZY p = p0 PROTIW ALXTERNATIWY p < p0 O WEROQTNOSTI p USPENOGO ISHODA W ISPYTANIQH bERNULLI. pRIMER TAKOJ ZADA^I { PROWERKA GIPOTEZY O WEROQTNOSTI NASLEDOWANIQ DOMINANTNOGO PRIZNAKA W OPYTAH mENDELQ, KOGDA ALXTERNATIWNAQ MODELX PREDPISYWAET \TOJ WEROQTNOSTI MENXEE ZNA^ENIE. pREDLAGAEMYJ NIVE METOD REENIQ POZWOLQET STROITX KRITERII PROWERKI TAKOJ GIPOTEZY PRI ALXTERNATIWAH p > p0 ILI p 6= p0 POSREDSTWOM PROSTOJ ZAMENY NERAWENSTWA, OPREDELQ@]EGO KRITI^ESKU@ OBLASTX, NA OBRATNOE ILI DWUSTORONNEE. 1
2
1
2
2
1
+
240
2
2
iTAK, ESLI MY RASPOLAGAEM WYBORKOJ X (n) IZ DWUHTO^E^NOGO RASPREDELENIQ B(1 p) TO OTNOSITELXNAQ ^ASTOTA USPENYH ISPYTANIJ (WYBORO^NOE SREDNEE) X QWLQETSQ NESME]ENNOJ OCENKOJ p S MINIMALXNOJ DISPERSIEJ. w SOOTWETSTWII S PREDLOVENNOJ WYE IDEOLOGIEJ PROWERKI GIPOTEZ S POMO]X@ OCENOK TESTIRUEMOGO PARAMETRA MY DOLVNY OTWERGATX GIPOTEZU p = pX 0 W POLXZU p < p0 ESLI X ; p0 < C: pOSKOLXKU STATISTIKA T = nX = n1 Xk IMEET BINOMIALXNOE RASPREDELENIE B(n p) A ZNA^ENIE p0 ZADANO, TO DLQ WY^ISLENIQ FUNKCII MO]NOSTI UDOBNEE ZAPISATX KRITI^ESKU@ OBLASTX W WIDE T < C: nO STATISTIKA T PRINIMAET TOLXKO CELO^ISLENNYE ZNA^ENIQ 0 1 : : : n PO\TOMU BESSMYSLENNO RASSMATRIWATX DROBNYE ZNA^ENIQ KRITI^ESKIH KONSTANT. tAKIM OBRAZOM, MY PRIHODIM K NAIBOLEE UDOBNOJ FORME ZAPISI KRITI^ESKOJ OBLASTI W WIDE T < C GDE C PRINIMAET ZNA^ENIQ 1 2 : : : n fUNKCIQ MO]NOSTI TAKOGO KRITERIQ m(p) = Pp (T < C ) =
CX ;1 k=0
pk (1 ; p)n;k
I POSKOLXKU PROWERQETSQ PROSTAQ GIPOTEZA, TO KRITI^ESKAQ KONSTANTA C DOLVNA OPREDELQTXSQ PO ZADANNOMU UROWN@ ZNA^IMOSTI IZ NERAWENSTWA CX ;1 m(p0) = p0k (1 ; p0) n;k : (2) k=0 o^EWIDNO, ^TO ^EM BOLXE C TEM BOLXE MO]NOSTX KRITERIQ, I PO\TOMU C () SLEDUET WYBIRATX KAK NAIBOLXEE CELOE ^ISLO, UDOWLETWORQ@]EE NERAWENSTWU (2). rAZMER KRITERIQ S TAKIM C () NE OBQZATELXNO RAWEN TAK ^TO MY MOVEM POLU^ITX KRITERIJ UROWNQ NO NE RAZMERA (W PREDYDU]IH PRIMERAH S TESTOWYMI STATISTIKAMI, IME@]IMI RASPREDELENIE NEPRERYWNOGO TIPA, MY IMELI KRITERII RAZMERA ). bOLEE TOGO, ESLI p0 NASTOLXKO MALO, ^TO (1 ; p0)n > TO NE SU]ESTWUET TAKIH C PRI KOTORYH IMEET MESTO NERAWENSTWO (2). w TAKOM SLU^AE MY DOLVNY PRINIMATX NULEWU@ GIPOTEZU PRI L@BOM REZULXTATE STATISTI^ESKOGO \KSPERIMENTA, OBESPE^IWAQ TEM SAMYM NULEWOJ RAZMER TAKOGO KRITERIQ \UROWNQ ": pRI BOLXIH OB_EMAH WYBORKI n MOVNO ISPOLXZOWATX NORMALXNYE APPROKSIMACII BINOMIALXNOGO RASPREDELENIQ, POLU^AQ TAKIM OBRAZOM KRITERIJ, RAZMER KOTOROGO ASIMPTOTI^ESKI (n ! 1) RAWEN : 241
sTATISTIKA T ASIMPTOTI^ESKI NORMALXNA SO SREDNIM np I DISPERSIEJ np(1 ; p) PO\TOMU NERAWENSTWO (2) DLQ OPREDELENIQ KRITI^ESKOJ KONSTANTY IMEET ASIMPTOTI^ESKIJ ANALOG 0 1 C ; np 0 A @q np0(1 ; p0) q OTKUDA C () np0 ; ;1(1 ; )= np0(1 ; p0): lEGKO PONQTX, ^TO TAKOJ METOD POSTROENIQ KRITERIEW ASIMPTOTI^ESKOGO UROWNQ PRIMENIM DLQ L@BOJ KRITI^ESKOJ OBLASTI, W ZADANII KOTOROJ ISPOLXZUETSQ ASIMPTOTI^ESKI NORMALXNAQ OCENKA TESTIRUEMOGO PARAMETRA (SM. POQSNENIQ W PREDYDU]EM PARAGRAFE PERED PUNKTOM 50). |TOT PRIMER POKAZYWAET, ^TO W SLU^AE DISKRETNYH RASPREDELENIJ ZADA^A POSTROENIQ RAWNOMERNO NAIBOLEE MO]NYH KRITERIEW ZNA^ITELXNO USLOVNQETSQ, POSKOLXKU ODIN IZ DWUH KRITERIEW ODNOGO I TOGO VE UROWNQ MOVET IMETX BOLXU@ MO]NOSTX TOLXKO POTOMU, ^TO ON IMEET BOLXIJ RAZMER. mY STOLKNEMSQ S \TOJ PROBLEMOJ W SLEDU@]EM PARAGRAFE, NO SLEDUET ZAMETITX, ^TO SOWREMENNAQ TEORIQ NAIBOLEE MO]NYH KRITERIEW OBHODIT \TOT NEPRIQTNYJ MOMENT ZA S^ET RASIRENIQ PONQTIQ STATISTI^ESKOGO PRAWILA, WWODQ TAK NAZYWAEMYE RANDOMIZIROWANNYE KRITERII. k SOVALENI@, Q NE RASPOLAGA@ WREMENEM POZNAKOMITX WAS S \TIM ZAME^ATELXNYM OB_EKTOM TEORII STATISTI^ESKOGO WYWODA. mY ZAKON^IM \TOT PARAGRAF, KAK I BYLO OBE]ANO, FORMULIROWKOJ PRINCIPA DWOJSTWENNOSTI MEVDU ZADA^AMI PROWERKI GIPOTEZ I DOWERITELXNOGO OCENIWANIQ. pUSTX A(0) Xn { OBLASTX PRINQTIQ NEKOTOROGO KRITERIQ UROWNQ TESTIRU@]EGO GIPOTEZU H0 : = 0 I PUSTX A(0) OPREDELENA PRI L@BOM 0 2 : dLQ KAVDOGO REZULXTATA x(n) NABL@DENIQ SLU^AJNOJ WYBORKI X (n) WWEDEM PODMNOVESTWO (x(n)) PARAMETRI^ESKOGO PROSTRANSTWA POLOVIW (x(n)) = f : x(n) 2 A()g: tOGDA (X (n) ) ESTX )-DOWERITELXNOE DLQ PARAMETRA (1(n; (n) MNOVESTWO ) POSKOLXKU P (X ) 3 = P X 2 A() 1 ; : nAPRIMER, KRITERIJ sTX@DENTA PROWERKI GIPOTEZY = 0 O SREDNEM ZNA^ENII NORMALXNOGO ( 2) RASPREDELENIQ S NEIZWESTNOJ DISPERSIEJ 2 IMEET OBLASTX PRINQTIQ (SM. P. 30 DANNOGO PARAGRAFA) 9 8 < (n) j X ; 0 j p = A( 0) = :X : n ; 1 Sn;;11(1 ; =2) : S 242
pODSTAWIM W \TO NERAWENSTWO WMESTO FIKSIROWANNOGO 0 PARAMETR I RAZREIM NERAWENSTWO OTNOSITELXNO : w REZULXTATE POLU^IM DOWERITELXNOE UTWERVDENIE (SM. P. 40 PREDYDU]EGO PARAGRAFA) p p X ; St= n ; 1 X + St= n ; 1 W KOTOROM t = Sn;;11(1 ; =2): wY SAMI MOVETE SOPOSTAWITX DOWERITELXNYE INTERWALY, POSTROENNYE W x6, S KRITERIQMI IZ x7. pRI \TOM SOPOSTAWLENII MOVNO WYWESTI POLEZNOE PRAWILO, KASA@]EESQ DOWERITELXNOJ OCENKI SKALQRNOGO PARAMETRA : eSLI IMEETSQ SOSTOQTELXNYJ KRITERIJ PROWERKI GIPOTEZY = 0 PRI DWUSTORONNEJ ALXTERNATIWE 6= 0 TO EGO OBLASTI PRINQTIQ SOOTWETSTWUET DWUSTORONNIJ DOWERITELXNYJ INTERWAL. eSLI VE ALXTERNATIWNAQ GIPOTEZA NOSIT ODNOSTORONNIJ HARAKTER, TO PRI ALXTERNATIWE < 0 MY POLU^AEM WERHN@@ DOWERITELXNU@ GRANICU, A PRI > 0 { NIVN@@. eSTESTWENNO, PRINCIP DWOJSTWENNOSTI PRIMENIM I K DOWERITELXNYM INTERWALAM, KAK STATISTI^ESKIM PRAWILAM PROWERKI GIPOTEZ: GIPOTEZA 2 0 OTWERGAETSQ TOGDA I TOLXKO TOGDA, KOGDA (1 ; )DOWERITELXNAQ OBLASTX PRINADLEVIT PODMNOVESTWU 1 I TAKOE STATISTI^ESKOE PRAWILO (KRITERIJ) GARANTIRUET ZADANNOE OGRANI^ENIE NA WEROQTNOSTX OIBKI PERWOGO RODA.
243
x8. rAWNOMERNO NAIBOLEE MO]NYE KRITERII lEKCIQ 13
mETOD POSTROENIQ KRITERIEW ZADANNOGO UROWNQ KOTORYJ RAWNOMERNO PO WSEM ALXTERNATIWNYM ZNA^ENIQM PARAMETRA MAKSIMIZIRUET MO]NOSTX KRITERIQ, SU]ESTWENNO OPIRAETSQ NA SLEDU@]EE, PO^TI O^EWIDNOE UTWERVDENIE, KOTOROE W TEORII PROWERKI GIPOTEZ OBY^NO NAZYWAETSQ LEMMOJ nEJMANA{pIRSONA. rASSMOTRIM WEROQTNOSTNU@ MODELX, SOSTOQ]U@ WSEGO IZ DWUH RASPREDELENIJ P0 I P1 S OB]IM NOSITELEM X I FUNKCIQMI PLOTNOSTI f0(x) I f1(x) x 2 X: pO WYBORKE X ( ) PROWERQETSQ PROSTAQ GIPOTEZA H0 : WYBORKA WZQTA IZ RASPREDELENIQ P0 PRI PROSTOJ ALXTERNATIWE H1 : WYBORKE SOOTWETSTWUET RASPREDELENIE P1: oPREDELIM KRITI^ESKU@ FUNKCI@ '(X ( )) KAK INDIKATORNU@ FUNKCI@ KRITI^ESKOJ OBLASTI Y ) L(X ( ) ) = ff1((X > C: =1 0 X ) sTATISTIKA L NAZYWAETSQ STATISTIKOJ OTNOENIQ PRAWDOPODOBIQ, A KRITERIJ ' { KRITERIEM OTNOENIQ PRAWDOPODOBIQ ILI KRITERIEM nEJMANA{pIRSONA. kRITERIJ ' OTWERGAET NULEWU@ GIPOTEZU, ESLI PRAWDOPODOBIE ALXTERNATIWY f1 (X ( ) ) = Y 1 f1(X ) YW C RAZ PREWOSHODIT PRAWDOPODOBIE NULEWOJ GIPOTEZY f0 (X ( ) ) = 1 f0(X ): |TOT KRITERIJ OBLADAET SLEDU@]IM ZAME^ATELXNYM SWOJSTWOM. tEOREMA 8.1.kRITERIJ OTNOENIQ PRAWDOPODOBIQ ' QWLQETSQ NAIn
n
n
k
n
k
k
n
n
n
k
n
n
n
k
BOLEE MO]NYM KRITERIEM W KLASSE WSEH KRITERIEW PROWERKI PROSTOJ GIPOTEZY PRI PROSTOJ ALXTERNATIWE, RAZMER KOTORYH NE PREWOSHODIT RAZMERA KRITERIQ ' : eSLI KRITERIJ ' IMEET RAZMER TO ON OBLADAET NAIBOLXEJ MO]NOSTX@ W KLASSE WSEH KRITERIEW UROWNQ :
d O K A Z A T E L X S T W O. pUSTX ' = '(X ( ) ) { L@BOJ DRUGOJ KRITERIJ, RAZMER KOTOROGO E 0 '(X ( ) ) E 0 '(X ( ) ): (1) tREBUETSQ POKAZATX, ^TO TOGDA KRITERIJ ' IMEET BOLXU@ MO]NOSTX, ^EM KRITERIJ ' TO ESTX E 1 '(X ( )) E 1 '(X ( ) ): n
n
n
n
244
n
rASSMOTRIM INTEGRAL Z h ih i '(x( ) ) ; '(x( ) ) f1 (x( ) ) ; Cf0 (x( )) d (x( )) = n
n
n
n
n
Xn
E 1 '(X (
)
n
)
n
)
h
; C E 0 '(X (
n
n
n
n
n
n
)
)
; E 0 '(X (
i
: dOSTATO^NO POKAZATX, ^TO \TOT INTEGRAL NEOTRICATELEN, I TOGDA PERWOE UTWERVDENIE TEOREMY BUDET SLEDOWATX IZ NERAWENSTWA: h i E 1 '(X ( ) ) ; E 1 '(X ( ) ) ; C E 0 '(X ( ) ) ; E 0 '(X ( ) ) 0 KOTOROE WLE^ET (SM. (1)) h i E 1 '(X ( ) ) ; E 1 '(X ( ) ) C E 0 '(X ( ) ) ; E 0 '(X ( ) ) 0: pOKAVEM, ^TO FUNKCII '(x( )) ; '(x( )) I f1 (x( )) ; Cf0 (x( )) PROIZWEDENIE KOTORYH INTEGRIRUETSQ, ODNOWREMENNO POLOVITELXNY ILI OTRICATELXNY PRI L@BYH x( ) 2 X : dEJSTWITELXNO, ESLI '(x( )) ;'(x( ) ) > 0 TO \TO WLE^ET '(x( ) ) = 1 POSKOLXKU KRITI^ESKAQ FUNKCIQ RAWNA EDINICE, ESLI ONA NE RAWNA NUL@. nO, PO OPREDELENI@ KRITERIQ OTNOENIQ PRAWDOPODOBIQ, RAWENSTWO '(x( )) = 1 WOZMOVNO LIX W SLU^AE f1 (x( ) ) ; Cf0 (x( ) ) > 0: tO^NO TAKVE USTANAWLIWAETSQ, ^TO NERAWENSTWO '(x( )) ; '(x( ) ) < 0 WLE^ET f1 (x( )) ; Cf0 (x( )) < 0: iTAK, KRITERIJ ' NAIBOLEE MO]EN W KLASSE WSEH KRITERIEW, RAZMER KOTORYH NE PREWOSHODIT RAZMERA ': eSLI VE E 0 '(X ( ) ) = TO \TO UTWERVDENIE, O^EWIDNO, WLE^ET EGO NAIBOLXU@ MO]NOSTX W KLASSE WSEH KRITERIEW UROWNQ : pRIMENENIE \TOJ TEOREMY K POSTROENI@ RAWNOMERNO NAIBOLEE MO]NYH KRITERIEW MY PROILL@STRIRUEM NA ODNOM ^ASTNOM PRIMERE, IZ KOTOROGO BUDET WIDEN OB]IJ PODHOD K DANNOJ ZADA^E. p R I M E R 8.1. pROWERKA NADEVNOSTI PRI POKAZATELXNOM RASPREDELENII DOLGOWE^NOSTI. w PRIMERE 3.3 MY RASSMATRIWALI PROBLEMU OCENKI NADEVNOSTI IZDELIQ S POKAZATELXNYM RASPREDELENIEM DOLGOWE^NOSTI. nAPOMNIM, SLU^AJNAQ WELI^INA X REALIZACIQ x KOTOROJ SOOTWETSTWUET PROMEVUTKU WREMENI OT NA^ALA RABOTY DO MOMENTA OTKAZA NEKOTOROGO IZDELIQ, NAZYWAETSQ DOLGOWE^NOSTX@, I PO FUNKCII RASPREDELENIQ F (x) x 0 SLU^AJNOJ WELI^INY X MOVNO RASS^ITATX )
n
; E 1 '(X (
n
n
n
n
n
n
n
)
n
)
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
245
NADEVNOSTX H (t) IZDELIJ, SOOTWETSTWU@]U@ GARANTIJNOMU WREMENI t : H (t) = P (X t) = 1 ; F (t): pUSTX DOLGOWE^NOSTX X RASPREDELENA PO POKAZATELXNOMU ZAKONU S FUNKCIEJ RASPREDELENIQ F (x j ) = 1 ; expf;x=g ZNA^ENIE PARAMETRA KOTOROJ NE IZWESTNO. mY DOLVNY UDOSTOWERITXSQ, ^TO NADEVNOSTX WYPUSKAEMYH IZDELIJ DOSTATO^NO WYSOKA: H (t) P0 GDE P0 { NAIMENXAQ DOPUSTIMAQ DOLQ IZDELIJ, KOTORYE DOLVNY PROSLUVITX GARANTIJNYJ SROK t: |TO TIPI^NAQ ZADA^A PROWERKI GIPOTEZ, REENIE KOTOROJ NA^INAETSQ S OPREDELENIQ NULEWOJ GIPOTEZY H0: pRI \TOM SLEDUET POMNITX, ^TO W STATISTI^ESKOM KRITERII KONTROLIRUETSQ WEROQTNOSTX OTKLONENIQ H0 KOGDA ONA W DEJSTWITELXNOSTI WERNA. w NAEJ KONKRETNOJ PROBLEME SPECIFIKACIQ NULEWOJ GIPOTEZY WO MNOGOM ZAWISIT OT TOGO, ^TO POWLE^ET ZA SOBOJ OTKAZ IZDELIQ. eSLI MY WYPUSKAEM BYTOWYE PRIBORY, TO OTKAZ IZDELIQ DO GARANTIJNOGO SKROKA t POWLE^ET IZDERVKI NA REMONT, KOTORYE MOGUT BYTX NEZNA^ITELXNYMI PO SRAWNENI@ SO STOIMOSTX@ IZDELIQ. w TAKOM SLU^AE ESTESTWENNO WYBRATX W KA^ESTWE NULEWOJ GIPOTEZY UTWERVDENIE O NADEVNOSTI IZDELIJ { OTKLONIW \TU GIPOTEZU, KOGDA ONA WERNA, MY POTERQEM DOROGOSTOQ]U@ PRODUKCI@, REMONT KOTOROJ NAM OBOELSQ BY ZNA^ITELXNO DEEWLE, ^EM EE UNI^TOVENIE ILI PRODAVA PO BROSOWOJ CENE. eSLI VE OTKAZ IZDELIQ PRIWODIT K KATASTROFI^ESKIM POSLEDSTWIQM, NAPRIMER, K GIBELI L@DEJ, TO ZDESX RASSUVDATX NE^EGO, I ZA NULEWU@ GIPOTEZU SLEDUET BRATX UTWERVDENIE O \NENADEVNOSTI". oTKLONIW TAKU@ GIPOTEZU, KOGDA ONA W DEJSTWITELXNOSTI WERNA, MY STOLKNEMSQ S NEPRIEMLEMO BOLXOJ DOLEJ OTKAZOW DO ISTE^ENIQ GARANTIJNOGO SROKA, I PO\TOMU RISK OT PRINQTIQ \PLOHIH" IZDELIJ DOLVEN BYTX KONTROLIRUEM. oSTANOWIMSQ NA \TOM WARIANTE I PRISTUPIM K POSTROENI@ RAWNOMERNO NAIBOLEE MO]NOGO KRITERIQ PROWERKI GIPOTEZY \NENADEVNOSTI" H0 : H (t) < P0 PRI ALXTERNATIWE H1 : H (t) P0 KOGDA H (t) = expf;t=g: w TERMINAH ZNA^ENIJ PARAMETRA NULEWAQ GIPOTEZA PRINIMAET WID H0 : < 0 = ;t= ln : zAFIKSIRUEM NEKOTOROE ALXTERNATIWNOE ZNA^ENIE 1 > 0 I RASSMOTRIM ZADA^U PROWERKI PROSTOJ GIPOTEZY H00 : = 0 PRI PROSTOJ ALXTERNATIWE H10 : = 1: nAIBOLEE MO]NYJ KRITERIJ PROWERKI PROSTOJ GIPOTEZY PRI PROSTOJ ALXTERNATIWE 246
IMEET KRITI^ESKU@ OBLASTX WIDA (SM. TEOREMU 8.1) ( ! ) Y f1(X ) 0 1 1 X ( ) L(X ) = f (X ) = exp ; 1 X > C 1 0 1 =1 0 GDE KRITI^ESKAQ KONSTANTAC OPREDELQETSQ PO ZADANNOMU UROWN@ ZNA( ) ^IMOSTI X IZ USLOWIQ P L(X ) > C : pOSKOLXKU STATISTIKA T = 1 X IMEET GAMMA-RASPREDELENIE G(n 0) TO DLQ OPREDELENIQ C W POSLEDNEM NERAWENSTWE SLEDUET POLOVITX ZNAK RAWENSTWA. kROME \TOGO, STATISTIKA OTNOENIQ PRAWDOPODOBIQ L(X ( ) ) ESTX MONOTONNAQ FUNKCIQ STATISTIKI T PO\TOMU KRITI^ESKU@ OBLASTX L(X ( ) ) > C MOVNO ZAPISATX W \KWIWALENTNOJ FORME T > C I NAHODITX NOWOE C IZ RAWENSTWA P (T > C ) = 1 ; G (C=0) = (SOBSTWENNO GOWORQ, NAM WSE RAWNO, KAKOE C OPREDELQTX, NO NA PRAKTIKE, WNE SOMNENIQ, UDOBNEE IMETX DELO S KRITI^ESKOJ OBLASTX@ T > C ). iTAK, C () = 0 G;1(1 ; ) GDE G;1() { KWANTILX STANDARTNOGO GAMMA-RASPREDELENIQ G(n 1) I KRITERIJ '(X ( ) ) = If n ( )g(X ( )) ZADANNOGO RAZMERA QWLQETSQ NAIBOLEE MO]NYM W KLASSE WSEH KRITERIEW UROWNQ PROWERQ@]IH GIPOTEZU H00 PRI ALXTERNATIWE H10: |TO OZNA^AET, ^TO DLQ L@BOGO DRUGOGO KRITERIQ ' S E '(X ( )) WYPOLNQETSQ NERAWENSTWO E '(X ( ) ) E '(X ( ) ): (2) nO KRITERIJ ' NE ZAWISIT OT WYBORA ALXTERNATIWNOGO ZNA^ENIQ 1 PARAMETRA { KRITI^ESKAQ KONSTANTA C () = 0 G;1(1 ; )! sLEDOWATELXNO, NERAWENSTWO (2) SPRAWEDLIWO PRI L@BYH 1 > 0 I MY PRIHODIM K ZAKL@^ENI@, ^TO KRITERIJ ' ESTX RAWNOMERNO NAIBOLEE MO]NYJ KRITERIJ W KLASSE WSEH KRITERIEW UROWNQ PROWERQ@]IH PROSTU@ GIPOTEZU H00 : = 0 PRI SLOVNOJ ALXTERNATIWE H1 : > 0: dALEE, FUNKCIQ MO]NOSTI KRITERIQ ' KAK KRITERIQ RAZLI^ENIQ ISHODNYH SLOVNYH GIPOTEZ H0 : < 0 I H1 : 0 RAWNA m() = E '(X ( ) ) = P (T > C ()) = 1 ; G (G;1(1 ; )0 =) > 0: |TO { WOZRASTA@]AQ FUNKCIQ PO\TOMU MAKSIMUM WEROQTNOSTI OIBKI PERWOGO RODA (RAZMER KRITERIQ) RAWEN m(0) = 1 ; G G;1(1 ; ) = : tAKIM OBRAZOM, KRITERIJ ' ESTX KRITERIJ RAZMERA PROWERKI GIPOTEZY H0 PRI ALXTERNATIWE H1 OBLADA@]IJ RAWNOMERNO NAIBOLXEJ MO]NOSTX@ W KLASSE WSEH KRITERIEW ', UDOWLETWORQ@]IH n
n
k
n
k
k
k
n
0
n
n
k
n
n
n
n
0
n
n
n
n
n
n
n
T >C
n
0
n
n
1
1
n
n
n
n
n
n
247
n
'(X ( )) = : nO W TAKOM SLU^AE ON BUDET RAWNOMERNO NAIBOLEE MO]NYM I W BOLEE UZKOM KLASSE KRITERIEW UROWNQ TO ESTX KRITERIEW ' UDOWLETWORQ@]IH OGRANI^ENI@ E '(X ( )) PRI L@BOM < 0: bOLEE TOGO, NETRUDNO UBEDITXSQ, ^TO KRITERIJ ' OBLADAET MINIMALXNOJ WEROQTNOSTX@ OIBKI PERWOGO RODA () = m() 0 W KLASSE WSEH KRITERIEW UROWNQ : dLQ \TOGO DOSTATO^NO POMENQTX MESTAMI NULEWU@ GIPOTEZU I ALXTERNATIWU I WYBRATX UROWENX ZNA^IMOSTI, RAWNYJ 1 ; : w \TOM PRIMERE POSTROENIE RAWNOMERNO NAIBOLEE MO]NOGO KRITERIQ STALO WOZMOVNYM BLAGODARQ OSOBOMU SWOJSTWU STATISTI^ESKOJ STRUKTURY POKAZATELXNOGO RASPREDELENIQ: STATISTIKA L(X ( ))
USLOWI@ E
0
n
n
n
OTNOENIQ PRAWDOPODOBIQ ESTX MONOTONNAQ FUNKCIQ STATISTIKI X
T = 1 X : |TO { ^ASTNYJ SLU^AJ STATISTI^ESKIH STRUKTUR, OBLADA@]IH DOSTATO^NOJ STATISTIKOJ T IBO W SILU TEOREMY FAKTORIZACII U TAKIH STRUKTUR L(X ( ) ) = g (T )=g (T ) ZAWISIT OT X ( ) TOLXKO ^EREZ ZNA^ENIQ T (X ( )): dOPOLNITELXNOE SWOJSTWO MONOTONNOSTI OTNOENIQ PRAWDOPODOBIQ OTNOSITELXNO T OBESPE^IWAET SU]ESTWOWANIE I WOZMOVNOSTX KONSTRUKTIWNOGO POSTROENIQ RAWNOMERNO NAIBOLEE MO]NOGO KRITERIQ, PRI^EM KRITI^ESKAQ OBLASTX TAKOGO KRITERIQ X OBQZATELXNO IMEET WID T > C ILI T < C: nAPRIMER, KRITERIJ 1 X > C PRI SOOTWETSTWU@]EM WYBORE C PO ZADANNOMU UROWN@ ZNA^IMOSTI BUDET RAWNOMERNO NAIBOLEE MO]NYM KRITERIEM W KLASSE WSEH KRITERIEW UROWNQ PROWERKI GIPOTEZY < 0 PRI ALXTERNATIWE 0 KOGDA ESTX SREDNEE ZNA^ENIE NORMALXNOGO RASPREDELENIQ (DISPERSIQ PREDPOLAGAETSQ IZWESTNOJ) ILI PARAMETR MASTABA GAMMA-RASPREDELENIQ (PARAMETR FORMY IZWESTEN). nO ESLI { PARAMETR TAKIH RASPREDELENIJ, KAK DWUHTO^E^NOE ILI pUASSONA, TO KRIX TERIJ ' S KRITI^ESKOJ OBLASTX@ 1 X > C OBLADAET RAWNOMERNO NAIBOLXEJ MO]NOSTX@ TOLXKO W KLASSE TEH KRITERIEW, RAZMER KOTORYH NE BOLXE RAZMERA ': dRUGIE KRITERII, KOTORYE MY RASSMATRIWALI W PREDYDU]EM PARAGRAFE, TAKVE OBLADA@T SWOJSTWOM RAWNOMERNOJ NAIBOLXEJ MO]NOSTI, I PRI DOKAZATELXSTWE \TOGO TAKVE ISPOLXZUETSQ LEMMA nEJMANA{ pIRSONA, NO METODIKA DOKAZATELXSTWA SOWERENNO DRUGAQ I TREBUET RAZRABOTKI METODOW POSTROENIQ KRITERIEW, OBLADA@]IH SWOJSTn
n
k
n
1
0
n
n
k
n
k
248
n
WOM INWARIANTNOSTI { NEZAWISIMOSTI OT MEA@]IH PARAMETROW. nO \TO UVE SOWSEM DRUGAQ OBLASTX TEORII PROWERKI GIPOTEZ, POGOWORITX O KOTOROJ U NAS NE HWATAET WREMENI. q LU^E RASSKAVU WAM O NEKOTORYH DOPOLNITELXNYH UHI]RENIQH W PRAKTI^ESKIH PRIMENENIQH STATISTI^ESKIH KRITERIEW, KOTORYE POZWOLQ@T S BOLXEJ STEPENX@ NAGLQDNOSTI OCENITX STEPENX SOGLASIQ PROWERQEMOJ GIPOTEZY S WYBORO^NYMI DANNYMI. wSE RASSMATRIWAEMYE NAMI KRITERII ZADANNOGO UROWNQ OBLADA@T TEM SWOJSTWOM, ^TO IH KRITI^ESKIE OBLASTI MOVNO ZAPISATX W WIDE T (X ( )) > C () GDE T { NEKOTORAQ STATISTIKA, HARAKTERIZU@]AQ RASHOVDENIE WYBORO^NYH DANNYH S PREDPOLAGAEMYMI ZNA^ENIQMI PARAMETRA. uWELI^ENIE UROWNQ ZNA^IMOSTI PRIWODIT K UMENXENI@ C () I MY POLU^AEM SISTEMU WLOVENNYH DRUG W DRUGA KRITI^ESKIH OBLASTEJ. |TO ZAME^ATELXNOE SWOJSTWO NAIH KRITERIEW POZWOLQET NESKOLXKO IZMENITX METODOLOGI@ IH PRAKTI^ESKOGO ISPOLXZOWANIQ. dO SIH POR MY FIKSIROWALI UROWENX ZNA^IMOSTI NAHODILI PO NEMU KRITI^ESKU@ KONSTANTU C () I SRAWNIWALI EE S WYBORO^NYM ZNA^ENIEM t = T (x( )) STATISTIKI T = T (X ( )): pOSTUPIM TEPERX SLEDU@]IM OBRAZOM. pOLU^IW WYBORO^NYE DANNYE x( ) WY^ISLIM ZNA^ENIE t = T (x( )) I RASSMOTRIM KRITERIJ T (X ( )) > t: rAZMER TAKOGO KRI TERIQ KR = P0 T (X ( )) > t NAZYWAETSQ KRITI^ESKIM UROWNEM ZNA^IMOSTI, KOTORYJ TRAKTUETSQ KAK WEROQTNOSTX POLU^ITX STOLX VE BOLXIE RASHOVDENIQ MEVDU WYBORO^NYMI DANNYMI I NULEWOJ GIPOTEZOJ, KAK I DLQ WYBORO^NYH DANNYH x( ): eSTESTWENNO, MY PO-PREVNEMU MOVEM RABOTATX S ZADANNYM UROWNEM ZNA^IMOSTI , OTKLONQQ NULEWU@ GIPOTEZU, ESLI K R < I PRINIMAQ EE W PROTIWNOM SLU^AE. kSTATI, PRINIMAQ GIPOTEZU, NE SLEDUET UTWERVDATX, ^TO ONA WERNA. nA \TOT S^ET SU]ESTWUET BOLEE DELIKATNOE WYRAVENIE: \WYBORO^NYE DANNYE SOGLASU@TSQ S WYDWINUTOJ GIPOTEZOJ," IBO, KAK GOWORIL ODIN IZ SOZDATELEJ MATEMATI^ESKOJ STATISTIKI S\R d.fIER, \GIPOTEZY NE PROWERQ@TQ, A RAZWE LIX OTWERGA@TSQ". tAK WOT, W SWETE \TOGO WYSKAZYWANIQ BOLEE RAZUMNO PROSTO SOOB]ATX POLU^ENNYJ KRITI^ESKIJ UROWENX ZNA^IMOSTI, SOPROWOVDAQ EGO SLEDU@]IM KOMMENTARIEM, KOTORYJ MOVNO S^ITATX MEVDUNARODNYM STATISTI^ESKIM STANDARTOM. eSLI KR 0:01 TO GOWORQT, ^TO RASHOVDENIE MEVDU GIPOTEZOJ I WYBORO^NYMI DANNYMI WYSOKO ZNA^IMO, ESLI 0:01 < K R 0:05 TO PROSTO { ZNA^IMO, ESLI n
n
n
n
n
n
n
:
n
:
:
:
249
VE 0:05 < KR 0:10 { PO^TI ZNA^IMO, I W SLU^AE K R > 0:10 { NE ZNA^IMO. zAMETIM TAKVE, ^TO W NEKOTORYH PRIMENENIQH KRITERIEW ZNA^IMOSTI (OSOBENNO, W MEDICINE) K R NAZYWA@T DOSTOWERNOSTX@. sU]ESTWU@T I DRUGIE, SOWERENNO FANTASTI^ESKIE NAZWANIQ K R KOTORYE Q NE BUDU ZDESX PRIWODITX W SILU IH KRAJNE NEPRILI^NOGO ZWU^ANIQ. pOGOWORIM TEPERX OB OPTIMALXNYH SWOJSTWAH DOWERITELXNYH GRANIC, SOOTWETSTWU@]IH RAWNOMERNO NAIBOLEE MO]NYM KRITERIQM. rASSMOTRIM TOLXKO SLU^AJ WERHNEJ DOWERITELXNOJ GRANICY = (X ( )): :
:
:
:
n
n
n
oPREDELENIE 8.1 wERHNQQ (1 ; )-DOWERITELXNAQ GRANICA
NAZYWAETSQ RAWNOMERNO NAIBOLEE TO^NOJ, ESLI ONA RAWNOMERNO PO WSEM I 0 UDOWLETWORQ@]IM NERAWENSTWU 0 > MINIMIZIRUET WEROQTNOSTX P ( (X ( ) ) 0): tAKIM OBRAZOM, W SLU^AE RAWNOMERNO NAIBOLEE TO^NOJ GRANICY INTERWAL (;1 ] S ZADANNOJ WEROQTNOSTX@ 1 ; NAKRYWAET ISTINNOE ZNA^ENIE PARAMETRA NO ON S MINIMALXNOJ WEROQTNOSTX@ NAKRYWAET L@BYE ZNA^ENIQ LEVA]IE PRAWEE ISTINNOGO. eSLI MY PROWERQEM GIPOTEZU H : = 0 PRI ALXTERNATIWE K (0) : < 0 I OBLASTX PRINQTIQ A(0) RAWNOMERNO NAIBOLEE MO]NOGO KRITERIQ RAZMERA OBLADAET TEM SWOJSTWOM, ^TO PODMNOVESTWO (x( ) ) = f : x( ) 2 A()g PARAMETRI^ESKOGO PROSTRANSTWA R ESTX INTERWAL (;1 : (x( ) ) ] TO (X ( ) ) ESTX RAWNOMERNO NAIBOLEE TO^NAQ WERHNQQ (1 ; )-DOWERITELXNAQ GRANICA. wSE OB_QSNQETSQ DOWOLXNO PROSTO: WEROQTNOSTX P ( (X ( )) 0 ) = P (X ( ) 2 A( 0 )) ESTX WEROQTNOSTX OIBKI WTOROGO RODA U KRITERIQ PROWERKI GIPOTEZY H : = 0 PRI ALXTERNATIWE K ( 0 ) : < 0: rAWNOMERNO NAIBOLEE MO]NYJ KRITERIJ ESTESTWENNO OBLADAET RAWNOMERNO MINIMALXNOJ WEROQTNOSTX@ OIBKI WTOROGO RODA. wSE POSTROENNYE NAMI W x6 DOWERITELXNYE GRANICY OBLADA@T OPTIMALXNYMI SWOJSTWAMI S TO^KI ZRENIQ MALOJ WEROQTNOSTI NAKRYTIQ TEH ZNA^ENIJ PARAMETRA, KOTORYE NE SOOTWETSTWU@T ISTINE. n
n
n
n
n
n
n
n
n
n
n
n
n
n
n
250
x9. pROWERKA MODELXNYH PREDPOLOVENIJ. kRITERII SOGLASIQ
lEKCIQ 14
rASSMOTRENNYE NAMI METODY POSTROENIQ OPTIMALXNYH REA@]IH FUNKCIJ W PROBLEMAH OCENKI PARAMETROW I PROWERKI PARAMETRI^ESKIH GIPOTEZ SU]ESTWENNO OPIRALISX NA TAKIE OSOBYE SWOJSTWA WEROQTNOSTNYH MODELEJ, KAK SU]ESTWOWANIE DOSTATO^NYH STATISTIK, MONOTONNOSTX OTNOENIQ PRAWDOPODOBIQ OTNOSITELXNO NEKOTOROJ STATISTIKI, NEZAWISIMOSTX WYBOROK I PRO^EE. oCENITX VE POSLEDSTWIQ OT ISPOLXZOWANIQ KONKRETNYH REA@]IH FUNKCIJ (NAJTI FUNKCI@ RISKA STATISTI^ESKOGO PRAWILA) WOOB]E NE PREDSTAWLQETSQ WOZMOVNYM BEZ ZNANIQ WEROQTNOSTNOJ MODELI. oTS@DA WOZNIKAET NEOBHODIMOSTX RAZRABOTKI OB]IH METODOW TESTIROWANIQ (PROWERKI) PREDLAGAEMOJ WEROQTNOSTNOJ MODELI P = fP 2 g PO DANNYM SLU^AJNOJ WYBORKI, ILI NESKOLXKIH WYBOROK, KOTORYE PREDPOLOVITELXNO IZWLEKA@TSQ IZ NEKOTORYH RASPREDELENIJ SEMEJSTWA P: zNA^IMYE RASHOVDENIQ MEVDU MODELXNYMI I \MPIRI^ESKIMI RASPREDELENIQMI WYNUVDA@T STATISTIKA PERESMOTRETX POSYLKI, POLOVENNYE W OSNOWU POSTROENIQ WEROQTNOSTNOJ MODELI, I TEM SAMYM IZBEVATX BOLXIH POTERX OT ISPOLXZOWANIQ ZAWEDOMO PLOHIH REA@]IH PRAWIL (TO^NEE PRAWIL, KOTORYE OPTIMALXNY NE DLQ TOJ MODELI). pONQTNO, ^TO RE^X IDET O PROWERKE STATISTI^ESKIH GIPOTEZ BEZ OSOBOJ SPECIFIKACII ALXTERNATIW K NULEWOJ GIPOTEZE. sTATISTI^ESKIE PRAWILA PROWERKI MODELXNYH PREDPOLOVENIJ OBY^NO NAZYWA@TSQ KRITERIQMI SOGLASIQ, I W MATEMATI^ESKOJ STATISTIKE SLOVILSQ NEKOTORYJ TRADICIONNYJ NABOR TAKIH KRITERIEW, OBLADA@]IH BOLXOJ UNIWERSALXNOSTX@. |TO KRITERII, S POMO]X@ KOTORYH MOVNO PROWERQTX NE TOLXKO PRINADLEVNOSTX RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY K OPREDELENNOMU SEMEJSTWU, NO I TESTIROWATX NEKOTORYE BOLEE \GRUBYE" ^ERTY MODELI, KAK TO NEZAWISIMOSTX KOMPONENT NABL@DAEMOGO SLU^AJNOGO WEKTORA (WEKTORNOJ SLU^AJNOJ WELI^INY), WOZMOVNOSTX OB_EDINENIQ NESKOLXKIH WYBOROK W ODNU (PROWERKA GIPOTEZY ODNORODNOSTI WYBOROK) I MNOVESTWO DRUGIH PREDPOLOVENIJ, KASA@]IHSQ STRUKTURY WYBORO^NYH DANNYH. mY POZNAKOMIMSQ W \TOM PARAGRAFE S NABOROM UNIWERSALXNYH STATISTI^ESKIH PROCEDUR, OB_EDINQEMYH OB]IM NAZWANIEM KRITERII HI-KWADRAT. oB ODNOM IZ NIH 251
MY UVE UPOMINALI W x2 W SWQZI S POSTROENIEM GISTOGRAMMY WYBORKI \TO { 10: kRITERIJ SOGLASIQ HI-KWADRAT. rEAETSQ STATISTI^ESKAQ PROBLEMA PROWERKI GIPOTEZY O WIDE RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY X (WOZMOVNO, WEKTORNOJ). nA^NEM S PROSTEJEGO SLU^AQ, KOGDA POSTROENIE WEROQTNOSTNOJ MODELI PRIWELO K POLNOJ SPECIFIKACII RASPREDELENIQ, TO ESTX PROBLEMA SOSTOIT W PROWERKE PROSTOJ GIPOTEZY H : RASPREDELENIE X NA IZMERIMOM PROSTRANSTWE (X A) EE ZNA^ENIJ ESTX P (A) A 2 A: pOSTROENIE KRITERIQ SOGLASIQ WYBORO^NYH DANNYH c RASPREDELENIEM P NA^INAETSQ Xr S RAZBIENIQ PROSTRANSTWA X NA r 2 ^ASTEJ A1 : : : Ar X = 1 Ai . rEKOMENDACII PO WYBORU ^ISLA r I SPOSOBU RAZBIENIQ NOSQT DOWOLXNO RASPLYW^ATYJ HARAKTER, I ESLI NE UTO^NQTX WOZMOVNYE ALXTERNATIWY K P TO, KAK WY SAMI PONIMAETE, TAKIH REKOMENDACIJ NE MOVET BYTX W PRINCIPE. gLAWNOE, RAZBIENIE NE DOLVNO OPREDELQTXSQ WYBORO^NYMI ZNA^ENIQMI, NADO STREMITSQ K OBLASTQM ODINAKOWOJ KONFIGURACII I RAZMERA, NE SLEDUET DELATX SLIKOM PODROBNOE RAZBIENIE. nAPRIMER, ESLI X = R (NABL@DAETSQ DEJSTWITELXNAQ SLU^AJNAQ WELI^INA), TO PRQMAQ R RAZBIWAETSQ NA r INTERWALOW WIDA (;1 a] (a a + ] (a + a + 2] : : : (a + (r ; 3) a + (r ; 2)] (a + (r ; 2) +1) TAK ^TO DLINA WNUTRENNIH INTERWALOW POSTOQNNA I RAWNA : kONE^NO WYBOR r ZAWISIT OT OB_EMA WYBORKI n NO DAVE PRI ISKL@^ITELXNO BOLXIH n NE DELAETSQ BOLEE 15-20 RAZBIENIJ \TOGO WPOLNE DOSTATO^NO, ^TOBY W GISTOGRAMME OTRAZITX WS@ SPECIFIKU FORMY TESTIRUEMOGO RASPREDELENIQ. pOSLE RAZBIENIQ X PROWODITSQ SORTIROWKA WYBORO^NYH DANNYH Xr PO OBLASTQM RAZBIENIJ I PODS^ITYWA@TSQ KOLI^ESTWA 1 : : : r 1 i = n DANNYH, POPAWIH W SOOTWETSTWU@]IE OBLASTI A1 : : : Ar : wY^ISLQ@TSQ \TEORETI^ESKIE" WEROQTNOSTI pi = P (Ai) i = 1 : : : r POPADANIQ WYBORO^NYH DANNYH W \TI OBLASTI I WY^ISLQETSQ ZNA^ENIE x2 TESTOWOJ STATISTIKI r ( ; np )2 X i i 2 X = npi : i=1 gIPOTEZA H OTWERGAETSQ, ESLI x2 > C GDE KRITI^ESKAQ KONSTANTA C WYBIRAETSQ PO ZADANNOMU UROWN@ ZNA^IMOSTI KAK NAIMENXEE ^ISLO, UDOWLETWORQ@]EE NERAWENSTWU P (X 2 > C ) : eSTES252
TWENNO, NA PRAKTIKE ISPOLXZU@T KRITI^ESKIJ UROWENX ZNA^IMOSTI KR: = P (X 2 > x2) SOPROWOVDAQ EGO KOMMENTARIQMI TIPA TEH, KOTORYE BYLI PRIWEDENY W PREDYDU]EM PARAGRAFE POSLE WWEDENIQ PONQTIQ KRITI^ESKOGO UROWNQ ZNA^IMOSTI. oDNAKO TO^NOE RASPREDELENIE STATISTIKI X 2 NAJTI W QWNOM WIDE NE PREDSTAWLQETSQ WOZMOVNYM PREDELXNOE RASPREDELENIE X 2 PRI n ! 1 USTANOWIL k.pIRSON W SAMOM NA^ALE hh WEKA. tEOREMA 9.1. eSLI ^ISLO RAZBIENIJ r 2 FIKSIROWANO, A OB_EM WYBORKI n ! 1 TO RASPREDELENIE X 2 SHODITSQ K RASPREDELENI@ HIKWADRAT S r ; 1 STEPENX@ SWOBODY. d O K A Z A T E L X S T W O. o^EWIDNO, DLQ WYWODA PREDELXNOGO RASPREDELENIQ X 2 SLEDUET W PERWU@ O^EREDX OBRATITXSQ K SOWMESTNOMU RASXn PREDELENI@ ^ASTOT 1 : : : r 1 i = n: |TO MULXTINOMIALXNOE RASPREDELENIE M(r n p) (SM. x9 KURSA tw) S FUNKCIEJ PLOTNOSTI f (x1 : : : xr ) = P (1 = x1 : : : r = xr ) = x ! n! x ! p1x prx 1 r Xn SOSREDOTO^ENNOE NA CELO^ISLENNOJ REETKE 1 xi = n: tEOREMA 9.1 IZ KURSA tw UTWERVDAET, ^TO SOWMESTNOE RASPREDELENIE PERWYH r ; 1 ^ASTOT 1 : : : r;1 APPROKSIMIRUETSQ r ; 1-MERNYM NORMALXNYM RASPREDELENIEM. eSTESTWENNO, PREDELXNOE RASPREDELENIE WSEGO WEKTORA ^ASTOT 1 : : : r PRI SOOTWETSTWU@]EJ NORMIROWKE NA IH SREDNIE Xn ZNA^ENIQ I STANDARTNYE OTKLONENIQ BUDET WYROVDENNYM, IBO 1 i = n: wYROVDENNYE RASPREDELENIQ LU^E WSEGO ISSLEDOWATX S POMO]X@ HARAKTERISTI^ESKIH FUNKCIJ, IBO TAKIE RASPREDELENIQ MOVNO ZAPISATX W QWNOM WIDE, TOLXKO PEREHODQ K SISTEME KOORDINAT NA TOJ GIPERPOWERHNOSTI, GDE SOSREDOTO^ENO TAKOE RASPREDELENIE, I \TO ^REZWY^AJNO USLOVNQET TEHNIKU ASIMPTOTI^ESKOGO ANALIZA RASPREDELENIJ. iTAK, NAJDEM SOWMESTNU@ HARAKTERISTI^ESKU@ FUNKCI@ 1 : : : r : wSPOMNIM SHEMU MULXTINOMIALXNYH ISPYTANIJ. mY NABL@DAEM WYBORKU Y1 : : : Yn, KAVDYJ \LEMENT KOTOROJ ESTX NEZAWISIMAQ KOPIQ (W SMYSLE ODINAKOWOSTI RASPREDELENIQ) SLU^AJNOGO WEKTORA Y = (X1 : : : Xr ): wSE KOMPONENTY WEKTORA Y , ZA ISKL@^ENIEM ODNOJ (SKAVEM, Xj ), MOGUT PRINIMATX TOLXKO NULEWYE ZNA^ENIQ, W TO WREMQ KAK Xj = 1: tAKIM OBRAZOM, Yi = (X1i : : : Xri) I Xji { KOPIQ Xj j = 1
253
r
1 : : : r i = 1 : : : n: w TAKIH OBOZNA^ENIQH
j =
n X
i=1
Xji j = 1 : : : r:
eSLI MY NAJDEM HARAKTERISTI^ESKU@ FUNKCI@ ' Y (t) t = (t1 : : : tr ) NABL@DAEMOGO WEKTORA Y TO HARAKTERISTI^ESKAQ FUNKCIQ ' (t) WEKTORA ^ASTOT = (1 : : : r ) BUDET WY^ISLQTXSQ PO FORMULE ' (t) = 'nY (t) IBO HARAKTERISTI^ESKAQ FUNKCIQ SUMMY NEZAWISIMYH SLU^AJNYH WELI^IN RAWNA PROIZWEDENI@ HARAKTERISTI^ESKIH FUNKCIJ SLAGAEMYH (PUNKT 30 TEOREMY 12.1 KURSA Xr tw). nO HARAKTERISTI^ESKAQ FUNKCIQ WEKTORA Y (NAPOMNIM, 1 Xj = 1) 8 r 9 r < X = ' Y (t) = E exp :i tj Xj = X pj e t 1 1 i j
I PO\TOMU
0r 1n X ' (t) = @ pj e t A : i j
1
tEPERX PRISTUPIM K ASIMPTOTI^ESKOMU ANALIZU HARAKTERISTI^ESKOJ FUNKCII WEKTORA X NORMIROWANNYH ^ASTOT Xj = jp;npnpj j = 1 : : : r j SUMMA KWADRATOW KOMPONENT KOTOROGO SOSTAWLQET TESTOWU@ STATISTIKU X 2 (IZWINITE, ^TO ISPOLXZU@ BUKWU X W NOWOM SMYSLE, NO NE HO^ETSQ WWODITX DLQ OBOZNA^ENIQ SLU^AJNYH WELI^IN NOWYE SIMWOLY). hARAKTERISTI^ESKAQ FUNKCIQ SLU^AJNOGO WEKTORA, KOMPONENTY KOTOROGO PODWERGNUTY LINEJNOMU PREOBRAZOWANI@, WY^ISLQETSQ PO FORMULE, ANALOGI^NOJ PUNKTU 20 TEOREMY 12.1: 8 r 9 r 8 9 < X p = 0X < i tj =1n 'X (t) = exp :;i tj npj @ pj exp : pnp A : j 1 1 rAZLOVIM LOGARIFM \TOJ FUNKCII W RQD mAKLORENA PO STEPENQM t1 : : : tr KAK \TO DELALOSX PRI DOKAZATELXSTWE CENTRALXNOJ PREDELXNOJ TEOREMY: r p X ln 'X (t) = ;i n tj ppj + 1 3 2 r r X X i 1 p 2 ; 3 = 2 tj + O(n ) 5 = n ln 4 1 + p tj pj ;
n
1
2n
254
1
0
1
2 r r X X 1 1 p 2 = ; 2 tj + 2 @ tj pj A + O(n;1=2): 1 1 tAKIM OBRAZOM, HARAKTERISTI^ESKAQ FUNKCIQ PREDELXNOGO RASPRE-
DELENIQ WEKTORA X NORMIROWANNYH ^ASTOT ESTX
8 2 0r 12 3 9 > > r < 1 6X = X p 7 2 @ A 4 5 lim ' ( t ) = exp ; t ; t p X j j > > n!1 : 2 1 j : 1
|TO { HARAKTERISTI^ESKAQ FUNKCIQ r-MERNOGO NORMALXNOGO RASPREDELENIQ S NULEWYMI SREDNIMI I MATRICEJ KOWARIACIJ = I ; pp0 GDE p p I { EDINI^NAQ MATRICA, A p = ( p1 : : : pr ) { WEKTOR STOLBEC. rASSMOTRIM KWADRATI^NU@ FORMU Q(t) =
r X
1
0r 12 X p tj ; @ tj pj A 2
1
KO\FFICIENTY KOTOROJ OPREDELQ@T KOWARIACII KOMPONENT WEKTORA Z = (Z1 : : : Zr ) RASPREDELENNOGO PO NORMALXNOMU ZAKONU. eSLI PROIZWESTI ORTOGONALXNOE PREOBRAZOWANIE A WEKTORA t POLAGAQ u = At I FIKSIRUQ POSLEDN@@ STROKU MATRICY A TAKIM , ^TOBY W XrOBRAZOM p NOWOM WEKTORE u = (u1 : : : ur ) KOMPONENTA ur = 1 tj pj TO MY POLU^IM KWADRATI^NU@ FORMU (WSPOMNITE ANALOGI^NYE ORTOGONALXNYE PREOBRAZOWANIQ NORMALXNOGO WEKTORA PRI WYWODE RASPREDELENIQ WYBORO^NOJ DISPERSII W LEMME fIERA) Q(t) =
r X
1
12 r 0r r;1 X p t2j ; @ tj pj A = X u2j ; u2r = X u2j : 1
1
1
tAKIM OBRAZOM, SU]ESTWUET ORTOGONALXNOE PREOBRAZOWANIE Y = BZ WEKTORA Z POSLE KOTOROGO Y1 : : : Yr;1 NEZAWISIMY I ODINAKOWO NORMALXNO RASPREDELENY SO SREDNIMI, RAWNYMI NUL@, I EDINI^NYMI DISPERSIQMI, A Yr IMEET NULEWOE SREDNEE I NULEWU@ DISPERSI@, TO ESTX Yr = 0 PO^TI NAWERNOE. wSE \TO, KONE^NO, SLEDSTWIE WYROVDENNOSTI NORMALXNOGO WEKTORA Z { ONO SOSREDOTO^ENO NA Xr RASPREDELENIQ p GIPERPLOSKOSTI 1 Zj pj = 0: TEPERX K PREDELXNOMU RASPREDELENI@ STATISTIKI X 2 = XroBRATIMSQ 2 1 Xj : pOSKOLXKU PREDELXNOE RASPREDELENIE WEKTORA X SOWPADAET S RASPREDELENIEM WEKTORA Z TO PREDELXNOE RASPREDELENIE X STATISTIKI 2 X OPREDELQETSQ RASPREDELENIEM KWADRATI^NOJ FORMY r1 Zj2: kAK 255
IZWESTNO, ORTOGONALXNYE Xr 2 XrPREOBRAZOWANIQ Xr;1 2 NE MENQ@T SUMMY KWADRA2 TOW, PO\TOMU 1 Zj = 1 Yj = 1 Yj : sLEDOWATELXNO, PREDELXNOE RASPREDELENIE STATISTIKI X 2 ESTX RASPREDELENIE SUMMY KWADRATOW r ; 1 NEZAWISIMYH SLU^AJNYH WELI^IN, IME@]IH OB]EE STANDARTNOE NORMALXNOE RASPREDELENIE. pO OPREDELENI@ \TO { HI-KWADRAT RASPREDELENIE S r ; 1 STEPENQMI SWOBODY. tEOREMA pIRSONA DOKAZANA. lEKCIQ 15
rASSMOTRIM TEPERX BOLEE SLOVNU@ STATISTI^ESKU@ PROBLEMU, W KOTOROJ PROWERQETSQ GIPOTEZA O PRINADLEVNOSTI RASPREDELENIQ P NABL@DAEMOJ SLU^AJNOJ WELI^INY NEKOTOROMU PARAMETRI^ESKOMU SEMEJSTWU P = fP 2 Rsg INDEKSIROWANNOMU s-MERNYM PARAMETROM = (1 : : : s): w TAKOM SLU^AE 2 r X 2() = X (i ;npnp(i())) i i=1 NE MOVET NAZYWATXSQ STATISTIKOJ I EE NELXZQ ISPOLXZOWATX DLQ PROWERKI SLOVNOJ GIPOTEZY H : P 2 P: eSTESTWENNO WOSPOLXZOWATXSQ KAKOJ-LIBO OCENKOJ ^n = ^n(X (n) ) PARAMETRA I RASSMOTRETX TESTOWU@ STATISTIKU r ( ; np ( ^ 2 X i i n )) 2 2 ^ ^ X = X (n) = : npi(^n) i=1 pONQTNO, ^TO RASPREDELENIE STATISTIKI X^ 2 MOVET ZAWISETX OT METODA OCENKI PARAMETRA : oDNAKO, ESLI OPREDELITX OCENKU ^n IZ USLOWIQ MINIMUMA SLU^AJNOJ FUNKCII X 2() TO, KAK POKAZAL fIER, PRI OPREDELENNYH USLOWIQH REGULQRNOSTI, KOTORYM UDOWLETWORQ@T WSE RASSMOTRENNYE NAMI W KURSE tw WEROQTNOSTNYE MODELI, PREDELX^ 2 ESTX HI-KWADRAT RASPREDELENIE NOE RASPREDELENIE STATISTIKI X S r ; s ; 1 STEPENQMI SWOBODY. eSLI VE ^n { OCENKA PO METODU MAKSIMALXNOGO PRAWDOPODOBIQ, TO PREDELXNOE RASPREDELENIE X^ 2 TAKVE PRI USLOWIQH REGULQRNOSTI TIPA TEH, ^TO OBESPE^IWALI ASIMPTOTI^ESKU@ NORMALXNOSTX ^n IMEET FUNKCI@ RASPREDELENIQ K (x) DLQ KOTOROJ SPRAWEDLIWA DWUSTORONNQQ OCENKA Kr;1(x) K (x) Kr;s;1(x) 256
PRI L@BOM x > 0: dOKAZATELXSTWO \TIH UTWERVDENIJ DOSTATO^NO GROMOZDKO I MY NE BUDEM IM ZANIMATXSQ IZ-ZA NEDOSTATKA WREMENI. iDEJNAQ STORONA PROBLEMY NAM QSNA, I KOLX SKORO NAM SOOB]ILI RASPREDELENIE TESTOWOJ STATISTIKI, TO MY MOVEM ISPOLXZOWATX EGO DLQ RAS^ETA KRITI^ESKOGO UROWNQ ZNA^IMOSTI. w SLU^AE OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ, KOGDA MY RASPOLAGAEM DWUSTORONNEJ OCENKOJ K R: REKOMENDUETSQ PRI OTKLONENII GIPOTEZY ORIENTIROWATXSQ NA KR: = 1 ; Kr;1(x2) > 1 ; Kr;s;1(x2) A W SLU^AE EE PRINQTIQ { NA K R: = 1 ; Kr;s;1(x2) < 1 ; Kr;1(x2) ^TOBY UMENXITX RISK OT PRINQTIQ NEPRAWILXNOGO REENIQ. kRITERIJ HI-KWADRAT QWLQETSQ NAIBOLEE UNIWERSALXNYM STATISTI^ESKIM METODOM TESTIROWANIQ WEROQTNOSTNOJ MODELI, POSKOLXKU PREDELXNOE RASPREDELENIE STATISTIKI NE ZAWISIT OT RASPREDELENIQ NABL@DAEMOJ SLU^AJNOJ WELI^INY DAVE W TOM SLU^AE, KOGDA \TO RASPREDELENIE ZAWISIT OTpPARAMETROW p , ZNA^ENIE KOTORYH NEIZWESTNO. kRITERIJ kOLMOGOROWA nDn = n sup x j Fn(x);F (x) j > C O KOTOROM GOWORILOSX W NA^ALE x2, MOVNO ISPOLXZOWATX TOLXKO DLQ PROWERKI PROSTOJ GIPOTEZY F () = F 0 () O WIDE FUNKCII RASPREDELENIQ . eSLI F 0 (x j ) p ZAWISIT OT PARAMETRA I W STATISTIKU nDn WMESTO F (x) PODSTAWLQETSQ F 0 x j ^n(X (n))p TO RASPREDELENIE MODIFICIROWANNOJ TAKIM OBRAZOM STATISTIKI nDn ZAWISIT KAK OT WIDA FUNKCII F 0 TAK I OT PARAMETRA : sU]ESTWUET, PRAWDA, NESKOLXKO SLU^AEW OSOBOJ SWQZI MEVDU x I W ZAPISI FUNKCII F 0 PRI NALI^II KOTOROJ RASPREDELENIE TESTOWOJ STATISTIKI NE ZAWISIT OT : |TO, NAPRIMER, TAKIE FUNKCII RASPREDELENIQ S PARAMETRAMI MASTABA I SDWIGA, KAK NORMALXNOE I POKAZATELXNOE. dLQ TESTIROWANIQ TAKIH RASPREDELENIJ SOSTAWLQ@TSQ SPECIALXNYE TABLICY KRITI^ESKIH KONSTANT I KRITI^ESKIH UROWNEJ ZNA^IMOSTI. sLEDUET ZAMETITX, ^TO PRQMOE ISPOLXZOWANIE KRITERIQ kOLMOGOROWA S OCENKAMI NEIZWESTNYH ZNA^ENIJ PARAMETROW QWLQETSQ NAIBOLEE RASPROSTRANENNOJ OIBKOJ W PRAKTI^ESKIH PRILOVENIQH METODOW TESTIROWANIQ WEROQTNOSTNYH MODELEJ. oBRATIMSQ TEPERX K PROWERKE GIPOTEZ, KASA@]IHSQ NE STOLXKO WIDA RASPREDELENIQ NABL@DAEMYH SLU^AJNYH WELI^IN, SKOLXKO IH OSOBYH SWOJSTW, NALI^IE KOTORYH POZWOLQET ZNA^ITELXNO UPROSTITX WEROQTNOSTNU@ MODELX I DOBITXSQ EE BOLEE ^ETKOJ SPECIFIKACII. 257
20: kRITERIJ NEZAWISIMOSTI HI-KWADRAT (TABLICY SOPRQVENNOSTI PRIZNAKOW). sLEDU@]AQ ZADA^A WYQWLENIQ ZAWISIMOS-
TI MEVDU OPREDELENNYMI PRIZNAKAMI NABL@DAEMYH OB_EKTOW ^ASTO WOZNIKAET W PRAKTI^ESKIH PRILOVENIQH MATEMATI^ESKOJ STATISTIKI. pREDPOLOVIM, ^TO MY SLU^AJNO WYBRALI n OSOBEJ IZ NEKOTOROJ \TNI^ESKOJ POPULQCII, I HOTIM WYQSNITX, SU]ESTWUET LI ZAWISIMOSTX MEVDU CWETOM WOLOS I CWETOM GLAZ. mY RAZLI^AEM s 2 UROWNEJ PERWOGO PRIZNAKA (NAPRIMER, BLONDIN, BR@NET, ATEN I RYVIJ) I r 2 UROWNEJ WTOROGO (NAPRIMER, KARIE, SERYE, GOLUBYE I ZELENYE). wSE n OSOBEJ RAZBIWA@TSQ NA sr GRUPP W SOOTWETSTWII S NALI^IEM TEH ILI INYH UROWNEJ KAVDOGO PRIZNAKA, I SOSTAWLQETSQ SLEDU@]AQ TABLICA ^ASTOT OSOBEJ W KAVDOJ GRUPPE. p RIZNAK I
1 2 ..
r
s UMMA
1
2 11 12 21 22 .. .. .. r1 r2 1 2
tAKIE TABLICY, W KOTORYH SUMMY i = X ij s
s 1s 2s
s UMMA
rs s
r n
1 2
..
..
j = X ij r
j =1
i=1
NAZYWA@TSQ TABLICAMI SOPRQVENNOSTI PRIZNAKOW. tREBUETSQ PROWERITX NULEWU@ GIPOTEZU O TOM, ^TO PEREMENNYE PRIZNAKI, PO KOTORYM POSTROENA TABLICA, NEZAWISIMY. pOSTROIM WEROQTNOSTNU@ MODELX, SOOTWETSTWU@]U@ TAKOGO RODA TABLI^NYM DANNYM I SOSTAWIM STATISTIKU X 2 DLQ PROWERKI GIPOTEZY NEZAWISIMOSTI. pUSTX p ij { WEROQTNOSTX TOGO, ^TO SLU^AJNO OTOBRANNAQ OSOBX IMEET i-YJ UROWENX PO PERWOMU PRIZNAKU I j -YJ { PO WTOROMU, i = 1 : : : r j = 1 : : : s: gIPOTEZA NEZAWISIMOSTI OZNA^AET, ^TO p ij = p i p j GDE s r p i = X p ij p j = X p ij j =1
i=1
258
PRI L@BYH i = 1 : : : r I j = 1 : : : s: dLQ PROWERKI GIPOTEZY NEZAWISIMOSTI PREDLAGAETSQ ISPOLXZOWATX TESTOWU@ STATISTIKU X ( ij ; n p i p j )2 2 X = (1) n pi pj ij W KOTOROJ SUMMIROWANIE RASPROSTRANQETSQ NA WSE rs GRUPP TABLICY SOPRQVENNOSTI PRIZNAKOW. pONQTNO, ^TO X 2 QWLQETSQ TESTOWOJ STATISTIKOJ TOLXKO W SLU^AE IZWESTNYH ZNA^ENIJP r + s ;P2 PARAMETROW p i I p j i = 1 : : : r j = 1 : : : s (NAPOMNIM, r1 p i = s1 p j = 1 TAK ^TO S POMO]X@ \TIH SOOTNOENIJ DWA IZ r + s PARAMETROW, NAPRIMER, p r I p s MOVNO WYRAZITX ^EREZ OSTALXNYE r + s ; 2 PARAMETROW). w \TOM SLU^AE X 2 IMEET W PREDELE (n ! 1) HI-KWADRAT RASPREDELENIE S rs ; 1 STEPENQMI SWOBODY. kONE^NO, WSQ PROBLEMA SOSTOIT W TOM, ^TO \TI PARAMETRY NEIZWESTNY. oKAZYWAETSQ, OCENKI MAKSIMALXNOGO PRAWDOPODOBIQ p^i = ni p^ j = n j i = 1 : : : r j = 1 : : : s \TIH PARAMETROW ASIMPTOTI^ESKI \KWIWALENTNY OCENKAM PO METODU MINIMUMA STATISTIKI X 2 I PO\TOMU PODSTANOWKA W PRAWU@ ^ASTX (1) \TIH OCENOK PRIWODIT K STATISTIKE 0 1 2 2 X X ( ; =n ) ij i j ij @ X^ 2 = n = n ; 1A i j i j ij ij PREDELXNOE RASPREDELENIE KOTOROJ ESTX HI-KWADRAT S rs ; (r + s ; 2) ; 1 = (r ; 1)(s ; 1) STEPENQMI SWOBODY. eSTESTWENNO, STATISTIKU X^ 2 MOVNO ISPOLXZOWATX DLQ PROWERKI NEZAWISIMOSTI KOMPONENT DWUMERNOGO WEKTORA (X Y ), I PRI \TOM TABLICA SOPRQVENNOSTI PREDSTAWLQET ^ASTOTNYE DANNYE DLQ POSTROENIQ GISTOGRAMMY DWUMERNOJ WYBORKI (X1 Y1) : : : (Xn Yn): sOOTWETSTWU@]IM OBRAZOM NORMIROWANNAQ STATISTIKA X 2 MOVET SLUVITX MEROJ ZAWISIMOSTI PRIZNAKOW (ILI KOMPONENT X I Y SLU^AJNOGO WEKTORA). 30: kRITERIJ ODNORODNOSTI HI-KWADRAT. aNALIZIRU@TSQ DANNYE s 2 NEZAWISIMYH MULXTINOMIALXNYH SHEM ISPYTANIJ S ODINAKOWYM ^ISLOM r 2 WOZMOVNYH ISHODOW I SOOTWETSTWU@]IMI OB_EMAMI n1 : : : ns NABL@DENIJ W KAVDOJ SHEME. pROWERQETSQ GIPOTEZA 259
WSE SHEMY ISPYTANIJ IME@T ODINAKOWYJ WEKTOR WEXr ROQTNOSTEJ p = (p1 : : : pr ) 1 pi = 1 POQWLENIQ SOOTWETSTWU@]IH ISHODOW, PRI^EM ZNA^ENIQ KOMPONENT WEKTORA p NE IZWESTNY. oBOZNA^AQ ij ^ASTOTU POQWLENIQ i-GO ISHODA W j -OM ISPYTANII, PREDSTAWIM DANNYE NABL@DENIJ W WIDE TABLICY, ANALOGI^NOJ TABLICE SOPRQVENNOSTI PRIZNAKOW ODNORODNOSTI:
ISH : n SH EM :
1 2 ..
r
s UMMA
1
11 21 ..
r1 n1
2 12 22 .. .. r2 n2
s 1s 2s
s UMMA
rs ns
r n
..
1 2 ..
sOSTAWIM SNA^ALA STATISTIKU HI-KWADRAT DLQ SLU^AQ IZWESTNOGO WEKTORA WEROQTNOSTEJ p: s X r ( ; n p )2 X ij j i 2 X = nj pi : j =1 i=1 wNUTRENNQQ SUMMA 2 r Xj2 = X ( ij n; npj p i) j i i=1 PREDSTAWLQET STATISTIKU HI-KWADRAT DLQ j -OJ SHEMY MULXTINOMIALXNYH ISPYTANIJ, I PO\TOMU IMEET W PREDELE (nj ! 1) HI-KWADRAT RASPREDELENIE S r ; 1 STEPENQMI SWOBODY. sTATISTIKA X 2 ESTX SUMMA s NEZAWISIMYH STATISTIK, KAVDAQ IZ KOTORYH IMEET PREDELXNOE HI-KWADRAT RASPREDELENIE, TAK ^TO, W SILU TEOREMY SLOVENIQ, PREDELXNOE RASPREDELENIE X 2 ESTX HI-KWADRAT RASPREDELENIE S (r ; 1)s STEPENQMI SWOBODY. w SLU^AE NEIZWESTNYH ZNA^ENIJ WEROQTNOSTEJ ISHODOW, KOTORYE PRI SPRAWEDLIWOSTI NULEWOJ GIPOTEZY ODINAKOWY DLQ WSEH SHEM ISPYTANIJ, ISPOLXZUEM IH OCENKI p^i = i =n i = 1 : : : r (WSEGO OCENIWAETSQ r ; 1 PARAMETR). pODSTANOWKA \TIH OCENOK W X 2 DAET STATISTIKU 0 1 2 2 X X ( ; n =n ) ij j i ij @ X^ 2 = n = n ; 1A n n j i j i ij ij 260
PREDELXNOE RASPREDELENIE KOTOROJ ESTX HI-KWADRAT S (r ;1)s;(r ;1) = (r ; 1)(s ; 1) STEPENQMI SWOBODY. zAME^ATELEN TOT FAKT, ^TO MY POLU^ILI TESTOWU@ STATISTIKU TAKOGO VE WIDA I S TEM VE PREDELXNYM RASPREDELENIEM, ^TO I PRI PROWERKE GIPOTEZY NEZAWISIMOSTI PRIZNAKOW. eSTESTWENNO, POSTROENNYJ KRITERIJ MOVNO ISPOLXZOWATX DLQ PROWERKI GIPOTEZY ODNORODNOSTI RASPREDELENIJ, IZ KOTORYH IZWLEKA@TSQ s 2 WYBOROK. wYBORO^NYE DANNYE PRI \TOM PODWERGA@TSQ GRUPPIROWKE W SOOTWETSTWII S ODINAKOWYM DLQ WSEH WYBOROK RAZBIENIEM PROSTRANSTWA X NA r 2 OBLASTEJ.
261