Камчатский государственный технический университет Кафедра высшей математики
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Обработка стати...
24 downloads
196 Views
580KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Камчатский государственный технический университет Кафедра высшей математики
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Обработка статистических данных Корреляционная зависимость Задания и методические указания для студентов дневного и заочного отделений
Петропавловск-Камчатский 2004
Батуев Э.Н., Сидорова А.С. Б 28
Математическая статистика. Обработка статистических данных. Корреляционная зависимость. Задания и методические указания для студентов дневного и заочного отделений. – Петропавловск-Камчатский: КамчатГТУ, 2004. – 26 с. Задания по математической статистики предназначены для студентов дневного и заочного отделений КамчатГТУ. Задания соответствуют базовым стандартам специальностей и программе, утвержденной Министерством образования Российской Федерации. Рекомендовано к изданию решением ученого совета КамчатГТУ (протокол № 8 от 23,04,2004 г.).
©КамчатГТУ, 2004 ©Батуев Э.Н., Сидорова А.С., 2004
2
Введение Построение и анализ выборочного распределения является основным математическим способом исследования реальной случайной величины. Рассматривается двумерная случайная величина (Х, У), имеется выборка объема n (xi, yi), i = 1, 2, ..., n. Работа состоит из двух частей: 1. Анализируем компоненты нашего случайного вектора. Для каждой компоненты строится выборочное распределение, определяются его числовые характеристики, которые служат точечными оценками для числовых характеристик Х и У. Проводится интервальное оценивание параметров, оценивается вид закона распределения Х и У. 2. Анализируется совместное распределение Х и У. Проверяется гипотеза о коррелированности компонент. Строятся уравнения линейной регрессии. Варианты выдаются преподавателем индивидуально, в противном случае студент выбирает вариант, номер которого совпадает с последней цифрой зачетной книжки.
3
Часть I Задание По результатам наблюдений над случайной величиной Х и У требуется для каждой величины: 1) Построить интервальный и дискретный вариационный ряд, полигон или гистограмму в зависимости от того, дискретна или непрерывна изучаемая случайная величина. Найти эмпирическую функцию распределения и построить ее график. 2) Найти точечные оценки параметров закона распределения случайной величины. 3) С помощью выборочных коэффициентов ассиметрии и эксцесса определить, имеется ли основание для выдвижения гипотезы о нормальности распределения. Выбрать гипотетический закон распределения. Используя точечные оценки параметров, записать плотность и функцию распределения. 4) В случае нормальности распределения построить доверительные интервалы с надежностью γ. 4.1 для математического ожидания, считая, что σ = S 2 ; 4.2 для математического ожидания, считая дисперсию неизвестной; 4.3 для среднего квадратического отклонения. 5) Проверить с помощью критерия согласия χ2 гипотезу о виде закона распределения при уровне значимости β. 6) Построить график функции плотности и сравнить его с гистограммой, в случае дискретной случайной величины сравнить многоугольник распределения с полигоном.
4
Указания 1) Пусть х1, х2, ..., хn – совокупность значений случайной величины Х, полученных в результате n независимых повторений некоторого эксперимента. Эта совокупность называется выборкой объема n из генеральной совокупности Х. Элементы выборки, расположенные в порядке возрастания, образуют вариационный ряд. Пусть l – число различных выборочных значений в данной выборке. Далее через х1, х2, ..., хn обозначаем только различные выборочные l m значения, mi – число элементов выборки, равных хi, mi = n , i – n i =1 относительная частота появления хi. Таким образом, мы получаем дискретную случайную величину (выборочное распределение)
∑
Х
mi n
х1
х2
m1 n
...
m2 n l
∑ i =1
mi 1 = n n
...
l
∑m
i
xl
ml n
=1
i =1
В силу закона больших чисел выборочное распределение при n → ∞ сходится по вероятности к распределению генеральной совокупности Х. ⎛ m ⎞ В декартовой системе координат изобразим точки ⎜ xi , i ⎟ и соn ⎠ ⎝ единим их. Получим ломаную – приближенный график многоугольника распределения Х. Он называется полигоном относительных частот. В случае, когда случайная величина Х непрерывна, а также если l велико, то весь диапазон выборочных значений разбивают на К интервалов одинаковой длины. Для определения оптимальной длины интервала можно использовать формулы x − xmin h = max , или 1 + log 2 n h=
xmax − xmin 1 + 3 ,322 ⋅ lg n
5
При объеме выборки порядка 60 ≤ n ≤ 200 формулы надежны. Здесь хmin и хmax – соответственно наименьшее и наибольшее выборочное значение Х. За начало первого интервала принимаем величину
a 1 = x min −
h . Тогда а2 = а1 + h, а3 = а2 + h, ... Далее подсчитываем 2
число ni выборочных значений, попавших в каждый интервал (аi, аi+1], i = 1, 2, ..., k. Получаем интервальный ряд (выборочное распределение) (аi, аi+1] ni n
(а1, а2]
(а2, а3]
...
(аk, аk+1]
n1 n
n2 n
...
nk n
k
∑ i =1
ni 1 = n n
k
∑n
i
=1
i =1
Графически интервальный ряд – это ступенчатая фигура, состоящая из прямоугольников, основание которых – интервалы длины h, а площадь ступеньки – относительная частота попадания Х в данный n интервал. Соответственно, высоты определяют как i : h . n При увеличении объема выборки n контур гистограммы приближается к графику функции плотности Х (как и в случае полигона). Таким образом, гистограмма – приближенный график плотности Х. Естественным образом определяется эмпирическая функция распределения: n F*(x) = x , n где nx – число выборочных значений Х, меньших х. Понятно, что при n→∞ F*(x) по вероятности стремится к F(x). Отметим, что мы опираемся на статистическое определение вероятности (теорему Бернулли), согласно которому в качестве вероятности берется относительная частота.
6
2) Точечные оценки параметров. Рассмотрим задачу определения неизвестных числовых параметров распределения Х. Вспомним некоторые основные моменты. Пусть θ – неизвестный параметр. Функция (статистика) от выборочных значений θ* = f(x1, x2, ..., xn) называется точечной оценкой θ, если она дает некоторое приближенное значение θ. Вспомним, что выборка – это последовательность n независимых случайных величин, распределенных как случайная величина Х. Поэтому θ* – случайная величина. Оценка θ* называется несмещенной, если ее математическое ожидание равно оцениваемому параметру θ, т.е. M(θ*) = θ. Оценка θ* называется состоятельной, если она сходится по вероятности к оцениваемому параметру, т.е. ∀ ε > 0 p (θ * −θ > ε ) = 0.
lim ∞ n→
Оценка θ* называется эффективной в некотором классе точечных оценок, если ее дисперсия наименьшая среди дисперсий других оценок из этого класса. Естественно, имеет смысл использовать состоятельные и несмещенные (или хотя бы асимптотически несмещенные), и по возможности, эффективные оценки. Некоторые точечные оценки:
• •
x=
1 n
S2 =
k
∑ x ⋅n i
i
– выборочное среднее, оценка для M(X);
i =1
1 n
k
∑( x − x )⋅ n i
i
– выборочная дисперсия, оценка для
i =1
D(X);
•
A* =
k
1 n
∑( x − x )
1 n
∑( x − x )
3
i
⋅ ni
i =1
– эмпирический коэффициент ассиметS3 рии, характеризует ассиметрию графика функции плотности относительно графика плотности нормального распределения;
•
k
i
4
⋅ ni
− 3 – эмпирический коэффициент эксS4 цесса, характеризует «крутизну» графика плотности относительно плотности нормального распределения с тем же M(X) и D(Х). E* =
i =1
7
Известно, что X – состоятельная и несмещенная (и эффективна в классе линейных оценок) оценка, остальные оценки - состоятельные и асимптотически несмещенные. В курсе лекций обосновано, что в качестве значений хi для интерa + a i+1 вального ряда надо брать середины интервалов, т.е. xi = i . 2 Вычислять эти оценки удобно по таблице: хi
ni
хi ⋅ ni
xi − x
(x i − x ) 2 ⋅ n (x i − x) 3 ⋅ n (x i − x) 4 ⋅ n i
x1
n1
x1⋅ n1
x1 − x
(x 1 − x) 2 ⋅ n (x 1 − x ) 3 ⋅ n (x 1 − x) 4 ⋅ n 1
... . xk
....
....
....
....
nk
xk⋅ nk
xk − x
(x k − x) 2 ⋅ n (x k − x ) 3 ⋅ n (x k − x) 4 ⋅ n k
∑
n
∑ x i ⋅ n ∑ (x i − ∑ (x i − x ) 2 ∑ (x i − x) 3 ∑ (x i − x ) 4 ⋅
....
....
После оценивания параметров можно определиться с гипотетической функцией плотности и распределения. В качестве параметров распределений берут их точечные оценки. 3) Приближенная проверка нормальности распределения. Для нормального распределения коэффициент ассиметрии А и эксцесс Е равны нулю. Соответственно, близость к нулю А* и Е* говорит о том, что распределение Х близко к нормальному. В частности, если 6( n − 1 ) 24 n ⋅ ( n − 2 ) ⋅ ( n − 3 ) и E* ≤ 3⋅ , A* ≤ 3 ⋅ ( n + 1 )( n + 3 ) ( n − 1 )2 ⋅ ( n + 3 ) ⋅ ( n + 5 ) то есть основание предположить, что распределение Х нормально, т.е. f(x)=
1 2π ⋅ S x
F( x ) =
− ( x − x )2
⋅e
2S2
∫ f ( t ) dt .
−∞
8
,
4) Интервальное оценивание параметров. Точечная оценка может значительно отличаться от истинного значения параметра. Чтобы иметь представление о точности и надежности точечной оценки, строят доверительные интервалы. Пусть θ* − оценка для параметра θ. Зададим достаточно большую вероятность γ (например, γ = 0,95 или γ = 0,99) и найдем такое ε > 0, для которого p (θ − θ * < ε ) = γ или, что то же самое,
p(θ * −ε < θ < θ * +ε ) = γ . Это означает, что с вероятностью γ истинное значение θ покрывается интервалом со случайными концами (θ* − ε, θ* + ε). Величина γ называется надежностью или доверительной вероятностью, β = 1 − γ − уровнем значимости, а ε − точностью оценки. В равенстве θ* − случайная величина. Если же θ* конкретное значение оценки, вычисленное по выборке, то мы имеем следующее: вероятность ошибки при утверждении, что θ * −ε < θ < θ * +ε , равна β.
4.1 Доверительный интервал для оценки неизвестного математического ожидания нормальной случайной величины. Точечной оценкой для математического ожидания М(Х) мы взяли выборочное среднее X . Следовательно, доверительный интервал имеет вид x − ε ,x + ε Задавая надежность γ, подберем ε так, чтобы выполнялось соотношение
(
)
(
)
p X − M( X ) < ε = γ .
Имеем два случая: первый – дисперсия нормальной случайной величины Х известна, второй – дисперсия неизвестна.
9
4.2 Пусть дисперсия D(X) =σ2 известна. Для отыскания ε воспользуемся тем, что x – нормальная случайная величина с математическим ожиданием М(Х) и дисперсией
σ2
(центральная предельная теоре-
n
)
(
⎛ε ⋅ n ⎞ ⎟ , где Φ(t) – функция ма). В силу этого p X − M ( X ) < ε = 2Φ ⎜ ⎜ σ ⎟ ⎠ ⎝
Лапласа. Обозначим t =
ε⋅ n γ . По условию 2Φ(t) = γ, или Φ ( t ) = . 2 σ 2
Из таблицы значений функции Лапласа найдем tγ, такое, что
Φ ( tγ ) =
γ
2
. Отсюда ε = tγ ⋅
σ
n
и искомый интервал имеет вид:
⎛ σ σ ⎞ ⎟⎟ ⎜⎜ x − tγ ⋅ , x + tγ ⋅ n n⎠ ⎝
Таким образом, x − tγ ⋅
σ
< M ( X ) < x + tγ ⋅
σ
, и вероятность тоn n го, что это утверждение неверно, равно β = 1 − γ. Пусть дисперсия неизвестна. В этом случае, случайная величина x − M( X ) ⋅ n − 1 имеет распределение Стьюдента (статистика) T = S 2 1 k с n – 1 степенями свободы, где S 2 = xi − x ⋅ ni . n i=1 По таблице распределения Стьюдента находим tγ такое, что
∑(
)
P( T < tγ ) = γ .
Это равенство означает, что ⎛ S ⎞ ⎟⎟ = γ , P⎜⎜ x − M ( X ) < tγ ⋅ n −1 ⎠ ⎝
отсюда доверительный интервал имеет вид ⎛ S S ⎞ ⎟⎟. ⎜⎜ x − tγ ⋅ , x + tγ ⋅ n −1 n −1 ⎠ ⎝
10
Замечание. В случае если имеется таблица P ( T > tγ ) , то по надежности γ и числу степеней свободы n – 1, находим tγ такое, что P( T > tγ ) = β = 1 − γ . 4.3 Доверительный интервал для неизвестной дисперсии нормальной случайной величины. Вспомним, что точечной оценкой для дисперсии D(X) = σ2 служит статистика S2. Для построения доверительного интервала воспользуnS 2 емся тем, что случайная величина имеет распределение хи – 2
σ
квадрат (χ2) с n – 1 степенями свободы. При n ≤ 30 по таблице распределения χ2 найдем числа χ1 и χ2 такие, что 1 P (χ 2 < χ 12 ) = (1 − γ ) 2 , 1 2 2 P (χ < χ 2 ) = (1 + γ ) 2 где γ - заданная надежность. ⎛ ⎞ nS 2 Тогда P⎜⎜ χ 12 < 2 < χ 12 ⎟⎟ = γ . σ ⎝ ⎠ ⎛ nS 2 nS 2 ⎞ Отсюда вытекает, что P⎜⎜ 2 < σ 2 < 2 ⎟⎟ = γ . χ1 ⎠ ⎝ χ2 ⎛ nS 2 nS 2 ⎞ Таким образом, ⎜⎜ 2 , 2 ⎟⎟ – доверительный интервал дисперсии ⎝ χ2 χ1 ⎠ ⎛ nS nS⎞ ⎟ – доверительный интервал для среднего квадратиσ2, а ⎜ , ⎜ χ χ 1 ⎟⎠ ⎝ 2 ческого отклонения σ. При n > 30 по надежности γ и числу степеней свободы n – 1 найn n и γ2 = . дем γ 1 =
χ2 χ1 Тогда доверительный интервал для дисперсии примет вид (γ 1 S 2 ,γ 2 S 2 ) , а для среднего квадратического отклонения – (γ 1 S ,γ 2 S ) .
11
5) Проверка статистических гипотез. Любое предположение о генеральной совокупности Х, сделанные на основе выборки, – статистическая гипотеза. Правило, показывающее, когда статистическую гипотезу надо принять, а когда отвергнуть, – статистический критерий. Критерии, относящиеся к предположениям о виде функции распределения, называются критериями согласия. Рассмотрим один из критериев согласия – критерий хи-квадрат (или критерий Пирсона). Пусть выдвинута гипотеза о том, что генеральная совокупность Х имеет функцию распределения F(x) или плотность f(x). Далее, пусть вся область изменения величины Х разбита на k интервалов (a1, a2], (a2, a3], ..., (ak, ak+1], и пусть Pi – вероятность для величины Х при гипотетическом распределении F(x) попасть в интервал (ai, ai+1]: Pi = P(ai < x < ai+1 ) = F (ai+1 ) − F (ai ) =
ai+1
∫ f ( x ) dx
ai
Пусть ni – число выборочных значений, попавших в интервал n (ai, ai+1]. Тогда i – относительная частота попадания в i-ый интервал n (статистическая вероятность попадания в интервал). n Если величины i и Pi (i = 1, 2, ..., k) мало различаются, то раn зумно считать, что выдвинутая гипотеза не противоречит опытным данным. Это обстоятельство лежит в основе χ2. k ( ni − nPi )2 Рассмотрим статистику χ 2 = . nPi i =1
∑
При больших n статистика χ2 практически не зависит от гипотетического распределения F(x) и имеет распределение χ2 с r степенями свободы, где r = k – m – 1, где m – количество неизвестных параметров гипотетического распределения, оцениваемых по выборке. Чтобы сформулировать правило проверки гипотезы, сначала задаем уровень значимости β (β = 0,05 или β = 0,1) и по таблице χ2 с r сте2 пенями свободы и β находим число χ крит такое, что выполняется равенство 2 )= β . P (χ 2 ≥ χ крит
12
Если значение χ2, вычисляемое по выборке, окажется больше или 2 равно χ крит , то гипотеза отвергается, в противном случае гипотеза принимается (не противоречит наблюдениям). По этому правилу верная гипотеза отвергается с вероятностью β. Схема применения критерия 1. Вычисляем χ2 для нашей выборки по формуле k ( ni − nPi )2 χ2 = . nPi i =1
∑
2. По уровню значимости β и числу степеней свободы 2 – m – 1 из таблицы распределения χ2 находим χ крит ..
r=k
2 2 , гипотеза отвергается, если χ 2 < χ крит , то ги3. Если χ 2 ≥ χ крит
потеза считается не противоречащей наблюдениям. 6. В случае верно выбранного гипотетического распределения F(x), график выбранной функции плотности должен мало отличаться от гистограммы.
13
Часть II Задание 1) По построенным интервальным рядам для компонент Х и У построить двумерное выборочное распределение (Х, У). 2) Найти выборочную ковариацию. Если ковариация не равна нулю, то в генеральной совокупности компоненты Х и У коррелированны. 3) Найти условные выборочные средние y x и x y , построить на одном чертеже ломанные регрессии y x на х и x y на у. 4) Найти выборочный коэффициент корреляции ρв, проверить гипотезу о значимости коэффициента корреляции при уровне значимости β. 5) Найти уравнения линейной регрессии y x на х и x y на у, построить полученные линии регрессии на том же чертеже, что и ломанные. Указания Величины У и Х могут быть связаны функциональной зависимостью y = f(x). Если закон распределения случайной величины У зависит от Х, то имеется стохастическая зависимость. Если условное математическое ожидание У функционально зависит от Х, то имеется корреляционная зависимость – частный случай стохастической. Представление о двумерной случайной величине (Х, У) дает нам двумерное выборочное распределение. 1) Строим корреляционную таблицу (фактически двумерную случайную величину).
14
Y X
y1 (b1, b2]
y2 (b2, b3]
...
yl (bk, bk+1]
ni
∑ n1j
x1
(a1, a2]
n11
n12
n1k
x2
(a2, a3]
n21
n22
n2k
... xl
... (al, al+1]
... nl1
... nl2
... ...
... nlk
... ...
∑ ni
∑ ni
...
...
∑ n ij
nj
∑ n 2j
В клетках таблицы записываем числа nij – частота попадания выборочных значений (xt, yt) в прямоугольник со сторонами nij = n . В последней строке таблицы – числа (ai, ai+1] и (bj, bj+1],
∑
nj – частоты попадания Y в интервалы (bj, bj+1], соответственно в последнем столбце – частоты попадания Х в интервалы (ai, ai+1]. Первая и последняя строка – интервальный ряд для У, первый и последний столбец – интервальный ряд для Х (см. часть I). 2) По определению считаем выборочную ковариацию: cov ( x , y ) = xy − x ⋅ y ,
где xy =
1 n
∑x y n i
j
ij
3) Находим условные средние: y x= x = i
x y= yi =
1 ni
∑y
1 nj
∑ x ⋅n ,
j
⋅ nij , i = 1, 2 ,...l
j
i
ij
j = 1, 2 , ...k
i
По точкам (х, y x ) строим ломанную регрессии y x на х, и соответственно ломанную регрессии x y на у. 4) Выборочный коэффициент корреляции
ρв =
cov ( x , y ) S( x ) ⋅ S( y )
15
характеризует
тесноту
линейной
связи:
чем
ближе
ρв
к единице, тем сильнее линейная зависимость. 5) Методом наименьших квадратов определяем параметры уравнения регрессии y x = α + βx :
β = ρв ⋅
S( y) , α = y−βx S( x)
Соответственно, x y = γ + δx , S( x) , γ = x −δ y S( y) Строим графики полученных линий регрессий.
δ = ρв ⋅
16
Ииндивидуальные задания
Вариант 1 X 59 71 61 67 62 62 61 59 65 63 65 62 62 65 67 63 58 64 64
Y 57 67 43 60 55 59 59 54 49 47 62 56 49 55 50 50 54 53 45
X 61 63 59 64 63 62 68 65 68 65 62 68 64 60 64 67 68 62 67
Y 46 55 57 49 55 47 67 57 56 45 46 50 55 47 59 59 58 54 50
X 63 65 64 68 70 87 65 69 62 65 66 66 62 60 64 60 60 63
Y 53 50 61 50 63 41 53 66 59 64 62 65 45 44 44 40 55 43
X 62 62 64 64 62 56 65 66 64 61 62 69 65 62 66 63 57 55
Y 58 54 60 63 43 38 49 49 44 54 42 54 61 45 62 48 39 51
Y -34 -29 -38 -30 -33 -30 -39 -25 -32 -35 -30 -34 -33 -31 -34 -29
X 31 25 27 26 27 28 24 24 26 25 22 27 26 24 25 22
Y -38 -30 -31 -32 -31 -38 -32 -32 -28 -34 -29 -35 -32 -30 -29 -31
Вариант 2 X 31 28 30 23 25 25 25 27 31 25 28 25 30 28 28 31
Y -37 -36 -32 -30 -32 -33 -27 -28 -40 -33 -31 -31 -39 -30 -34 -37
X 23 28 26 26 28 27 25 26 27 28 27 29 24 23 27 27
Y -32 -30 -35 -34 -29 -35 -34 -30 -35 -30 -35 -36 -33 -24 -29 -32
X 28 26 29 26 23 27 29 24 27 25 29 29 25 25 30 25
17
Вариант 3 X 77 76 62 83 83 79 77 81 71 83 73 81 82 77 82 83 80 77 69 78
Y 72 58 45 80 71 70 61 66 51 70 56 75 71 60 63 77 61 60 57 74
X 74 77 69 72 76 69 84 77 72 76 78 87 79 80 70 80 75 69 77
Y 66 68 66 60 58 60 76 61 59 56 61 69 70 68 54 70 71 54 61
X 67 69 66 71 71 77 78 77 67 73 67 83 67 76 71 74 73 75 80
Y 57 56 62 53 69 60 72 73 63 65 53 69 53 66 59 60 58 60 61
X 72 66 80 72 68 76 81 69 83 77 69 81 65 71 69 85 81 72 84
Y 58 49 63 62 61 57 79 55 64 70 62 80 62 55 65 68 62 56 77
Y 76 102 97 149 85 95 64 74 63 109 105 92 83 82 101 91 91 78 72
X 20 15 16 16 10 15 23 15 17 17 17 19 16 11 13 17 20 19
Y 134 94 110 101 67 102 153 93 105 102 109 119 102 64 75 101 133 132
Вариант 4 X 13 11 18 13 15 21 17 13 16 13 19 17 15 12 17 20 17 18 17
Y 88 72 123 90 93 135 112 75 110 74 115 116 87 76 118 120 107 115 116
X 17 16 17 16 17 13 18 14 13 11 15 10 15 14 9 19 18 15 15
Y 117 110 117 97 117 82 112 88 71 60 102 69 93 93 59 127 107 101 92
X 13 16 15 22 14 15 12 12 11 16 17 15 14 13 17 15 14 12 12
18
Вариант 5 X 46 40 58 35 53 47 40 60 39 41 58 59 57 65 34 50 45 50 55
Y 44 39 49 25 47 42 32 53 29 39 54 55 50 55 28 42 36 47 52
X 57 45 55 46 53 45 43 48 50 44 38 68 54 57 34 59 57 57 49
Y 55 39 50 41 47 44 38 43 47 35 33 66 44 54 28 52 50 50 41
X 56 48 44 49 50 46 46 47 39 49 44 49 53 44 47 51 56 39 46
Y 46 47 36 44 40 36 41 41 31 43 37 45 51 41 43 41 52 33 38
X 68 47 40 35 60 37 41 46 46 53 43 53 54 50 45 50 25 44 54
Y 59 39 38 29 53 35 37 36 38 45 34 48 48 44 39 44 23 43 47
Y 564 345 518 430 436 504 450 584 521 580 509 542 498 608 461 445 595 431
X 50 49 54 45 36 41 46 38 44 35 47 44 57 53 51 48 46 43
Y 542 538 588 485 387 441 503 416 483 376 512 474 624 579 554 519 496 467
Вариант 6 X 48 40 52 50 39 47 38 46 47 44 45 44 53 52 45 42 45 45
Y 520 435 564 541 424 516 413 505 514 479 490 483 577 569 493 461 486 492
X 61 42 55 52 44 41 47 43 55 43 49 42 31 40 47 43 48 44
Y 664 456 601 567 475 450 516 468 602 472 538 459 333 432 516 471 527 483
X 52 32 48 40 40 46 41 54 48 53 47 50 46 56 42 41 55 40
19
Вариант 7 X 7 11 10 4 11 12 9 5 8 13 12 10 9 9 11 9 10 10 13 15 4 9 14
Y 38 63 55 16 64 70 50 22 44 76 71 58 45 49 65 44 55 54 75 89 22 48 76
X 6 5 10 10 13 15 6 11 10 14 8 14 6 16 8 6 8 8 7 8 10 12
X 40 40 42 41 42 41 40 41 41 39 38 39 42 40 40 41
Y 272 260 281 271 289 277 264 280 280 267 256 263 293 277 261 280
X 40 39 41 42 41 42 40 41 42 40 41 40 42 40 42 41
Y 28 27 56 55 74 84 31 58 54 78 47 79 35 95 39 33 41 40 39 38 59 69
X 6 10 14 12 6 6 8 6 6 13 11 9 10 8 12 14 14 7 16 11 11 12
Y 35 55 79 65 29 35 47 28 31 77 59 45 58 45 66 75 76 38 90 63 59 70
X 11 9 12 10 7 8 9 9 11 13 9 9 10 13 7 9 8 16 12 15 13 11
Y 58 45 64 58 33 46 46 50 63 70 52 49 57 77 32 50 40 92 65 81 75 62
Y 279 275 276 278 273 282 287 267 275 277 270 271 267 273 284 255
X 40 40 41 40 41 40 41 39 41 41 40 41 39 41 40
Y 270 266 274 278 278 263 283 257 279 267 264 284 257 278 276
Вариант 8 Y 212 204 224 223 215 214 210 207 215 203 207 212 226 204 221 220
X 41 40 41 40 41 42 42 40 40 41 40 41 41 40 41 39
20
Вариант 9 X 37 39 30 32 40 34 33 40 38 35 37 35 26 29 37 31 38 38 33 36 37 48
Y 58 63 59 59 67 53 53 69 68 55 67 53 37 45 73 50 66 59 54 68 58 93
X 41 31 44 38 28 42 31 26 32 31 40 31 34 45 36 38 35 32 37 40 31
X 17 16 17 16 15 17 17 16 17 16 16 18 15 16 16 7
Y 97 94 97 90 75 99 88 82 83 81 85 95 73 82 93 89
X 15 18 16 18 18 15 18 17 18 15 17 17 16 18 16 18
Y 72 51 71 63 55 81 46 42 58 59 61 43 53 74 65 63 32 51 63 67 59
X 42 39 34 36 31 29 41 27 27 37 38 47 40 33 36 36 41 41 35 39 33
Y 72 60 56 71 52 44 77 47 51 66 72 90 67 65 62 69 81 75 52 70 49
X 40 35 24 37 42 38 35 38 32 38 37 41 33 32 42 28 44 42 35 33 35
Y 73 56 31 69 78 63 69 74 58 60 71 81 60 58 72 50 73 75 63 60 61
Y 77 84 94 91 103 94 97 79 90 76 94 84 77 94 76
X 16 17 16 18 15 16 17 19 15 16 15 18 15 16 15
Y 92 94 91 103 76 89 100 107 80 77 79 98 85 93 73
Вариант 10 Y 80 104 86 94 91 70 99 85 101 85 100 84 80 105 88 100
X 16 16 16 17 18 16 17 14 17 15 18 17 16 18 15
21
Приложение 1: χ2 – распределение (распределение Пирсона) P(χ2 > xα) = α α k 1 2 3 4 5
0,99
0,95
0,90
0,80
0,20
0,02
0,01
0,00016 0,0201 0,115 0,297 0554
0,0063 0,0404 0,185 0,429 0,752
0,393 0,0642 1,642 0,103 0,446 3,219 0,352 1,005 4,642 0,711 1,649 5,989 1,145 2,343 7,289
2,706 3,841 4,605 5,991 6,251 7,815 7,779 9,488 9,236 11,070
5,412 7,824 9,837 11,668 13,388
6,635 9,210 11,341 13,277 15,086
6 7 8 9 0
0,872 1,239 1,646 2,088 2,588
1,134 1,564 2,032 2,532 3,059
1,635 2,167 2,733 3,325 3,940
3,070 8,558 10,645 12,592 3,822 9,803 12,017 14,067 4,594 11,030 13,362 15,507 5,380 12,242 14,684 16,919 6,179 13,442 15,987 18,307
15,033 16,622 18,168 19,679 21,161
16,812 18,475 20,090 21,666 23,209
1 2 3 4 5
3,053 3,571 4,107 4,660 5,229
3,609 4.178 4,765 5,368 5,985
4,575 6,989 5,226 7,807 5,892 8,634 6,571 9,467 7,261 10,307
14,631 15,812 16,985 18,151 19,311
17,275 18,549 19,812 21,064 22,307
19,675 21,026 22,362 23,685 24,996
22,618 24,054 25,472 26,873 28,259
24,725 26,217 27,688 29,141 30,578
6 17 18 19 20
5,812 6,408 7,015 7,633 8,260
6,614 7,962 11,152 7,255 8,672 12,002 7,906 9,390 12,857 8,567 10,117 13,716 9,237 10,851 14,578
20,465 21,615 22,760 23,900 25,038
23,542 24,769 25,989 27,204 28,412
26,296 27,587 28,869 30,144 31,410
29,633 30,995 32,346 33,687 35,020
32,000 33,409 34,805 36,191 37,566
21 22 23 24 25
8,897 9,542 10,196 10,856 11,524
9,915 10,600 11,293 11,992 12,697
11,591 12,338 13,091 13,848 14,611
15,445 16,314 17,187 18,062 18,940
26,171 27,301 28,429 29,553 30,675
29,615 30,813 32,007 33,196 34,382
32,671 33,924 35,172 36,415 37,652
36,343 37,659 38,968 40,270 41,566
38,932 40,289 41,638 42,980 44,314
26 27 28 29 30
12,198 12,879 13,565 14,256 14,953
13,409 14,125 14,847 15,574 16,306
15,379 16,151 16,928 17,708 18,493
19,820 20,703 21,588 22,475 23,364
31,795 32,912 34,027 35,139 36,250
35,563 36,741 37,916 39,087 40,256
38,885 40,112 41,337 42,557 43,773
42,856 44,140 45,419 46,693 47,962
45,642 46,963 48,278 49,588 50,892
22
0,10
0,05
Приложение 2: t – распределение (распределение Стьюдента) P(t > tα) = α и P( |t | > tα) = α
k 1 2 3 4 5
0,2 3,08 1,89 1,64 1,53 1,48
Односторонняя критическая область (α) 0,05 0,025 0,01 0,005 0,0025 0,001 Двусторонняя критическая область (α) 0,1 0,05 0,02 0,01 0,005 0,002 6,31 12,71 31,82 63,66 127,32 318,30 2,92 4,30 6,96 9,92 14,09 22,33 2,35 3,18 4,54 5,84 7,45 10,21 2,13 2,78 3,75 4,60 5,60 7,17 2,02 2,57 3,36 4,03 4,77 5,89
6 7 8 9 10
1,44 1,41 1,40 1,38 1,37
1,94 1,89 1,86 1,83 1,81
2,45 2,36 2,31 2,26 2,23
3,14 3,00 2,90 2,82 2,76
3,71 3,50 3,36 3,25 3,17
4,32 4,03 3,83 3,69 3,58
5,21 4,79 4,50 4,30 4,14
5,96 5,41 5,04 4,78 4,59
11 12 13 14 15
1,36 1,36 1,35 1,34 1,34
1,80 1,78 1,77 1,76 1,75
2,20 2,18 2,16 2,14 2,13
2,72 2,68 2,65 2,62 2,60
3,11 3,05 3,01 2,98 2,95
3,50 3,43 3,37 3,33 3,29
4,02 3,93 3,85 3,79 3,73
4,44 4,32 4,22 4,14 4,07
16 17 18 19 20
1,34 1,33 1,33 1,33 1,33
1,75 1,74 1,73 1,73 1,72
2,12 2,11 2,10 2,09 2,09
2,58 2,57 2,55 2,54 2,53
2,92 2,90 2,88 2.86 2,85
3,25 3,22 3,20 3,17 3,15
3,69 3,65 3,61 3,58 3,55
4,02 3,97 3,92 3,88 3,85
21 22 23 24 25
1,32 1,32 1,32 1,32 1,32
1,72 1,72 1,71 1,71 1,71
2,08 2,07 2,07 2,06 2,06
2,52 2,51 2,50 2,49 2,49
2,83 2,82 2,81 2,80 2,79
3,14 3,12 3,10 3,09 3,08
3,53 3,51 3,48 3,47 3,45
3,82 3,79 3,77 3,75 3,73
26 27 28 29 30
1,32 1,31 1,31 1,31 1,31
1,71 1,70 1,70 1,70 1,70
2,06 2,05 2,05 2,05 2,04
2,48 2,47 2.47 2,46 2,46
2,78 2,77 2,76 2,76 2,75
3,07 3,06 3,05 3,04 3,03
3,44 3,42 3,41 3,40 3,39
3,71 3,69 3,67 3,66 3,65
40 60 120 ∞
1,30 1,30 1,29 1,28
1,30 1,30 1,66 1,64
1,68 1,67 1,98 1,96
2,02 2,00 2,36 2,33
2,42 2,39 2,62 2,58
2,70 2,66 2,85 2,81
2,97 2,91 3,16 3,09
3,31 3,23 3,37 3,29
0,1
23
0,0005 0,001 636,61 31,60 12,92 8,61 6,87
Приложение 3: Функция распределения нормального распределения Φ(x) =
1 2π
x
∫
−
t2
e 2 dt
−∞
х 00,0 0,1 0,2 0,3 0,4
0 50000 53983 57926 61791 65542
1 50399 54380 58317 62172 65910
2 50798 54776 58706 62552 66276
3 51197 55172 59095 62930 66640
4 51595 55567 59483 63307 67003
5 51994 55962 59871 63683 67364
6 52392 56356 60257 64058 67724
7 52790 56749 60642 64431 68082
8 53188 57142 61026 64803 68439
9 53586 57535 61409 65173 68793
0,5 0,6 0,7 0,8 0,9
69146 72575 75804 78814 51594
69497 72907 76115 79103 81859
69847 73237 76424 79389 82121
70194 73565 76730 79673 82381
70540 73891 77035 79955 82639
70884 74215 77337 80234 82894
71226 74537 77637 80511 83147
71566 74857 77935 80785 83398
71904 75175 78230 81057 83646
72240 75490 78524 81327 83891
1,0 1,1 1,2 1,3 1,4
84134 86433 88493 90320 91924
84375 86650 88686 90490 92073
84614 86864 88877 90658 92220
84850 87076 89065 90824 92364
85083 87286 89251 90988 92507
85314 87493 89435 91149 92647
85543 87698 89617 91308 92786
85769 87900 89796 91466 92922
85993 88100 89973 91621 93056
86214 88298 90147 91774 93189
1,5 1,6 1,7 1,8 1,9
93319 94520 95543 96407 97128
93448 94630 95637 96485 97193
93574 94738 95728 96562 97257
93699 94845 95818 96638 97320
93822 94950 95907 96712 97381
93943 95053 95994 96784 97441
94062 95154 96080 96856 97500
94179 95254 96164 96926 97558
94295 95352 96246 96995 97615
94408 95449 96327 97062 97670
2,0 2,1 2,2 22,3 22,4
97725 98214 98610 98928 99180
97778 98257 98645 98956 99202
97831 98300 98679 98983 99224
97882 98341 98713 99010 99245
97932 98382 98745 99036 99266
97982 98422 98778 99061 99286
98030 98461 98809 99086 99305
98077 98500 98840 99111 99324
98124 98537 98870 99134 99343
98169 98574 98899 99158 99361
22,5 22,6 2,7 22,8 22,9
99379 99534 99653 99744 99813
99396 99547 99664 99752 99819
99413 99560 99674 99760 99825
99430 99573 99683 99767 99831
99446 99585 99693 99774 99836
99461 99598 99702 99781 99841
99477 99609 99711 99788 99846
99492 99621 99720 99795 99851
99506 99632 99728 99801 99856
99520 99643 99736 99807 99861
33,0 99865 99869 99874 3,1 99910 33,2 99931 99934 99936 33,3 99952 99953 99955
99878 99913 99938 99957
99882 99916 99940 99958
99886 99918 99942 99960
99889 99921 99944 99961
99893 99924 99946 99962
99896 99926 99948 99964
99900 99929 99950 99965
24
33,4 99966 99968 99969 99970 99971 99972 99973 99974 99975 99976 33,5 33,6 33,7 33,8 33,9 44,0
99977 99984 99989 99993 99995 99997
99978 99985 99990 99993 99995 99998
99978 99985 99990 99993 99996 99999
99979 99986 99990 99994 99996 99999
99980 99986 99991 99994 99996 99999
25
99981 99987 99991 99994 99996 −
99981 99987 99992 99994 99996 −
99982 99988 99992 99995 99996 −
99983 99988 99992 99995 99997 −
99983 99989 99992 99995 99997 −
Рекомендуемая литература
1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высш. шк., 1998. 2. Гмурман В.Е. Теория вероятностей и математическая статистика. Учеб. Пособие для вузов. – М.: Высш. шк., 1998 3. Кремер Н.Ш. Математика для экономистов. 4. Колде Я.К. Практикум по теории вероятностей и математической статтистики: Учеб. пособие для техникумов. – М.: Высш. шк., 1991
26
Батуев Эрдэмто Николаевич Сидорова Александра Сергеевна МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Обработка статистических данных Корреляционная зависимость Задания и методические указания для студентов дневгого и заочного отделений В авторской редакции Набор, верстка Сидорова А.С. Лицензия ИД №02187 от 30.06.00 г. Подписано в печать____ Формат 61*86/16.Печать офсетная. Гарнитура Times New Roman Усл. печ. л. ___ Тираж __ экз. Заказ № Редакционно-издательский отдел Камчатского государственного технического университета Отпечатано полиграфическим участком РИО КамчатГТУ 683003, г. Петропавловск-Камчатский, ул. Ключевская, 35
27