ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
МЕТОДЫ ВЫБОРОЧНОГО ОБСЛЕДОВАНИЯ Практикум по курсу
Составитель В.Б. Борисов
Издательско-полиграфический центр Воронежского государственного университета 2007
Утверждено научно-методическим советом экономического факультета ВГУ 24 мая 2007 г., протокол № 5
Практикум по курсу «Методы выборочного обследования» подготовлен на кафедре региональной экономики и территориального управления экономического факультета Воронежского государственного университета. Рекомендуется для студентов 4-го курса направления «Статистика».
Для специальности: 522200 – Статистика
2
СОДЕРЖАНИЕ Общие методические указания………………………………………...
4
1. Сводка и группировка статистических данных выборочного обследования…………………………………………………………….
5
2. Средние величины выборочной совокупности и показатели вариации…………………………………………………………………
17
3. Выборочное наблюдение…………………………………………….
36
3
ОБЩИЕ МЕТОДИЧЕСКИЕ УКАЗАНИЯ Работа экономиста статистической специальности неизбежно связана со сбором, разработкой и анализом статистических материалов. Нередко экономисту самому приходится проводить выборочные обследования. Поэтому изучение выборочных обследований при подготовке статистиков имеет большое значение в системе высшего экономического образования. Особенно большое значение приобретают изучение статистики экономистами в условиях рыночной экономики, когда возрастает роль статистики в системе информационного обеспечения потребностей внутреннего рынка. В
учебном
статистических
практикуме
методов
к
содержится
проведению
системное
выборочных
изложение
обследований,
решению управленческих задач в коммерческой деятельности на рынке товаров и услуг и, прежде всего, в розничной торговле товарами народного потребления, где в условиях рыночной экономики наибольшие массивы порождаемой и потребляемой информации. Настоящий
учебный
практикум
написан
для
студентов
экономических вузов и факультетов, чтобы облегчить самостоятельную работу над курсом, в особенности, студентам вечернего и заочного обучения.
4
1. СВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ ВЫБОРОЧНОГО ОБСЛЕДОВАНИЯ В
результате
первой
стадии
статистического
исследования –
статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Этот этап в статистике называется сводкой. Различают простую сводку (подсчет только общих итогов) и статистическую
группировку,
которая
сводится
к
расчленению
совокупности из группы по существующему для единиц совокупности признаку. Группировка позволяет получать такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи. Результаты сводки могут быть представлены в виде статистических рядов распределения. Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от признака ряды могут быть вариационные (количественные) и атрибутивные
(качественные). Вариационные (количественные)
признаки – это признаки, имеющие количественное выражение у отдельных единиц совокупности, например, заработная плата рабочих, стоимость продукции промышленных предприятий, возраст людей, урожайность отдельных участков посевной площади и т. д. Атрибутивные
признаки
–
это
признаки,
не
имеющие
количественной меры. Например, пол (мужской, женский), отрасль
5
народного хозяйства, вид продукции, профессия рабочего и т. д. Вариационные ряды могут быть дискретными или интервальными. Дискретный ряд распределения – это ряд, в котором варианты выражены целым числом.
Примером может служить распределение
рабочих по тарифным разрядам: тарифный разряд
число рабочих, чел.
1-й
10
2-й
20
3-й
40
4-й
60
5-й
50
6-й
20
Итого
200
Интервальный ряд распределения – это ряд, в котором значения признака заданы в виде интервала. Например, распределение рабочих по разрядам можно представить в виде интервального ряда: тарифный разряд
число рабочих,чел.
1–2-й
30
3–4-й
100
5–6-й
70
Итого
200
При определении интервальных рядов распределения необходимо определить, какое число групп следует образовать и какие взять интервалы (равные, неравные, закрытые, открытые). Эти вопросы решаются на основе экономического анализа сущности изучаемых явлений, поставленной цели и характера измерений признака. Рассмотрим методику составления ряда распределения на примере. Задача 1. Имеются следующие данные о работе 24 предприятий одной из отраслей промышленности, представленные в табл. 1.1. 6
Таблица 1.1 Среднегодовая
Среднесписоч- Производство
Номер
стоимость осн.
ное число
п/п
производствен.
работников за
фондов, млн р.
отчетный
продукции за отчетный пери-
Выполнение договора,
од, млн р.
%
период, чел. 1
30
360
32
103,1
2
70
380
96
120,0
3
20
220
15
109,5
4
39
460
42
104,5
5
33
395
64
104,8
6
28
280
28
94,3
7
65
580
94
108,1
8
66
200
119
125,0
9
20
270
25
101,4
10
47
340
35
102,4
11
27
200
23
108,5
12
33
250
13
102,1
13
30
310
14
112,7
14
31
410
30
92, 0
15
31
635
20
108,0
16
35
400
79
111,1
17
31
310
36
96,9
18
56
450
80
114,4
19
35
300
25
108,0
20
40
350
28
107,0
21
10
330
16
100,7
22
70
260
129
118,0
23
45
435
56
111,9
24
49
505
44
104,7
Если по каждому абсолютному показателю таблицы подвести итоги, то получим простую сводку. Однако только по итогам и отдельным 7
показателям трудно судить о характере распределения предприятий, например, по проценту выполнения договора, по числу работающих или стоимости основных фондов, о том, какие значения показателей являются наиболее характерными для данной отрасли за отчетный период.
Для
этого имеющиеся данные надо привести в систему по интересующему нас признаку. В качестве изучаемого признака возьмем, например, стоимость основных фондов и построим по нему ряд распределения с равными закрытыми интервалами. Величина интервала в этом случае определяется по формуле: − x max x min i= n
,
где xmax и xmin – соответственно максимальное и минимальное значения
n – число групп.
стоимости основных фондов,
Число групп тесно связано с объемом изучаемой совокупности. При равенстве
интервалов
для
ориентировки
существует
формула,
предложенная американским ученым Стерджессом, с помощью которой можно наметить число групп
n
при известной численности изучаемой
совокупности N:
n = 1 + 3,322 lg N, или n = 1 + 1,44 ln N, где N – число элементов выборочной совокупности. Образуем пять групп предприятий. Тогда величина интервала будет равна:
i=
70 − 10 = 12 (млн р.) 5 8
Теперь образуем группы предприятий, отличающихся друг от друга по среднегодовой стоимости основных производственных
фондов на эту
величину. Первая группа предприятий будет иметь размер основных производственных фондов в пределах от 10 до 22 млн р., вторая группа определится в пределах от 22 до 34 млн р. и т. д. Распределив предприятия по группам, подсчитаем число предприятий в каждой из них. Техника подсчета проста. Можно сделать выборку нужных значений из таблицы 1.1 и занести их предварительно в рабочую таблицу по следующей методике: Группы предприятий по стоимости
Число предприятий
основных производственных фондов, млн р. 10–22
III
22–34
IIII IIII
34–46
IIII
46–58
III
58–70
IIII
П р и м е ч а н и е . Каждая черта соответствует
единице совокупности, т. е. одному
предприятию. Счет ведется пятерками – каждые четыре черты перечеркиваются пятой.
На
основании
рабочей
таблицы
составляется
ряд
распределения
предприятий по размеру основных фондов (см. табл. 1.2). Этот способ подсчета
сводится
к
следующему.
Предварительно
составляется
ранжированный ряд распределения, т. е. ряд, в котором значение признака располагается в возрастающем или убывающем порядке, и счет ведется по группам.
9
Таблица 1.2 Группы предприятий по стоимости
Удельный
вес предприятий
основных производственных фондов,
Число
группы в процентах к
млн р.
предприятий
итогу
10–22
3
12,5
22–34
9
37,5
34–46
5
20,8
46–58
3
12,5
58–70
4
16,7
Итого
24
100,0
Построим ранжированный ряд предприятий по стоимости основных производственных фондов в возрастающем порядке (см. табл. 1.3). По данным ранжированного ряда хорошо видно изменение стоимости основных производственных фондов и легко обозначить границы групп. В группу предприятий с размером стоимости основных фондов 1–22 войдут первые по порядку
три завода, во вторую группу
22–34 войдут
следующие по порядку девять заводов и т. д. Составив предварительно макет таблицы и заполнив его, получим таблицу 1.3 аналогичную табл. 1.2. Как видно из таблицы 1.3, ряд
распределения
состоит
из двух
элементов: 1) значения признака; 2) абсолютной численности единиц признака. Для большей наглядности абсолютные величины могут быть дополнены относительными показателями (частностями), выраженными в процентах. Таким образом, обобщение данных в виде ряда распределения позволяет видеть вариацию и состав совокупности по изучаемому признаку, сравнивать между собой группы, изучать их в динамике.
10
Таблица 1.3 Но-
Номер
Стоимость основных
Но-
Номер
Стоимость основных
мер
предпр
производственных
мер
предприя-
производственных
груп-
иятия
фондов, млн р.
груп-
тия
фондов, млн р.
пы
по по-
пы
по по-
рядку
I
II
рядку
1
10
13
35
2
20
14
35
3
20
15
39
16
40
17
45
4
27
5
28
6
30
7
30
8
31
9
31
10
31
11
33
12
33
Итак,
ряд
распределения
III
IV
V
заводов
производственных фондов показывает,
18
47
19
49
20
56
21
65
22
66
23
70
24
70
по
стоимости
основных
что для данной отрасли
характерной является группа заводов с основными фондами от 22 до 34 млн р., которая составляет 35 % всех заводов, и что более половины заводов (58,3 %) имеют стоимость основных фондов в размере от 22 до 45 млн р. Интервалы в рядах распределения могут быть неравными – прогрессивно возрастающими или прогрессивно убывающими. Это
11
характерно для совокупностей с большими колебаниями значений признака. Примером
может
служить
следующий
ряд
распределения,
представленный в табл. 1.4. Таблица 1.4 Группа предприятий по объему продукции,
Число
Удельный вес
млн р.
предприятий
предприятий в процентах к итогу
до 100
2
6,7
100–200
3
10,0
200–400
5
16,7
400–700
4
13,3
700–1000
6
20,0
Свыше 1000
10
33,3
Итого
30
100,0
Этот ряд имеет также открытые интервалы в первой и последней группах. Рассмотрим ряды распределения по атрибутивному признаку. Задача 2.
По данным таблицы 1.1
произведем группировку по
атрибутивному признаку, выделив две группы заводов: не выполнивших план и выполнивших план. Подсчитав число предприятий по группам и оформив результаты в виде таблицы, получим ряд распределения предприятий по результатам производственной
деятельности.
Таблица
1.5
дает
наглядное
представление о составе совокупности и характеризует производственную деятельность отрасли.
12
Таблица 1.5 Удельный вес заводов Группы предприятий
Число предприятий
в процентах к итогу
Не выполнившие план
3
12,5
Выполнившие план
21
87,5
24
100,0
Итого
Другим примером атрибутивного ряда распределения служит таблица 1.6, характеризующая распределение среднегодовой численности работников по отраслям экономики в 2006 году. Таблица 1.6 Отрасль экономики
Численность
Удельный вес в
работников, чел.
процентах к итогу
Всего по отраслям экономики
108616
100
производственный персонал)
36014
33,2
сельское и лесное хозяйство
11716
10,8
транспорт и связь
11462
10,6
строительство
11034
10,2
9361
8,6
4218
3,9
24811
22,7
в том числе: промышленность (промышленно-
торговля, общественное питание, материально-техническое снабжение и сбыт, заготовки жилищно-коммунальное хозяйство и бытовое обслуж. населения прочие отрасли народного хозяйства (здравоохранение, народное образование, культура, аппарат органов управл. и т. д.)
Таблица 1.6 дает наглядное представление о распределении работников в регионе по отраслям экономики. 13
При построении атрибутивных рядов распределения не возникает проблемы расчета численности групп, размера интервалов, так как сам признак часто предопределяет их число. Например, распределение населения по полу дает всего две группы населения: мужчин и женщин; распределение по образованию столько групп, сколько видов образования, и т. д. Контрольные вопросы для закрепления 1. В чем заключается суть сводки статистических материалов? 2. Какие существуют виды сводки? 3. Какие задачи решаются в статистике при помощи метода группировок? 4. Какие существуют виды группировок? 5. Чем
надо
руководствоваться
при
выборе
группировочных
признаков? 6. Как определить число групп? 7. Какие бывают интервалы? 8. Что понимается под классификацией в статистике? 9. Как
определить
величину
группировочного
интервала
вариационного признака? 10. Что представляет собой ряды распределения? 11. По
каким
признакам
могут
быть
образованы
ряды
распределения? 12. Что такое полигон и гистограмма, для чего они применяются и как строятся? 13. Что такое частность ряда распределения?
14
Задачи. 1.1. Имеются следующие данные о тарифных разрядах 50 рабочих : 5 6 4 5
2 4 2 2
3 2 3 1
1 3 2 4
1 4 2 3 5 4 6 1 2 4 5 4 2 3 5 6 4 5 2 3 1 6 1 4 5 6 1 2 3 5 2 4 6 3
Требуется: 1. Построить ряд распределения рабочих по тарифному разряду и выделить основные элементы ряда. 2. Построить график распределения рабочих по тарифному разряду. 3. Сделать выводы. 1.2. Имеются следующие данные о возрасте студентов: 16; 17; 18; 19; 20; 16; 15; 17; 18; 19; 21; 17; 18; 18; 21; 17; 18; 17; 20; 21; 17; 18; 16; 17; 16; 19; 20; 16; 19; 20.
Т р е б у е т с я : 1. Построить вариационный дискретный ряд. 2. Указать элементы ряда распределения. 3. Построить график. 1.3. Имеются следующие данные о производственном стаже рабочих цеха: 5 2 5 1 3
Требуется:
1 1 1 0 4
7 4 3 3 11
2 4 15 9 5
1 2 1 9 7
5 3 20 12 15
8 10 3 2 0 6 2 8 4 5
0 3 7 0 9
7 1 1 14 4
2 3 5 4 2 2 3 12 2 4 0 15 11 9 10
1 3 6 9 2
1. Построить интервальный вариационный ряд,
выделив 5 групп с равными интервалами. 2. Сделать выводы 1.4. Имеются следующие данные о заработной плате работников предприятия за один месяц 2007 года (тыс. р.) 20,9; 17,1; 23,2; 16,1; 13,5; 17,9; 20,4; 25,2; 12,3; 19,8; 17,2; 18,6; 23,0; 11,8; 16,4; 22,3; 19,0; 14,2; 13,6; 24,3; 17,4; 12,6; 22,3; 19,6; 18,1; 19,4; 18,0; 11,2; 18,7; 11,6; 22,9; 18,7; 12,8; 16,2; 16,0; 26,7; 15,9; 30,1; 19,2; 20,7.
Т р е б у е т с я : 1. Построить ряд распределения по размеру месячной заработной платы, выделив семь групп с равными интервалами. 2. Указать элементы ряда. 3. Построить график.
15
1.5. Имеются следующие данные о стоимости основных фондов предприятий отрасли (млн р.) 195,8; 10,0; 198,3; 16,3; 16,3; 111,2; 180,3; 12,0; 4,0; 154,4; 140,0; 15,4; 190,0; 19,3; 15,6; 111,0; 130,2; 40,0; 70,8; 40,0; 65,6; 60,0; 66,0; 11,6; 17,8; 210,2; 230,4; 210,4; 230,0; 251,4; 112,2; 155,6; 11,4; 122,0; 11,8; 50,0; 110,2; 180,0; 90,6; 20,0; 24,0; 60,0; 100,4; 50,0; 18,0; 144,6; 180,2; 210,4; 145,6; 250,0; 165,8.
Т р е б у е т с я : 1. Построить вариационный интервальный ряд, выделив шесть групп с равными интервалами. 2. Указать элементы ряда распределения. 3. Построить график. 4. Сделать выводы по результатам группировки. 1.6. По данным таблицы 1.1 п о с т р о й т е ряд распределения по числу работающих, образовав пять групп предприятий с равными интервалами. Сделайте выводы. 1.7. По данным таблицы 1.1 п р о и з в е д и т е распределение предприятий по проценту выполнения договора, образовав следующие группы предприятий: 1) не выполнившие договор; 2) выполнившие договор. Предприятия, выполнившие договор, р а с п р е д е л и т е на следующие подгруппы по проценту выполнения договора: от 100,0 до 104,9 %, от 105,0 до 114,9 %, свыше 115,0 %. Сделайте выводы. 1.8. По данным таблицы 1.1 п р о и з в е д и т е распределение предприятий по объему выпущенной продукции, образовав четыре группы предприятий с равными интервалами. Сделайте выводы.
16
2. СРЕДНИЕ ВЕЛИЧИНЫ ВЫБОРОЧНОЙ СОВОКУПНОСТИ И ПОКАЗАТЕЛИ ВАРИАЦИИ Прежде чем приступить к практическим занятиям, необходимо понять сущность средней
величины в выборочной совокупности,
являющейся обобщающей характеристикой выборочной совокупности однотипных явлений по изучаемому признаку. Необходимо учесть, что средняя
величина
должна
вычисляться
с
учетом
экономического
содержания определяемого показателя. Такой подход позволяет правильно определить среднюю величину признака, выбрать форму средней. Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений . Отдельные значения признака называют вариантами и обозначают через x
n,
( x1,x2,x3,..xn),
число единиц в совокупности обозначают через
среднее значение признака через
x.
Следовательно, средняя
арифметическая простая равна:
x=
x1 + x2 + x3 + … + xn ∑ x = .. n n
Простая средняя арифметическая применяется в случаях, когда имеются отдельные значения признака, т. е. данные не сгруппированы. Если данные представлены в виде рядов распределения или группировок, то средняя исчисляется как средняя арифметическая взвешенная:
x1 ⋅ f 1 + x 2 ⋅ f 2 + x3 ⋅ f 3 +…+ xn ⋅ fn ∑ xf = x= f 1 + f 2 + f 3 +…+ fn ∑ f
.
Из формулы видно, что средняя зависит не только от значений признака, но и от их частот, т. е. от состава совокупности, от ее структуры. 17
Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных
вариационных
рядов
с
закрытыми
или
открытыми
интервалами. Рассмотрим расчет средней арифметической для таких рядов (см. табл. 2.1). И с ч и с л и м среднюю выработку продукции одним рабочим за смену. В данном ряду варианты усредняемого признака (продукции за смену) представлены не одним числом, а в виде интервала «от – до». Рабочие первой группы производят продукцию от 3 до 5 шт., рабочие второй группы – от 5 до 7 шт. и т. д. Таким образом, каждая группа ряда распределения имеет нижнее и верхнее значения вариант, или закрытые интервалы. Исчисление средне по группированным данным производится по формуле средней арифметической взвешенной:
∑ xf X= ∑ f
. Таблица 2.1
Группы рабочих по количеству произведенной продукции за смену., штук
Число рабочих
Середина интервала
f
x
3–5 5–7 7–9 9–11 11–13
10 30 40 15 5
4 6 8 10 12
40 180 320 150 60
Итого
100,0
-
750
xf
Чтобы применить эту формулу, необходимо варианты признака выразить одним числом (дискретным). 18
За такое дискретное число принимается средняя арифметическая простая из верхнего и нижнего значений интервала. Так, для первой группы дискретная величина х будет равна:
3+5 =4. 2 Дальнейший расчет производится обычным методом определения средней арифметической взвешенной:
x=
∑ xf 750 = = 7 ,5 (шт.) ∑ f 100
Итак, все рабочие произвели 750 шт. изделий за смену, а каждый в среднем произвел 7,5 штук. Для измерения степени варьировании (однородности) признаков выборочной совокупности служат показатели вариации. Основными
обобщающими
показателями
вариации
признаков
выборочной совокупности в статистике являются дисперсия и среднее квадратическое отклонение и коэффициент вариации. Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. Дисперсия обычно называется средним квадратом отклонений и обозначается
σ2.
В
зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой или взвешенной:
σ2 =
∑(
x−x n
)
2
– дисперсия невзвешенная (простая); 19
σ
2
∑( =
Среднее
x−x
∑f
)
2
f – дисперсия взвешенная.
квадратическое
отклонение
представляет
собой
корень
квадратный из дисперсии и обозначается:
σ=
∑(
x−x
)
2
– среднее квадратическое отклонение
n
невзвешенное;
σ=
∑ ( x − x) ∑f
2
f – среднее квадратическое отклонение взвешенное.
Среднее
квадратическое
отклонение
–
это
обобщающая
характеристика абсолютных размеров вариации признака в совокупности. Выражается оно в тех же единицах, что и выборочный признак (в метрах, тоннах, процентах, гектарах и т.д.) Коэффициент вариации – это отношение среднего квадратического отклонения к средней арифметической в процентах:
V =
σ ⋅ 100 x
.
В отличие от среднего квадратического отклонения коэффициент вариации является величиной относительной, что очень удобно для сравнения вариаций в любых совокупностях. По величине коэффициента вариации можно судить о степени вариации признаков изучаемой совокупности. Чем больше его величина,
20
тем больше разброс значений признака выборочной совокупности вокруг выборочной средней, тем менее представительна средняя. Если совокупность разбита на группы (или части) по изучаемому признаку, то для такой совокупности могут быть исчислены следующие виды дисперсий: общая, групповые (частные), средняя из групповых (остаточная дисперсия), межгрупповая. Общая дисперсия равна среднему квадрату отклонений отдельных значений признака x от общей средней
x.
Она может быть исчислена как простая средняя или как взвешенная соответственно по формулам:
(
∑ x−x 2 σ = n
)
(
2
∑ x−x 2 σ = ∑f
;
)
2
f
⋅
Общая дисперсия отражает вариацию признака за счет всех условий и причин, действующих в совокупности. Групповая (частная) дисперсияравна среднему квадрату отклонений отдельных значений признака внутри группы от средней арифметической этой группы (групповой средней). Она может быть исчислена как простая средняя или как взвешенная соответственно по формулам:
σi
2
∑( =
x − xi
)
2
n
σi
;
2
∑( =
x − xi
∑
)
f
2
f
⋅
Эта дисперсия отражает вариацию признака только за счет условий и причин, действующих внутри группы. Средняя
из
групповых
(частных)
дисперсий
арифметическая, взвешенная из дисперсий групповых:
21
–
это
средняя
σ f ∑ = ∑f 2
σi
2
Межгрупповая дисперсия групповых средних
xi
равна среднему квадрату отклонений
x:
от общей средней
δ
2
⋅
i
x − x) ( ∑ = ∑f i
2
f
⋅
Межгрупповая дисперсия характеризует вариацию результативного признака за счет группировочного признака. Между указанными видами дисперсий существует определенное соотношение: общая дисперсия равна сумме средней из групповых дисперсий и межгрупповой дисперсии:
σ 2 = σ i + δ 2⋅ 2
Это соотношение называют правилом сложения дисперсий. С его помощью, зная два вида дисперсий, можно определить третий:
δ2 = σ2 −σi ;
σ i = σ 2 − δ 2⋅
2
2
Поясним правило сложения на примере. По имеющимся данным о производительности ткачей за час работы ( см. табл. 2.2) и с ч и с л и м: 1)
групповые
дисперсии;
2)
среднюю
из
групповых
дисперсий;
3) межгрупповую дисперсию; 4) общую дисперсию. 1. Для расчета групповых дисперсий исчислим средние по каждой группе:
X1 =
90 = 15( м ), 6
X2 =
126 = 21( м ). 6
Расчет дисперсий по группам представлен в таблице. Подставив полученные значения в формулу, получим:
22
σ
×−× ) ( ∑ =
2
1
2 1
=
n
σ 22 =
∑(
× − ×2
10 = 1, 666 = 1, 67; 6
)
2
=
n
28 = 4, 66; 6 Таблица 2.2
ИзготовлеТаб. но-
но ткани
Таб. Изготовлено
трехстаноч- X − X i
мер
никами за
ткача
1час ( Х),
(
X − Xi
)
2
номер ткани четырехткача станочниками за 1 час (Х),
м
X − Xi
(X − X ) i
м
1
13
-2
4
7
18
-3
9
2
14
-1
1
8
19
-2
4
3
15
0
0
9
22
1
1
4
17
2
4
10
20
-1
1
5
16
1
1
11
24
3
9
6
15
0
0
12
23
2
4
Итого
90
10
126
28
2. Рассчитаем среднюю из групповых ( частных ) дисперсий:
∑σ f = ∑f 2
σ
2
i
=
1, 67 × 6 + 4, 66 × 6 10 + 28 38 = = = 3,16. 12 12 12
3. Исчислим межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:
X=
∑Xi f ∑f
=
15 × 6 + 21 × 6 90 + 126 = = 18 (м). 12 12 23
2
Затем рассчитаем межгрупповую дисперсию: δ = 2
(
)
Σ Xi − X
∑f
2
f
(15 − 18) =
2
× 6 + ( 21 − 18 ) × 6 9 × 6 + 9 × 6 108 = 9⋅ = = 12 12 12 2
4. Исчислим общую дисперсию по правилу сложения дисперсий: 2
σ 2 = σ i + δ 2 = 3,16 + 9 = 12,16. Проверим полученный результат, исчислив общую дисперсию обычным способом: (13 − 18) 2 + (14 − 18) 2 + (15 − 18) 2 + (17 − 18) 2 +
σ
2
∑( X − X ) =
+(16 − 18) 2 + (15 − 18) 2 + (18 − 18) 2 + (19 − 18) 2 +
2
+(22 − 18) 2 + (20 − 18) 2 + (24 − 18) 2 + (23 − 18) 2 146 = = = 12,16. 12 12
n
Контрольные вопросы для закрепления 1. В чем состоит сущность и значение средних величин? 2. Какие виды средних величин вы знаете? 3. В каких случаях применяется средняя арифметическая простая и взвешенная? Порядок их определения и формулы исчисления. 4. В каких случаях применяется средняя гармоническая? Назовите порядок ее определения и формулу исчисления. 5. Изложите
особенности
исчисления
средних
величин
из
интервального ряда с открытыми и закрытыми интервалами. 6. Что такое мода и медиана в статистике? Порядок их определения. 7. Что такое вариация признака и в чем обусловлена необходимость ее изучения. 8. Какими показателями изучается вариация. 9. В
чем
специфика
расчета
показателей
вариации
сгруппированных и несгруппированных данных. 10. Каковы свойства дисперсии. 11. Какие виды дисперсии вам известны и что они характеризуют. 24
для
12. Для каких целей и как вычисляют коэффициент вариации. 13. Что такое правило сложения дисперсии и где оно применяется. 14. В чем особенности измерения вариации альтернативных признаков? Задачи 2.1. Имеются следующие данные о выпуске продукции по 23 предприятиям отрасли (млн р.): Таблица 2.3
№ предприятия
Выпуск продукции
№ предприятия
Выпуск продукции
1 2 3 4 5 6 7 8 9 10 11 12
28 94 19 25 35 32 23 25 86 15 32 42
13 14 15 16 17 18 19 20 21 22 23
34 13 34 50 4 36 60 32 2 56 54
И с ч и с л и т е средний размер продукции на одно предприятие. 2.2. По четырем заводам, производящим продукцию А, имеются следующие данные (см. табл. 2.4).
Затраты времени на единицу
Таблица 2.4 Произведено продукции,
№ завода
продукции, мин.
шт.
1
40
1 200
2
42
1 000
3
50
800
4
38
200
25
О п р е д е л и т е
среднее значение затрат времени (среднюю
трудоемкость) на изготовление единицы продукции по четырем заводам. 2.3. Имеются следующие данные о посевной площади и урожайности культуры по бригадам хозяйства (табл. 2.5). Таблица 2.5 № бригады
Урожайность, ц / га
Посевная площадь, га
I
27
200
II
24
280
III
26
350
IV
30
170
О п р е д е л и т е среднюю урожайность культуры по хозяйству. 2.4. Имеются следующие данные о составе строительных бригад (табл. 2.6). Таблица 2.6 Группы бригад по числу рабочих, чел.
Группы бригад по числу рабочих, чел.
Число бригад
Число бригад
16–20
80
36–40
40
21–25
44
41–45
20
26–30
100
46–50
16
31–35
200
Итого:
500
О п р е д е л и т е среднее число рабочих в бригаде. 2.5. Состав работников предприятия по стажу работы характеризуется следующими показателями (табл. 2.7).
26
Таблица 2.7 Группы работников по стажу, лет
Число рабочих, чел.
Число служащих, чел.
Группы работников по стажу, лет
Число рабочих,
Число служащих,
чел.
чел.
1–3
26
5
10–15
12
17
3–5
30
12
15–20
5
13
5–10
25
43
Свыше 20
2
10
100,0
100,0
Итого:
О п р е д е л и т е средний стаж работы: 1) рабочих; 2) служащих.
С р а в н и т е полученные результаты. 2.6. В результате выборочной проверки получено следующее распределение рабочих по проценту допускаемого брака (табл. 2.8). Таблица 2.8 Процент допускаемого брака
Число рабочих в цехе
Число рабочих в цехе
№ 1,чел.
№ 2,чел.
0,5–1,0
4
2
1,0–2,0
20
12
2,0–3,0
16
20
3,0–5,0
5
15
Свыше 5,0
5
1
Итого:
50
50
И с ч и с л и т е средний процент брака, допускаемого рабочими: 1) в цехе № 1; 2) в цехе № 2; 3) в целом по предприятию. 2.7. Имеются следующие данные о распределении заводов цементной промышленности по величине производственной мощности (табл. 2.9).
27
Таблица 2.9 Производство цемента в год, тыс.т
Удельный вес заводов в процентах к итогу
До 100
10
100–200
15
200–300
25
300–500
21
500–700
16
Свыше 700
13
Итого:
100
В ы ч и с л и т е среднее производство цемента в год на одном заводе. При расчетах принять значение варианты для первой группы равным 70. 2.8. Для изучения качества пряжи было проведено обследование 100 одинаковых по массе образцов пряжи, в результате чего получены следующие результаты (табл. 2.10). Таблица 2.10 Группы образцов пряжи по крепости нити, г
Число проб
До 160
3
160–180
5
180–200
25
200–220
40
220–240
20
240–260
7
Итого:
100
О п р е д е л и т е среднюю крепость нити. 2.9.
Распределение
рабочих
предприятия
характеризуется следующими данными (табл. 2.11).
28
по
возрасту
Таблица 2.11 35 и Возраст, лет
15–19
20–24
25–29
30–34
17,8
61,2
12,9
7,1
Число рабочих,% к итогу
Требуется
старше
1,0
определить: а) средний возраст рабочих; б) сделать
выводы. 2.10. В пригородных районах области были получены данные о выходе продукции на 100 га сельскохозяйственных угодий (табл. 2.12). Таблица 2.12 Продукция на 100 га
Число
угодий, тыс. руб.
хозяйств
10
2
12
5
17
7
20
3
22
2
25
1
Итого:
20
Т р е б у е т с я определить: 1) средний выход продукции на 100га по всем хозяйствам области; 2) показатели вариации; 3) сделать выводы. 2.11.
Имеются
следующие
данные
о
посевной
урожайности пшеницы по хозяйствам района (табл. 2.13).
29
площади
и
Таблица 2.13 2005 г.
2006 г.
Номер
Урожайность
Посевная
Урожайность
Валовой
хозяйства
пшеницы, ц/га
площадь, га
пшеницы, ц/га
сбор зерновых, ц
1
19,0
250
21,2
5 300
2
20,5
260
22,0
6 600
3
23,0
300
24,0
7 680
Т р е б у е т с я: 1) О п р е д е л и т ь среднюю урожайность: а) в 2005 г., б) в 2006 г. 2) На сколько изменилась средняя урожайность за прошедший период? 3) И с ч и с л и т ь
показатели вариации в 2006 г. (об изменении
урожайности). 2.12. Имеются следующие данные о распределении рабочих по выработке изделий за смену (табл. 2.14). Таблица 2.14 Число изделий, шт.
Кол-во рабочих, чел.
До 60
10
60–70
20
70–80
50
80–90
15
90–100
5
Итого :
100
В ы ч и с л и т е: 1) среднюю выработку изделий за смену одним рабочим; 2) дисперсию и среднее квадратическое отклонение; 3) коэффициент вариации. Сделайте выводы. 30
2.13. Имеются следующие данные по промышленному предприятию о среднегодовой выработке работающих и их среднесписочной численности за 2006 г. (табл. 2.15). Таблица 2.15 Среднегодовая выработка
Среднесписочное число
I работающего, тыс. руб.
работающих, чел.
До 300
400
300–400
1000
400–500
1200
Свыше 500
800
Итого:
3400
1) О п р е д е л и т ь среднегодовую выработку одного работающего по предприятию в целом и указать вид средней. 2) В ы ч и с л и т е показатели вариации. Сделайте выводы. 2.14. Имеются следующие данные о распределении предприятий одной из отраслей промышленности по стоимости основных фондов (табл. 2.16). Таблица 2.16
Группы предприятий по размеру
1–3
3–5
5–7
7–9
9–11
основных фондов, млн р.
более 11
Число предприятий в процентах к итогу
13
20
30
15
10
12
О п р е д е л и т ь: 1) средний размер предприятий по величине основных фондов. 2) показатели вариации. Сделайте выводы. 2.15. Выпуск продукции по пятидневкам на характеризуется следующими данными (табл. 2.17).
31
двух
предприятиях
Таблица 2.17 Номер
Единицы
Выпуск продукции по шестидневкам
Итоги
измерения предприятия
продукции
I
II
III
IV
V
VI
1
млн р.
11
12
16
17
24
40
120
2
млн шт.
19
21
18
20
28
30
136
И с ч и с л и т е показатели вариации выпуска продукции: 1) по предприятию № 1; 2) по предприятию № 2. О п р е д е л и т е, какое предприятие работало более ритмично. 2.16. Для характеристики производственного стажа работников одной из отраслей промышленности проведено обследование различных категорий работников. Результаты обследования систематизированы в виде следующей таблицы (табл. 2.18). И с ч и с л и т е коэффициент вариации стажа рабочих. Сделайте выводы. Группы работников по стажу работы, лет
Таблица 2.18 Удельный вес работников по стажу в % к итогу рабочие
мастера
технологи
До 2
7
1
-
2–4
15
10
3
4–6
20
22
20
6–8
30
20
10
8–10
10
23
32
10–12
8
7
20
12–14
2
6
10
Свыше 14
8
11
5
Итого:
100
100
100
2.17. Затраты труда на 1 ц в хозяйствах области за отчетный год характеризуется следующими данными (табл. 2.19).
32
Таблица 2.19 Группы хозяйств по затратам
Число хозяйств
труда на 1 ц зерна, чел./час. 0,8–1,2
101
1,2–1,6
90
1,6–2,0
70
2,0–2,4
15
2,4–2,8
20
2.8 и выше
4
Итого:
300
И с ч и с л и т е дисперсию затрат труда по формуле
σ 2 = x 2 − ( x )2 .
2.18. Распределение предприятий по объему выпуска продукции за год характеризуется следующими данными (табл. 2.20). Таблица 2.20 Продукция за год, млн р.
Число предприятий
До 2
2
2–4
5
4–6
8
6–8
3
8–10
2
Итого:
20
И с ч и с л и т е дисперсию выпуска продукции, используя формулу
σ 2 = x 2 − ( x )2 . 2.19. Имеются следующие данные о производительности труда рабочих (табл. 2.21).
33
Таблица 2.21 Табельный номер
Произведено продукции, шт.
рабочего
в дневную смену
в ночную смену
1
5
5
2
8
6
3
7
4
4
4
4
5
6
6
И с ч и с л и т е: 1) частные дисперсии; 2) среднюю из частных дисперсий; 3) межгрупповую дисперсию; 4) общую дисперсию (по правилу сложения дисперсий и обычным способом). 2.20. На рынках города в марте зарегистрированы следующие цены на сельскохозяйственную продукцию (табл. 2.22). Таблица 2.22 № рынка
Цена 1 кг, р.
I
10 15 20 17 12 15 15 15 20 20 17 12 15 20 17
II
20 25 25 20 18 17
III
15 15 20 17 17 20 20 15 18 18 17 25 20 15 18
И с ч и с л
17 18 20 20
и т е:
1) групповые (частные) дисперсии; 2)
межгрупповую дисперсию; 3) среднюю из групповых (остаточную) дисперсию; 4) общую дисперсию (по правилу сложения дисперсий и обычным способом). 2.21. Бригада рабочих механического цеха, состоящая из 10 человек, к концу месяца имела следующие показатели по выполнению норм выработки (табл. 2.23). 34
Таблица 2.23 Группа рабочих по степени выполнения договора, %
Процент выполнения договора
До 100
90
95
85
92
Свыше 100
100
102
104
103
105
104
И с ч и с л и т е : 1) групповые дисперсии; 2) межгрупповую дисперсию; 3) среднюю из групповых (остаточную) дисперсию; 4)общую дисперсию (обычным способом и по правилу сложения дисперсий). 2.22. Имеются показатели распределения основных фондов по заводам отрасли (табл. 2.24). Таблица 2.24 Группы заводов по стоимости основных фондов, млн р.
Число заводов
Основные фонды в среднем на заводе, млн р.
Групповые дисперсии
1,2–2,7
9
1.8
0,17
2,7–4,2
11
3.2
0,09
4,2–5,7
7
4.8
0,25
5,7–7,2
3
6.9
0,14
О п р е д е л и т е
общую дисперсию основных фондов по
совокупности заводов, применяя правило сложения дисперсий. 2.23. Имеются следующие данные о распределении рабочих по проценту допускаемого брака в процессе производства (табл. 2.25). Таблица 2.25 Процент брака
Кол-во рабочих, чел.
до 1 1–3 3–5 5–7 Свыше 7
7 20 15 5 3
Средний процент брака продукции на одного рабочего 0,8 2,3 3,7 5,9 7,8
Среднее квадратическое отклонение (%) 0,67 0,65 0,51 0,48 0,82
И с ч и с л и т е общую дисперсию допускаемого рабочими брака продукции, применяя правило сложения дисперсий. 35
3. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Средняя ошибка выборки для средней показывает среднюю величину всех возможных расхождений выборочной и генеральной средней. При случайном повторном отборе средняя ошибка выборочной средней
рассчитывается по формуле:
где
μ–
σ2
μ=
n
,
средняя ошибка выборочной средней;
выборочной совокупности;
σ2–
дисперсия
n – численность выборки.
При бесповторном отборе она рассчитывается по формуле:
μ= где
σ2 ⎛
n⎞ 1 − ⎜ ⎟, n ⎝ N⎠
N – численность генеральной совокупности, n⎞ ⎛ ⎜ 1 − ⎟ – доля признаков не попавших под обследование. ⎝ N⎠ ( Δ ) рассчитывается по формуле
Предельная ошибка выборки
Δ = μ ⋅ t , где t – коэффициент доверия, зависит от значения вероятности P(t). Значения t при заданной вероятности значений функции ϕ
(t ) ,
Р(t)
определяются по таблице
которая выражается интегральной формулой
Лапласа, и отражают зависимость между t и вероятностью Р(t):
Р(t) t
0,683 0,866 0,954 0,988 0,997 0,999 1,0
1,5
2,0
36
2,5
3,0
3,5
При механическом отборе средняя ошибка выборки рассчитывается по формуле собственно-случайного бесповторного отбора. Задача 1. Методом случайной повторной выборки было взято для проверки на вес 200 шт. деталей . В результате был установлен средний вес детали 30 г при среднем квадратическом отклонении 4 г. С вероятностью 0,954 требуется определить пределы, в которых находится средний вес деталей в генеральной совокупности. Генеральная средняя
x
отличается от выборочной средней
~ x
на
величину ошибки выборки Δ :
x=~ x ± Δ ~x . Чтобы определить границы генеральной средней с вероятностью 0,954, необходимо
рассчитать
предельную
ошибку
выборочной
средней.
Предельная ошибка выборки для средней определяется по формуле при
повторном отборе:
Δx = t
σ2 n
.
С вероятностью 0,954 ошибка выборки
не превысит двух средних ошибок, так как значение равно 2. Подставим значения в формулу ошибки выборки:
42 Δx = 2 = 0,56 г. 200 Определим верхнюю границу генеральной средней:
x=~ x + Δ ~x =30 г+0,56 г=30,56 г. Определим нижнюю границу генеральной средней: 37
t
при
Р(t) = 0,954
x=~ x − Δ ~x =30 г – 0,56 г = 29,44 г. С вероятностью 0,954 можно утверждать, что средний вес детали в генеральной совокупности находится в пределах 29,44 г <
x < 30,56 г.
Задача 2. В районе А проживает 2500 семей. Для установления среднего числа детей в семье была проведена 2 % случайная бесповторная выборка семей. В результате обследования были получены следующие данные (табл. 3.1). Таблица 3.1 Число детей в семье
0
1
2
3
4
5
Число семей
10
20
12
4
2
2
С вероятностью 0,997 требуется определить границы, в которых будет находиться среднее число детей в семье в генеральной совокупности (в городе А). Генеральная средняя
x = ~ x ± Δ ~x .
Чтобы определить границы генеральной средней, необходимо рассчитать выборочную среднюю и ошибку выборочной средней. Рассчитаем среднее число детей в семье в выборочной совокупности (табл. 5.2).
∑ xf x= ∑f
74 = = 1,5 чел.; 50
Предельная
ошибка
σ
2
∑ ( x − x) = ∑f
2
выборочной
f
=
76,5 = 1,53 ≈ 1,5 . 50
средней
случайном отборе рассчитывается по формуле:
38
при
Δ ~x = t
бесповторном
σ2 ⎛
n⎞ ⎜1 − ⎟ . n ⎝ N⎠
С вероятностью 0,997 наша ошибка выборки не превышает трех средних ошибок:
Δx = 3
1,5 ⎛ 50 ⎞ ⎜1 − ⎟ = 0, 5. 50 ⎝ 2500 ⎠
Определим пределы, в которых находится среднее число детей в
x = x ± Δx = 1,5 ± 0,5.
семье в городе А:
С вероятностью 0,997 можно утверждать, что среднее число детей в семье в городе А находится в пределах 1,0<
x <2,0
. Таблица 3.2
Число детей в семье
х
Количество семей
f
xf
x−~ x
( x − x~ ) 2
( x − ~x ) 2 f
0
10
0
–1,5
2.25
2,5
1
20
20
–0,5
0.25
5,0
2
12
24
+0,5
0.25
3,0
3
4
12
+1,5
2.25
9,0
4
2
8
+2,5
6.25
12,5
5
2
10
+3,5
12.25
24,5
Итого:
50
74
-
-
76,5
При повторном отборе средняя ошибка выборочной доли рассчитывается по формуле
μ=
w(1 − w) n
39
,
где
w=
признаком;
m n
– выборочная доля, доля единиц, обладающих изучаемым
w( 1-w ) – дисперсия альтернативного признака;
единиц, обладающих изучаемым признаком;
n
m
–число
– численность выборки.
Задача 3. При обследовании 100 образцов изделий, отработанных из партий в случайном порядке, оказалось 20 нестандартных. С вероятностью 0,954 о п р е д е л и т е пределы, в которых находится доля нестандартной продукции в партии. Генеральная доля равна:
P = w ± Δ w .Чтобы определить границы
генеральной доли, необходимо определить выборочную долю и ошибку выборочной доли. Рассчитаем
долю
нестандартной
продукции
в
выборочной
совокупности:
w=
m 20 ; w= = 0,2 . n 100
Предельная ошибка выборочной доли с вероятностью 0,954 составит:
Δ=t
w(1 − w) n
=2
0,2 ⋅ 0,8 = 0,08. 100
Определим нижнюю границу генеральной доли
w − Δ w = 0,2 − 0,08 = 0,12. Определим верхнюю границу генеральной доли
w − Δ w = 0,2 + 0,08 = 0,28.
40
Вывод: с вероятностью 0,954 можно утверждать, что доля нестандартной продукции в партии товара находится в пределах 12 %
≤ p ≤ 28 %. При бесповторном способе отбора средняя ошибка выборочной доли
определяется по формуле:
w(1 − w) ⎛ n⎞ 1 − ⎜ ⎟. ⎝ n N⎠
μ=
Задача 4. В городе 500 тыс. жителей. По материалам учета городского населения было обследовано 50 тыс. жителей методом случайного
бесповторного
отбора.
В
результате
обследования
установлено, что в городе 15 % жителей старше 60 лет. Генеральная доля равна P ±Δ w . Выборочная доля равна w=15%. С вероятностью 0,683 определим ошибку выборки для доли:
w(1 − w) ⎛ 0,15 ⋅ 0,85 n⎞ ⋅ 0,9 = 0,048 ≈ 0,05, ⎜1 − ⎟ = 1 ⋅ ⎝ n N⎠ 50
Δw = t или 5 % Определим
верхнюю
границу
генеральной
доли:
Рв = 0,15 + 0,05 = 0,20 (или 20 %). Определим
нижнюю
границу
генеральной
Pв = 0,15 –
доли:
0,05 = 0,1 (или 10 %). Вывод: с вероятностью 0,683 можно утверждать, что доля жителей в возрасте 10 %
старше
≤ p≤
60
лет
в
городе
А
находится
в
пределах
20 %.
В практике проектирования выборочного наблюдения возникает потребность определения численности выборки, которая необходима для 41
обеспечения точности расчета генеральных средних. Предельная ошибка выборки и ее вероятность при этом являются заданными. При бесповторном случайном отборе необходимая численность выборки вычисляется по формуле:
t 2σ 2 N n= . 2 2 2 NΔ + t σ Задача 5. В районе А проживает 2000 семей. В порядке случайной бесповторной выборки предполагается о п р е д е л и т ь средний размер семьи. Какова должна быть численность выборочной совокупности при условии, что с вероятностью
Р(t)=0,954
ошибка выборочной средней не
должна превышать 0,8 человека и при среднем квадратическом отклонении 2 человека. Рассчитаем необходимую численность выборки:
n= При
повторном
4 ⋅ 4, 0 ⋅ 2000 = 24 семьи. 2000 ⋅ 0, 64 + 4 ⋅ 4, 0 случайном
отборе
численность
выборки
определяется по формуле
t 2σ 2 n= 2 . Δ Задача 6. Для определения средней длины детали необходимо провести выборочное обследование методом случайного повторного отбора. Какое количество деталей надо отобрать, чтобы ошибка выборки не превышала 2 мм, с вероятностью 0,954 при среднем квадратическом отклонении 8 мм? Рассчитаем необходимую численность выборки:
2 2 ⋅ 82 n= = 64 детали. 4 42
При случайном бесповторном отборе для расчета необходимой численности выборки для определения доли с заданной точностью применяется следующая формула:
n=
t 2 w(1 − w) N
Δ2 N + t 2 w(1 − w)
или формулу:
0,25t 2 N n= 2 , 2 Δ N + 0,25t если дисперсия доли неизвестна. Задача 7. В городе А 10 тыс. семей.
В порядке
механической
выборки предполагается определить долю семей в городе А с числом детей 3 и более. Какова
должна быть численность выборки, чтобы с
вероятностью 0,954 ошибка выборки не превышала 0,02 человека, если на основе предыдущих обследований известно, что дисперсия равна 0,2. Рассчитываем необходимую численность выборки:
n= При
4 ⋅ 0,2 ⋅ 10000
(0,02)
повторном
2
= 1666
⋅ 10000 + 4 ⋅ 0,2
способе
отборки
семей.
численность
выборки
рассчитывается по формуле:
n=
w(1 − w)t 2 Δ2
.
Задача 8. Используя данные условия предыдущей типовой задачи, рассчитаем необходимую численность выборки при условии, что метод отбора повторный.
4 ⋅ 0,2 n = = 2000 семей. Численность выборки: 0,0004 43
Если известны коэффициенты вариации и предельная ошибка выборки (в процентах к средней), объем собственно-случайной выборки целесообразно определять по следующим формулам:
n=
при повторной выборке
при бесповторной выборке
2
2
⎛ Δ⎞ ⎜ _⎟ ⎜ ⎟ ⎝ x⎠
2
tv
n=
;
Nt
2
2
v
2
⎛ ⎞ Δ 2 2 N⎜ _ ⎟ + t v ⎜ ⎟ ⎝ x⎠
.
Контрольные вопросы для закрепления 1. Какие преимущества выборочного наблюдения делают его важнейшим источником статистической информации? 2. Назовите
общие
и
специфические
этапы
выборочного
наблюдения? 3. Охарактеризуйте сферы применения и особенности различных способов формирования выборочной совокупности. 4. Какие факторы влияют на определения объема выборки при различных способах отбора единиц для обследования? 5. Как определяется выборочная дисперсия: а) для средней и для доли; б) для качественных альтернативных признаков? 6. Что такое корректировка материалов выборочного наблюдения? 7. Какие
способы
распространения
выборочных
генеральную совокупность вы знаете? Изложите их.
44
данных
на
Задачи 3.1. В порядке механической выборки было подвергнуто испытанию на разрыв 100 нитей из партии. В результате обследования установлена средняя крепость пряжи 320 г при среднем квадратическом отклонении 20 г. С вероятностью 0,954 о п р е д е л и т е
пределы, в которых
находится средняя крепость пряжи в партии. 3.2. Для определения зольности угля месторождения в порядке случайной
выборки
взято
установлена средняя
400
проб.
В
результате
зольность угля в выборке
исследования
16 %
при среднем
квадратическом отклонении 4 %. С вероятностью 0,997 о п р е д е л и т е пределы, в которых находится средняя зольность угля месторождения. 3.3. В порядке случайной повторной выборки из партии было взято 100 проб продукта А. В результате исследования установлена средняя влажность продукта
А в выборке
9%
при среднем квадратическом
отклонении 1,5 %. С вероятностью 0,954 о п р е д е л и т е пределы, в которых находится средняя влажность продукта А в партии. 3.4. В порядке случайной выборки обследовано 900 деревьев, по этим данным установлен
средний диаметр одного дерева
235 мм и
среднее квадратическое отклонение равно 27 мм. С вероятностью 0,683 о п р е д е л и т е границы, в которых будет находиться средний диаметр деревьев в генеральной совокупности. 3.5. На заводе с числом рабочих 1000 человек было проведено 5 % выборочное
обследование
возраста
рабочих
методом
случайного
бесповторного отбора. В результате обследования получены следующие данные : возраст рабочих, лет число рабочих
до 30 8
30–40 22
40–50 10
С вероятностью 0,997 о п р е д е л и т е находится средний возраст рабочих завода. 45
50–60 6
свыше 60 4
пределы, в которых
3.6.
Для
изучения
машиностроительном
производительности
заводе
было
труда
проведено
токарей
10 %
на
выборочное
обследование 100 рабочих методом случайного бесповторного отбора. В результате обследования получены данные о часовой выработке рабочих: часовая выработка, шт.
18–20
20–22
22–24
24–26
26–28
2
8
24
50
12
число рабочих
С вероятностью 0,997
о п р е д е л и т е
28–30 4
пределы, в которых
находится среднее время обработки одной детали токарями завода. 3.7. В районе 2 000 семей. С целью определения среднего количества детей в семье района было проведено 3 % выборочное обследование семей методом случайного бесповторного отбора. В результате обследования получены следующие данные: Количество детей в семье, чел.
0
1
2
3
4
5
6
7
8
число семей
4
8
14
16
8
4
3
2
1
С вероятностью 0,997 о п р е д е л и т е
пределы, в которых
находится среднее количество детей в семьях района. 3.8. При обследовании 500 образцов изделий, отобранных из партии готовой продукции предприятия в случайном порядке, 40 оказалось нестандартными. С вероятностью 0,954 о п р е д е л и т е
пределы, в
которых находится доля нестандартной продукции, выпускаемой заводом. 3.9.
Научно-исследовательским
институтом
для
изучения
общественного мнения населения области о проведении определенных мероприятий в порядке случайного повторного отбора было опрошено 600 человек. Из числа опрошенных 360 человек одобрили мероприятия. С вероятностью 0,997 о п р е д е л и т е пределы, в которых находится доля лиц, одобривших мероприятия. 46
3.10. В порядке случайной повторной выборки было обследовано 80 предприятий, из
которых 20 предприятий имели долю нестандартной
продукции выше 0,5 %. С вероятностью 0,997 о п р е д е л и т е пределы, в которых находится доля предприятий, выпускающих более 0,5 % нестандартной продукции промышленности данной отрасли. 3.11. В порядке случайной повторной выработки было отобрано 400 единиц готовой продукции предприятия,
из которых 20 единиц были
забракованы. С вероятностью 0,954 о п р е д е л и т е
пределы, в
которых находится доля бракованной продукции предприятия. 3.12. В городе 2000 семей. По результатам переписи населения города методом случайного бесповторного отбора обследовано 80 семей. В результате обследования установлено, что 24 семьи состоят из четырех и более человек. С вероятностью 0,954
о п р е д е л и т е пределы, в
которых находится доля семей в городе, состоящих из четырех и более человек. 3.13. Для изучения мнения студентов о проведении определенных мероприятий из совокупности, состоящей из 10 тыс. человек, методом случайного бесповторного отбора опрошено 600 студентов. Из них 240 одобрили план мероприятий. С вероятностью
0,954 о п р е д е л и т е
пределы, в которых находится доля студентов, одобривших мероприятия, во всей совокупности. 3.14. Из
100 тыс. семей, проживающих в городе А, методом
случайного бесповторного отбора обследовано 2000 семей. Анкеты, посланные семьям, содержали вопрос: живет ли семья в квартире более 10 лет?
Из опрошенных семей 600 дали утвердительный ответ. С
вероятностью
0,997
о п р е д е л и т е
долю семей
в городе А,
проживающих в квартире более 10 лет, в генеральной совокупности.
47
3.15. Из 5 тыс. человек, совершивших правонарушения в течение года, было обследовано 500 правонарушителей методом механического отбора. В результате обследования установлено, что 300 человек выросли в ненормальных семейных условиях. С вероятностью 0,997 определите долю правонарушений, выросших в ненормальных семейных условиях в генеральной совокупности. 3.16. На заводе с числом рабочих 15 тыс. человек
в порядке
механической выработки предполагается определить долю рабочих со стажем
работы
20
лет и более. Какова должна быть численность
выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,03, если на основе предыдущих обследований известно, что дисперсия равна 0,2? Равна 0,16? 3.17. В городе Н с числом семей менее 10 тыс. предполагается методом
случайного бесповторного отбора определить долю семей с
детьми ясельного возраста. Какова
должна быть численность выборки,
чтобы с вероятностью 0,954 ошибка выборки не превышала 0,04, если на основе предыдущих обследований известно, что дисперсия равна 0,24? 3.18. На заводе с числом рабочих 12 тыс. необходимо установить долю рабочих, обучающихся в высших учебных заведениях, методом механического отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,997 ошибка выборки не превышала 0,08, если на основе предыдущих обследований известно, что дисперсия равна 0,16? 3.19. По данным задачи 3.16 о п р е д е л и т е численность выборки при условии, что метод отбора повторный. 3.20. По данным задачи 3.17 о п р е д е л и т е численность выборки при условии, что метод отбора повторный. 3.21. По данным задачи 3.18 о п р е д е л и т е численность выборки при условии, что метод отбора повторный. 48
3.22. По данным задачи 3.19 о п р е д е л и т е численность выборки при условии, что метод отбора повторный. 3.23. Для определения
среднего размера вклада
определенной
категории вкладчиков в сберегательных кассах города,
где число
вкладчиков 5000, необходимо провести выборку лицевых счетов методом механического
отбора.
Предварительно
установлено,
что
среднее
квадратическое отклонение размера вклада составляет 120 р. О п р е д е л и т е необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит 10 р. 3.24. Для установления среднего возраста 50 тыс. читателей библиотеке необходимо провести выборку из читательских
карточек
методом механического отбора. Предварительно установлено, что среднее квадратическое отклонение возраста читателей равно 10 годам. О п р е д е л и т е
необходимую численность выборки
при условии, что с
вероятностью 0,954 ошибка выборки будет не более двух лет. 3.25. На ткацкой фабрике работает 6 тыс. ткачей. Для установления норм
выработки
предполагается провести случайный бесповторный
отборткачей. Предварительным обследованием установлено, что среднее квадратическое отклонение дневной выработки составляет 25 м. О п р е д е л и т е
необходимую численность выборки при условии, что с
вероятностью 0,954 ошибка выборки не превышает 5 м. 3.26. На заводе, где работает 10 тыс. рабочих,
необходимо
установить их средний стаж работы методом механической выборки. Предварительным
обследованием
установлено,
что
среднее
квадратическое отклонение стажа равно 5 годам. О п р е д е л и т е необходимую численность выборки при условии, что с вероятностью 0,997 ошибка выборки не превысит 1,0 года.
49
3.27. В городе А с целью определения средней продолжительности поездки населения на работу обследование
предполагается
провести выборочное
методом случайного повторного отбора. Какова должна
быть численность выборки, чтобы с вероятностью 0,997 ошибка выборочной средней не превышала 5 мин. при среднем квадратическом отклонении 20 мин. 3.28. С целью определения среднего диаметра деревьев необходимо провести
выборочное
обследование
деревьев
методом
случайного
повторного отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборочной средней не превышала 15 см при среднем квадратическом отклонении 25 см. 3.29. С целью определения качества пряжи на прядильной фабрике предполагается провести выборочное обследование пряжи методом случайного повторного отбора.
Какова должна быть численность
выборки, чтобы с вероятностью 0,954 ошибка выборочной средней не превышала 4 г при среднем квадратическом отклонении 20 г. 3.30. На заводе предполагается провести выборочное обследование средней часовой выработки рабочих методом случайного повторного отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка не
превышала 5 шт., если на основе предыдущих
обследований известно, что дисперсия равна 225. 3.31. Для определения среднего уровня квалификации рабочих цеха произведено 20% выборочное обследование по способу случайного бесповторного отбора. Распределение рабочих по тарифному разряду по данным обследования оказалось следующим (табл. 3.3). Тарифные разряды
1
2
3
4
Кол-во рабочих
5
10
25
30
50
5
6 16
14
Таблица 3.3 Всего 100
О п р е д е л и т е: 1) с вероятностью 0,954 в целом для цеха: а) предельную ошибку среднего тарифного разряда рабочих цеха; б) пределы (доверительный разряд рабочих;
интервал),
в
которых находится средний тарифный
в) предельную ошибку доли всех рабочих цеха с
тарифным разрядом от 4-го и выше; г) доверительный интервал для этой доли; д) доверительный интервал числа рабочих, имеющих 4-й тарифный разряд и выше; 2) с какой вероятностью могут быть гарантированы пределы (доверительный интервал) 3,54–4,14, в которых будет находится средний разряд всех рабочих цеха. 3.32.
Принимая
распределение
рабочих
по
квалификации,
приведенное в предыдущей задаче, за результаты ранее проведенного по этому цеху выборочного наблюдения, определите, какое число рабочих цеха следует подвергнуть наблюдению для определения среднего тарифного разряда с тем, чтобы предельную ошибку выборки, равную 0,2 тарифного разряда, можно было гарантировать с вероятностью 0,997. 3.33. Какова при тех же условиях должна быть минимальная численность населения города, чтобы при выборочном обследовании предельная ошибка выборочной доли всех признаков с вероятностью 0,954 не превышала 0,5 %? 3.34. Какова должна быть доля выборки в отдельных городах, чтобы с вероятностью 0,954 предельная ошибка выборки при определении доли населения по всем признакам не превышала 0,4 %? Выборочным обследованием намечено охватить города с населением не менее 250 000 человек. 3.35. Во сколько раз уменьшится средняя ошибка
случайной
бесповторной выборки, если объем выборки увеличится в 2 раза? В К раз?
51
3.36. Во сколько раз уменьшится средняя ошибка случайной бесповторной выборки при увеличении объема выборки в 2 раза, если первоначальная доля выборки составляла 10 %? 3.37. Во сколько раз уменьшится средняя ошибка случайной бесповторной выборки при увеличении объема выборки в 2 раза, если объем генеральной совокупности составляет 10 000 ед., а первоначальная доля выборки была равна 5 % ? 3.38. Во сколько раз средняя ошибка случайной повторной выборки больше средней ошибки случайной бесповторной выборки, если доля выборки равна 10, 20, 30 %? 3.39. При какой доли выборки бесповторная случайная выборка будет точнее повторной в 1,5 раза? В 2 раза?
52
Учебное издание
МЕТОДЫ ВЫБОРОЧНОГО ОБСЛЕДОВАНИЯ Практикум по курсу
Составитель Борисов В.Б.
Подписано в печать 22.08.07. Формат 60×84/16. Усл. печ. л. 3,1. Тираж 30 экз. Заказ 1654. Издательско-полиграфический центр Воронежского государственного университета. 394000, г. Воронеж, пл. им. Ленина, 10. Тел. 208-298, 598-026 (факс) http://www.ppc.vsu.ru; e-mail:
[email protected] Отпечатано в типографии Издательско-полиграфического центра Воронежского государственного университета. 394000, г. Воронеж, ул. Пушкинская, 3. Тел. 204-133.
53