Всего на сайте:
303 тыс. 117 статей

Главная | Статистика

Распределение выборки. Эмпирическая функция распределения  Просмотрен 199

Предположим, что мы изучаем некоторуюс.в.X и с этой целью производим ряд независимых наблюдений. Пусть X приняла раз значение, равное , раз – значениеx2,…, nk раз – значение xk, при этом ,где – объем выборки.

Определение 6.Вариантами с. в. называются значения .

Определение 7.Частотами называются числа , которые показывают, сколько раз встречаются значения в ряде наблюдений.

. (1)

Определение 8.Относительными частотами называются отношение частот к объему выборки :

Определение 9.Распределением выборки или вариационным рядом называется ранжированный (упорядоченный) перечень вариантов и соответствующих им частот . Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину, и интервальным, если варианты могут отличаться один от другого на сколь угодно малую величину.

Для построения интервального ряда необходимо определить величину частичных интервалов, на которые разбивается весь интервал варьирования наблюдаемых значений с.в. . Длину частичного интервала нужно выбрать таким образом, чтобы построенный ряд, с одной стороны, не был громоздким, а с другой стороны, позволял выявить характерные черты изменения изучаемой с.в.X.По формуле Стерджеса оптимальное число интервалов определяется по формуле:

,а длина интервала –

, (2)

где – разность между наибольшим и наименьшим наблюдаемыми значениями, при этом за начало первого интервала принимается .

Пример 2. В результате трех экзаменов группа из 30 наудачу выбранных абитуриентов набрала следующую сумму баллов: 157, 175, 170, 166, 159, 173, 182, 167, 171, 169, 172, 164, 173, 175, 171, 158, 179, 156, 165, 179, 155, 178, 160, 154, 183, 153, 155, 167, 186, 163. Построить интервальный ряд.

Решение. Сначала упорядочим полученные данные по возрастанию:

153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165, 166, 167, 167, 169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Ясно, что 153, 186. Найдем число частичных интервалов и длину интервала по формуле Стерджеса: , . Возьмем h=6, тогда xнач=153-0,5×6=150. Разобьем весь ряд на 6 интервалов: [150, 156),
[156, 162), [162, 168), [168, 174), [174, 180), [180, 186).Подсчитаем число абитуриентов, попавших в каждый из полученных интервалов, и получим интервальный ряд:

Сумма баллов [150, 156) [156, 162) [162, 168) [168, 174) [174, 180) [180, 186)
Частота       
Относит.частота

Определение 10.Функция

(3)

называется эмпирической функцией распределения, где n – объём выборки, nk– частота появления варианты xk, а – число выборочных значений <x.

Эмпирическая функция распределения по её вариационному ряду строится так:

(4)

Значениями являются так называемые накопленные частости. График эмпирической функции распределения строят так же, как и график функции распреде­ления дискретной с.в.

Если вариационный ряд составлен по интервалам значений и вкачестве представителя интервала берется его середина, то эмпи­рическая функция составляется так же, как по вариационному ряду по значениям. Но в качестве представителя интервала можно брать правый конец интервала. Объединяя отрезками точки, ко­ординатами которых являются правые концы интервалов и накоп­ленные частости соответствующих интервалов, получаем ломаную линию, являющуюся довольно хорошим приближением графика функции распределения непрерывной случайной величины. Такой график является точным, если все значения в каждом интервале распределены равномерно. Аналитический вид этой функции довольно сложен.

В отличие от эмпирической функции распределения функцию распределения генеральной совокупности называют теоретической функцией распределения. Функция играет фундаментальную роль в математической статистике. Важнейшее её свойство состоит в том, что при увеличении объёма выборки п происходит сближение этой функции с теоретической.

Предыдущая статья:Обработка результатов измерения Следующая статья:Полигон и гистограмма
page speed (0.0358 sec, direct)