Задачи математической статистики, Выборочное наблюдение
87
Лекция 5. Задачи математической статистики. Генеральные и выборочные совокупности. Способы отбора. Статистическое распределение выборки. Эмпирическая функция распределения. Полигон и гистограмма.
Выборочное наблюдение.
Математическая статистика - это раздел математики, в котором изучаются математические методы систематизации, обработки, анализа и представления статистических данных для научных и практических выводов.
Математическая статистика использует математический аппарат и выводы теории вероятностей. Связующим звеном между теорией вероятностей и математической статистикой является закон больших чисел и так называемые предельные теоремы. В частности, закон больших чисел аргументирует применение средней арифметической в качестве оценки математического ожидания и относительной частоты появления события как оценки вероятности. Последнее обосновывает понятие статистической устойчивости.
В основе математической статистики лежат понятия генеральной совокупности и выборочной совокупности (выборки).
Под генеральной совокупностью мы понимаем все возможные наблюдения показателя, который нас интересует, все элементарные последствия случайного испытания или всю совокупность реализаций случайной величины. Пример генеральной совокупности - данные о результатах голосования населения по определенному вопросу, данные о доходах всех жителей некоторой страны и т.д. Однако в большинстве случаев мы имеем дело только с частью возможных наблюдений, взятые из генеральной совокупности, и называем это множество значений выборкой. Таким образом, выборка - это часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением).
Когда реализуется выборка, количественный признак, например , приобретает конкретные значения
, которые называют вариантами. Каждая варианта выборки может быть
раз (
). Число
называют частотой варианты
.
При этом , где
– количество вариант, которые равны числовым значениям,
– объем выборки. Отношение частоты
варианты
к объему выборки
называют ее относительной частотой и обозначают
:
. (1)
Для каждой выборки справедливо равенство .
Возрастающий ряд вариант называют вариационным рядом: .
Дискретное статистическое распределение выборки.
Перечень вариант вариационного ряда и соответствующих им частот или относительных частот, называют дискретным статистическим распределением выборки.
В табличной форме оно имеет вид
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Дискретное статистическое распределение выборки можно представить эмпирической функцией .
Функция действительного аргумента , которая определяет относительную частоту события
:
, (2)
называется эмпирической функцией распределения, или кумулятою.
Здесь – объем выборки,
– количество вариант статистического распределения выборки, значения которых меньше
.
имеет такие свойства:
1) ;
2) , где
является наименьшей вариантой вариационного ряда;
3) , где
является наибольшей вариантой вариационного ряда;
4) является неубывающей функцией аргумента
.
Пример.По данному дискретному статистическому распределению выборки
![]() |
-6 | -4 | -2 | |||
![]() | ||||||
![]() |
0,05 | 0,1 | 0,15 | 0,2 | 0,4 | 0,1 |
Построить и изобразить ее графически.
Решение. Согласно определению (2) и свойствам, имеет такой вид:
Графическое изображение F*(x):
![]() |