Функция распределения непрерывной случайной величины
Функция распределения случайной величины или интегральная функция распределения вероятностей или кумулятивная функция распределения.
Для анализа полученных данных часто необходимо построить функцию распределения непрерывной случайной величины.
Функцией распределения вероятностей случайной величины ξ называется функция F(x), которая для любого значения х равна вероятности события ξ ≤ х:
Эта функция может использоваться для дискретных и непрерывных величин. Ссылку на калькулятор функции распределения для дискретных величин можно найти внизу страницы.
Для определения оптимального количества интервалов, на которые разбивается имеющийся диапазон измерения случайной величины для построения гистограммы плотности ее распределения может быть использована формула Стерджеса 1. При получении дробного числа желательно округление количества интервалов проводить в меньшую сторону.
Количество интервалов определяется как:
Для определения оптимального количества интервалов, на которые разбивается имеющийся диапазон измерения случайной величины для построения гистограммы плотности ее распределения может быть использована формула Стерджеса (Sturges H. (1926). The choice of a class-interval. J. Amer. Statist. Assoc., 21, 65-66). При получении дробного числа желательно округление количества интервалов проводить в меньшую сторону.
Количество интерваловпределяется как:
,
где n — общее число наблюдений величины,
— логарифм по основанию 2,
— обозначает целую часть числа
В случае, если данные распределены с отклонением от нормального распределения (распределение Гаусса или Гаусса-Лапласа) используется модификация правила Стерджеса (Doan, 1976), которое позволяет учесть асимметрию. Учитывая, что аргумент, ведущий к правилу Стерджеса не верен 1, применяют правило Скотта 2 или правило Фридмана и Диакониса 3 rule for the class width:
Также есть расширенное правило Скотта, предложенное Wand (1995) 4ю
Калькулятор позволяет дополнительно ввести количество интервалов, если количество интервалов не введено, то расчет проводят автоматически.
Другим вариантом вычисления количества интервалов является правило Скотта в модификации Ванга.
-
Sturges H. The choice of a class-interval. J. Amer. Statist. Assoc., 1926. 21, 65-66. ↩ ↩
-
Scott, D.W. (1979) On optimal and data-based histograms. Biometrika, 66, 605–610. ↩
-
Freedman, D. and Diaconis, P. (1981) On this histogram as a density estimator: L2 theory. Zeit. Wahr. ver. Geb., 57, 453–476. ↩
-
Wand, M.P. (1995) Data-based choice of histogram bin-width. Technical report, Australian Graduate School of Management, University of NSW. ↩
Комментарии