Процентили и квартили
Процентиль — это мера, в которой процентное значение общих значений равно этой мере или меньше ее. Например, 90 % значений данных находятся ниже 90-го процентиля, а 10 % значений данных находятся ниже 10-го процентиля.
Квартили — это значения, которые делят таблицу данных (или ее часть) на четыре группы, содержащие приблизительно равное количество наблюдений. Общий объем делится на четыре равные части: 25, 50, 75 и 100 %.
Первый квартиль (или нижний квартиль) Q1 определяется как значение, содержащее f-значение, равное 0,25. Это то же самое, что и двадцать пятый процентиль. F-значение третьего квартиля (или верхнего квартиля) Q3, равно 0,75. Интерквартильный размах IQR определяется как Q3–Q1.
- Вычисляется f-значение каждого значения из таблицы данных. ,
где
— индекс значения, а n — количество значений.
- Первый квартиль вычисляется путем интерполяции между f-значениями, которые находятся непосредственно ниже и выше 0,25, чтобы найти значение, соответствующее f-значению 0,25.
- Третий квартиль вычисляется путем интерполяции между f-значениями, которые находятся непосредственно ниже и выше 0,75, чтобы найти значение, соответствующее f-значению 0,75.
- Любой другой процентиль вычисляется таким же образом путем интерполяции между соответствующими значениями.
Пример
Значение | f-значение |
---|---|
4 | 0 |
8 | 0,2 |
9 | 0,4 |
11 | 0,6 |
16 | 0,8 |
17 | 1,0 |
Интерполяция при f-значении = 0,75 дает Q3 = 14,75.
