Студопедия — Величины, описывающие распределения
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Величины, описывающие распределения






Многие из вас наверняка знакомы со средним, или, если говорить точнее, средним арифметическим (arithmetic mean). Это просто сумма значений, соответствующих точкам распределения, деленная на количество точек данных:

где А = среднее арифметическое;

X. = значение, соответствующее точке i;

N = общее число точек данных в распределении.

Среднее арифметическое является самым распространенным из набора величин, оценивающих расположение (location) или центральную тенденцию (central tendency) тела данных распределения. Однако вы должны знать, что среднее арифметическое является не единственным доступным измерением центральной тенденции, и зача­стую не самым лучшим. Среднее арифметическое обычно оказывается плохим вы­бором, когда распределение имеет широкие хвосты (tails1). Если при исследовании распределения с очень широкими хвостами вы случайным образом будете выби­рать точки данных для расчета среднего, то, проделав это несколько раз подряд, увидите, что средние арифметические, полученные таким способом, заметно отли­чаются друг от друга. Еще одной важной величиной, определяющей расположение распределения, явля­ется медиана (median). Медиана описывает среднее значение, когда данные расположе­ны по порядку в соответствии с их величиной. Медиана делит распределение вероятно­сти на две половины таким образом, что площадь под кривой одной половины равна площади под кривой другой половины. В некоторых случаях медиана лучше задает центральную тенденцию, чем среднее арифметическое. В отличие от среднего арифме­тического медиана не искажается крайними случайными значениями. Более того, ме­диану можно рассчитать даже для распределения, в котором все значения выше задан­ной ячейки попадают в определенную ячейку. Примером такого распределения явля­ется рассмотренный выше забег лошадей. Любое финишное место после десятого записывается в десятое место. Медиана широко используется в Бюро Переписи США. Третьей величиной, определяющей центральную тенденцию, является мода (mode) — наиболее часто повторяющееся событие (или значение данных). Мода — это пик кривой распределения. В некоторых распределениях нет моды, а иногда есть более чем одна мода. Как и медиана, мода в некоторых случаях может лучше всего описывать центральную тенденцию. Мода никак не зависит от крайних случайных значений, и ее можно рассчитать быстрее, чем среднее арифметическое или медиану. Мы увидели, что медиана делит распределение на две равные части. Таким же образом распределение можно разделить тремя квартилями (quartiles), чтобы по­лучить четыре области равного размера или вероятности, или девятью децилями (deciles), чтобы получить десять областей равного размера или вероятности, или 99 перцентилями (percentiles) (чтобы получить 100 областей равного размера или вероятности), 50-й перцентиль является медианой и вместе с 25-м и 75-м перцен­тилями дает нам квартили. И наконец, еще один термин, с которым вы должны познакомиться, — это квантиль (quantile). Квантиль — это некоторое число N-1, которое делит общее поле данных на N равных частей. Теперь вернемся к среднему. Мы обсудили среднее арифметическое, которое изме­ряет центральную тенденцию распределения. Есть и другие виды средних, они реже встречаются, но в определенных случаях также могут оказаться предпочтительнее. Одно из них — это среднее геометрическое (geometric mean), расчет которого дан в первой главе. Среднее геометрическое является корнем степени N из произведе­ния значений, соответствующих точкам распределения.

где G = среднее геометрическое;

Х = значение, соответствующее точке i;

N = общее число точек данных в распределении.

Среднее геометрическое не может быть рассчитано, если хотя бы одна из пере­менных меньше или равна нулю.

Мы знаем, что арифметическое математическое ожидание является средним арифметическим результатом каждой игры (на основе 1 единицы) минус размер ставки. Таким же образом можно сказать, что геометрическое математическое ожидание является средним геометрическим результатом каждой игры (на основе 1 единицы) минус размер ставки.

Еще одним видом среднего является среднее гармоническое (harmonic mean). Это обратное значение от среднего обратных значений точек данных.

где Н = среднее гармоническое;

Х = значение, соответствующее точке i;

N = общее число точек данных в распределении.

Последней величиной, определяющей центральную тенденцию, является среднее квадратическое (quadratic mean), или среднеквадратический корень (root mean square).

где R = среднеквадратический корень;

Х = значение, соответствующее точке i;

N = общее число точек данных в распределении.

Вы должны знать, что среднее арифметическое (А) всегда больше или равно сред­нему геометрическому (G), а среднее геометрическое всегда больше или равно среднему гармоническому (Н):

G = среднее геометрическое;

А = среднее арифметическое.







Дата добавления: 2015-10-12; просмотров: 470. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Виды сухожильных швов После выделения культи сухожилия и эвакуации гематомы приступают к восстановлению целостности сухожилия...

КОНСТРУКЦИЯ КОЛЕСНОЙ ПАРЫ ВАГОНА Тип колёсной пары определяется типом оси и диаметром колес. Согласно ГОСТ 4835-2006* устанавливаются типы колесных пар для грузовых вагонов с осями РУ1Ш и РВ2Ш и колесами диаметром по кругу катания 957 мм. Номинальный диаметр колеса – 950 мм...

Философские школы эпохи эллинизма (неоплатонизм, эпикуреизм, стоицизм, скептицизм). Эпоха эллинизма со времени походов Александра Македонского, в результате которых была образована гигантская империя от Индии на востоке до Греции и Македонии на западе...

Этические проблемы проведения экспериментов на человеке и животных В настоящее время четко определены новые подходы и требования к биомедицинским исследованиям...

Классификация потерь населения в очагах поражения в военное время Ядерное, химическое и бактериологическое (биологическое) оружие является оружием массового поражения...

Факторы, влияющие на степень электролитической диссоциации Степень диссоциации зависит от природы электролита и растворителя, концентрации раствора, температуры, присутствия одноименного иона и других факторов...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия