Студопедия — Ранговый критерий Спирмена
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Ранговый критерий Спирмена






Пусть имеется случайная выборка (X1,Y1),…,(Xn,Yn) генеральной совокупности двумерной непрерывной случайной величины (X, Y) с функцией распределения F(t,τ), a FX(t) и FY(τ) — функции распределения случайных величин X и Y соответственно. Если случайные величины X и У имеют нормальные распределения, то для проверки статистической гипотезы об их независимости H0: F(t,τ) = FX(t)FY(τ) можно использовать процедуру, связанную с вычислениями выборочного коэффициента корреляции (По формуле: , где - значение точечной оценки коэффициента корреляции).

Если же о распределениях непрерывных случайных величин X и Y ничего не известно, то для проверки основной гипотезы (1) при альтернативной гипотезе Н1: F(t,τ) ≠ FX(t)FY(τ) для некоторых (t, τ) € R2 используют ранговый критерий Спирмена, основанный на следующем понятии.

Пусть задана конечная числовая последовательность (1)

Определение 1. Рангом Ri элемента zi числовой последовательности (1) называют его порядковый номер в вариационном ряду z(1),…,z(N).

Множество результатов измерений {x1, x2, …, xn} величины X называется выборкой объема n. Для того чтобы иметь возможность воспользоваться аппаратом теории вероятностей, целесообразно наблюдаемую величину X рассматривать как случайную величину, функцию распределения которой F(x)=P{X<x}следует определить.

Полученный статистический материал x1, x2,...xn наблюдений представляет собой первичные данные о величине, подлежащей статистической обработке. Обычно такие статистические данные оформляются в виде таблицы, графика, гистограммы и т.д.

Если выборка объема n содержит k различных элементов , причем встречается mi раз, то число mi называется частотой элемента , а отношение называется относительной частотой элемента . Очевидно, что

Вариационным (статистическим) рядом называется таблица, первая строка которой содержит в порядке возрастания элементы , а вторая - их частоты mi (относительные частоты ).

Согласно определению, Ri — это число элементов последовательности z1,..., zN, не больших чем zi, которое можно записать следующим образом:

Ri = 1+ , где ŋ(t) — функция Хевисайда. Ранг любого элемента последовательности (1) — это натуральное число в диапазоне от 1 до N, причем ранг наименьшего элемента последовательности равен 1, а ранг наибольшего — N.

Пример 1. Рассмотрим выборку z4=(3,8, 4,7, —2,6,17,3). Ее вариационный ряд имеет вид —2,6; 3,8; 4,7; 17,3. Поэтому R1(z4) = 2, R2(z4) = 3, R3(z4) = 1, R4(z4) = 4. #

Определение 2. Рангом элемента Zi случайной выборки ZN = (Z1,..., ZN) называют случайную величину Ri(ZN), реализация которой Ri(zN) есть ранг реализации zi случайной величины Zi, в вариационном ряду z(1),…,z(N).

Обозначим через Ri = Ri(Xn) — ранг элемента Хi случайной выборки Х1,..., Хn, а через Si = Si(Yn) — ранг элемента Yi случайной выборки Y1,..., Yn.

Ранговым коэффициентом корреляции Спирмена назовем случайную величину

 

где

Статистика (2) является выборочным коэффициентом корреляции последовательностей рангов R1,…,Rn и S1,…,Sn.

Согласно определению рангов Ri, Si, i=, и можно показать, что

Без ограничения общности можно считать, что значения пар наблюдений (xi, yi), i =, занумерованы в порядке возрастания их первых элементов, т.е. так, что выполняются неравенства x1<x2<…<xn.

В этом случае реализация ri ранга Ri равна i, i =, и значение статистики можно вычислить по формуле

где — реализация ранга , i =.

Пусть выборочный коэффициент корреляции используется для нахождения линейной зависимости между случайными величинами X и Y. И если же между X и Y имеется функциональная, но не линейная зависимость, то выборочный коэффициент корреляции может быть равен нулю. Аналогично выгладит ситуация с ранговым коэффициентом (2), главным отличием является то, что он выявляет не только линейную, но и любую монотонную зависимость.

Доказательство этого начнем с исследования статистики при линейной зависимости Y = аХ + b, a R, b R, между случайными величинами X и Y.

Если, а > 0, то большим значениям xi соответствуют большие значения yi, и, наоборот, меньшим значениям xi — меньшие значения yi, . Если пары наблюдений (xi, yi), i =, занумерованы по возрастанию первых элементов, то будут иметь место неравенства y1<y2<…<yn. Поэтому ri = si для всех i =, и из (4) следует, что = 1.

Если же, а < 0, то большим значениям xi соответствуют меньшие значения yi, а меньшим значениям xi — большие значения yi, i =. В этом случае ri=sn-i+1, si=rn-i+1, i =, и = -1.

Заметим, что если (х) — возрастающая функция, то ранг элемента xi в последовательности x1<x2<…<xn равен рангу i) в последовательности (x1)< (x2)<…< (xn). Поэтому если случайные величины X и Y связаны функциональной зависимостью Y= (х), то = 1.

Аналогично, если Y = (X), где (х) — убывающая функция, то = -1.

Условие выполняется всегда, так как оно выполняется для выборочного коэффициента корреляции, а— это выборочный коэффициент корреляции, построенный по последовательностям рангов наблюдений.

Рассмотрим теперь другой крайний случай, когда случайные величины X uY независимы, т.е. когда основная гипотеза H0 является истинной. В этой ситуации случайный вектор (Si,..., Sn) принимает с равной вероятностью любое свое возможное значение, являющееся одной из n! перестановок, составленной из чисел 1, 2,...,n. Следовательно, вероятность того, что статистика примет любое из своих возможных значений при истинности основной гипотезы (1), не зависит от распределений случайных величин X и Y.

Можно показать, что при истинности основной гипотезы (1)

M = 0, D

и, следовательно, при этом выборочные значения статистики невелики и группируются около нуля. Поэтому (и это кажется достаточно естественным) ранговый критерий Спирмена отклоняет H0 на уровне значимости α, если где — квантиль уровня 1 —α/2 распределения случайной величины при истинности основной гипотезы (1).

При небольших n это распределение табулировано. Известно, что при n и при истинности основной гипотезы (1)

т.е. квантили случайной величины можно приближенно вычислять при помощи таблиц квантилей стандартного нормального распределения.







Дата добавления: 2015-10-15; просмотров: 715. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Седалищно-прямокишечная ямка Седалищно-прямокишечная (анальная) ямка, fossa ischiorectalis (ischioanalis) – это парное углубление в области промежности, находящееся по бокам от конечного отдела прямой кишки и седалищных бугров, заполненное жировой клетчаткой, сосудами, нервами и...

Основные структурные физиотерапевтические подразделения Физиотерапевтическое подразделение является одним из структурных подразделений лечебно-профилактического учреждения, которое предназначено для оказания физиотерапевтической помощи...

Почему важны муниципальные выборы? Туристическая фирма оставляет за собой право, в случае причин непреодолимого характера, вносить некоторые изменения в программу тура без уменьшения общего объема и качества услуг, в том числе предоставлять замену отеля на равнозначный...

Виды сухожильных швов После выделения культи сухожилия и эвакуации гематомы приступают к восстановлению целостности сухожилия...

КОНСТРУКЦИЯ КОЛЕСНОЙ ПАРЫ ВАГОНА Тип колёсной пары определяется типом оси и диаметром колес. Согласно ГОСТ 4835-2006* устанавливаются типы колесных пар для грузовых вагонов с осями РУ1Ш и РВ2Ш и колесами диаметром по кругу катания 957 мм. Номинальный диаметр колеса – 950 мм...

Философские школы эпохи эллинизма (неоплатонизм, эпикуреизм, стоицизм, скептицизм). Эпоха эллинизма со времени походов Александра Македонского, в результате которых была образована гигантская империя от Индии на востоке до Греции и Македонии на западе...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия