Студопедия — Другие коэффициенты
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Другие коэффициенты






 

Для ситуации, когда Х – дихотомия, основанная на нормальном распределении, a Y измерен в шкале порядка, подходят только коэффициенты, которые были введены Кертеном (1956) и Глассом (1966).

При измерениях такого рода, мы исходим из гипотезы о нормальном распределении, лежащем в основе дихотомии для X, и обращаемся к вычислению бисериального рангового коэффициента корреляции Кертена, который обсуждается ниже в п. 5.3.

Мера связи, когда одна переменная измеряется дихотомически на основе нор­мального распределения, а другая – в шкале интервалов или отношений, – это бисериальный коэффициент корреляции rbis.

Предположим, что переменная Y измеряется дихотомически, хотя более тщательная или более совершенная методика могла бы дать приблизительно нормальное распределение значений Y. Мы говорим, что измерение Y привело к дихотомии, основанной на нормальном распределении. Таким образом, Y измеряется точ­но тем же способом, что и переменные, участвующие в вычисле­нии тетрахорического коэффициента корреляции. Однако в этом случае данные измерений Х надо рассматривать как значения в шкале интервалов или отношений, которые распределены при­близительно нормально. Например, значения Х могут быть результатами теста на симпатии и антипатии учащихся к педагогам, а Y, при­нимающий значения 0 и 1, – результатами ответа на вопросы, оценивающие усвоение знаний. При более тщательно разработанных проверках успеваемости можно было бы обеспечить бо­лее широкий диапазон оценок успеваемости (оценок Y), которые были бы распределены приблизительно нормально. Тогда два массива нормально распределенных данных для Х и Y привели бы к определению rху. Что же говорят о величине rху оценки Х и дихотомические оценки Y? Ответ на этот вопрос дает бисериальный коэффициент корреляции rbis.

Бисериальный коэффициент корреляции – это корреляция произведения моментов между Х и нормально распределенными значениями Y, что, по предположению, лежит в основе дихото­мии
(0 или 1). Это аналогично ситуации, в которой возник rtet, за исключением того, что для rtet обе переменные были дихото­мическими с нормальными распределениями.

Допустим, что преподаватель хочет установить связь времени (X), затраченного учащимися на изучение уравнивания химиче­ских реакций, и их навыками (Y) уравнивания таких реакций. Измерения значения Х ведутся по данным сообщений учащихся о времени, необходимом для выполнения домашнего задания. Вероятно, Y можно было оценить при более основательной проверке успевае­мости так, чтобы обеспечивалось приблизительно нормальное распределение; но допустим, что время, которым располагал пре­подаватель, позволяет предложить учащимся рассмотреть только один вопрос — хими­ческую реакцию для уравнивания. Поэтому предполагается, что в основе нулевых (неверный ответ) и единичных (правильное решение) лежит нормальное распределение ответов. Данные, ко­торые можно было бы получить в результате такого исследова­ния, приводятся в табл. 20. Они показывают, что 11 из 18 уча­щихся верно выполнили задание и их оценки в среднем более высоки, чем у 7 учащихся, которые решили задачу неправильно.

Объяснение, на основе которого выводится rbis, следует из теории регрессии. Коэффициент регрессии для предсказания Х по нор­мально распределенному Y есть:

,

где sy – стандартное отклонение гипотетически нормально рас­пределенного Y, причем Y – не дихотомическая переменная. На­клон линии регрессии для предсказания Х по Y можно аппрокси­мировать наклоном линии, проходящей через среднее значение Х для объектов, имеющих нули по Y (обозначим их ), и среднее Х для объектов, имеющих единицы по Y (обозначим их ). Та­кая линия проведена на диаграмме рассеивания в табл. 20. Это линия наименьших квадратов в том смысле, что среднее группы представляет собой точку, относительно которой сумма квадра­тов отклонений минимальна.

Таблица 20

Пример вычисления бисериального коэффициента корреляции

Время, затраченное на изучение Ответ на контрольный вопрос Диаграмма рассеивания
    n1 =11, n0 = 7, n = 18   = 12,36, = 10,00, = 11,44, Sx = 2,55, u = 0,3836, rbis = 0,60

 

Наклон этой линии равен разности ( 1 0), деленной на расстояние между средними значениями нормально распределенного Y для объектов, имеющих нули и единицы по дихотомии. Последнее расстояние трудно найти элементарным способом. Искомое расстояние предполагает введение высоты и нормированной нормальной кривой над точкой с абсциссой (здесь осью Y), за кото­рой лежит 100 (n1/n) процентов площади (n1 – число объектов, имеющих “1” по дихотомии). Комбинирование этих фактов дает следующую формулу для вычисления rbis:

rbis = ,

где и являются средними значениями Х для объектов, имеющих соответственно единицы и нули по Y; sx – стандарт­ное отклонение значений X; n1 и n0 – число единиц и нулей для Y, соответственно (n1 + n0 = n); и u — ордината (т.е. вы­сота) нормированного нормального распределения в точке, за которой лежит 100 – (n1/n) процентов площади под кривой (см. рис. 3).

Пример вычисления rbis приведен в табл. 20.

Вычисление rbis можно упростить, пользуясь следующей экви­валентной, но слегка отличаю-щейся формулой, позволяющей получать то же, что и предыдущее уравнение:

 

rbis = .

 

В отличие от любого другого коэф­фициента корреляции, rbis иногда может принимать значения ниже –1 и выше +1. Но это лишь означает, что либо некоррект­но предположение о нормальности распределения X, либо что имеет место флуктуация выборки, когда значение n мало, что приводит к распределению значений Х в выборке с эксцессом меньше нор­мального.

Вероятно, вы уже заметили, что данные, по которым вычис­лялись и точечно-бисериальный коэффициент корреляции rpb и rbis, похожи. Единственная разница между постановками двух задач состоит в том, что в случае rbis выдвигаются некоторые ги­потезы относительно распределения, лежащего в основе дихото­мии. В том, что касается свойств данных, rpb и rbis су­щественно различны. Поэтому беспредметны вопросы типа: «Как сравнить rpb и rbis для одной совокупности данных?» Области применения коэффициентов не пересекаются: каждый соответ­ствует своей цели.

Для одних и тех же данных отношение rpb и rbis равно

 

.

 

Минимальная величина отношения в этом уравнении есть 1,25, когда ни rbis, ни rpb не равны нулю. Поэтому, если rpb положительно, rbis будет положительным и большим; если rpb отрицательно, rbis будет отрицательным и ближе к –1. Если rpb равно нулю, то rbis также равен нулю. Таким образом, одни и те же данные дают основание для фиксации более сильной связи между Х и Y, если относительно нее делается больше предположений, т.е. если допустить, что дихотомия основана на нормальном распределении.

Понятия, лежащие в основе бисериальной корреляции, можно обобщить для применения при определении (установлении) трисериальной и полисериальной корреля­ции. Если значения Y измеряются трихотомически (О, 1, 2), можно исполь­зовать трисериальный коэффициент корреляции для оценки корреляции произведения моментов между Х и нормально распре­деленным Y, который, по предположению, трихотомичен. Обоб­щение rbis до полисериальной корреляции содержится в работе Джаспена (1946). Практика свидетельствует о том, что часто величина коэффициента полисериальной корреляции намного от­личается от величины rbis , которая была бы получена при объ­единении нескольких категорий в две (так, например, при замене трихотоми­ческой переменной на дихотомическую переменную совмещением двух смежных категорий).

 

5.3. Бисериальная ранговая корреляция rbis

 

Коэффициент бисериальной ранговой корреляции тесно связан с τ Кендалла, в определении используются понятия совпадения и инверсии. Обозначим его как рангово-бисериальный коэффициент rb.

Пусть Х дихотомическая переменная, а Y – переменная, име­ющая n рангов 1, 2,..., n. Кертен искал такой коэффициент, описывающий связь между Х и Y, чтобы: а) при любых условиях он мог достигнуть границы +1; б) был бы равен +1, когда все n наивысших рангов являются единицами по дихотомии; в) был бы строго непараметричным, т.е. полностью определимым в терминах инверсий и совпадений без использования таких понятий, как среднее, дисперсия, регрес­сия и т.д.

Гласс (1966) показал, что rb алгебраически эквивалентен коэффициенту для порядковых переменных. Практическое значение этого факта заключается в том, что появляется простой способ вычисления rb без подсчета совпаде­ний и инверсий, но используют Fi – средний ранг объектов, имеющих 1 по X; a Fo – сред­ний ранг объектов с 0 по X.

Уайтфилд (1947) вывел коэффициент корреляции одной ди­хотомической и одной порядковой переменной. Его подход сво­дился к тому, чтобы рассматривать дихотомическую переменную как ранжируемую переменную, связанную на двух рангах. Далее он применил формулу τ Кендалла для связанных рангов. Получившийся коэффициент имеет тот же числитель, что и rb, но другой знаменатель. В качестве меры корреляции предпочтитель­нее рангово-бисериальный коэффициент, поскольку коэффициент Уайтфилда не достигает +1, когда между Х и Y существуют некоторые строгие взаимосвязи.

 







Дата добавления: 2015-09-18; просмотров: 1007. Нарушение авторских прав; Мы поможем в написании вашей работы!



Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Виды нарушений опорно-двигательного аппарата у детей В общеупотребительном значении нарушение опорно-двигательного аппарата (ОДА) идентифицируется с нарушениями двигательных функций и определенными органическими поражениями (дефектами)...

Особенности массовой коммуникации Развитие средств связи и информации привело к возникновению явления массовой коммуникации...

Тема: Изучение приспособленности организмов к среде обитания Цель:выяснить механизм образования приспособлений к среде обитания и их относительный характер, сделать вывод о том, что приспособленность – результат действия естественного отбора...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия