Студопедия — Выбор меры расстояния.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Выбор меры расстояния.






Чтобы группировать объекты, необходим некоторый показатель сходства или различия. Схожие объекты группируются вместе, а те, что отстоят от них, попадают в другие кластеры. Наиболее часто используются следующие показатели:

а) евклидово расстояние наименьшее расстояние между двумя точками х и у. В двух- или трёхмерном случае – это прямая, соединяющая данные точки. Общей формулой для n -мерного случая (n переменных) является:

 

;

 

б) квадрат евклидового расстояния благодаря возведению в квадрат при расчёте лучше учитываются большие разности. Эта мера должна всегда использоваться при построении кластеров при помощи центроидного метода и метода Варда;

в) корреляция Пирсона – ее применение целесообразно для большого количества переменных. Если кластеризация наблюдений осуществляется только на основании двух переменных, то корреляционный коэффициент Пирсона со значениями находящимися в пределах от -1 до +1 не годится для использования в качестве меры подобия; он будет давать только значения -1 или +1;

г) расстояние Чебышева – р азностью двух наблюдений является абсолютное значение максимальной разности последовательных пар переменных, соответствующих этим наблюдениям;

д) блок ( дистанция Манхэттена, дистанция таксиста) – э та дистанционная мера определяется суммой абсолютных разностей пар значений. Для двумерного пространства это не прямолинейное евклидово расстояние между двумя точками, а путь, который должен преодолеть Манхэттенский таксист, чтобы проехать от одного дома к другому по улицам, пересекающимся под прямым углом:

;

е) расстояние Минковского –равно корню r -ой степени из суммы абсолютных разностей пар значений взятых в r -ой степени:

 

;

ж) мера хи-квадрат чтобы найти расстояние между двумя наблюдениями, сравнивают частоты выпадения переменных, относящихся к этим наблюдениям. Квадратный корень из значения хи-квадрат будет применяться в качестве дистанционной меры.

и) мера фи-квадрат представляет собой попытку нормализации меры хи-квадрат. Для этого она делится на квадратный корень общей суммы частот.

Выбор меры расстояния зависит от типа критериев кластеризации (например, для интервальных и относительных переменных целесообразно применять евклидово расстояние, квадрат евклидова расстояния, меру Чебышева и др.), их количества (например, при большом количестве критериев используют корреляцию Пирсона) и выбранного метода объединения (например, для центроидной и дисперсионной кластеризации целесообразно ее осуществление на основе квадрата евклидова расстояния). Кроме того, следует отметить, что разные пакеты прикладных программ обладают разным набором мер расстояния для проведения кластерного анализа. Необходимо также учитывать тот факт, что использование различных мер расстояния дает неодинаковые результаты в рамках одного метода объединения.







Дата добавления: 2015-08-12; просмотров: 1594. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Законы Генри, Дальтона, Сеченова. Применение этих законов при лечении кессонной болезни, лечении в барокамере и исследовании электролитного состава крови Закон Генри: Количество газа, растворенного при данной температуре в определенном объеме жидкости, при равновесии прямо пропорциональны давлению газа...

Ганглиоблокаторы. Классификация. Механизм действия. Фармакодинамика. Применение.Побочные эфффекты Никотинчувствительные холинорецепторы (н-холинорецепторы) в основном локализованы на постсинаптических мембранах в синапсах скелетной мускулатуры...

Шов первичный, первично отсроченный, вторичный (показания) В зависимости от времени и условий наложения выделяют швы: 1) первичные...

Упражнение Джеффа. Это список вопросов или утверждений, отвечая на которые участник может раскрыть свой внутренний мир перед другими участниками и узнать о других участниках больше...

Влияние первой русской революции 1905-1907 гг. на Казахстан. Революция в России (1905-1907 гг.), дала первый толчок политическому пробуждению трудящихся Казахстана, развитию национально-освободительного рабочего движения против гнета. В Казахстане, находившемся далеко от политических центров Российской империи...

Виды сухожильных швов После выделения культи сухожилия и эвакуации гематомы приступают к восстановлению целостности сухожилия...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия