Построение линейной модели регрессии
Регрессия – это функция, устанавливающая характер, степень и направление корреляционной зависимости результативного признака от факторного. Наиболее простой и распространенной формой регрессии является прямолинейная зависимость вида:
y(xi ) = a1xi+ a0
Для нахождения параметров уравнения регрессии в соответствии с требованиями метода наименьших квадратов строится система нормальных уравнений.
Решив систему нормальных уравнений методом Крамера, получают следующие формулы расчета параметров уравнения регрессии.
Для расчета параметров уравнения регрессии составляется таблица 2.1.
Таблица 2.1 – Расчет показателей корреляционно-регрессионной зависимости
№ предприятия
| Стоимость основных средств, млн. руб
| Грузооборот, тыс. т-км
| расчетные графы
| №
| xi
| yi
| xi*yi
| xi²
| yi²
| y(xi)
|
| 5,9
| 124,8
| 736,32
| 34,81
| 15575,04
| 110,062
|
| 5,9
| 125,1
| 738,09
| 34,81
| 15650,01
| 110,062
|
| 7,8
| 134,7
| 1050,66
| 60,84
| 18144,09
| 129,404
|
| 6,7
| 138,8
| 929,96
| 44,89
| 19265,44
| 118,206
|
| 7,8
| 130,0
|
| 60,84
|
| 129,404
|
| 6,2
| 127,0
| 787,4
| 38,44
|
| 113,116
|
| 6,1
| 94,3
| 575,23
| 37,21
| 8892,49
| 112,098
|
| 7,4
| 111,4
| 824,36
| 54,76
| 12409,96
| 125,332
|
| 4,3
| 94,3
| 405,49
| 18,49
| 8892,49
| 93,774
|
| 6,0
| 99,6
| 597,6
|
| 9920,16
| 111,08
|
| 6,2
| 127,8
| 792,36
| 38,44
| 16332,84
| 113,116
|
| 6,5
| 113,2
| 735,8
| 42,25
| 12814,24
| 116,17
|
| 7,3
| 122,2
| 892,06
| 53,29
| 14932,84
| 124,314
|
| 6,4
| 108,7
| 695,68
| 40,96
| 11815,69
| 115,152
|
| 6,6
| 105,3
| 694,98
| 43,56
| 11088,09
| 117,188
|
| 7,2
| 108,7
| 782,64
| 51,84
| 11815,69
| 123,296
|
| 7,0
| 113,9
| 797,3
|
| 12973,21
| 121,26
|
| 6,2
| 110,2
| 683,24
| 38,44
| 12144,04
| 113,116
|
| 6,6
| 102,1
| 673,86
| 43,56
| 10424,41
| 117,188
|
| 7,2
| 121,1
| 871,92
| 51,84
| 14665,21
| 123,296
|
| 7,3
| 112,7
| 822,71
| 53,29
| 12701,29
| 124,314
|
| 6,7
| 136,8
| 916,56
| 44,89
| 18714,24
| 118,206
|
| 7,6
| 115,5
| 877,8
| 57,76
| 13340,25
| 127,368
|
| 7,6
| 142,1
| 1079,96
| 57,76
| 20192,41
| 127,368
|
| 5,6
| 104,5
| 585,2
| 31,36
| 10920,25
| 107,008
|
| 7,5
| 124,5
| 933,75
| 56,25
| 15500,25
| 126,35
|
| 5,8
| 100,0
|
| 33,64
|
| 109,044
|
| 4,7
| 100,9
| 474,23
| 22,09
| 10180,81
| 97,846
|
| 7,3
| 124,8
| 911,04
| 53,29
| 15575,04
| 124,314
|
| 6,2
| 120,1
| 744,62
| 38,44
| 14424,01
| 113,116
|
| 7,6
| 130,2
| 989,52
| 57,76
| 16952,04
| 127,368
|
| 6,3
| 98,6
| 621,18
| 39,69
| 9721,96
| 114,134
|
| 5,9
| 92,6
| 546,34
| 34,81
| 8574,76
| 110,062
|
| 5,8
| 84,1
| 487,78
| 33,64
| 7072,81
| 109,044
|
| 6,0
| 121,1
| 726,6
|
| 14665,21
| 111,08
|
| 7,7
| 132,2
| 1017,94
| 59,29
| 17476,84
| 128,386
|
| 6,8
| 127,8
| 869,04
| 46,24
| 16332,84
| 119,224
|
| 5,2
| 103,7
| 539,24
| 27,04
| 10753,69
| 102,936
|
| 5,9
| 111,9
| 660,21
| 34,81
| 12521,61
| 110,062
|
| 6,9
| 135,2
| 932,88
| 47,61
| 18279,04
| 120,242
|
| 7,2
| 139,0
| 1000,8
| 51,84
|
| 123,296
|
| 5,7
| 117,7
| 670,89
| 32,49
| 13853,29
| 108,026
|
| 6,1
| 131,0
| 799,1
| 37,21
|
| 112,098
|
| 6,7
| 125,4
| 840,18
| 44,89
| 15725,16
| 118,206
|
| 6,3
| 113,8
| 716,94
| 39,69
| 12950,44
| 114,134
|
| 6,7
| 115,2
| 771,84
| 44,89
| 13271,04
| 118,206
|
| 6,2
| 114,3
| 708,66
| 38,44
| 13064,49
| 113,116
|
| 6,3
| 102,7
| 647,01
| 39,69
| 10547,29
| 114,134
|
| 5,1
| 107,5
| 548,25
| 26,01
| 11556,25
| 101,918
|
| 5,9
| 100,2
| 591,18
| 34,81
| 10040,04
| 110,062
| ∑
| 323,9
| 5799,3
| 37890,4
| 2129,89
| 682174,29
| 5797,302
| Таким образом, параметры линейного уравнения регрессии составляют:
Оценка значимости параметров уравнения регрессии осуществляется при помощи t-критерия Стьюдента: если расчетные значения t-критерия больше его критической величины, то параметры уравнения признаются типичными, а сама модель адекватно описывающей зависимость между факторами.
Критическое (табличное) значение t-критерия Стьюдента определяется по приложению Б и зависит от:
– уровня значимости уравнения регрессии (α);
– числа степеней свободы: k = n − m, где m – количество параметров уравнения регрессии.
При уровне значимости α = 0,05 и числе степеней свободы k =50 − 2 =48,
табличное значение tкрит (0,05;48) = 2,0106.
Расчетные значения t-критерия определяются по формулам:
где среднее квадратическое отклонение результативного признака от его выровненных значений:
Для определения среднего квадратического отклонения и оценки значимости параметров уравнения регрессии заполняется таблица 2.2.
Таблица 2.2 – Расчет средних квадратических отклонений признаков
№ предприятия
| Торговая площадь, м²
| среднесписочное число сотрудников, чел
| расчетные графы
| №
| xi
| yi
| y(xi)
| (yi-y(xi))²
| (yi- )²
|
| 5,9
| 124,8
| 110,062
| 217,209
| 77,687
|
| 5,9
| 125,1
| 110,062
| 226,141
| 83,065
|
| 7,8
| 134,7
| 129,404
| 28,048
| 350,214
|
| 6,7
| 138,8
| 118,206
| 424,113
| 520,479
|
| 7,8
| 130,0
| 129,404
| 0,355
| 196,392
|
| 6,2
| 127,0
| 113,116
| 192,765
| 121,308
|
| 6,1
| 94,3
| 112,098
| 316,769
| 470,283
|
| 7,4
| 111,4
| 125,332
| 194,101
| 21,031
|
| 4,3
| 94,3
| 93,774
| 0,277
| 470,283
|
| 6,0
| 99,6
| 111,08
| 131,790
| 268,501
|
| 6,2
| 127,8
| 113,116
| 215,620
| 139,571
|
| 6,5
| 113,2
| 116,17
| 8,821
| 7,762
|
| 7,3
| 122,2
| 124,314
| 4,469
| 38,614
|
| 6,4
| 108,7
| 115,152
| 41,628
| 53,086
|
| 6,6
| 105,3
| 117,188
| 141,325
| 114,191
|
| 7,2
| 108,7
| 123,296
| 213,043
| 53,086
|
| 7,0
| 113,9
| 121,26
| 54,170
| 4,351
|
| 6,2
| 110,2
| 113,116
| 8,503
| 33,478
|
| 6,6
| 102,1
| 117,188
| 227,648
| 192,821
|
| 7,2
| 121,1
| 123,296
| 4,822
| 26,153
|
| 7,3
| 112,7
| 124,314
| 134,885
| 10,798
|
| 6,7
| 136,8
| 118,206
| 345,737
| 433,223
|
| 7,6
| 115,5
| 127,368
| 140,849
| 0,236
|
| 7,6
| 142,1
| 127,368
| 217,032
| 681,941
|
| 5,6
| 104,5
| 107,008
| 6,290
| 131,928
|
| 7,5
| 124,5
| 126,35
| 3,422
| 72,488
|
| 5,8
| 100,0
| 109,044
| 81,794
| 255,552
|
| 4,7
| 100,9
| 97,846
| 9,327
| 227,587
|
| 7,3
| 124,8
| 124,314
| 0,236
| 77,687
|
| 6,2
| 120,1
| 113,116
| 48,776
| 16,925
|
| 7,6
| 130,2
| 127,368
| 8,020
| 202,038
|
| 6,3
| 98,6
| 114,134
| 241,305
| 302,273
|
| 5,9
| 92,6
| 110,062
| 304,921
| 546,905
|
| 5,8
| 84,1
| 109,044
| 622,203
| 1016,717
|
| 6,0
| 121,1
| 111,08
| 100,400
| 26,153
|
| 7,7
| 132,2
| 128,386
| 14,547
| 262,894
|
| 6,8
| 127,8
| 119,224
| 73,548
| 139,571
|
| 5,2
| 103,7
| 102,936
| 0,584
| 150,946
|
| 5,9
| 111,9
| 110,062
| 3,378
| 16,695
|
| 6,9
| 135,2
| 120,242
| 223,742
| 369,178
|
| 7,2
| 139,0
| 123,296
| 246,616
| 529,644
|
| 5,7
| 117,7
| 108,026
| 93,586
| 2,938
|
| 6,1
| 131,0
| 112,098
| 357,286
| 225,420
|
| 6,7
| 125,4
| 118,206
| 51,754
| 88,623
|
| 6,3
| 113,8
| 114,134
| 0,112
| 4,779
|
| 6,7
| 115,2
| 118,206
| 9,036
| 0,618
|
| 6,2
| 114,3
| 113,116
| 1,402
| 2,843
|
| 6,3
| 102,7
| 114,134
| 130,736
| 176,518
|
| 5,1
| 107,5
| 101,918
| 31,159
| 72,012
|
| 5,9
| 100,2
| 110,062
| 97,259
| 249,198
| Сумма:
| 323,9
| 5799,3
| 5797,302
| 6251,558
| 9536,680
| Значит, в рассматриваемом случае:
Так как расчетные значения t-критерия больше его критической величины (30,984>2,0106; 2,0106>0,493),то параметры уравнения признаются типичными, а модель регрессии значимой для практической деятельности.
Таким образом, уравнение регрессии принимает вид:
y(xi) = 10,18 xi +50.
Теоретические значения результативного признака – грузооборот – также сводятся в таблицу 2.1.
По реальным значениям факторного и результативного признаков, представленных в таблице 2.1 на рисунке 2.1. строится поле корреляции. По выровненным (теоретическим) уровням результативного признака строится прямая уравнения регрессии.
s Поле корреляции
— График уравнения регрессии y(xi) = 10,18 xi +50.
Рисунок 2.1 – Эмпирическая и теоретическая зависимости грузооборота от величины стоимости основных средств.
Положительное значение коэффициента регрессии (а1) характеризует прямую связь между признаками, то есть при увеличении стоимости основных средств грузооборот, как правило, увеличивается. Величина коэффициента регрессии свидетельствует о том, что при увеличении стоимости основных средств на 1 млн. руб. грузооборот автотранспортных предприятий в среднем увеличивается на 10,18 млн. руб.
2.2. Расчет показателей корреляции
Проверка практической значимости полученной модели регрессии между признаками осуществляется при помощи показателей корреляции.
Теснота связи между признаками в линейной модели регрессии определяется главным образом посредством расчета линейного коэффициента корреляции (r) по формуле:
Значение коэффициента корреляции находиться в интервале от -1 до 1. Знак коэффициента корреляции, аналогично знаку коэффициента регрессии, характеризует направление связи: положительное значение – прямую связь, отрицательное значение – обратную. Величина коэффициента корреляции свидетельствует о тесноте связи: чем больше но по модулю к 1, тем связь теснее; чем ближе к 0, тем связь слабее.
Необходимые промежуточные расчеты приведены в таблице 3.1. Значит значение коэффициента корреляции составит:
Значимость коэффициента корреляции оценивается при помощи формулы:
=0,586
Так как табличное значение t-критерия Стьюдента больше его расчетного (5,01 >2,01) коэффициент корреляции признается незначимым.
Значение линейного коэффициента корреляции и индекса корреляции линейной модели, как правило, совпадают. Их значение оценивается по шкале Чеддока.
Шкала Чеддока
Показатель тесноты связи
| 0,1-0,3
| 0,3-0,5
| 0,5-0,7
| 0,7-0,9
| 0,9-0,999
| Характеристика связи
| слабая
| умеренная
| заметная
| тесная
| очень тесная
| Положительный знак коэффициента индекса корреляции свидетельствует о прямой связи. Величина коэффициента индекса корреляции (0,586) характеризует связь между признаками как заметную.
3 СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ДИНАМИКИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ
Показатели любой сферы общественной деятельности изменяются с течением времени. Это происходит за счет совокупного действия множества факторов, влияющих на социально-экономический объект. Сочетание и характеристики этих факторов также подвержены изменению. Поэтому динамическое моделирование в статистической науке использует время в качестве собирательного факторного признака развития.
Выявление закономерностей изменения социально-экономических объектов и явлений во времени осуществляется посредством построения и анализ рядов динамики.
Ряд динамики - это статистические данные, характеризующиеся двумя основными элементами: показателем времени (t) и уровнем ряда динамики (у).
Уровень ряда динамики - это объемный или процентный показатель состояния объекта статистического исследования на определенный момент или интервал времени.
В таблице 3.1 приведены исходные данные для исследования рядов динамики.
Год
| Суммарный грузооборот по кварталам, млн. ткм.
| Грузооборот за год, млн. ткм.
| I кв
| II кв
| III кв
| IV кв
|
| 296,19
| 262,67
| 196,17
| 297,2
| 1052,23
|
| 400,2
| 333,81
| 258,76
| 329,6
| 1322,37
|
| 440,54
| 374,31
| 274,87
| 322,53
| 1412,37
|
| 381,27
| 409,47
| 283,16
| 352,64
| 1426,54
|
| 443,77
| 446,39
| 340,32
| 404,05
| 1634,53
| Таблица 3.1. Грузооборот транспортных предприятий г. Екатеринбурга в 2008-2012 годах
Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...
|
Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...
|
Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...
|
Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...
|
|
ТРАНСПОРТНАЯ ИММОБИЛИЗАЦИЯ
Под транспортной иммобилизацией понимают мероприятия, направленные на обеспечение покоя в поврежденном участке тела и близлежащих к нему суставах на период перевозки пострадавшего в лечебное учреждение...
Кишечный шов (Ламбера, Альберта, Шмидена, Матешука) Кишечный шов– это способ соединения кишечной стенки.
В основе кишечного шва лежит принцип футлярного строения кишечной стенки...
Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка:
а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...
|
|
ТЕРМОДИНАМИКА БИОЛОГИЧЕСКИХ СИСТЕМ. 1. Особенности термодинамического метода изучения биологических систем. Основные понятия термодинамики. Термодинамикой называется раздел физики...
Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...
Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реакций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...
|
|