Решение. По графику видно, что точки выстраиваются в некоторую прямую линию.Рис. 1.4. По графику видно, что точки выстраиваются в некоторую прямую линию. Для удобства дальнейших вычислений составим таблицу. Таблица 1.3
Рассчитаем параметры линейного уравнения парной регрессии . Для этого воспользуемся формулами (1.5): ; . Получили уравнение: . Т.е. с увеличением дохода семьи на 1000 руб. расходы на питание увеличиваются на 168 руб. Как было указано выше, уравнение линейной регрессии всегда дополняется показателем тесноты связи – линейным коэффициентом корреляции : . Близость коэффициента корреляции к 1 указывает на тесную линейную связь между признаками. Коэффициент детерминации (примерно тот же результат получим, если воспользуемся формулой (1.7)) показывает, что уравнением регрессии объясняется 98,7% дисперсии результативного признака, а на долю прочих факторов приходится лишь 1,3%. Оценим качество уравнения регрессии в целом с помощью -критерия Фишера. Сосчитаем фактическое значение -критерия: . Табличное значение (, , ): . Так как , то признается статистическая значимость уравнения в целом. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем -критерий Стьюдента и доверительные интервалы каждого из показателей. Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции : , , . Фактические значения -статистик: , , . Табличное значение -критерия Стьюдента при и числе степеней свободы есть . Так как , и , то признаем статистическую значимость параметров регрессии и показателя тесноты связи. Рассчитаем доверительные интервалы для параметров регрессии и : и . Получим, что и . Средняя ошибка аппроксимации (находим с помощью столбца 10 таблицы 1.3; ) говорит о хорошем качестве уравнения регрессии, т.е. свидетельствует о хорошем подборе модели к исходным данным. И, наконец, найдем прогнозное значение результативного фактора при значении признака-фактора, составляющем 110% от среднего уровня , т.е. найдем расходы на питание, если доходы семьи составят 9,85 тыс. руб. (тыс. руб.) Значит, если доходы семьи составят 9,845 тыс. руб., то расходы на питание будут 2,490 тыс. руб. Найдем доверительный интервал прогноза. Ошибка прогноза , а доверительный интервал (): . Т.е. прогноз является статистически надежным. Теперь на одном графике изобразим исходные данные и линию регрессии: Рис. 1.5. Пример 2. По территориям региона приводятся данные за 199X г. Таблица 1
Требуется: 1. Построить линейное уравнение парной регрессии от . 2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. 3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента. 4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня. 5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. 6. На одном графике построить исходные данные и теоретическую прямую. Решение 1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу D.2. Таблица 2
; . Получено уравнение регрессии: . С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,89 руб. 2. Тесноту линейной связи оценит коэффициент корреляции: ; . Это означает, что 51% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации: . Качество построенной модели оценивается как хорошее, так как не превышает 8-10%. 3. Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия: . Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как , то уравнение регрессии признается статистически значимым. Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей. Табличное значение -критерия для числа степеней свободы и составит . Определим случайные ошибки , , : ; ; . Тогда ; ; . Фактические значения -статистики превосходят табличное значение: ; ; , поэтому параметры , и не случайно отличаются от нуля, а статистически значимы. Рассчитаем доверительные интервалы для параметров регрессии и . Для этого определим предельную ошибку для каждого показателя: ; . Доверительные интервалы Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля. 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: руб., тогда прогнозное значение заработной платы составит: руб. 5. Ошибка прогноза составит: . Предельная ошибка прогноза, которая в случаев не будет превышена, составит: . Доверительный интервал прогноза: руб.; руб. Выполненный прогноз среднемесячной заработной платы является надежным () и находится в пределах от 131,66 руб. до 190,62 руб. 6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую (рис. D.1):
|