Студопедия — Использование гистограмм для анализа данных
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Использование гистограмм для анализа данных






Лабораторная работа №1

Визуальный анализ статистических данных

 

Статистические данные, как правило, представляются в виде числовых таблиц больших размеров. Если пытаться анализировать данные, просматривая таблицу, потребуются большие затраты времени и, чаще всего, целый ряд свойств данных останется не выявленным, поскольку представление информации в виде чисел лишено наглядности и не дает конкретного визуального указания о наличии этих свойств. Более информативно для анализа использование графического отображения данных, например гистограмм. С помощью табличного процессора Microsoft Excel, либо отдельного статистического пакета программ (например, «Статистика») можно с большей экономией времени построить гистограмму и получить информацию для визуального анализа данных.

Использование гистограмм для анализа данных

Гистограмма представляет собой столбиковую диаграмму частот. По горизонтальной оси диаграммы откладывают измеренные значения из набора данных, по вертикальной – частоту встречаемости этих значений. Высота каждого столбца показывает частоту (количество) значений из набора данных, принадлежащих соответствующему интервалу, равному ширине этого столбца.

Визуальный анализ гистограмм позволяет выявить характер распределения данных и ответить на следующие шесть вопросов:

1. Какие значения типичны для заданного набора данных?

2. Как различаются между собой значения (диапазон значений)?

3. Сконцентрированы ли данные вокруг некоторого типичного значения?

4. Какой характер имеет эта концентрация данных? В частности, одинаков ли характер «затухания» для малых и больших значений данных?

5. Есть ли в заданном наборе такие значения, которые сильно отличаются от остальных и требуют специальной обработки (выбросы)?

6. Можно ли сказать, что в целом это однородный набор или отчетливо наблюдается наличие групп, которые надо анализировать отдельно?

Задание 1. Построить и проанализировать гистограмму процентных ставок ссуд под залог недвижимости.

В таблице 1 представлены размеры фиксированной процентной ставки ссуд под залог недвижимости, предоставляемых на 30 лет ипотечными компаниями.

Таблица 1. Процентные ставки ссуд под залог недвижимости

Кредитор Процентная ставка Кредитор Процентная ставка Кредитор Процентная ставка
  7,000   7,125   6,875
  6,875   7,125   6,500
  6,875   7,000   6,875
  6,750   7,000   7,000
  6,875   7,000   6,875
  7,250   6,875   7,000
  6,875   6,875   7,250
  7,000   6,500   7,000
  6,875   6,500   6,625
  7,000   6,500   6,875
  7,250   7,250   6,625
  7,000   6,750   6,625
  7,000   6,875   6,250
  6,125   6,875   5,875
  6,750   6,875   7,000

Чтобы построить гистограмму в Excel с помощью статистического пакета Анализ данных, выполните следующие действия.

В папке Мои документы создайте папку Статистика. На Рабочем столе создайте ярлык для папки Статистика.

Откройте программу Excel. Щелкните на кнопке Сохранить на панели инструментов Стандартная. В появившемся диалоговом окне откройте папку Статистика и задайте имя файлу Гистограммы.xls.

На Листе1 в ячейке A1 задайте метку (название) Процентная ставка, а в диапазон A2:A46 введите из Таблицы 1 значения процентных ставок.

Выберите из меню команду: Сервис®Анализ данных®Гистограмма. Щелкните на кнопке OK.

В появившемся диалоговом окне в области Входные данные укажите Входной интервал:, выделяя диапазон данных А1:А46 вместе с меткой. Установите флажок Метки, чтобы указать, что метка включена в диапазон входного интервала.

В области Параметры вывода установите флажок Вывод графика и включите параметр Выходной интервал: для вывода гистограммы на том же листе, где располагаются входные данные. Для определения места вывода гистограммы сначала щелкните в текстовом поле параметра Выходной интервал:, а затем выделите ячейку D1, указывающую адрес левого верхнего угла поля вывода гистограммы. Щелкните на кнопке OK.

Замечание. Если не указывать параметр Интервал карманов:, определяющий ширину столбца, то программа Excel устанавливает равные интервалы автоматически. Количество интервалов приближенно равно квадратному корню из числа значений данных.

Excel разместит на листе таблицу распределения частот и гистограмму как показано ниже.

Карман Частота
5,875  
6,104167  
6,333333  
6,5625  
6,791667  
7,020833  
Еще  

Таблица распределения частот включает исходные карманы. Значения карманов указывают правые границы интервалов. Например, карману со значением 6,5625 соответствует интервал (6,333333; 6,5625]. В данный интервал попали 4 значения процентных ставок. На гистограмме Excel размещает значения карманов по оси Х в середине интервалов, а не у отметок, разделяющих интервалы.

Для того, чтобы гистограмма была удобочитаемой и имела обычный вид, проведите форматирование гистограммы следующим образом.

Измените размеры диаграммы так, чтобы она разместилась в диапазоне G1:L16.

Удалите легенду. Для этого щелкните по легенде Частота (справа от гистограммы) и нажмите клавишу [Delete].

Для устранения зазоров между столбцами гистограммы, дважды щелкните на любом столбце, выберите в появившемся диалоговом окне вкладку Параметры, установите нулевое значение параметра Ширина зазора и щелкните на кнопке OK.

Для уменьшения разрядности значений процентных ставок на гистограмме до одного знака после запятой выделите диапазон значений карманов D2:D7 и воспользуйтесь соответствующей кнопкой на панели инструментов Форматирование.

Дважды щелкните по значениям оси Y. В диалоговом окне Формат оси на вкладке Шкала установите в текстовом поле цена основных делений: значение 4, а в текстовом поле цена промежуточных делений: значение 1. На вкладке Шрифт установите размер 10. Щелкните на кнопке ОК.

Дважды щелкните по значениям оси Х. В диалоговом окне Формат оси на вкладке Выравнивание дважды щелкните в текстовом поле градусов и введите значение 0, чтобы при любом изменении размеров диаграммы подписи по оси Х всегда были горизонтальными. На вкладке Шрифт установите размер 10. Щелкните на кнопке ОК.

Выделите название диаграммы. Используя список на панели инструментов Форматирование, установите размер шрифта 10. Введите новое название Процентные ставки ссуд под залог недвижимости. Нажмите клавишу [Enter].

Выделите название оси Y. Установите размер шрифта 10. Введите новое название Частота (количество ипотечных компаний). Нажмите клавишу [Enter].

Выделите название оси Х. Установите размер шрифта 10. Введите новое название Процентная ставка. Нажмите клавишу [Enter].

Карман Частота
5,9  
6,1  
6,3  
6,6  
6,8  
7,0  
Еще  

Выделите Область построения диаграммы и увеличьте ее высоту. Щелкните на кнопке Сохранить. Ниже показан вид полученной гистограммы.







Дата добавления: 2015-09-04; просмотров: 2124. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Функциональные обязанности медсестры отделения реанимации · Медсестра отделения реанимации обязана осуществлять лечебно-профилактический и гигиенический уход за пациентами...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор, если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...

Конституционно-правовые нормы, их особенности и виды Характеристика отрасли права немыслима без уяснения особенностей составляющих ее норм...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

Значення творчості Г.Сковороди для розвитку української культури Важливий внесок в історію всієї духовної культури українського народу та її барокової літературно-філософської традиції зробив, зокрема, Григорій Савич Сковорода (1722—1794 pp...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия