^ Наверх

Добьёмся успеха вместе!


6

 

ПОСТРОЕНИЕ ГРАФИКА РАСПРЕДЕЛЕНИЯ

В программе STATISTICA реализован графически-ориентированный подход к анализу данных. Он заключается в том, чтобы получать всестороннее визуальное представление данных на всех этапах статистической обработки. В связи с этим программа обладает огромным набором различных типов графиков, которые можно построить, обратившись к пункту главного меню Graphs (рисунок ниже) или к соответствующим закладкам того или иного статистического модуля.

Выбор типа графика в программе STATISTICA.

 

Для того чтобы программа смогла построить график распределения, из данных столбца «Лейкоциты» нужно сформировать вариационный ряд, т.е. в двойной ряд чисел, в котором содержатся значения анализируемого признака и частоты их встречаемости в выборке. Перед тем как сделать это, добавим два столбца в таблицу Spreadsheet, содержащую данные о числе лейкоцитов. Подведите курсор к заголовку столбца «Лейкоциты» и нажмите правую клавишу мыши. В выскочившем контекстном меню выберите пункт Add Variables (добавить переменные). Появится диалоговое окно, в котором нужно указать, сколько переменных мы намерены добавить (поле How Many: выставляем 2) и после какой из существующих переменных их нужно вставить (поле After: наберите слово «Лейкоциты»). Остальные настройки установите так, как это показано на рисунке Диалоговое окно «Add Variables». В таблице появятся два новых столбца с названиями «NewVar1» и «NewVar2». Переименуйте их в «Количество лейкоцитов» и «Количество пациентов» соответственно (о том, как задать имя переменной, рассказано выше).

Диалоговое окно «Add Variables»

 

Теперь построим вариационный ряд. Для этого в пункте основного меню Statistics (Статистические процедуры) выберем модуль Basic Statistics/Tables (Основные статистические показатели/Таблицы), а в нем - опцию Frequency Tables (Таблицы частот). В появившемся диалоговом окне программе необходимо указать, какую именно переменную мы собираемся анализировать. Для этого служит кнопка Variables (переменные) (рисунок ниже). При нажатии на нее всплывает еще одно окошко (Select the variables for the analysis), основная часть которого занята списком переменных, имеющихся в таблице Spreadsheet. Дважды кликните по пункту «Лейкоциты», а затем нажмите либо кнопку Summary: Frequency Tables (Результат: Частотные таблицы), либо Summary (Результат), либо просто клавишу «Ввод» на клавиатуре.

Выбор переменной для анализа Frequency Tables

 

В итоге программа выдаст таблицу, представляющую собой «расширенный» вариант вариационного ряда. В этой таблице имеются следующие столбцы:

  • Category (Категория): содержит ранжированные численные значения анализируемой переменной, отмеченные в выборке. В случае с нашим примером видим, что количество лейкоцитов у пациентов изменялось от 6,4 до 27.
  • Count (Счет): здесь приведены частоты, с которыми в выборке встречались те или иные значения переменной (так, в ходе исследования обнаружено, что уровень лейкоцитов 6,4 был у 1 пациента, 21,4 у 4 пациентов, а 11,6 у 3 пациентов и т.д.).
  • Cumulative count: накопленные частоты численных значений переменной.
  • Percent: процентная доля, которую составляет каждая из частот от общего числа наблюдений.
  • Cumulative percent: накопленные процентные доли частот.

Последняя строка итоговой таблицы называется Missing (Отсутствующие) - она имеет отношение к пропущенным (т.е. не внесенным в таблицу) значениям анализируемой переменной. Таковых в нашем примере нет, в связи с чем, на пересечении столбца Count и строки Missing видим 0.

Рассмотрите внимательно: итоговая таблица анализа Frequency Tables является частью окна с заголовком Workbook (рабочая книга). Такая форма вывода результатов очень удобна и является характерной особенностью программы STATISTICA. Результаты любого анализа, который  в дальнейшем применялся бы к данным открытого в текущий момент файла, заносился бы в эту же рабочую книгу на отдельный лист. Структура рабочей книги (= каталог выполненных анализов) отображается в специальном окошке слева. Рабочую книгу можно сохранить в виде самостоятельного файла (с расширением .stw) и при необходимости вернуться к ней в любое время.

 

Рабочая книга, содержащая результат анализа Frequency Tables.

 

Для построения графика распределения нам потребуются числа из столбцов Category и Count, которые необходимо будет перенести из итоговой таблицы анализа Frequency Tables в таблицу Spreadsheet. Чтобы скопировать данные из столбца Category, выполните следующие действия:

  • Подведите курсор к первой ячейке столбца Category, нажмите левую кнопку мыши и, удерживая ее, доведите курсор до предпоследней ячейки этого же столбца. При этом выделятся все ячейки таблицы (за исключением строки Missing). Все они нам не нужны, поэтому...
  • Нажмите правую кнопку мыши и из появившегося контекстного меню выберите пункт Select case names only (Выбрать только имена наблюдений), находящийся в самом верху списка.
  • Примените сочетание клавиш Ctrl+C.
  • Установите курсор в первую ячейку столбца «Количество лейкоцитов» таблицы Spreadsheet.
  • Примените сочетание клавиш Ctrl+V. Готово!

!! Данные из столбца Count итоговой таблицы анализа Frequency tables легко выделяются, копируются (Ctrl+C) и вставляются в столбец «Количество пациентов» обычным способом (Ctrl+V), в чем вы можете убедиться сами... В результате описанных операций по переносу данных таблица Spreadsheet должна принять вид, подобный приведенному на рисунке.

Результат копирования и переноса данных из столбцов Category и Count итоговой таблицы Frequency Tables в таблицу Spreadsheet

 

Теперь у нас есть все необходимое, чтобы построить полигон распределения по данным о количестве лейкоцитов у пациентов с перитонитом. В пункте главного меню Graphs (Графики) выберите подпункт 2D Graphs (двухмерные графики), а в нем - опцию Line Plots (Variables) (линейные графики (по переменным)). В появившемся диалоговом окне выберите закладку Advanced (расширенные настройки). На ней в поле Graph Type (Тип графика) выделите XY Trace, а в выпадающем меню Display points (отображать точки) выберите On (Включить). Наконец откройте закладку Options 1, разыщите на ней выпадающее меню Case labels (Подписи наблюдений) и выберите пункт Off (Отключить).

Окно 2D Line Plots на закладке Advanced

 

Теперь программе необходимо указать, в каком из столбцов таблицы Spreadsheet находятся данные о количестве лейкоцитов (ось X), а в каком - данные о частотах встречаемости (ось Y). Для этого снова возвращаемся на закладку Advanced и нажимаем кнопку Variables (переменные). Появится окошко с двумя списками переменных. В левом списке выделяем пункт «Количество лейкоцитов», а в правом - пункт «Количество пациентов». Жмем ОК, затем еще раз ОК и получаем график. Заметьте: график является составной частью рабочей книги Workbook, как это ранее было с итоговой таблицей анализа Frequency Tables.

График распределения, построенный с помощью программы STATISTICA

 

Если кликнуть один раз по любой части получившегося графика правой кнопкой мыши и из контекстного меню выбрать пункт Copy Graph, можно скопировать его в буфер обмена и затем вставить в документ какого-либо другого Windows-приложения, например, MS Word или Excel. График можно сохранить также как самостоятельный файл (с расширением .stg). Для этого необходимо выделить иконку графика в каталоге рабочей книги и, удерживая нажатой левую клавишу мыши, перетащить ее за пределы рабочей книги. В результате график окажется в отдельном окошке. Теперь, кликнув по нему правой кнопкой мыши, можно применить команду Save Graph (сохранить график).

 

 

 

 

Процедура, предшествующая сохранению графика в виде самостоятельного файла.

 

Программа STATISTICA предоставляет огромные возможности для придания графику необходимого внешнего вида. Достаточно кликнуть по интересующему вас элементу, и появится окошко со множеством опций по его преобразованию (заголовок, оси и их названия, маркеры, их форма, цвет и размер, и т.п.).

 

 

ПОСТРОЕНИЕ ГИСТОГРАММЫ

Ниже представлены данные о температуре тела пациентов с перитонитом (в °С):

Размах значений температуры тела составляет 38,6 – 35,3 = 3,3. Для графического изображения частотного распределения в данном случае лучше подходит гистограмма, а не график распределения.

Откройте файл «Распределение.sta» и добавьте в него еще одну переменную после столбца «Количество пациента» (как это сделать см. выше) и назовите ее «температура». Введите в этот новый столбец данные о температуре тела пациентов. Далее для построения гистограммы выполните следующие действия:

В основном меню Graphs выберите 2D Graphs > Histograms (Гистограммы).

В появившемся окне выберите закладку Advanced. Нажав на кнопку Variables, выберите для анализа переменную «Температура». В поле Fit type (Тип подгонки) выберите Off, а в выпадающем меню Y axis (Ось Y) - %. Остальные настройки оставьте без изменений.

Нажмите кнопку OK. В результате у вас должен получиться график, подобный приведенному на рисунке:

Гистограмма, построенная с помощью программы STATISTICA.

laquo;Распределение.sta


Аватар

Комментарий №1. Автор:Igoroshka

[04.01.2014 15:03]

Статистика имеет неплохой набор основных типов графиков. Но если нужно совместить несколько графиков на один или построить сложный график, Статистика очень ограничена в этих возможностях.

 


Аватар

Комментарий №2. Автор:retros

[03.03.2017 15:48]

В пакете STATISTICA можно быстро построить гистограмму, но алгоритм построения остаётся "за кадром". Это иногда может быть недостатком, особенно при обучении. В этом случае полезно использовать MS Excel, что позволяет выполнять построение по шагам, усваивая сущность алгоритма построения, но избавляясь от рутинных расчётов. Методику построения гисттограмм в MS Excel можно найти на http://statmetkach.ru


Добавление комментариев доступно только зарегистрированным пользователям
Google+