Основы работы с программой spss урок. Основы работы в SPSS. Основные значения параметров переменной

1

В последнее время широкое распространение в системе образования получили информационные технологии. Для получения количественных показателей о качестве подготовленности испытуемых требуется обработка больших объемов данных массового тестирования. Для этого применяются различные программные среды, среди которых особое место занимает программа SPSS - универсальная система статистического анализа и управления данными. Основные блоки SPSS: редактор данных; средство просмотра; многомерные мобильные таблицы; высококачественные; доступ к базам данных; преобразование данных; справочная система; командный язык. С помощью компьютерной программы SPSS возможна точная и быстрая обработка результатов тестирования. Программа SPSS является эффективным инструментом для практической работы в области социологического и педагогического анализа, обеспечивает быструю и точную обработку данных.

единый государственный экзамен.

телетестинг

компьютерное тестирование

бланочное тестирование

массовое централизованное тестирование

анализ пригодности

факторный анализ

непараметрические методы

образование

частотный анализ

программа spss

латентные характеристики

оценивание

обучение

технология массового тестирования

систематический анализ

итоговая аттестация

мониторинг

информационные технологии

1. SPSS искусство обработки информации А. Бююль, П.Цефель М.: ДиаСофтЮП, 2005. - 608 c.

2. Ефремова Н.Ф. Тестирование и мониторинг: рекомендации учителю // Стандарты и мониторинг в образовании. 2001. – № 3.

3. Ефремова Н.Ф., Месхи Б.Ч. Системность и преемственность в формировании фонда оценочных средств технического вуза // Совет ректоров. № 5. 2011. - С. 35-40.

4. Наследов А. Д. IBM SPSS 20 Statistics и AMOS: профессиональный статистический анализ данных. Практическое руководство. СПб.: Питер, 2013. – 416 с.

5. Обработка и анализ социологических данных с помощью пакета SPSS. Учебно-методическое пособие. Е.В. Дорогонько. Сургут. Издательский центр СурГУ. 2010. – 60 с.

6. Пациорковский В.В., Пациорковская В.В. SPSS для социологов. Учебное пособие / В.В.Пациорковский, В.В. Пациорковская. - М.: ИСЭПН РАН, 2005. - 434 c.

7. Усатая И.Е., Давыдова М.А. Эвалюация как инструмент управления качеством обучения в образовательной практике // Международный студенческий научный вестник. 2016. № 2.; URL: http://www.?id=14357

В последнее время широкое распространение в системе образования получили информационные технологии. Они применяются для обучения, контроля, проведения итоговой аттестации выпускников, самообучения, самоконтроля и др. Важнейшим условием повышения качества обучения становится систематический анализ объективных данных независимого контроля учебных достижений, осуществление мониторинга и диагностики подготовленности обучающихся для получения результатов, соответствующих их возможностям и потребностям. Все большее внимание исследователей для решения различных задач образования и самоуправления образовательной деятельностью привлекают возможности технологий массового тестирования .

Важную роль в развитии мониторинга результатов обучения должно играть системное и преемственное оценивание, обеспечивающее суждение о готовности студента к продолжению обучения и его участию в общественно-производственной деятельности. Трудность заключается в том, что требуются не только качественное обучение, но и качественное оценивание, качественные оценочные средства и процедуры, а также обеспечение мотивации при выполнении тестов, чтобы проявление латентных характеристик испытуемых было максимальным . Поэтому оценка должна проводиться как специфически целенаправленный и упорядоченный процесс определения набора и достигнутого уровня подготовленности, а результаты выражать количественно, независимо от того, насколько просто или сложно они поддаются оцениванию.

Для получения количественных показателей о качестве подготовленности испытуемых требуется обработка больших объемов данных массового тестирования. Для этого применяются различные программные среды, среди которых особое место занимает программа SPSS Statistics («Statistical Package for the Social Sciences») — это «статистический пакет для социальных наук. Он является лидером рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных и педагогических науках. SPSS - универсальная система статистического анализа и управления данными. Эта аббревиатура первоначально означала Statistical Package for the Social Science (статистический пакет для социальных наук). Затем исходной аббревиатуре было дано новое толкование: Superior Performance Software System (система программного обеспечения высшей производительности).

В начале 1970-х годов Норман Най (Norman Nie), Дейл Бент (Dale Bent) и Хэдлай Халл (Hadlai Hull) зарегистрировали торговый знак SPSSR statistical software. Компания с одноименным названием была создана ими в 1968 г. В 1975 г. компания была преобразована в корпорацию с главным офисом в Чикаго (Chicago, IL USA). За годы существования корпорацией было разработано множество программных продуктов, в том числе и SPSS/PC+TM, первая версия которого появилась в 1984 г. В 2009 г. пакет стал называться PASW Statistics (Predictive Analytics SoftWare - интеллектуальное аналитическое программное обеспечение). С июля 2009 г. пакет сопровождается фирмой IBM (International Business Machines) под именем IBM SPSS Statisics. В 2013 г. вышла очередная версия пакета - IBM SPSS Statistics 22, работающей под управлением различных операционных систем Windows, MacOsX, Linux.

По всем параметрам SPSS является сложным и мощным статистическим пакетом. С помощью пакета SPSS можно проводить практически любой анализ данных, а последние версии программы находят применение в самых разных научных областях, в том числе в педагогических науках . Сегодня SPSS - это программный продукт и одновременно защищенная торговая марка всемирно известной американской фирмы SPSS Inc., правление которой так и остается в Чикаго. Этот пакет занимает ведущее положение среди программ, предназначенных для статистической обработки информации в социальных и педагогических науках. Вместе со всем программным обеспечением указанного профиля он прошел большой путь эволюции: сначала от первых версий SPSS для больших ЭВМ, до версий, ориентированных на PC-DOS/MS-DOS, а затем до версий, работающих в среде Windows. SPSS представляет дружественный пользовательский интерфейс, который делает процесс ввода и статистического анализа доступным для начинающего и удобным для опытного пользователя. Редактор данных пакета позволяет удобно (табличным способом) вводить и корректировать входные данные. SPSS дает возможность получать множество высококачественных графиков и различных диаграмм. С помощью пакета, используя таблицы, простые меню и диалоговые окна, можно выполнять, во-первых, анализ огромных файлов данных с тысячами переменных, и, во-вторых, делать все это без строчной записи команд в языке программирования. С помощью программы SPSS можно: управлять данными; упорядочивать данные; преобразовывать данные, создавать новые переменные; анализировать данные.

Возможные области применения SPSS: хранение и анализ данных опросов, маркетинговых исследований и продаж, финансовый анализ и др. В социологии и педагогике пакет позволяет автоматизировать процесс создания баз данных разной информации, их хранение и обработку. Этапы аналитического процесса, реализуемого в SPSS: планирование; сбор данных; обеспечение доступа к данным; подготовка данных к анализу; выполнение анализа; формирование отчетов; представление и распространение результатов. В педагогике пакет позволяет автоматизировать обработку и интерпретацию результатов тестирования .

Первая версия SPSS для Windows имела порядковый номер 5.0. Затем последовали версии 6.0, 6.1, 7.0, 7.5, 8.0, 9.0 и, наконец, 10.0 и 11.5 и выше. Начиная с SPSS версии 7.0, оболочкой служит минимум Windows95 (NT).

Наряду с использованием своего собственного типа данных, пакет SPSS, может считывать данные практически из любых типов файлов и использовать их для создания отчетов в форме таблиц, графиков и диаграмм, а также вычислять описательные статистики, производить сложный статистический анализ и моделирование.

Пакет имеет модульную структуру. Модули пакета представляют собой интегрированную совокупность программных продуктов, обеспечивающих комплексное исследование - от планирования до управления данными, выполнения анализа и представления результатов.

Основные модули SPSS: IBM SPSS Statistics Base, IBM SPSS Decision Trees, IBM SPSS Advanced Statistics, IBM SPSS Direct Marketing, IBM SPSS Bootstrapping, IBM SPSS Exact Tests, IBM SPSS Categories, IBM SPSS Forecasting, IBM SPSS Complex Samples, IBM SPSS Missing Values, IBM SPSS Conjoint, IBM SPSS Neural Networks,IBM SPSS Custom Tables, IBM SPSS Regression, IBM SPSS Data Preparation. Состав модулей зависит от варианта поставки.

Основные блоки SPSS:

Редактор данных - гибкая система, внешне похожая электронную таблицу, для определения, ввода, редактирования и просмотра данных.

Средство просмотра - упрощает просмотр результатов, позволяя показывать и скрывать отдельные элементы вывода, изменять порядок вывода результатов, перемещать готовые к презентации таблицы и диаграммы в другие приложения и получать их из приложений.

Многомерные мобильные таблицы - служат для отображения результатов анализа. Можно исследовать таблицы, перемещая строки, столбцы и слои и, таким образом, выявлять важные моменты, которые могут потеряться в стандартных отчетах. Также можно сравнивать группы, расщепляя таблицы так, чтобы каждый раз выводилась только одна группа.

Высококачественные графика - средство формирования полноцветных диаграмм с высоким разрешением: круговые и линейчатые диаграммы, гистограммы, диаграммы рассеяния, объемные диаграммы и многие другие.

Доступ к базам данных - конструктор чтения баз данных, позволяющий загрузить данные из любого источника с помощью нескольких нажатий кнопки мыши.

Преобразование данных - средство преобразования данных, помогает готовить данные к анализу. Можно с легкостью выделять подмножества в данных, объединять категории, добавлять, агрегировать, сливать, расщеплять и транспонировать файлы, а также проводить другие преобразования.

Справочная система:

Электронный учебник, предлагающий детальный обзор;

Контекстная справка в диалоговых окнах помогает разобраться в конкретных задачах;

Всплывающие определения в мобильных таблицах объясняют статистические термины;

Репетитор по статистике помогает в поиске необходимой процедуры, - примеры анализа помогают в интерпретации результатов.

Командный язык. Несмотря на то, что многие задачи могут быть выполнены при помощи мыши и диалоговых окон, в SPSS также есть мощный командный язык, позволяющий сохранять и автоматизировать многие повторяющиеся задачи. Командный язык также позволяет пользоваться некоторыми функциональными возможностями, недоступными через меню и диалоговые окна. Полная документация по командному языку интегрирована в справочную систему и доступна в виде отдельного документа PDF Руководство по синтаксису, который можно вызвать в меню «Справка» .

Структура пакета включает в себя команды определения данных, преобразования данных, команды выбора объектов. В нем реализованы следующие методы статистической обработки информации:

  • суммарные статистики по отдельным переменным;
  • частоты, суммарные статистики и графики для произвольного числа переменных;
  • построение N-мерных таблиц сопряженности и получение мер связи; средние, стандартные отклонения и суммы по группам;
  • дисперсионный анализ и множественные сравнения;
  • корреляционный анализ; дискриминантный анализ; однофакторный дисперсионный анализ;
  • общая линейная модель дисперсионного анализа (GLM);
  • факторный анализ;
  • кластерный анализ;
  • иерархический кластерный анализ;
  • иерархический лог-линейный анализ;
  • многомерный дисперсионный анализ; непараметрические тесты; множественная регрессия;
  • методы оптимального шкалирования и т.д.

Кроме того, пакет позволяет получать разнообразные графики - столбиковые и круговые, ящичковые диаграммы, поля рассеяния и гистограммы и др. .

До недавнего времени обучение и контроль качества в сфере образования проводились традиционными методами в основном силами тех, кто проводит образовательный процесс, что с точки зрения теории менеджмента не способствует его повышению. На сегодняшний день обработка данных массового тестирования проводится автоматически с помощью многочисленных компьютерных программ. Одна из таких программ SPSS , она позволяет эффективно, точно и с экономией времени провести количественную обработку результатов массового тестирования по какому-либо предмету.

Частотный анализ позволяет определить: частоту каждого из вариантов ответа на вопрос из теста; процентную частоту ответа к общему количеству респондентов (доля правильных ответов на данный вопрос, взятая в процентах от общего количества ответов); допустимое процентное значение (отсутствующие значения исключаются); накопленные процентные значения (это сумма процентов допустимых значений).

В SPSS имеется большое количество разнообразных процедур, при помощи которых можно произвести анализ связи между двумя переменными. Связь между переменными, относящимися к номинальной шкале или к порядковой шкале с не очень большим количеством категорий, лучше всего представить в форме таблиц сопряженности. Для этой цели в SPSS реализован тест хи-квадрат, по которому проверяется, есть ли значимое различие между наблюдаемыми и ожидаемыми частотами. Кроме того, существует возможность расчета различных мер связанности.

Преимущество непараметрических методов наиболее заметно, когда в данных имеются выбросы (экстремально большие или малые значения). SPSS предоставляет в распоряжение пользователей немалое количество непараметрических тестов.

Наиболее часто применяемыми тестами являются тесты для сравнения двух и более независимых или зависимых выборок. Это U-тест Манна-Уитни, Н-тест Крускала-Уоллиса, тест Уилкоксона и тест Фридмана. Важную роль также играет тест Колмогорова-Смирнова для одной выборки, который может применяться для проверки наличия нормального распределения. Непараметрические тесты могут, конечно, применяться и в случае нормального распределения значений. Но в этом случае они будут иметь лишь 95 % эффективность по сравнению с параметрическими тестами. Если Вы хотите, к примеру, произвести множественное сравнение средних значений двух независимых выборок, причем выборки частично подчиняются нормальному распределению, а частично — нет, то рекомендуется всегда применять U-тест Манна и Уитни.

Факторный анализ это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводит к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные, сильно коррелирующие между собой. Переменные из разных факторов слабо коррелируют между собой. Таким образом, целью факторного анализа является нахождение таких комплексных факторов, которые как можно более полно объясняют наблюдаемые связи между переменными, имеющимися в наличии.

Факторный анализ возможен, если выполняется ряд критериев. Нельзя факторизовать качественные данные. Переменные должны быть независимыми, а их распределение приближаться к нормальному. Связи между переменными должны быть приблизительно линейны, а в исходной корреляционной матрице несколько корреляций по модулю выше 0,3; выборка испытуемых должна быть достаточно большой.

Анализ пригодности (а также: анализ вопросов или анализ заданий) помогает подбирать вопросы (задания) для тестов. При помощи разнообразных критериев устанавливается, какие задания подходят для определённого теста, а какие нет.

Для этой цели некоторой совокупности (выборке) респондентов предлагают предварительный вариант теста со всеми предполагаемыми заданиями и проводят анализ этих заданий. При помощи этого анализа исключают неподходящие задания, а оставшиеся включают в итоговую форму теста. Тесты подразделяются в зависимости от вида исследуемого личностного признака, а именно выделяются тест уровня образованности, тест способностей и личностный тест. Тестовое задание состоит преимущественно из двух частей: проблемы или вопроса и варианта решения проблемы или ответа.

С появлением массового централизованного тестирования в нашей стране появились формы независимой аттестации учащихся: бланочное и компьютерное тестирование, телетестинг, единый государственный экзамен. Отличительной особенностью такого контроля уровня подготовки учащихся является процедура, в основе которой лежит педагогический тест как средство измерения, обладающее определенными метрическими свойствами: точностью, надежностью, дифференцирующей способностью, валидностью и др.

Методы современного тестирования в настоящее время уже позволяют на достаточно высоком уровне проводить итоговую аттестацию выпускников на всей территории страны в одно и то же время одними и теми же по уровню трудности педагогическими измерителями или контрольно - измерительными материалами (КИМами), тестами нового поколения, с широким использованием информационных технологий.

Кроме того, современная техника и программные продукты автоматизированной проверки результатов тестирования значительно повышают объективность и достоверность образовательной статистики, упрощают работу проверяющим, обеспечивают возможности сравнения и сопоставления средних сертификационных баллов на любой территории и по любой выборке тестируемых, давая возможность анализировать уровень подготовки и причины, обеспечивающие его. С помощью компьютерной программы SPSS возможна точная и быстрая обработка результатов тестирования .

Достоверность данных обеспечивается путем подсчета значимых различий по Т-критерию Стьюдента при помощи компьютерной программы «SPSS 17 for Windows».

Вывод. Программа SPSS является эффективным инструментом для практической работы в области социологического и педагогического анализа, обеспечивает быструю и точную обработку данных. Основной особенностью этой программы служит то, что результаты анализа можно наглядно представлять в виде таблиц и диаграмм различных типов, распространять сетевым пользователям, внедрять полученные результаты в другие программные системы.

Библиографическая ссылка

Давыдова М.А., Усатая И.Е. ВОЗМОЖНОСТИ ПРОГРАММЫ SPSS ПРИ ОБРАБОТКЕ ДАННЫХ МАССОВОГО ТЕСТИРОВАНИЯ // Международный студенческий научный вестник. – 2017. – № 2.;
URL: http://eduherald.ru/ru/article/view?id=16902 (дата обращения: 28.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

Прежде чем непосредственно приступать к обработке данных проведенного исследования в программе SPSS, необходимо грамотно организовать ввод данных.

Заведение данных исследования в программу можно условно разделить на 2 основных этапа:

· Подготовка основы анкеты

· Непосредственный ввод данных

Рассмотрим подробнее эти процедуры.

Этап подготовки основы анкеты. В SPSS данные вводятся в определенном формате. Для того чтобы подготовить форму для ввода и дальнейшей обработки данных, нужно изначально ввести шаблон анкеты в приемлемом для программы виде. Общий вид окна программы выглядит, как показано на рисунке 1.

Рис. 1. Общий вид программы SPSS после запуска.

Когда программа запускается первый раз, пользователю предлагается дополнительное диалоговое окно, в котором предлагается осуществить выбор действий, связанных с редактированием существующей базы, открытию существующего файла и т.п. Как правило, в большинстве случаев это окно не несет существенной нагрузки. По этой причине рекомендуем поставить внизу галочку напротив «Don`t show this dialog in the future». Общий начальный вид программы в принципе стандартен для большинства программ, разработанных под операционную систему Windows. Общая навигационная панель, вид окна и управление окнами практически полностью идентичны большинству программ офисных приложений. По этой причине мы остановимся именно на отличительных особенностях самой программы SPSS.

Рис.2. Рабочее поле программы SPSS.

В программе SPSS существует 2 поля, организованные в виде закладок, аналогичных программе Excel. Вместе с тем эти поля далеко не равнозначны. На рисунке 2 показано рабочее поле программы, в которое пользователь непосредственно вводит данные из анкет (data view). Однако прежде чем осуществлять ввод данных необходимо создать в программе шаблон анкеты, ее основу. Ввод анкетного шаблона осуществляется в поле определения переменных - Variable View. В SPSS данные вводятся в определенном формате. В SPSS все переменные (при вводе) располагаются вертикально, а горизонтально - наблюдение. Рассмотрим подробнее поле Variable View (рисунок 3).

Рис.3. Вид окна переменных.

Каждая переменная - это вопрос в анкете. В программе SPSS по умолчанию установлены 10 основных характеристик, которыми может быть описана переменная: name, type, width, decimals, label, values, missing, columns, align и measure. В принципе, по значимости и важности заполнения эти переменные можно разделить на те, которые относятся к параметрам определения переменной и те, которые отвечают за удобство вывода.

Основные значения параметров переменной:


Name - имя переменной, которое будет отображаться в поле ввода. Это же имя использует программа для идентификации переменной. Имя не должно превышать 8 символов и быть только на английском. (В более поздних версиях программы можно использовать русский текст)

Type - определение типа переменной. Другими словами - какая информация вводится в качестве значений: число, дата, случайное значение, запятая и т.п. Чаще всего используются форматы «числовой» (Nymeric), дата (Date) и строковый (текст, String). В первом случае в качестве значения может приниматься любое число, во втором - дата в определенном формате, в последнем - текст.

Width - длина переменной. Количество разрядов, которые могут уместиться в ячейке.

Decimals - число десятичных разрядов после запятой.

Label - имя, метка, переменной для пользователя, более подробное описание переменной. Обычно формулируется именно как сам вопрос анкеты. Используется в отчетах и позволяет использовать любой шрифт.

Values - метки значений переменной, которые переменная может принимать. В SPSS данные представлены преимущественно в числовом формате, т.к. текстовый формат не поддается статистическому анализу. Например, пол, можно закодировать как 1 - мужской, 0 - женский. При вводе значений очень важно соблюдать последовательность при определении ранговой шкалы - значения должны идти по возрастанию. Чуть ниже будет рассмотрен пример некорректного ввода данных. Для определения метрической шкалы, значения можно не указывать.

Метки значений вводятся в дополнительном окне.

Рис.4. Определение типа переменной.

Missing - определение пропущенных значений. Могут задаваться системой автоматически (System-defined missing values) или пользователем (User-defined missing values).

Columns - определение ширины столбца.

Align - выравнивание в ячейке (левый край, правый, центр).

Рис. 5. Определение значения переменной.

Measure - определение шкалы переменной. Scale - число, метрическая шкала; ordinal - ранговая шкала; nominal - номинальная. Чрезвычайно важная характеристика, так как именно от корректного выбора типа шкалы будет зависеть обработка. В программе заложена графическая подсказка - пиктограмма напротив каждого типа шкалы (линейка - как результат измерения - число; возрастающая гистограмма - определение ранга; круги множеств - несравнимые характеристики, обозначающие непересекающиеся множества).

Рис. 6. Выбор типа шкалы в SPSS.

Остановимся на типах измерительных шкал чуть подробнее.

В принципе, сам тип шкалы определяется исследователем уже на этапе поиска эмпирических индикаторов измеряемых признаков во время составления программы социологического исследования. В окончательном виде шкала воплощается непосредственно в вопросе анкеты. Очень важно соблюдать требования, предъявляемые к формулировке альтернативных вариантов. С точки зрения программы SPSS наиболее важное требование - непересекаемость полученных подмножеств, формируемых альтернативными вопросами. В противном случае довольно сложно при обработке данных (точнее при вводе данных) определить именно тот интервал, то подмножество, к которому респондент действительно отнес данный вопрос.

Например, в качестве альтернативных вариантов ответа на вопрос о возрасте могут быть указаны такие интервалы, как до 15 лет, 15-20, 20-25, 25-30, 30 и старше. При такой формулировке возникает проблема в отношении таких результатов, когда респонденту оказывается 15, 20, 25 и 30 лет - т.е. когда он попадает в границу. Респондент может в случайном порядке, на основании каких-то своих предубеждений) отмечать любой интервал - как более высокий, так и более низкий. При обработке данных этот факт способен исказить действительную картину. Если рассматривать общую классификацию шкал, то ее можно представить в виде следующей схемы.

Рис. 7. Классификация шкал.

Пунктиром на рисунке отмечены стрелки, ведущие к интервальной шкале. Дело в том, что интервальная шкала не является в строгом смысле метрической, а относиться к неметрическим. Однако, в некоторых случаях, например, когда интервалы равны, можно осуществлять с ней некоторые математические операции, характерных для метрической шкалы.

С точки зрения проведения исследования и обработки данных очень важно понимать возможности и ограничения применения того или иного типа измерительной шкалы. Важно понимать, что метрические шкалы, в SPSS - тип scale, обладают самой мощной измерительной способностью с точки зрения аналитических возможностей, т.к. к этой шкале могут быть применены практически без ограничений все статистические процедуры. Номинальные (nominal) - напротив, предоставляют самые слабые возможности. По большому счету - это просто частотное распределение и мода, как показатель меры центральной тенденции.

На практике чрезвычайно важно правильно выбирать измерительную шкалу уже на этапе проектирования анкетного опроса. Важно понимать, что чем больше мы хотим получить информации именно поданному типу вопросов, тем больше нужно стремиться к использованию метрической шкалы. Идеальная анкета с точки зрения возможностей ее обработки представляет собой список вопросов, каждый из которых измеряется количественно. С другой стороны - это практически не реализуемо на практике как в силу невозможности «оцифровать» переменные (например, нереально полностью перевести в метрическую шкалу вопрос относительно пола респондента), так и на основе принципов драматургии самого анкетного инструментария - однообразные вопросы снижают мотивацию респондента и надежность получаемых данных.

Возвращаясь к особенностям определения параметров переменной в программе SPSS, можно отметить, что к параметрам, которые в большей степени ответственны за удобство представления информации относятся: columns (ширина столбца), align (выравнивание в ячейке) и в какой-то мере width (длина) и decimals (число десятичных знаков). Эти параметры в большинстве случаев можно просто не изменять, согласившись с предложенными значениями. А вот относительно остальных параметров определения переменных нужно быть аккуратным, так как именно они окажут существенное влияние на процесс ввода и обработки информации.

После определения переменных в программе SPSS можно непосредственно переходить к вводу данных, которые вводятся в поле data view в виде чисел или других символов (в зависимости от типа переменной). В следующем разделе будет рассмотрен подробный алгоритм определения переменных и ввода значений.

Контрольная работа

«СТАТИСТИЧЕСКАЯ ОБРАБОТКА В ПСИХОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ»

1. Конспект по программе SPSS, что за программа, в чем ее преимущества. 3

1.1. Анализ данных в психологическом исследовании. 5

2. По данным публикаций периодической печати, интернета и т.д. выбрать достаточную информацию для анализа и провести его с объяснением, сделать вывод. 9

2.1. Пример использования программы при расчете коэффициента корреляции 13

Список литературы.. 19

Конспект по программе SPSS, что за программа, в чем ее преимущества

Анализ литературы по математической обработке данных в психологических исследованиях и результаты анкетирования позволили выделить четыре основных программы, применяемых психологами. К ним относятся такие программные продукты как Statistica, SPSS, Stadia и MS Excel. Такие известные математические программы как MatLab, Maple, Mathematica и Mathcad практические не используются в психологических исследованиях из-за своей сложности. Более надежной и хорошо зарекомендовавшей себя программой является SPSS Statistics.

SPSS Statistics (аббревиатура англ. «Statistical Package for the Social Sciences» - «статистический пакет для социальных наук») - компьютерная программа для статистической обработки данных, один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках .

SPSS является комплексной системой анализа данных. SPSS может использовать данные почти из всех типов файлов и генерировать табличные отчёты, графики, рисунки распределений и трендов, описательную статистику и проводить сложные виды статистического анализа.

Программа предоставляет полный набор методов анализа данных, начиная с описательной статистики и заканчивая сложными видами анализа (дисперсионный, факторный, спектральный и т.д.). Представление результатов происходит при помощи различных видов диаграмм и гистограмм. При этом пользователя предоставляется возможность самому создавать шаблоны диаграмм. Но главной особенностью SPSS является ее интеграция с большим количеством внешних программ (MS Excel, dBASE, Lotus, SQL, SYSTAT и т.д.) и форматов (XML, HTML, PC, SAS и т.д.). Еще одной важной особенностью программы является поддержка современных программных решений. Так, последняя версия программ SPSS строится на основе клиент-серверной архитектуры, объявлено, что новая версия программы будет полностью совместима с Windows Vista.

Между 2009 и 2010 название программного обеспечения SPSS было изменено на PASW (Predictive Analytics SoftWare) Statistics.

28 июля 2009 компания объявила, что она была приобретена компанией IBM за 1,2 млрд долл. США. По состоянию на январь 2010 года компания стала называться «SPSS: An IBM Company».

Норман Най, Хедли Халл и Дейл Бент разработали первую версию системы в 1968 году, затем этот пакет развивался в рамках Чикагского университета. Первое пользовательское руководство вышло в 1970 году в издательстве McGraw-Hill, а с 1975 года проект выделился в отдельную компанию SPSS Inc. Первая версия пакета под Microsoft Windows вышла в 1992 году. На данный момент также существуют версии под MacOs X и Linux.

В 2009 году компания SPSS произвела ребрендинг своего статистического пакета, который теперь стал называться PASW Statistics (Predictive Analytics SoftWare). 29 июля 2009 года компания SPSS объявила о том, что она приобретается фирмой IBM.

Возможности и преимущества программы.

· Ввод и хранение данных.

· Возможность использования переменных разных типов.

· Частотность признаков, таблицы, графики, таблицы сопряжённости, диаграммы.

· Первичная описательная статистика.

· Маркетинговые исследования

· Анализ данных маркетинговых исследований

IBM SPSS Statistics 18 функционирует под управлением Windows XP, Windows Vista (32- или 64-разрядных редакций), Windows 7, Mac OS X 10.5, Mac OS X 10.6 и Linux для x86. Требует 800 МБайт места на жёстком диске и 1 ГБайт оперативной памяти.

Современная психология широко используют самые разнообразные статистические методы. Они позволяют наглядно описать некоторое явление или процесс, выявить закономерности, сделать выводы или прогноз. Как пишет Е.В. Сидоренко: «Стало принято использовать математические методы, как принято жениться молодому человеку, если он хочет сделать дипломатическую или политическую карьеру…» При этом «мода» иногда доходит до того, что при планировании эксперимента предлагается строить гипотезу, исходя из расчета определенных статистических процедур получения результатов, их оценивания и анализа, а статистическая верификация выводов считается обязательной.
Можно говорить о том, что программа SPSS является наиболее функциональной и поддерживает самые современные технологий. Однако ее цена и модульная структура приводит к тому, что SPSS является ориентированной на применение в коммерческих проектах .

Основным достоинством программного комплекса SPSS, как одного из самых существенных достижений в области компьютеризированного анализа данных, является самый широкий охват существующих статистических методов, который удачно сочетается с большим количеством удобных средств визуализации результатов обработки. Программный комплекс SPSS развивается уже на протяжении 35 лет, самая последняя 11-ая версия, выпущенная в мае 2002 года, предоставляет широкие возможности не только в сфере психологии, социологии, биологии и медицины, но и в области маркетинговых исследований и управлении качеством продукции, что значительно расширяет применимость комплекса.

Предлагаемая книга содержит минимально необходимый объем сведений по теории статистического анализа. Основное внимание сконцентрировано на особенностях использования отдельных методов, возможностях, которые эти методы предоставляют, а также интерпретации результатов применения данных методов. Ну и конечно, в книге описаны презентационные возможности SPSS 10/11, которые значительно превосходят объем функций, обеспечиваемых стандартными бизнес-программами, типа Excel.

В конце книги приводится таблица соответствия английских и русских пунктов меню SPSS 10/11, а также названий статистических процедур, для того чтобы облегчить переход на русскую версию.

Материал, изложенный в книге, достаточен для того, чтобы студент или молодой ученый сделали свои первые шаги в обобщении статистических данных и поиске скрытых закономерностей, а умудренные опытом профессионалы обрели еще один мощнейший инструмент, повышающий эффективность практической деятельности.

Книга предназначена для широкого круга читателей, специализирующихся на обработке данных в маркетинге, социологии, психологии, биологии и медицине
Содержание в полной новости

Иллюстрированный самоучитель по SPSS

Глава 1. Программа SPSS
Глава 2. Инсталляция
Глава 3. Подготовка данных
Глава 4. SPSS для Windows - обзор
Глава 5. Основы статистики
Глава 6. Частотный анализ.
Глава 7. Отбор данных
Глава 8. Модификация данных
Глава 9. Статистические характеристики
Глава 10. Исследование данных
Глава 11. Таблицы сопряженности
Глава 12. Анализ множественных ответов
Глава 13. Сравнение средних
Глава 14. Непараметрические тесты
Глава 15. Корреляции
Глава 16. Регрессионный анализ
Глава 17. Дисперсионный анализ
Глава 18. Дискриминантный анализ
Глава 19. Факторный анализ
Глава 20. Кластерный анализ
Глава 21. Анализ пригодности
Глава 22. Стандартные графики
Глава 23. Интерактивные графики
Глава 24. Модуль Tables
Глава 25. Экспортирование выходных данных
Глава 26. Программирование
Глава 27. Нововведения в 11-ой версии SPSS
Приложение. Обзор процедур SPSS

Два студента Норман Най (Norman Nie) и Дейл Вент (Dale Bent), специализировавшиеся в области политологии в 1965 году пытались отыскать в Стенфордском университете Сан-Франциско компьютерную программу, подходящую для анализа статистической информации. Вскоре они разочаровались в своих попытках, так как имеющиеся программы оказывались более или менее непригодными, неудачно построенными или не обеспечивали наглядность представления обработанной информации. К тому же принципы пользования менялись от программы к программе.

Так, не долго думая, они решили разработать собственную программу, со своей концепцией и единым синтаксисом. В их распоряжении тогда был язык программирования FORTRAN и вычислительная машина типа IBM 7090. Уже через год была разработана первая версия программы, которая, еще через год, в 1967, могла работать на IBM 360. К этому времени к группе разработчиков присоединился Хэдлай Халл (Hadlai Hull).

Как известно из истории развития информатики, программы тогда представляли собой пакеты перфокарт. Как раз на это указывает и исходное название программы, которое авторы дали своему продукту: SPSS - это аббревиатура от Statistical Package for the Social Science.

В 1970 году работа над программой была продолжена в Чикагском университете, а Норман Най основал соответствующую фирму - к тому моменту уже было произведено шестьдесят инсталляций. Первое руководство для пользователей описывало одиннадцать различных процедур.

Спустя пять лет SPSS была уже инсталлирована шестьсот раз, причём под разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера. В 1975 была разработана уже шестая версия (SPSS6). До 1981 последовали версии 7, 8 и 9.

Командный язык (синтаксис) SPSS в то время был ещё не так хорошо развит, как сейчас, и естественно ориентирован на перфокарты. Поэтому так называемые управляющие карты SPSS состояли из идентификационного поля (столбцы 1-15) и из поля параметров (столбцы 16-80).

В 1983 году командный язык SPSS был полностью переработан, синтаксис стал значительно удобней. Что бы отметить этот факт, программа была переименована в SPSSX, где буква X должна была служить как номером версии в римскими числами, так и сокращением для extended (расширенный).

Так как применение перфокарт к этому моменту уже стало историей, то программа SPSS и информация, подлежащая обработке, сохранялись в отдельных файлах на винчестерах больших ЭВМ, которые тогда использовались повсеместно. Год от года постоянно увеличивалось и количество процедур.

С появлением персональных компьютеров была разработана также и PC-версия SPSS, с 1983 года появилась PC-версия SPSS\PC+. рассчитанная на MS-DOS. Позже, с момента основания в 1984 году европейского торгового представительства в Горинхеме в Нидерландах, SPSS стал широко применяться и в Европе. В настоящее время это самое распространённое программное обеспечение для статистического анализа во всём мире.

Для того, чтобы отразить возможность использования программы во всех областях, имеющих отношение к статистическому анализу, буква X вновь была удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности).

Если PC версия SPSS/PC+ была чуть усовершенствованной версией для больших ЭВМ, то SPSS для операционной системой Windows (SPSS for Windows) стала большим шагом вперёд. Во первых эта версия SPSS обладает всеми возможностями версии для больших ЭВМ, во вторых, за некоторыми немногочисленными исключениями, программой можно пользоваться без особых знаний в области прикладного программирования. Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, то есть с помощью мыши и соответствующих диалоговых окон.

Первая версия SPSS для Windows имела порядковый номер 5. Затем последовали версии 6.0 и 6.1 с некоторыми нововведениями в статистической и графической областях; версия 6.1 была первой статистической программой для Windows, которая использовала 32 битную архитектуру Windows 3.1. Это можно было заметить по более высокой скорости выполнения вычислений. Усовершенствования коснулись также и интерфейса пользователя. В конце концов, была выпущена версия 6.1.3, которая уже могла работать и под Windows 95 и под NT.

В начале 1996 года появилась 7-я версия SPSS, сначала как версия 7.0, а затем 7.5. Наряду с расширением возможностей в сфере статистики, разница между этими двумя версиями заключалась в том, что в версии 7.5 как меню, так и интерфейс программы были выполнены уже не только на английском, но и на других наиболее распространенных языках.

Самым весомым отличием версии 7 по отношению к предыдущим версиям, был абсолютно новый подход к выводу информации на экран. Так, во первых, получил новые очертания так называемый Viewer (Окно просмотра), и, во вторых, более приятный внешний вид приобрели таблицы результатов расчётов (мобильные таблицы). Появившаяся технология мобильных таблиц позволяет перестраивать полученные таблицы различным способами.

Если предшественница данной версии - версия 6.1.3 могла работать как под старой Windows 3.1 так и под новой Windows 95 (NT), то SPSS версии 7 могла работать только при наличии Windows 95 (NT).

За версией 7.5 последовала версия 8.0, прогресс которой заключался в усовершенствовании графической оболочки. Возможность составления интерактивных графиков предоставляет рад преимуществ по сравнению с традиционными графиками, которые являются стандартом для многих других пакетов.

Версия 9.0 включала в себя несколько новых статистических методов, в т.ч. мультиномиальную логистическую регрессию, и несколько новых графических возможностей, расширяющих область интерактивных графиков.

С 2005 года распространяется 13 версия пакета SPSS.

Модули SPSS

Основу программы SPSS составляет SPSS Base (базовый модуль), предоставляющий разнообразные возможности доступа к данным и управления данными. Он содержит методы анализа, которые применяются чаще всего.

Традиционно вместе с SPSS Base (базовым модулем) поставляются ещё два модуля: Advanced Models (продвинутые модели) и Regression Models (регрессионные модели). Эти три модуля охватывают тот спектр методов анализа, который входил в раннюю версию программы для больших ЭВМ.

В приложении А Вы сможете найти информацию о том, какие методы анализа относятся к тому или иному модулю. Пользователь, который приобрёл все эти три модуля, может не обращать внимания на данное приложение.

Наряду с тремя упомянутыми, существует еще ряд специальных дополнительных модулей и самостоятельных программ, число которых постоянно растёт, так что пользователям следует постоянно знакомиться с информацией о нововведениях в SPSS.

В этой книге описываются базисный модуль, а также модули Regression Models, Advanced Models и Tables. Назначением последнего модуля является составление презентационных таблиц. В книге не рассматриваются логлинейные модели, анализ выживания и многомерное шкалирование, а также процедура составления презентаций.

SPSS Base (Базовый модуль)

SPSS Base входит в базовую поставку. Он включает все процедуры ввода, отбора и корректировки данных, а также большинство предлагаемых в SPSS статистических методов. Наряду с простыми методиками статистического анализа, такими как частотный анализ, расчет статистических характеристик, таблиц сопряженности, корреляций, построения графиков, этот модуль включает t-тесты и большое количество других непараметрических тестов, а также усложненные методы, такие как многомерный линейный регрессионный анализ, дискриминантный анализ, факторный анализ, кластерный анализ, дисперсионный анализ, анализ пригодности (анализ надежности) и многомерное шкалирование.

Regression Models

Данный модуль включает в себя различные методы регрессионного анализа, такие как: бинарная и мультиномиальная логистическая регрессия, нелинейная регрессия и пробит-анализ.

В этот модуль входят различные методы дисперсионного анализа (многомерный, с учетом повторных измерений), общая линейная модель, анализ выживания, включая метод Каплана-Майера и регрессию Кокса, лог-линейные, а также логит-лог-линсйные модели.

Модуль Tables служит для создания презентационных таблиц. Здесь предоставляются более широкие возможности по сравнению со упрощенными частотными таблицами и таблицами сопряженности, которые строятся в SPSS Base (базовом модуле).

Ниже в алфавитном порядке приведен список остальных модулей и программ предлагаемых для расширения SPSS.

Amos (Analysis of moment structures - анализ моментных структур) включает методы анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, вкоторую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы. Программа Amos включена в состав модулей расширения SPSS, как преемник L1SREL (Linear Structural RELationships - линейные структурные взаимоотношения).

AnswerTree (дерево решений) включает четыре различных метода автоматизированного деления данных на отдельные группы (сегменты). Деление проводится таким образом, что частотные распределения целевой (зависимой) переменной в различных сегментах значимо различаются. Типичным примером применения данною метода является создание характерных профилей покупателей при исследовании потребительского рынка. AnswerTree является преемницей программы Chi squared interaction Detector - детектор взаимодействий на основе хи-квадрата).

Модуль содержит различные методы для анализа категориальных данных, а именно: анализ соответствий и три различных метода оптимального шкалирования (анализ однородности, нелинейный анализ главных компонент, нелинейный канонический корреляционный анализ).

Clementine - это программа для data mining (добычи знаний), в которой пользователю предлагаются многочисленные подходы к построению моделей, к примеру, нейронные сети, деревья решений, различные виды регрессионного анализа. Clementine представляет собой "верстак" аналитика, при помощи которого можно визуализировать процесс моделирования, перепроверять модели, сравнивать их между собой. Для удобства пользования программой имеется вспомогательная среда внедрения результатов.

Conjoint (совместный анализ)

Совместный анализ применяется при исследовании рынка для изучения потребительских свойств продуктов на предмет их привлекательности. При этом опрашиваемые респонденты по своему усмотрению должны расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения, на основании которого можно затем вывести так называемые детализированные показатели полезности отдельных категорий каждого потребительских свойства.

Data Entry (ввод данных)

Программа Data Entry предназначена для быстрого составления вопросников, а также ввода и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.

Exact Tests (Точные тесты)

Данный модуль служит для вычисления точного значения вероятности ошибки (величины р) в условиях ограниченности данных при проверке по критерию Хи-квадрат (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применён метод Монте-Карло (Monte-Carlo).

Программа содержит специальную регрессионную модель для регрессионного анализа упорядоченных зависимых и независимых переменных.

При помощи SamplePower может быть определён оптимальный размер выборки для большинства методов статистического анализа, реализованных в SPSS.

SPSS Missing Value Analysis

Данный модуль служит для анализа и восстановления закономерностей, которым подчиняются пропущенные значения. Он предоставляет различные варианты замены недостающих значений.

Модуль Trends содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ.