Помощь в написании студенческих работ
Антистрессовый сервис

Создание файла базы данных в пакете SPSS

РефератПомощь в написанииУзнать стоимостьмоей работы

Выраженности некоторого свойства, например: средний балл отметки, тестовый показатель и пр. Идентификация количественных переменных на предварительном этапе не составляет труда: обычно они соответствуют тому, что исследователь намеревается измерить. Каждая переменная — это имеющее значение для исследователя основание, позволяющее отличать объекты друг от друга. На предварительном этапе следует… Читать ещё >

Создание файла базы данных в пакете SPSS (реферат, курсовая, диплом, контрольная)

Структура файла данных

Перед тем как начать ввод данных, необходимо определить структуру будущего файла. Для этого следует ответить на вопрос, как будут использоваться в анализах те или иные переменные. К сожалению, многие пользователи начинают задумываться об этом гораздо позже, чем следует, и в этом кроется причина многих неудач при проведении анализа данных: чем сложнее план исследования, тем больше шансов, что из-за необдуманных действий исследователя он завершится неудачей.

Итак, первое, что следует сделать, — определить последовательность действий при обработке данных. Кроме того, необходимо четко представлять.

себе структуру и взаимосвязи переменных в вашем плане исследования. Ниже перечислены наиболее характерные для файлов данных ошибки и недостатки.

  • Отсутствуют ключевые переменные (пол, возраст и т. п.), являющиеся основой для анализа.
  • Переменная плохо отражает содержание соответствующей реальной величины (например, на сложный вопрос имеются только два варианта ответа: и).
  • При большом количестве независимых переменных отсутствуют зависимые переменные, отражающие цель исследования (или наоборот).
  • Недостаточно независимых переменных, влияющих на заданную зависимую переменную.

Эти примеры демонстрируют, что залогом успеха как исследования в целом, так и создания файла данных в частности является тщательно продуманный выбор структуры данных.

Следует отметить, что структура файла данных должна соответствовать плану исследования. С другой стороны, план исследования должен быть составлен так, чтобы его исходные данные можно было бы обработать в соответствии с задачами и гипотезами исследования.

Самый оптимальный и простой путь обеспечения этих соответствий — определение структуры данных на этапе планирования исследования, еще до сбора данных. Это позволит избежать большинства типичных ошибок, относящихся как к планированию исследования, так и к организации данных.

На этапе планирования исследования структура данных может быть задана в виде предварительного списка переменных с указанием их типов и диапазонов возможных значений, например, так, как в таблице 9.

Каждая переменная — это имеющее значение для исследователя основание, позволяющее отличать объекты друг от друга. На предварительном этапе следует выделять два типа переменных: количественные и категориальные (номинальные).

Количественная переменная позволяет различать объекты по уровню

выраженности некоторого свойства, например: средний балл отметки, тестовый показатель и пр. Идентификация количественных переменных на предварительном этапе не составляет труда: обычно они соответствуют тому, что исследователь намеревается измерить.

Таблица 9.

Пример предварительного списка переменных.

№.

Название переменной.

Тип переменной.

Диапазон возможных значений.

Идентификационный номер

Номинальная.

1−100.

Пол.

Номинальная.

1−2.

Класс.

Номинальная.

1−3.

Предполагаемый для поступления вуз.

Номинальная.

  • 1 — гуманитарный;
  • 2- экономический;
  • 3- технический;
  • 4 — естественнонаучный

Внешкольные увлечения.

Номинальная.

1 — спорт; 2 — компьютер; 3 — искусство.

Показатели тестов 1−5.

Количественные.

1−20.

Средний балл отметок за 10-й класс.

Количественная.

3−5.

Средний балл отметок за 11-й класс.

Количественная.

3−5.

Второй тип — категориальные (номинальные) переменные. Обычно они используются как основания для деления объектов (испытуемых) на группы или категории: пол, класс, возрастная категория, уровень дохода и пр.

Типичная ошибка начинающего исследователя — игнорирование возможных оснований для деления объектов на группы в качестве самостоятельных номинативных переменных в структуре данных.

Важным свойством номинальных переменных является возможность их представления в виде набора целых чисел. Например, трем видам внешкольных увлечений (хобби) учащихся (спорт, компьютер, искусство) можно сопоставить числа 1, 2 и 3 соответственно. Числовое представление данных в компьютерных программах всегда предпочтительнее символьного, поскольку обработка чисел происходит быстрее, проще и с меньшей вероятностью ошибок.

Кроме того, числовое представление легко модифицировать: вы можете переназначить числа, соответствующие созданным элементам, а также (что часто требуется на практике) без проблем включить в анализ новые элементы. Например, если в группе окажется учащийся, увлечение которого не соответствует перечисленным, будет полезно включить в переменную хобби категорию с названием другие и присвоить ей число 4.

Порядок создания переменных также важен при вводе данных. Здесь следует придерживаться простого правила: наиболее важные и часто используемые переменные должны помещаться в начало файла, для остальных данных вопрос порядка следования не столь важен, однако рекомендуется объединять их в группы по физическому смыслу.

Чаще всего в начало файла следует поместить категориальные переменные, которые далее предполагается использовать для деления объектов (испытуемых) на группы, например пол, семейное положение и пр. Далее можно перечислять остальные сведения, а логическое объединение переменных производить в зависимости от того, какие аспекты они отражают.

Показать весь текст
Заполнить форму текущей работой