Создание файла базы данных в пакете SPSS
Выраженности некоторого свойства, например: средний балл отметки, тестовый показатель и пр. Идентификация количественных переменных на предварительном этапе не составляет труда: обычно они соответствуют тому, что исследователь намеревается измерить. Каждая переменная — это имеющее значение для исследователя основание, позволяющее отличать объекты друг от друга. На предварительном этапе следует… Читать ещё >
Создание файла базы данных в пакете SPSS (реферат, курсовая, диплом, контрольная)
Структура файла данных
Перед тем как начать ввод данных, необходимо определить структуру будущего файла. Для этого следует ответить на вопрос, как будут использоваться в анализах те или иные переменные. К сожалению, многие пользователи начинают задумываться об этом гораздо позже, чем следует, и в этом кроется причина многих неудач при проведении анализа данных: чем сложнее план исследования, тем больше шансов, что из-за необдуманных действий исследователя он завершится неудачей.
Итак, первое, что следует сделать, — определить последовательность действий при обработке данных. Кроме того, необходимо четко представлять.
себе структуру и взаимосвязи переменных в вашем плане исследования. Ниже перечислены наиболее характерные для файлов данных ошибки и недостатки.
- • Отсутствуют ключевые переменные (пол, возраст и т. п.), являющиеся основой для анализа.
- • Переменная плохо отражает содержание соответствующей реальной величины (например, на сложный вопрос имеются только два варианта ответа: и).
- • При большом количестве независимых переменных отсутствуют зависимые переменные, отражающие цель исследования (или наоборот).
- • Недостаточно независимых переменных, влияющих на заданную зависимую переменную.
Эти примеры демонстрируют, что залогом успеха как исследования в целом, так и создания файла данных в частности является тщательно продуманный выбор структуры данных.
Следует отметить, что структура файла данных должна соответствовать плану исследования. С другой стороны, план исследования должен быть составлен так, чтобы его исходные данные можно было бы обработать в соответствии с задачами и гипотезами исследования.
Самый оптимальный и простой путь обеспечения этих соответствий — определение структуры данных на этапе планирования исследования, еще до сбора данных. Это позволит избежать большинства типичных ошибок, относящихся как к планированию исследования, так и к организации данных.
На этапе планирования исследования структура данных может быть задана в виде предварительного списка переменных с указанием их типов и диапазонов возможных значений, например, так, как в таблице 9.
Каждая переменная — это имеющее значение для исследователя основание, позволяющее отличать объекты друг от друга. На предварительном этапе следует выделять два типа переменных: количественные и категориальные (номинальные).
Количественная переменная позволяет различать объекты по уровню
выраженности некоторого свойства, например: средний балл отметки, тестовый показатель и пр. Идентификация количественных переменных на предварительном этапе не составляет труда: обычно они соответствуют тому, что исследователь намеревается измерить.
Таблица 9.
Пример предварительного списка переменных.
№. | Название переменной. | Тип переменной. | Диапазон возможных значений. |
Идентификационный номер | Номинальная. | 1−100. | |
Пол. | Номинальная. | 1−2. | |
Класс. | Номинальная. | 1−3. | |
Предполагаемый для поступления вуз. | Номинальная. |
| |
Внешкольные увлечения. | Номинальная. | 1 — спорт; 2 — компьютер; 3 — искусство. | |
Показатели тестов 1−5. | Количественные. | 1−20. | |
Средний балл отметок за 10-й класс. | Количественная. | 3−5. | |
Средний балл отметок за 11-й класс. | Количественная. | 3−5. |
Второй тип — категориальные (номинальные) переменные. Обычно они используются как основания для деления объектов (испытуемых) на группы или категории: пол, класс, возрастная категория, уровень дохода и пр.
Типичная ошибка начинающего исследователя — игнорирование возможных оснований для деления объектов на группы в качестве самостоятельных номинативных переменных в структуре данных.
Важным свойством номинальных переменных является возможность их представления в виде набора целых чисел. Например, трем видам внешкольных увлечений (хобби) учащихся (спорт, компьютер, искусство) можно сопоставить числа 1, 2 и 3 соответственно. Числовое представление данных в компьютерных программах всегда предпочтительнее символьного, поскольку обработка чисел происходит быстрее, проще и с меньшей вероятностью ошибок.
Кроме того, числовое представление легко модифицировать: вы можете переназначить числа, соответствующие созданным элементам, а также (что часто требуется на практике) без проблем включить в анализ новые элементы. Например, если в группе окажется учащийся, увлечение которого не соответствует перечисленным, будет полезно включить в переменную хобби категорию с названием другие и присвоить ей число 4.
Порядок создания переменных также важен при вводе данных. Здесь следует придерживаться простого правила: наиболее важные и часто используемые переменные должны помещаться в начало файла, для остальных данных вопрос порядка следования не столь важен, однако рекомендуется объединять их в группы по физическому смыслу.
Чаще всего в начало файла следует поместить категориальные переменные, которые далее предполагается использовать для деления объектов (испытуемых) на группы, например пол, семейное положение и пр. Далее можно перечислять остальные сведения, а логическое объединение переменных производить в зависимости от того, какие аспекты они отражают.