Сущность, требования, классификация статистических пакетов
Блок описательной статистики и разведочного анализа исходных данных: анализ резко выделяющихся значение исследуемого признака, восстановление пропущенных значений, частотная обработка исходных данных (построение гистограмм, полигонов частот, вычисление выборочных средних дисперсий и т. д.), проверка статистических гипотез об однородности исследуемых совокупностей, оценка критериев согласия… Читать ещё >
Сущность, требования, классификация статистических пакетов (реферат, курсовая, диплом, контрольная)
Статистический пакет — это программный продукт, предназначенный для статистической обработки данных. Является надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.
Международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2 [7].
Основную часть имеющихся пакетов составляют:
1) Специализированные пакеты обычно содержат методы из нескольких разделов статистики или методы, используемые в конкретной предметной области (контроль качества промышленной продукции, расчет страховых сумм и т. д.). Чаще всего встречаются пакеты для анализа временных рядов регрессионного и факторного анализа. Обычно эти пакеты содержат весьма полный набор традиционных методов в своей области, а иногда включают также и оригинальные методы и алгоритмы, созданные разработчиками пакета. Как правило, пакет и его документация ориентированы на специалистов, хорошо знакомых с соответствующими методами.
Применять такие пакеты целесообразно в тех случаях, когда требуется систематически решать задачи из этой области, для которой предназначен специализированный пакет, а возможностей пакетов общего назначения недостаточно [7].
Из российских пакетов более известны STADIA, Олимп, Класс-Мастер, КВАЗАР, Статистик-Консультант; американские пакеты — ODA, WinSTAT, Statit и т. д.
- 2) Пакеты общего назначения. Особое место на рынке занимают так называемые статистические пакеты общего назначения. Широкий диапазон статистических методов, дружелюбный интерфейс пользователя привлекает в них не только начинающих пользователей, но и специалистов. Универсальность этих пакетов особенно полезна:
- — на начальных этапах обработки, когда речь идет о подборе статистической модели или метода анализа данных;
- — когда поведение статистических данных выходит за рамки использовавшейся ранее модели;
- — в процессе обучения основам статистики.
Именно пакеты общего назначения составляют большинство продаваемых на рынке статистических программ. Из зарубежных универсальных пакетов наиболее распространены BAS, SPSS, Systat, Minilab, Statgraphics, STATISTICA.
Статистический пакет в идеале должен удовлетворять определенным требованиям:
- — модульность;
- — ассистирование при выборе способа обработки данных;
- — использование простого проблемно-ориентированного языка для формулировки задания пользователя;
- — автоматическая организация процесса обработки данных и связей с модулями пакета;
- — ведение банка данных пользователя и составление отчета о результатах проделанного анализа;
- — диалоговый режим работы пользователя с пакетом;
- — совместимость с другим программным обеспечением.
Следует заметить, что развитие статистических программных продуктов (СПП) обычно идет поэтапно, на каждом из них создается вариант пакета, все в большей степени удовлетворяющий перечисленным выше требованиям. При этом если создание есть результат разработки, то на каждом этапе пакет, с одной стороны, должен представлять собой готовую к использованию программную продукцию, а с другой — входить составной частью в более поздние стадии развития пакета.
Для того, чтобы статистический пакет общего назначения был удобным и эффективным в работе, он должен удовлетворять многочисленным и весьма жестким требованиям. В частности, необходимо, чтобы он:
- — содержал достаточно полный набор стандартных статистических методов;
- — был достаточно простым для быстрого освоения и использования;
- — отвечал высоким требованиям к вводу, преобразованиям и организации хранения данных, как в самом пакете, так и обмену с широко распространенными базами данных (dBase, Lotus 1−2-3 и т. п.);
- — имел широкий набор средств графического представления данных и результатов.
- — предоставлял удобные возможности для включения в отчеты таблиц исходных данных, графиков, промежуточных и окончательных результатов обработки;
- — имел подробную документацию, хорошо продуманную с учетом интересов, как начинающего пользователя, так и специалиста-статистика.
Наконец, немаловажное значение имеет цена пакета. Профессиональные западные статистические пакеты (SAS, BMDP и т. д.) обычно стоят от 2 до 10 тысяч долларов и более. Эти пакеты позволяют обрабатывать гигантские объемы данных, включают средства описания задач на встроенном языке и дают возможность построения на их основе систем обработки информации для целых предприятий.
Пакеты, рассчитанные на массового пользователя, стоят дешевле — обычно 500 — 1500 долларов. Эти пакеты отличаются от профессиональных прежде всего ориентацией на индивидуального пользователя: преимущественно диалоговым режимом работы, наличием ограничений по объему обрабатываемых данных и т. д. Имеются и более дешевые пакеты (200−300 долларов и ниже), но они обычно обладают весьма скромными возможностями.
Отечественные статистические пакеты стоят существенно дешевле, как правило, их цена составляет от 200 до 500 долларов. [8].
Методориентированные СПП, как правило, имеют следующую структуру:
- 1. Блок описательной статистики и разведочного анализа исходных данных: анализ резко выделяющихся значение исследуемого признака, восстановление пропущенных значений, частотная обработка исходных данных (построение гистограмм, полигонов частот, вычисление выборочных средних дисперсий и т. д.), проверка статистических гипотез об однородности исследуемых совокупностей, оценка критериев согласия, визуализация распределения статистических данных и др.;
- 2. Блок статистического исследования динамики и зависимостей: дисперсионный и ковариационный анализ, корреляционно-регрессионый анализ, анализ временных рядов и др.;
- 3. Блок классификации и снижения размерности: дискриминантный анализ, статистических анализ смесей распределений, кластерный анализ и др.;
- 4. Блок методов статистического анализа нечисловых данных и экспертых оценок: анализ таблиц сопряженности, логлинейные модели, ранговые методы и др.;
- 5. Блок планирования эксперимента и выборочных исследований;
- 6. Блок вспомогательных программ.
Пакеты статистической обработки позволяют изучать тенденции изменения числовых данных и оценивать уровень достоверности результатов. Под статистической обработкой понимается использование методов однофакторного и двухфакторного анализа, статистических показателей (вариация, среднее, медиана, мода и т. д.), частотного распределения, корреляционного и регрессионного анализа и т. д. [6].