Некоторые замечания о терминах, использующихся в западной литературе
Отметим, что описанная выше точка зрения отвечает взглядам и современных русских ученых, и российских исследователей начала XX в. Например, известный математик-социолог А. А. Чупров называл «вероятностным априори» то, для обозначения чего мы используем словосочетание «генеральные параметры», и говорил о необходимости отчетливого и выдержанного разграничения априорных искомых и эмпирических данных… Читать ещё >
Некоторые замечания о терминах, использующихся в западной литературе (реферат, курсовая, диплом, контрольная)
Терминология, использующаяся в отечественной и западной литературе по интересующей нас теме (мы имеем в виду в первую очередь американские учебники по так называемой статистике), в определенной мере различна[1]. И за этим различием зачастую стоят разные методологические позиции. Представляется, что анализ соответствующих методологических аспектов имеет непосредственное отношение к практике использования социологом достижений математической статистики.
Итак, мы разделили все рассматриваемые статистические показатели на две большие группы — параметры распределений, т. е. как бы «истинные», генеральные характеристики случайных величин, и статистики — выборочные оценки «истинных» параметров. Процедура поиска параметров может иметь разную степень сложности. Одни параметры просто говорят об описании совокупности. Это, скажем, математическое ожидание и дисперсия. Поиск их сравнительно прост. Другие — позволяют изучать причинно-следственные отношения. Это, например, коэффициент корреляции. Его найти уже сложнее, соответствующая процедура включает, в частности, расчет математических ожиданий и средних квадратических отклонений. Третьи параметры дают возможность прогнозировать ситуацию. Это делает, например, регрессионный анализ (коэффициенты уравнения регрессии — это тоже набор параметров, характеризующих распределение случайной величины). Построение уравнения регрессии — еще более сложная процедура, включающая, в частности, расчет разного рода коэффициентов корреляции. Выбор рассчитываемых параметров определяется решаемой содержательной задачей. Здесь можно указать на три класса задач, обычно выделяемые в методологии науки как основные, отвечающие целям любой наукой — описание, объяснение, предсказание. Первую задачу обычно связывают с термином «описательная (дескриптивная) статистика», называя таким образом и совокупность простейших параметров распределения, таких, как математическое ожидание и дисперсия (или их выборочные оценки), и ветвь статистики (как науки), позволяющую эти характеристики найти. Наверное, можно было бы вводить термины «объяснительная статистика», «предсказательная статистика» и т. д. Но этого не делается, поскольку слишком много методов могут «объяснять» или «предсказывать» изучаемые явления, слишком трудно провести границу между теми и другими задачами.
Подчеркнем, что какие бы параметры мы ни рассчитывали (и, соответственно, какую бы задачу ни решали), всегда сначала будем находить соответствующие выборочные статистики, а потом «соображать», с какой вероятностью в генеральной совокупности будет иметь место та или иная ситуация с параметрами изучаемых распределений. И всегда за нашими действиями будет стоять определенная модель, в наличии которой мы должны давать себе отчет. Модель стоит даже за самыми простейшими параметрами. Например, выбирая для оценки средней тенденции математическое ожидание, моду или медиану, мы по-разному понимаем смысл этой самой средней тенденции (а ведь бывают и другие меры средней тенденции — например, среднее геометрическое, среднее гармоническое, да и квантили тоже можно считать своеобразными средними). То же можно сказать о разных мерах разброса, которых тоже немало[2][3].
В западной литературе вся статистика обычно делится на описательную (<descriptive) и «выводимую» (inferential).
В дескриптивной (описательной) статистике1* исследователь пытается описать ситуацию, определенным образом собирая данные, рассчитывая определенные средние величины и проценты и представляя собранную информацию в наглядном виде, используя диаграммы, графики, таблицы. Типичный пример использования описательной статистики — перепись населения.
Трудно возразить против описанного термина, если не попытаться уточнить его смысл путем сопоставления понятия «описательная статистика» с понятием, ему противопоставляемым, — «выводимой статистикой»[4].
Работая в рамках выводимой статистики, исследователь пытается перенести результаты с выборки (sample) на генеральную совокупность (population) путем проверки статистических гипотез. Но этим цели выводимой статистики (как науки) не ограничиваются. В нее еще входит изучение соотношений между переменными и осуществление предсказаний.
На наш взгляд, некорректно объединять в одну группу проверку статистических гипотез и, скажем, изучение связей между переменными. Остается неясным основание выделения такой группы. Сомнительным выглядит и противопоставление этой группы методам дескриптивной статистики. Приведем причины наших сомнений.
Во-первых, проверка статистических гипотез требуется абсолютно для всех методов — и для описательной статистики, и для разного рода коэффициентов связи, и для прогнозных алгоритмов.
Во-вторых, четкой границы между методами описательной статистики и методами изучения отношений переменных нет. Так, коэффициенты корреляции нередко используются в чисто описательных целях.
В-третьих, методы описательной статистики не менее «выводимы», чем методы изучения связей между переменными и методы прогнозирования. Собирая данные, мы используем иногда совсем не очевидные модели: именно так, а не иначе измеряем переменные (а в каждом методе измерения заложена своя модель); разбиваем диапазон изменения признака на интервалы (это — в значительной мерс субъективная процедура, а от нее зависит и характер получаемого описания, и величина коэффициентов связи и т. д.); выбираем то или иное понимание средней тенденции или разброса и т. д.
Более адекватной представляется нам терминология, которую мы ввели и которая соответствует традициям отечественной школы.
Отметим, что описанная выше точка зрения отвечает взглядам и современных русских ученых, и российских исследователей начала XX в. Например, известный математик-социолог А. А. Чупров называл «вероятностным априори» то, для обозначения чего мы используем словосочетание «генеральные параметры», и говорил о необходимости отчетливого и выдержанного разграничения априорных искомых и эмпирических данных статистического исследования. В частности, он полагал, что именно смешение указанных объектов изучения приводит к «сбивчивости» в трудах представителей известной английской статистической школы, возглавляемой К. Пирсоном (1857—1936). «Сбивчивость», по мнению Чупрова, затрудняла усвоение работ этой школы (которую Чупров ценил очень высоко; результаты, полученные Пирсоном и окружающими его исследователями, он активно пропагандировал в своих работах).
А.А. Чупров был воспитан на трудах крупнейших русских математиков — П. Л. Чебышева (1821 — 1894), А. М. Ляпунова (1857—1918), А. А. Маркова (1856— 1922), занимаюшихлидирующие позиции вмировой математической статистике второй половины XIX — начала XX в.
- [1] Под различием терминологии мы имеем в виду не то, что для обозначенияодного и того же понятия можно использовать разные (с точностью до перевода) слова. Это непринципиально (как говорится, назови хоть горшком, да не сажай впечку). Речь идет о том, какие именно понятия «удостаиваются» введения отдельных терминов и о том, какую связь между этими понятиями терминология отражает. Различие таких аспектов может быть весьма принципиальным.
- [2] О содержательном смысле некоторых мер средней тенденции и разброса см.:Толстова Ю. Н. Анализ социологических данных: Descriptive statistics consists of thecollections, organizations, summarizations. and presentations of data.
- [3], K «Descriptive statistics consists of the collections, organizations, summarizations, and presentations of date». Bluman A.G. Elementary Statistics. A Step by Step. McGraw-Hill Companies, 2001. P. 5.
- [4] «Inferential statistics consists of generalizing from samples to population, performinghypothesis tests, determining relationships among variables, and making predictions*. Тамже. С. 7.