Контент-анализ текстов сертификатов
Произведем такие же подсчёты относительно ключевых слов. Сертификат — ключевое слово данных текстов. Абсолютная частота упоминания составляет 6 раз. Относительная частота упоминания — 16%. На четвертом этапе происходит выделение единиц счёта, которые могут совпадать со смысловыми единицами и носить специфический характер. В данном случае — сертификат и сертификация. Первый этап включает в себя… Читать ещё >
Контент-анализ текстов сертификатов (реферат, курсовая, диплом, контрольная)
Контент-анализ — это техника сбора информации, производимого на основе систематического выявления соответствующих целям и задачам исследования характеристик текстов (понятий, глаголов, словосочетаний). Контент-анализ предполагает использование определенных стандартизированных процедур, обеспечивающих формализацию и изменение исследуемых признаков, что позволяет делать профессиональные заключения о характере и особенностях изучаемого объекта.
Контент-анализ может быть содержательным или структурным. Содержательный анализ сосредотачивает внимание исследователя на содержании сообщения, тогда как структурный — на количестве и особенностях упоминания контрольного термина или имени в тексте сообщения. Данный вид анализа начинается с логической, лингвистической и другой формализации изучаемого текста.
Тем самым, контент-анализ является методом качественно-количественного изучения текста, содержащим процедуры формализации исследуемого материала. Над выделенными смысловыми единицами производятся соответствующие математические операции.
Выделяют этапов контент-анализа.
Первый этап включает в себя определение совокупности изучаемых источников или сообщений с помощью набора заданных критериев, которым должно отвечать каждое сообщение:
- · Заданный тип источника — интернет, базы данных;
- · Один тип сообщения — бланки сертификатов соответствия;
- · Заданные стороны, участвующие в процессе коммуникации — орган по сертификации, изготовитель, эксперт;
- · Сопоставимый размер сообщений — минимальный объем 45 единиц;
Второй этап заключается в формировании выборочной совокупности сообщений.
Я для своей работы выбрала 50 бланков сертификата соответствия, на различную продукцию, от газировки до очистителя.
Третий этап это выявление единиц анализа. Ими могут быть слова или темы. Правильный выбор единиц анализа — важная составляющая всей работы. Простейшим элементом сообщения является слово. Существуют достаточно чёткие требования к выбору возможной единицы анализа:
- · Она должна быть достаточно большой, чтобы выражать значение и достаточно малой, чтобы не выражать много значений;
- · Она должна легко идентифицироваться;
- · Число единиц должно быть настолько велико, чтобы мз них можно было сделать выборку;
В данном случае будет реализован анализ в двух направлениях: ключевые слова и части речи.
В данных бланках ключевое слово — сертификат.
Наиболее часто встречающаяся часть речи — существительное.
На четвертом этапе происходит выделение единиц счёта, которые могут совпадать со смысловыми единицами и носить специфический характер. В данном случае — сертификат и сертификация.
И на пятом этапе производится непосредственно процедура подсчёта. Она в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц применение компьютерных программ, специальных формул, статистических расчётов.
1. Произведем расчет относительно встречающихся в текстах частей речи. Делаем анализ относительно постоянных позиций.
Таблица 2.3.
Частота упоминания частей речи в текстах.
№. | Часть речи. | Частота упоминания абсолютная, раз. | Частота упоминания относительная, %. |
Существительное. | |||
Прилагательное. | |||
Местоимение. | |||
Числительное. | |||
Глагол. | |||
Наречие. | |||
Предлог. | |||
Союз. | |||
Частица. | |||
Междометие. |
2. Произведем такие же подсчёты относительно ключевых слов. Сертификат — ключевое слово данных текстов. Абсолютная частота упоминания составляет 6 раз. Относительная частота упоминания — 16%.
Шестой этап. Интерпретация полученных результатов в соответствии с целями и задачами конкретного исследования. На данном этапе выявляются и оцениваются характеристики текстового материала, которые позволяют делать заключения о том, что является самым важным в тексте. Основа контент-анализа — это подсчёт встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними. Для наглядности представлю результат в виде функции распределения.
Функция распределения характеризует плотность вероятности распределения частиц статистической системы по фазовому пространству.
Для количественной характеристики распределения вероятностей удобно воспользоваться не вероятностью события, а вероятностью события, где — некоторая текущая переменная. Вероятность этого события, очевидно, зависит от, есть некоторая функция от. Эта функция называется функцией распределения случайной величины и обозначается :
Функцию распределения иногда называют также интегральной функцией.
Зная ряд распределения прерывной случайной величины, можно легко построить функцию распределения этой величины.
где неравенство под знаком суммы указывает, что суммирование распространяется на все те значения, которые меньше .
Присвоим частям речи номера от 1 до 10:
Таблица 2.4.
Присвоение порядковых номеров существительным.
№. | Часть речи. |
Существительное. | |
Прилагательное. | |
Местоимение. | |
Числительное. | |
Глагол. | |
Наречие. | |
Предлог. | |
Союз. | |
Частица. | |
Междометие. |
Ряд распределения величины имеет вид:
Таблица 2.5.
Функция распределения.
P. | 0,64. | 0,16. | 0,03. | 0,14. | 0,03. |
Функция распределения непрерывной случайной величины представляет собой функцию, непрерывную во всех точках, как это показано на графике (рис. 2.4).
Рис. 2.4 Функция распределения
Вывод: В результате проведенных исследований и вычислений можно сделать вывод о том, что наиболее часто используемой частью речи является существительное, что говорит о характере документа, все действия уже произведены, отсутствуют описательные элементы, есть только чёткая констатация факта.