Показатели эффективности добывания информации
Неопределенность (энтропия) появления буквы русского алфавита из 32 букв при равновероятном выборе равна H0=log32=5 бит, с учетом реальной статистики одной буквы H1 бит, двух букв подряд Н2=3.52 бит, трех -3.01 бит. Для латинских языков энтропия букв принимает меньшие значения: Н0=4.76 бит, H1=4.03 бит (английский язык), H1=4.1 бит (немецкий язык). H1=3.96 бит (французский язык). При увеличении… Читать ещё >
Показатели эффективности добывания информации (реферат, курсовая, диплом, контрольная)
Наиболее общим показателем эффективности разведки, включающей органы управления, добывания и обработки, является степень выполнения поставленных перед нею задач. Для более объективного определения эффективности используется группа общесистемных показателей количества и качества информации:
- — полнота добываемой информации;
- — своевременность добывания информации;
- — достоверность информации;
- — точность измерения демаскирующих признаков;
- — суммарные затраты на получение информации. Полноту полученной информации можно определить через отношение числа положительных ответов на тематические вопросы к их общему количеству. Тематический вопрос определяет границы информации, необходимой для ответа на этот вопрос. Очевидно, что тематические вопросы можно детализировать до ответов на них в виде «да-нет». Чем выше степень детализации тематических вопросов, тем точнее оценка полноты полученной информации. Тематические вопросы имеют иерархическую структуру и определяются в результате структурирования конфиденциальной информации при планировании мероприятий по ее добыванию. Поскольку тематические вопросы имеют различную значимость («вес»), то количественно полноту информации Пи с учетом «веса» тематического вопроса можно приближенно оценить по формуле:
где — «вес» i-го тематического вопроса;
= 1, когда количество и качество информации соответствует i-му тематическому вопросу и равно 0, когда не соответствует.
Своевременность информации является важным показателем ее качества, так как она влияет на цену информации. Если добытая формация устарела, то затраты на ее добывание оказались напрасными — она не может быть эффективно использована злоумышленником. Поэтому своевременность следует оценивать относительно продолжительности ее жизненного цикла. Если время устаревания информации существенно больше времени ее использования после добывания, то она своевременная. В противном случае она устаревшая.
Достоверность информации — важнейший показатель качества информации. Она искажается в результате дезинформирования и под действием помех. Так как использование ложной (искаженной) информации может нанести в общем случае больший ущерб, чем ее отсутствие, то выявлению достоверности добытой информации ее пользователь уделяет большое внимание.
Дпя оценки достоверности используют следующие частные показатели:
- — достоверность сообщения в смысле отсутствия ложных сведения и данных;
- — разборчивость речи;
- — вероятность ошибочного или неискаженного приема дискретной единицы (бита, символа, цифры, буквы, слова). Для количественной оценки достоверности сообщения могут применяться различные качественно-количественные способы и шкалы, в том числе, так как называемая схема Кента. В соответствии с ней диапазон возможных изменений достоверности разбивается на 7 интервалов и достоверность конкретной информации оценивается в шансах:
- — достоверная информация (вероятность отсутствия ложной информации близка к 1);
- — почти определено, что информация достоверна (9 шансов против одного);
- — имеется много шансов, что информация достоверна (3 шанса против одного);
- — шансы примерно равны (1 за, 1 против);
- — имеется много шансов, что информация недостоверна (3 шанса против одного);
- — почти определено, что информация недостоверна (за 9 шансов против одного);
- — недостоверная информация (вероятность ложной информации близка к 1). Достоверность информации в смысле отсутствия в ней элементов дезинформации зависит от надежности источника, которая может оцениваться по шкале:
- — совершенно надежный;
- — обычно надежный;
- — довольно надежный;
- — не всегда надежный;
- — ненадежный;
- — надежность не может быть определена.
Количество уровней не принципиально. Семь уровней выбрано как компромисс между точностью измерения (чем больше уровней, тем точность выше) и способностью эксперта интегрально оценивать достоверность информации. Известно, что человек в среднем способен одновременно оперировать с семью цифрами.
Качество речи во время подслушивания оценивается разборчивостью. В соответствии с лингвистическим делением речи на фразы, слова, слоги и звуки существует понятие смысловой, слоговой и звуковой (формантной) разборчивости. С точки зрения защиты речевой информации наиболее наглядным является показатель смысловой разборчивости (разборчивости фраз). Однако получение объективных оценок смысловой разборчивости затруднены из-за избыточности речи. Более надежные результаты получаются при определении слоговой или звуковой разборчивости. Поэтому они получили наибольшее распространение.
Разборчивость речи соответствует выраженной в процентах доли принятых без искажения единиц (фраз, слов, букв, звуков) по отношению к общему количеству переданных. Избыточность письменной или устной речи снижает требования к значениям разборчивости и обусловлена различными значениями частоты использования в речи букв, а также существенно меньшим количеством разрешенных грамматикой слогов, слов и фраз по отношению к возможным комбинациям слогов, слов и фраз, которые теоретически можно составить из букв алфавита. В национальных языках следующие друг за другом слова связаны между собой смыслом и синтаксисом грамматики, а последовательно расположенные буквы в пределах одного слова — правилами орфографии. Чем больше букв в алфавите, меньше словарный состав языка и строже правила грамматики, тем выше избыточность языка.
Неопределенность (энтропия) появления буквы русского алфавита из 32 букв при равновероятном выборе равна H0=log32=5 бит, с учетом реальной статистики одной буквы H1 бит, двух букв подряд Н2=3.52 бит, трех -3.01 бит. Для латинских языков энтропия букв принимает меньшие значения: Н0=4.76 бит, H1=4.03 бит (английский язык), H1=4.1 бит (немецкий язык). H1=3.96 бит (французский язык). При увеличении количества учитываемых букв энтропия стремится к предельной величине Нпр. Разность R=l-Hпp/H0 названа К. Шенноном избыточностью языка. Она характеризует долю (в процентах) неиспользуемых элементов языка из потенциально возможных.
В зависимости от количества учитываемых букв и анализируемых текстов различными авторами получены отличающиеся оценки разборчивости. Избыточность разговорной речи в силу ее большей «вольности», меньшей стесненности правилами стилистики и даже грамматики меньше избыточности деловых текстов (см табл. 2.3) [82].
Таблица 2.3.
Форма представления. | Избыточность, %. | |
русского языка. | Французского языка. | |
Язык в целом. | 72.6. | 70.6. |
Разговорная речь. | 72.0. | 68.4. |
Литературные тексты. | 76.2. | 71.0. |
Деловые тексты. | 83.4. | 74.4. |
Соотношения между качеством речи и количественными значениями слоговой и словесной разборчивости приведены в табл. 2.4 [82].
Таблица 2.4.
Качество речи. | Разборчивость. %. | |
Слоговая. | Словесная. | |
Предельно допустимая. | 25 — 40. | 75−87. |
Удовлетворительная. | 40 — 56. | 87 — 93. |
Хорошая. | 56−80. | 93 — 98. |
Отличная. | 80″ 100. | 98- 100. |
Искажение слогов оказывает существенно меньшее влияние на понимание смысла семантической информации, заключенной в предложении или фразе, чем искажение целого слова. За счет словесной избыточности слово может быть восстановлено при отсутствии части букв или слога, что наглядно иллюстрируется в игре «Поле чудес». Поэтому, требования к словесной разборчивости, что видно из табл. 2.4, более жесткие, чем к слоговой. Предельное значение разборчивости слогов и слов, при меньших значениях невозможно понять, равно 25 и 75% соответственно.
Цифровые данные также обладают избыточностью, но в контексте конкретного сообщения. Например, если в газете в июле месяце появляется прогноз погоды в Москве о температуре 0 или 50 градусов, то читатель этому сообщению не поверит и предположит об ошибке при верстке газеты. Однако исправить, т. е. указать точные значения цифр, он не сможет. Поэтому к достоверности передачи цифровых данных предъявляются высокие требования по достоверности передачи: одна ошибка и менее на миллион цифр. В ответственных случаях для повышения достоверности цифры пишутся прописью, как, например, принято при оформлении финансовых документов. В этом случае существенно понижается вероятность искажения цифр как под воздействием помех при передаче по каналам связи, так в результате преступных действий злоумышленников.
Математический аппарат для определения достоверности приема дискретных элементов достаточно хорошо разработан в теории связи. В ней получены аналитические выражения, позволяющие вычислять вероятность приема символа или слова в зависимости от метода модуляции сигнала, вида помехоустойчивого кода, от отношения сигнал/шум на входе приемника. Например, формула для оценки вероятности ошибочного приема двоичной единицы (бита) в условиях флуктуационной помехи — шума имеет вид:
Poш=0.5[l-Ф (kq)],.
где q — отношение сигнал/шум по амплитуде;
Ф (x)=.
— амплитудная модуляция;
— частотная модуляция;
— фазовая модуляция.
Точность п измерений значений признака х оценивается среднеквадратичным отклонением, равным величине:
Кроме показателей количества и качества информации на этапе поиска и обнаружения объектов для оценки Возможностей средств добывания используют такие показатели как вероятность обнаружения объектов и их распознавания (определение по измеренным признакам принадлежности объекта, его назначения, функций и свойств).
Вероятность обнаружения объекта определяется как мера идентификации текущей признаковой структуры, полученной при наблюдении объекта, с эталонной. Чем больше признаков текущей структуры совпадает с эталонными признаками объекта и чем больше их информативность, тем выше вероятность обнаружения объекта. При распознавании объектов используется тот же механизм. Для достаточно достоверной оценки величины угроз безопасности информации необходимо определение возможностей и путей попадания информации к злоумышленнику.