В данной модели предполагается, что вероятности сообщений полностью определены вероятностями использования отдельных букв алфавита в случайном тексте, межзнаковые зависимости в тексте игнорируются:
где Р{х1 = а) > 0 для любого а е 2т и
Открытый текст такого источника есть реализация последовательности независимых испытаний в полиномиальной вероятностной схеме с числом исходов, равным т. Множество исходов биективно соответствует множеству всех символов алфавита. Данная модель позволяет разделить буквы алфавита на классы высокой, средней и низкой частот использования.
В табл. 13.1 приведены буквы высокой частоты использования для некоторых европейских языков.
Таблица 13.1
Частота букв в европейских языках
Язык. | Буква алфавита/частота появления буквы в текстах, %. |
Английский. | Е/12,86. | Т/9,72. | А/7,96. | 1/7,77. | N/7,51. | К/7,03. |
Испанский. | Е/14,15. | А/12,90. | 0/8,84. | 5/7,64. | 1/7,01. | Н/6,95. |
Итальянский. | 1/12,04. | Е/11,63. | А/11,12. | 0/8,92. | N/7,68. | Т/7,07. |
Немецкий. | Е/19,18. | N/10,20. | 1/8,21. | 5/7,07. | К/7,01. | Т/5,86. |
Французский. | Е/17,76. | 5/8,23. | А/7,68. | N/7,61. | Т/7,30. | 1/7,23. |
Русский. | 0/11,0. | И/8,9. | Е/8,3. | А/7,9. | Н/6,9. | Т/6,0. |
Для сравнения частот редких букв с частотами букв, приведенных в табл. 13.1, укажем, что, например, в английском языке редкими буквами являются буквы /, (), 7, а их частоты в процентах оцениваются величинами 0,13, 0,12 и 0,08 соответственно. Из табл. 13.1 очевидно, что не случайно итальянский и испанский языки считаются певучими: суммарная частота гласных букв весьма высока.
Данная модель строится для любого ИОС с использованием относительно небольшого количества материала и удобна для практического применения. Например, эта модель эффективно используется при дешифровании текстов, защищаемых шифром простой замены.
Недостатком модели следует считать то, что некоторые свойства данной модели противоречат свойствам языков. В частности, согласно этой модели любая ?-грамма при к > 1 имеет ненулевую вероятность появления в сообщении. Ограниченность модели снижает эффективность ее применения при анализе широкого класса криптографических систем.