Студопедия — ЗАМЕНЫ И ГАММИРОВАНИЯ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ЗАМЕНЫ И ГАММИРОВАНИЯ






1.1 Основные статистическими характеристиками

открытых текстов

 

Любой метод вскрытия шифра простой замены основан на том обстоятельстве, что с точностью до переобозначений частотные характеристики т -грамм шифртекста и открытого текста одинаковы. При этом используются априорные частотные характеристики предполагаемого открытого текста, получаемые с учетом " характера переписки". Как отмечено в Приложении 1, такие характеристики являются более " рельефными" для литературных текстов и менее " рельефными" для формализованных электронных текстов. Чем менее рельефно распределение знаков текста, тем сложнее задача вскрытия шифра простой замены. Для открытых текстов с " почти равномерным" распределением знаков эта задача становится практически не решаемой. Это следует учитывать и не питать иллюзий о простоте вскрытия шифров простой замены, о которой часто упоминается в популярных книгах по защите информации. Методы " рандомизации" или " сжатия" открытых текстов, например, с использованием компьютерных архиваторов значительно усложняют задачу вскрытия шифра простой замены.

Известно, что рельефность диаграммы текста тесно связана с такой его важной теоретико-информационной характеристикой, как избыточность. Далее мы будем решать задачу вскрытия шифров простой замены лишь при условии, что предполагаемые открытые тексты — это литературные тексты с " приличной" избыточностью. Кроме того, мы будем считать, что при дешифровании мы располагаем достаточно большим числом знаков шифртекста, чтобы опираться не на " фокусы", использованные, например, в известных произведениях Э. А. По и А. КонанДойля, а в большей степени на " статистику".

Алгоритм вскрытия шифров простой замены по тексту криптограммы достаточно сложно формализовать. При любой попытке формализации теряется какой-либо важный нюанс. Поэтому мы укажем лишь основные идеи, лежащие в основе такого алгоритма Обычно выделяют следующие этапы алгоритма:

1. Подсчет частот встречаемости шифробозначений, а также некоторых их сочетаний, например биграмм и триграмм подряд идущих знаков.

2. Выявление шифробозначений, заменяющих гласные и согласные буквы.

3. Выдвижение гипотез о значениях шифробозначений и их проверка.

4. Восстановление истинного значения шифробозначений.

Если длина текста достаточно велика, то найденные на этапе 1 частоты окажутся близкими к табулированным значениям частот знаков (см. табл. 1) [1].

Проведенная на этом этапе работа служит основанием для выдвижения гипотез о значениях шифрвеличин, соответствующих данным шифробозначениям.

Таблица 1.

Частоты букв русского языка (в 32-буквенном алфавите со знаком пробела)

 

¾ 0, 175 O 0, 090 Е, Ё 0, 072 А 0, 062
И 0, 062 Т 0, 053 Н 0, 053 С 0, 045
Р 0, 040 В 0, 038 Л 0, 035 К 0, 028
М 0, 026 Д 0, 025 П 0, 023 У 0, 021
Я 0, 018 Ы 0, 016 З 0, 016 Ь, Ъ 0, 014
Б 0, 014 Г 0, 013 Ч 0, 012 Й 0, 010
Х 0, 009 Ж 0, 007 Ю 0, 006 Ш 0, 006
Ц 0, 004 Щ 0, 004 Э 0, 003 Ф 0, 002

 

При этом учитывается, что каждая буква имеет группу предпочтительных связей (см. табл. 2)[1], которые составляют ее наиболее характерную особенность.

Как правило, такие гипотезы подтверждаются не полностью. Хорошим критерием при этом является " читаемость" восстанавливаемого открытого текста.

Устойчивыми являются также частотные характеристики биграмм, триграмм и четырехграмм осмысленных текстов.

Приведем таблицы частот биграмм для русского языка (табл. 3) (таблица заимствована из книги [2]).

 


Таблица 2

Сочетаемость букв русского языка

Г С Слева   Справа Г С
    л, д, к, т, в, р, н А л, н, с, т, р, в, к, м    
    я, е, у, и, а, о Б о, ы, е, а, р, у    
    я, т, а, е, и, о В о, а, и, ы, с, н, л, р    
    р, у, а, и, е, о Г о, а, р, л, и, в    
    р, я, у, а, и, е, о Д е, а, и, о, н, у, р, в    
    м, и, л, д, т, р, н Е н, т, р, с, л, в, м, и    
    р, е, и, а, у, о Ж е, и, д, а, н    
    о, е, а, и З а, н, в, о, м, д    
    р, т, м, и, о, л, н И с, н, в, и, е, м, к, з    
    ь, в, е, о, а, и, с К о, а, и, р, у, т, л, е    
    г, в, ы, и, е, о, а Л и, е, о, а, ь, я, ю, у    
    я, ы, а, и, е, о М и, е, о, у, а, н, п, ы    
    д, ь, н, о, а, и, е Н о, а, и, е, ы, н, у    
    р, п, к, в, т, н О в, с, т, р, и, д, н, м    
    в, с, у, а, и, е, о П о, р, е, а, у, и, л    
    и, к, т, а, п, о, е Р а, е, о, и, у, я, ы, н    
    с, т, в, а, е, и, о С т, к, о, я, е, ь, с, н    
    ч, у, и, а, е, о, с Т о, а, е, и, ь, в, р, с    
    п, т, к, д, н, м, р У т, п, с, д, н, ю, ж    
    н, а, е, о, и Ф и, е, о, а, е, о, а    
    у, е, о, а, ы, и Х о, и, с, н, в, п, р    
    е, ю, н, а, и Ц и, е, а, ы    
    е, а, у, и, о Ч е, и, т, н    
    ь, у, ы, е, о, а, и, в Ш е, и, н, а, о, л    
    е, б, а, я, ю Щ е, и, а    
    м, р, т, с, б, в, н Ы л, х, е, м, и, в, с, н    
    н, с, т, л Ь н, к, в, п, с, е, о, и    
    с, ы, м, л, д, т, р, н Э н, т, р, с, к    
    ь, о, а, и, л, у Ю д, т, щ, ц, н, п    
    о, н, р, л, а, и, с Я в, с, т, п, д, к, м, л    

 

 


Таблица 3

Таблица частот биграмм русского языка

  А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Ь Э Ю Я
А                                                              
Б                                                              
В                                                              
Г                                                              
Д                                                              
Е                                                              
Ж                                                              
З                                                              
И                                                              
Й                                                              
К                                                              
Л                                                              
М                                                              
Н                                                              
О                                                              
П                                                              
Р                                                              
С                                                              
Т                                                              
У                                                              
Ф                                                              
Х                                                              
Ц                                                              
Ч                                                              
Ш                                                              
Щ                                                              
Ы                                                              
Ь                                                              
Э                                                              
Ю                                                              
Я                                                              
       

Выделение шифробозначений, отвечающих гласным и согласным, основано на характерных свойствах этих букв, учитывающих устойчивую закономерность открытых текстов, связанную с чередованием гласных и согласных букв. Подсчитаны частоты встречаемости биграмм вида гласная-гласная (г, г), гласная-согласная (г, с), согласная-гласная (с, г), согласная-согласная (с, с) в русском тексте длиной в 105 знаков. Результаты подсчета отражены в Таблице 4[1].

Таблица 4

Чередование гласных и согласных

  Г С ВСЕГО
Г      
С      

Для большинства европейских языков характерно следующее свойство. Если шифробозначение часто встречается, равномерно располагается по шифртексту, в отдельных местах чередуется через 1, 2 или 3 знака, сочетается сосредними и редкими (по частоте) шифробозначениями, то это дает основания полагать, что такое шифробозначение скрывает гласную букву. Удвоение гласных в открытом тексте происходит реже, чем согласных. Если некоторое шифробозначение признано гласной, то буква, часто сочетающаяся с ней, скорее всего согласная. В открытом тексте чрезвычайно редко встречаются три, и более, подряд идущие гласные. Четыре, и более, подряд идущие согласные также редки. Важно учитывать также процентное соотношение чисел гласных и согласных в открытом тексте.

При проверке гипотез о значениях шифробозначений полезен поиск в шифртексте слов с характерной структурой, которые часто встречаются в открытом тексте. Для русского языка — это, например, слова сколько, которое, что и т. п. Для английского языка — слова every, that, look, the и т. п. Такие слова выделяются в шифртексте посредством интервалов между повторяющимися частыми буквами, характерными сочетаниями гласных и согласных.

Если с помощью приведенных соображений произведено несколько идентификаций шифробозначений, то дальнейшая работа по вскрытию текста криптограммы не представляет особого труда.







Дата добавления: 2014-11-10; просмотров: 1260. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Типовые ситуационные задачи. Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт. ст. Влияние психоэмоциональных факторов отсутствует. Колебаний АД практически нет. Головной боли нет. Нормализовать...

Эндоскопическая диагностика язвенной болезни желудка, гастрита, опухоли Хронический гастрит - понятие клинико-анатомическое, характеризующееся определенными патоморфологическими изменениями слизистой оболочки желудка - неспецифическим воспалительным процессом...

Признаки классификации безопасности Можно выделить следующие признаки классификации безопасности. 1. По признаку масштабности принято различать следующие относительно самостоятельные геополитические уровни и виды безопасности. 1.1. Международная безопасность (глобальная и...

ТЕРМОДИНАМИКА БИОЛОГИЧЕСКИХ СИСТЕМ. 1. Особенности термодинамического метода изучения биологических систем. Основные понятия термодинамики. Термодинамикой называется раздел физики...

Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...

Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реак­ций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия