Студопедия — символов
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

символов






 

 


 

4. Создаем дерево Хаффмана, относительно этого дерева выстраиваем кодовую таблицу.

 

Символ Код
о  
т  
е  
и  
а  
м  
н  
л  
к  
с  
г  
у  
,  
р  
д  
в  
б  
з  
ь  
я  
п  
ч  
ж  
й  
ы  
.  
ф  
х  
ц  
щ  
э  
;  

 

 

Итоговая таблица на основе моей частотной таблицы

 

Символ Частота размер(бит) ASCII размер(бит) UTF - 8 Код размер(бит) итоговый
о          
т          
е          
и          
а          
м          
н          
л          
к          
с          
г          
у          
,          
р          
д          
в          
б          
з          
ь          
я          
п          
ч          
ж          
й          
ы          
.          
ф          
х          
ц          
щ          
э          
;          

 

Общий размер до сжатия (в ASCII): 2288 бит

Общий размер до сжатия (в UTF - 8): 4472 + 24 (BOM) = 4496 бит

 

Общий размер после сжатия (в ASCII): 1293 бит

Общий размер после сжатия (в UTF - 8): 1293 + 24 (BOM) = 1317 бит

 

       
 
 
   

 


5. Проделываем тоже самое, только на основе известной частотной таблицы букв русского языка http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters&title=%D7%E0%F1%F2%EE%F2%ED%EE%F1%F2%FC%20%E1%F3%EA%E2%20%F0%F3%F1%F1%EA%EE%E3%EE%20%E0%EB%F4%E0%E2%E8%F2%E0)

 

Сортируем по рангу (см. общую таблицу ниже) и задаем условную частоту, на основе условной частоты создаем дерево Хаффмана:

 

 

таблица на основе известной частотной таблицы букв русского языка

 

Символ (по частоте) Частота Ранг Размер (бит) итоговый Символ (по рангу) Условная частота Кодовая таблица
  о       о    
  т       е    
  е       а    
  и       и    
  а       н    
  м       т    
  н       с    
  л       р    
  к       в    
  с       л    
  г       к    
  у       м    
  ,   ,   д    
  р       п    
  д       у    
  в       я    
  б       ы    
  з       ь    
  ь       г    
  я       з    
  п       б    
  ч       ч    
  ж       й    
  й       х    
  ы       ж    
  .   .   ц    
  ф       щ    
  х       э    
  ц       ф    
  щ       ,    
  э       .    
  ;   ;   ;    

 

Общий размер до сжатия (в ASCII): 2288 бит

Общий размер до сжатия (в UTF - 8): 4472 + 24 (BOM) = 4496 бит

Общий размер после сжатия (в ASCII): 1341 бит

Общий размер после сжатия (в UTF – 8): 1341 + 24 (BOM) = 1365 бит

 

 

 







Дата добавления: 2015-06-15; просмотров: 295. Нарушение авторских прав; Мы поможем в написании вашей работы!



Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Измерение следующих дефектов: ползун, выщербина, неравномерный прокат, равномерный прокат, кольцевая выработка, откол обода колеса, тонкий гребень, протёртость средней части оси Величину проката определяют с помощью вертикального движка 2 сухаря 3 шаблона 1 по кругу катания...

Неисправности автосцепки, с которыми запрещается постановка вагонов в поезд. Причины саморасцепов ЗАПРЕЩАЕТСЯ: постановка в поезда и следование в них вагонов, у которых автосцепное устройство имеет хотя бы одну из следующих неисправностей: - трещину в корпусе автосцепки, излом деталей механизма...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

Дизартрии у детей Выделение клинических форм дизартрии у детей является в большой степени условным, так как у них крайне редко бывают локальные поражения мозга, с которыми связаны четко определенные синдромы двигательных нарушений...

Педагогическая структура процесса социализации Характеризуя социализацию как педагогический процессе, следует рассмотреть ее основные компоненты: цель, содержание, средства, функции субъекта и объекта...

Типовые ситуационные задачи. Задача 1. Больной К., 38 лет, шахтер по профессии, во время планового медицинского осмотра предъявил жалобы на появление одышки при значительной физической   Задача 1. Больной К., 38 лет, шахтер по профессии, во время планового медицинского осмотра предъявил жалобы на появление одышки при значительной физической нагрузке. Из медицинской книжки установлено, что он страдает врожденным пороком сердца....

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия