Студопедия — Кодирование текстов
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Кодирование текстов






Начать объяснение следует с напоминания того, что компьютер может работать с четырьмя видами информации: текстовой, графической, числовой и звуковой. Термин «текстовая информация» и «символьная информация» используются как синонимы. С точки зрения компьютера текст - это последовательность символов, входящих в компьютерный алфавит.

Первая задача - познакомить учеников с символьным алфавитом компьютера. Они должны знать, что:

• Алфавит компьютера включает в себя 256 символов;

• Каждый символ занимает 1 байт памяти;

Необходимо отметить, что каждый символ в памяти компьютера представлен 8-ми разрядным двоичным кодом. Существует 256 различных 8-ми разрядных комбинаций из «0» и «1». Удобство побайтового кодирования очевидно, поскольку байт - наименьшая адресуемая часть памяти, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста.

Далее следует ввести понятие о таблице кодировки. Таблица кодировки - это стандарт, ставящий в соответствие каждому символу алфавита свой порядковый номер. Наименьший номер - 0, наибольший - 256. Двоичный код символа, это его порядковый номер в двоичной системе счисления. Международным стандартом стала система кодов ASCII. От учеников не нужно требовать запоминания кодов символов. Однако некоторые принципы организации кодовых таблиц они должны знать. Необходимо рассмотреть с учащимися таблицу кодов ASCII. Проводя анализ таблицы кодов ASCII важно отметить соблюдение лексикографического порядка в расположении букв латинского алфавита, а также цифр. На этом принципе основана возможность сортировки символьной информации.

В качестве дополнительной информации можно рассказать о том, что проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, то есть в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65 536 символов и можно внести всевозможные национальные алфавиты.

В разделе 1.3 части II учебника Семакин «Информатик базовый курс» рассматривается иной подход к проблем кодирования текста в компьютерной памяти. Этот подход основа на применении алгоритма Д. Хаффмана. Суть его состоит в том, что длина двоичного кода у разных символов может быть разная. Чем чаще символ встречается в тексте, тем его код короче и наоборот — чем символ более «редкий», тем его код длиннее Перекодирование текста из байтового кода путем применения алгоритма Д. Хаффмана позволяет существенно сокращать объем памяти, занимаемый текстом.







Дата добавления: 2015-04-19; просмотров: 823. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

ТЕОРИЯ ЗАЩИТНЫХ МЕХАНИЗМОВ ЛИЧНОСТИ В современной психологической литературе встречаются различные термины, касающиеся феноменов защиты...

Этические проблемы проведения экспериментов на человеке и животных В настоящее время четко определены новые подходы и требования к биомедицинским исследованиям...

Классификация потерь населения в очагах поражения в военное время Ядерное, химическое и бактериологическое (биологическое) оружие является оружием массового поражения...

Почему важны муниципальные выборы? Туристическая фирма оставляет за собой право, в случае причин непреодолимого характера, вносить некоторые изменения в программу тура без уменьшения общего объема и качества услуг, в том числе предоставлять замену отеля на равнозначный...

Тема 2: Анатомо-топографическое строение полостей зубов верхней и нижней челюстей. Полость зуба — это сложная система разветвлений, имеющая разнообразную конфигурацию...

Виды и жанры театрализованных представлений   Проживание бронируется и оплачивается слушателями самостоятельно...

Studopedia.info - Студопедия - 2014-2024 год . (0.007 сек.) русская версия | украинская версия