Знания в формате 4 и 5

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Знания в формате 4 и 5 » 10 класс (Семакин И.Г.) » П/р 2.10. Представление текстов. Сжатие текстов


П/р 2.10. Представление текстов. Сжатие текстов

Сообщений 1 страница 8 из 8

1

Представление текстов. Сжатие текстов

   Цель работы: практическое закрепление знаний о представлении в компьютере текстовых данных.

Задание 1

Закодировать текст с помощью кодировочной таблицы ASCII.

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-2.png

Happy Birthday to you!!

   Записать двоичное и шестнадцатеричное представление кода (для записи шестнадцатеричного кода использовать средство для просмотра файлов любого файлового менеджера).

Задание 2

Декодировать текст, записанный в международной кодировочной таблице ASCII(дано десятичное представление, сама таблица представлена в задании 1).

   72 101 108 108 111 44 32 109 121 32 102 114 105 101 110 100 33

Задание 3

Пользуясь таблицей кодировки ASCII (из задания 1), расшифровать текст, представленный в виде двоичных кодов символов.

   01010000 01100101 01110010 01101101 00100000 01010101 01101110 01101001 01110110 01100101 01110010 01110011 01101001 01110100 01111001

Задание 4

Кодировка ASCII - Windows-1251 c 16-тиричной системой счисления

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-10.gif

Пользуясь кодовой страницей Windows-1251 таблицы кодировки ASCII, получить шестнадцатеричный код слова ИНФОРМАТИЗАЦИЯ.

Задание 5

   Во сколько раз увеличится объём памяти, необходимый для хранения текста, если его преобразовать из кодировки KOI8-R в кодировку Unicode?

Задание 6

   С помощью табличного процессора Excel построить кодировочную таблицу ASCII, в которой символы буду автоматически отображаться на экране в соответствии с их заданным десятичным номером (использовать соответствующую текстовую функцию).

Справочная информация

   Алгоритм Хаффмена. Сжатием информации в памяти компьютера называют такое её преобразование, которое ведёт к сокращению объёма ханимаемой памяти при сохранении закодированного содержания. Рассмотрим один из способов сжатия текстовой информации - алгоритм Хаффмена. С помощью этого алгоритма строится двоичное дерево, которое позволяет однозначно декодировать двоичный код, состоящий из символьный кодов различной длины. Двоичным называется дерево, из каждой вершины которого выходят две ветви. На рисунке приведён пример такого дерева, построенный для алфавита английского языка с учётом частоты встречаемости его букв.

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-3.png

   Закодируем с помощью данного дерева слово "hello":
   0101 100 01111 01111 1110
   При размещении этого кода в памяти побитово он примет вид:
   010110001111011111110
   Таким образом, текст, занимающий в кодировки ASCII 5 байтов, в кодировке Хаффмена займет 3 байта.

Задание 7

   Используя метод сжатия Хаффмена, закодируйте следующие слова:
     а) administrator
     б) revolution
     в) economy
     г) department

Задание 8

   Используя дерево Хаффмена, декодируйте следующие слова:
     а) 01110011 11001001 10010110 10010111 100000
     б) 00010110 01010110 10011001 01101101 01000100 000

2

Опишите подробнее, пожалуйста, в задании 1, как  преобразовать алфавит в другую кодировку*

3

Задание 1

   Определить, какие символы кодируются таблицей ASCII (DOS) соответствуют всем прописным буквам русского алфавита в кодировочной таблице ANSI (Windows). Для выполнения задания создать текст с русским алфавитом в Блокноте, а затем открыть его в режиме просмотра (клавиша F3) в любом файловом менеджере (Windows Commander, Far, Total Commander, Norton Commander) и преобразовать в другую кодировку. После выполнения задания заполнить таблицу.

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-1.png

Если следовать по заданию, то нам понадобится программа Total Commander.

1. Создаём текстовой файл с набором символов. Для примера укажу первые пять.

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-4.png

2. Сохраняем документ. По умолчанию файл находится в кодировки ANSI.

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-5.png

3. Далее открывает Total Commander и ищем в нём наш файл.

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-6.png

4. Затем нажимаем на режим просмотра F3. Там отобразится содержимое файла в изначальной кодировке...и там же есть возможность, просмотреть это же содержимое в разных кодировках. В нашем случае нужно найти значение кодировки ASCII (DOS).

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-7.png

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-8.png

5. Получаем результат:

http://informat45.ucoz.ru/practica/10_klass/10-2-10/2-10-9.png

4

спасибо

5

Здравствуйте! В учебнике "Информатика. для 10 класса." Бином.Лаборатория знаний, 2014. на 206 стр в задании 3 описка
"71 101 108 108 ...

6

в задании 9 не получается декодировать слово, используя дерево Хаффмана
01110011 - В
1111 - А
001 - E
001 -E
10010 - F
110 - S
10010 - F
1111- A
00000-Y

7

Всё правильно, только по коду 001 будет не "A", а "Т". И ещё в кое-каких местах допущены ошибки...

Нужно вспомнить, что изначально мы берем двоичный код из кодировки ASCII, где он размещается в 8-битных ячейках
01110011 11001001 10010110 10010111 100000

Но при декодировании Хаффмана, вся информация принимает вид: 01110011110010011001011010010111100000.
Попробуйте теперь раскодировать текст, на самом деле это задание очень простое.

Sanzhidma написал(а):

Здравствуйте! В учебнике "Информатика. для 10 класса." Бином.Лаборатория знаний, 2014. на 206 стр в задании 3 описка
"71 101 108 108 ...

Спасибо за информацию

8

СПАСИБО

Отредактировано Sanzhidma (2014-10-10 05:29:27)


Вы здесь » Знания в формате 4 и 5 » 10 класс (Семакин И.Г.) » П/р 2.10. Представление текстов. Сжатие текстов