К О Д И Р О В А Н И Е... П Р Е Д С Т А В Л Е Н...

реклама
КОДИРОВАНИЕ
ИНФОРМАЦИИ.
ПРЕДСТАВЛЕНИЕ ДАННЫХ В ПАМЯТИ ЭВМ
Цель работы: Знать способы представления информации в памяти ЭВМ, уметь записать
представление целого и действительного числа в памяти компьютера в
различных интерпретациях.
 Краткие сведения
I. Для представления информации (как числовой, так и нечисловой) в памяти ЭВМ используется
двоичный способ кодирования.
Элементарная ячейка памяти ЭВМ имеет длину 8 бит (байт). Каждый байт имеет свой номер (его
называют адресом). Наибольшую последовательность бит, которую ЭВМ может обрабатывать как единое целое,
называют машинным словом. Длина машинного слова зависит от разрядности процессора и может быть
равной 16, 32 битам и т.д.
Для кодирования символов достаточно одного байта. При этом можно представить 256 символов (с
десятичными кодами от 0 до 255). Набор символов персональных ЭВМ IBM PC чаще всего является
расширением кода ASCII (American Standart Code for Information Interchange — стандартный
американский код для обмена информацией).
В некоторых случаях при представлении в памяти ЭВМ чисел используется смешанная двоичнодесятичная «система счисления», где для хранения каждого десятичного знака нужен полубайт (4 бита) и
десятичные цифры от 0 до 9 представляются соответствующими двоичными числами от 0000 до 1001.
Например, упакованный десятичный формат, предназначенный для хранения целых чисел с 18 значащими
цифрами и занимающий в памяти 10 байт (старший из которых знаковый), использует именно этот
вариант.
II. Другой способ представления целых чисел — дополнительный код. Диапазон значений величин
зависит от количества бит памяти, отведенных для их хранения. Например, величины типа
Integer (все названия типов данных здесь и ниже представлены в том виде, в каком они приняты в
языке программирования Turbo Pascal, в других языках такие типы данных тоже есть, но могут иметь
другие названия) лежат в диапазоне от -32768 (-215) до 32767 (215 - 1), и для их хранения отводится 2 байта
типа Longlnt — в диапазоне от -231 до 23' - 1 и размещаются в 4 байтах
типа Word — в диапазоне от 0 до 65535 (216— 1) (используется 2 байта) и т.д.
Как видно из примеров, данные могут быть интерпретированы как числа со знаками, так и без
знаков. В случае представления величины со знаком самый левый (старший) разряд указывает на
положительное число, если содержит нуль, и на отрицательное, если — единицу.
Вообще разряды нумеруются справа налево, начиная с 0. Ниже показана нумерация бит в
двухбайтовом машинном слове.
15
14
13 12 11
10
9
8
7
6
5
4
3
2
1
0
Дополнительный код положительного числа совпадает с его прямым кодом. Прямой код целого
числа может быть получен следующим образом:
- число переводится в двоичную систему счисления,
- его двоичную запись слева дополняют таким количеством незначащих нулей, сколько требует
тип данных, к которому принадлежит число.
Например, если число 3710 = 1001012 объявлено величиной типа Integer, то его прямым кодом
будет 0000000000100101, а если величиной типа Longlnt, то его прямой код будет
00000000000000000000000000100101.
Для более компактной записи чаще используют шестнадцатеричный код. Полученные коды можно
переписать соответственно как 002516 и 0000002516.
Дополнительный код целого отрицательного числа может быть получен по следующему
алгоритму:
1) записать прямой код модуля числа
2) инвертировать его (заменить единицы нулями, нули — единицами)
3) прибавить к инверсному коду единицу.
Например, запишем дополнительный код числа (-37), интерпретируя его как величину типа
Longlnt:
1) прямой код числа 37 есть 00000000000000000000000000100101
1
2) инверсный код 11111111111111111111111111011010
3) дополнительный код 11111111111111111111111111011011 или FFFFFFDB(16).
III. При получении числа по его дополнительному коду прежде всего необходимо определить его знак.
Если число окажется положительным, то просто перевести его код в десятичную систему
счисления. В случае отрицательного числа необходимо выполнить следующий алгоритм:
1) вычесть из кода числа 1
2) инвертировать код
3) перевести в десятичную систему счисления. Полученное число записать со знаком минус.
Примеры. Запишем числа, соответствующие дополнительным кодам:
а) 0000000000010111. Поскольку в старшем разряде записан нуль, то результат будет
положительным. Это код числа 23
б) 1111111111000000. Здесь записан код отрицательного числа. Исполняем алгоритм:
1) 11111111110000002 - 12= 11111111101111112
2) 0000000001000000
3) 10000002= 6410.
Ответ: -64.
IV. Несколько иной способ применяется для представления в памяти персонального компьютера
действительных чисел. Рассмотрим представление величин с плавающей точкой.
Любое действительное число можно записать в стандартном виде М*10р, где 1 <М< 10, р — целое.
Например, 120100000 = 1,201*108. Поскольку каждая позиция десятичного числа отличается от соседней
на степень числа 10, умножение на 10 эквивалентно сдвигу десятичной запятой на одну позицию вправо.
Аналогично деление на 10 сдвигает десятичную запятую на позицию влево. Поэтому приведенный выше
пример можно продолжить: 120100000 = 1,201*108= 0,1201*109= 12,01*107... Десятичная запятая
«плавает» в числе и больше не помечает абсолютное место между целой и дробной частями.
В приведенной выше записи М называют мантиссой числа, а р — его порядком. Для того чтобы
сохранить максимальную точность, вычислительные машины почти всегда хранят мантиссу в
нормализованном виде, что означает, что мантисса в данном случае есть число, лежащее между 110 и 210
(1 <М< 2). Основание системы счисления здесь, как уже отмечалось выше, — число 2. Способ хранения
мантиссы с плавающей точкой подразумевает, что двоичная запятая находится на фиксированном месте.
Фактически подразумевается, что двоичная запятая следует после первой двоичной цифры, т.е.
нормализация мантиссы делает единичным первый бит, помещая тем самым значение между единицей и
двойкой. Место, отводимое для числа с плавающей точкой, делится на два поля. Одно поле содержит
знак и значение мантиссы, а другое содержит знак и значение порядка.
Персональный компьютер IBM PC позволяет работать со следующими действительными типами
(диапазон значений указан по абсолютной величине):
Тип
Диапазон
Мантисса Байты
Real
2,9*10-39...l,7*1038
11-12
6
Single
l,5*10-45...3,4*1038
7-8
4
Double
5,0*10-324...l,7*10308
15-16
8
3,4*10-4932...1,1*104932
19-20
10
Extended
Покажем преобразование действительного числа для представления его в памяти ЭВМ на примере
величины типа Double.
Как видно из таблицы, величина это типа занимает в памяти 8 байт. На рисунке показано, как
здесь представлены поля мантиссы и порядка:
S
63
Смещенный порядок
52
Мантисса
0
2
Можно заметить, что старший бит, отведенный под мантиссу, имеет номер 51, т. е. мантисса
занимает младшие 52 бита. Черта указывает здесь на положение двоичной запятой. Перед запятой
должен стоять бит целой части мантиссы, но поскольку она всегда равна 1, здесь данный бит не
требуется и соответствующий разряд отсутствует в памяти (но он подразумевается). Значение порядка
для упрощения вычислений и сравнения действительных чисел хранится в виде смещенного числа, т.е. к
настоящему значению порядка перед записью его в память прибавляется смещение. Смещение
выбирается так, чтобы минимальному значению порядка соответствовал нуль. Например, для типа
Double порядок занимает 11 бит и имеет диапазон от 2-1023 до 21023, поэтому смещение равно 102310 =
13111111112. Наконец, бит с номером 63 указывает на знак числа.
Алгоритм для получения представления действительного числа в памяти ЭВМ:
1) перевести модуль данного числа в двоичную систему счисления
2) нормализовать двоичное число, т.е. записать в виде М*2Р, где М— мантисса (ее целая часть
равна 12 и р — порядок, записанный в десятичной системе счисления
3) прибавить к порядку смещение и перевести смещенный порядок в двоичную систему счисления
4) учитывая знак заданного числа (0 — положительное 1 — отрицательное), выписать его
представление в памяти ЭВМ.
Пример. Запишем код числа —312,3125.
1) Двоичная запись модуля этого числа имеет вид 100111000,0101.
2) Имеем 100111000,0101 = 1,0011100001001*28.
3) Получаем смещенный порядок 8 + 1023 = 1031. Далее имеем 103110 = 100000001112
4) Окончательно
0
10000000111
0011100001010000000000000000000000000000000000000000
63
52
0
Очевидно, что более компактно полученный код стоит записать следующим образом:
407385000000000016.
Другой пример иллюстрирует обратный переход от кода действительного числа к самому числу.
Пример. Пусть дан код 3FEC60000000000016 или
0
01111111110
1100011000000000000000000000000000000000000000000000
1) Прежде всего, замечаем, что это код положительного числа, поскольку в разряде с
номером 63 записан нуль.
2) Получим порядок этого числа: 011111111102 = 102210 1022 - 1023 = -1.
3) Число имеет вид 1,1100011-2-1 или 0,11100011.
4) Переводом в десятичную систему счисления получаем 0,88671875.
3

Задачи для самостоятельного решения
Порядок работы:
Зашифруйте данный текст, используя таблицу ASCII-кодов.
Дешифруйте данный текст, используя таблицу ASCII-кодов.
Запишите прямой код числа, интерпретируя его как восьмибитовое целое без знака.
Запишите дополнительный код числа, интерпретируя его как восьмибитовое целое со
знаком.
5. Запишите прямой код числа, интерпретируя его как шестнадцатибитовое целое без знака.
6. Запишите дополнительный код числа, интерпретируя его как шестнадцатибитовое целое со
знаком.
7. Запишите в десятичной системе счисления целое число, если дан его дополнительный код.
1.
2.
3.
4.
Вариант 1
1.
2.
3.
4.
5.
6.
7.
IBM PC
8А АЕ AC AF ЕС ЕЕ Е2 А5 Е0
а) 22410
б) 25310
а) 11510
б) -3410
а) 2249110
б) 2383210
а) 2085010
б) -1864110
а) 0011010111010110
б) 1000000110101110
Вариант 2
1.
2.
3.
4.
5.
6.
7.
Автоматизация
50 72 6F 67 72 61 6D
а) 24210
а) 8110
а) 1850910
а) 2888210
а) 0110010010010101
б) 13510
б) -4010
б) 2818010
б) -1907010
б) 1000011111110001
Вариант 3
1.
2.
3.
4.
5.
6.
7.
Информатика
50 72 6F 63 65 64 75 72 65
а) 20710
а) 9810
а) 1983510
а) 1815610
а) 0111100011001000
б) 21010
б) -11110
б) 2224810
б) -2884410
б) 1111011101101101
Вариант 4
1.
2.
3.
4.
5.
6.
7.
Computer
84 88 91 8А 8Е 82 8Е 84
а) 18510
а) 8910
а) 2940710
а) 2364110
а) 0111011101000111
б) 22410
б) -6510
б) 2534210
б) -2307010
б) 1010110110101110
Вариант 5
1. Printer
2. 43 4F 4D 50 55 54 45 52
4
3.
4.
5.
6.
7.
а) 15810
а) 6410
а) 3053910
а) 2258310
а) 0100011011110111
б) 13410
б) -10410
б) 2614710
б) -2812210
б) 1011101001100000
Вариант 6
1.
2.
3.
4.
5.
6.
7.
Компьютеризация
50 52 49 4Е 54
а) 23910
а) 5510
а) 1786310
а) 2425510
а) 0000010101011010
б) 16010
б) -8910
б) 2589310
б) -2668б10
б) 1001110100001011
Вариант 7
1.
2.
3.
4.
5.
6.
7.
YAMAHA
4D4F44 45 4D
а) 23710
а) 9510
а) 2865810
а) 3101410
а) 0001101111111001
б) 23610
б) -6810
б) 2961410
б) -2401310
б) 1011101101001101
Вариант 8
1.
2.
3.
4.
5.
6.
7.
Световое перо
4С 61 73 65 72
а) 13610
б) 13010
а) 8210
б) -1310
а) 2789810
б) 242681|0
а) 1951810
б) -1633410
а) 0000110100001001
б) 1001110011000000
Вариант 9
1.
2.
3.
4.
5.
6.
7.
Микропроцессор
88 AD Е4 АЕ Е0 АС АО Е2 А8 АА АО
а) 23010
б) 15010
а) 7410
б) -4310
а) 1834б10
б) 2568810
а) 3139710
б) -2102910
а) 0110101101111000
б) 1110100100110101
Вариант 10
1.
2.
3.
4.
5.
6.
7.
Принтер
42 69 6Е 61 72 79
а) 21910
а) 4410
а) 2335910
а) 2148110
а) 0001101010101010
б) 24010
б) -4310
б) 2742810
б) -2070410
б) 1011110111001011
5
Вариант 11
1.
2.
3.
4.
5.
6.
7.
Дисковод
49 6Е 66 6F 72 6D 61 74 69 6F 6Е
а) 23710
б) 16010
а) 12210
б) -9710
а) 3046910
б) 2151710
а) 2300810
б) -2315610
а) 0010111101000000
б) 1011001101110001
Вариант 12
1. Pentium 100
2. 91 А8 El Е2 А5 АС АО 20 El Е7 А8 El AB A5 AD A8 EF
3. a) 20110
б) 1351О
4. a) 9110
б) -710
5. a) 2923410
6) 1990910
6. a) 25879(l0)
6) -2716910
7. a) 0001111001010100
б) 101101000Ш0010
Вариант 13
1.
2.
3.
4.
5.
6.
7.
Арифмометр
AC AE A4 A5 AB A8 E0 AE A2 A0 AD A8 A5
a) 18810
б) 21310
a) 8910
б) -9010
a) 2517310
6) 2541610
a) 27435l0
6) -2243310
a) 0111110101101100
б) Ш1011001100010
Вариант 14
1.
2.
3.
4.
5.
6.
7.
Сканер
А2 ЕВ Е7 А8 Е2 А5 АВ ЕС AD EB A9 20 ED AA El AF A5 E0 A8 AC А5 АD Е2
a) 12710
б) 19910
a) 5710
б) -3110
a) 1768910
6) 2046110
a) 2649310
6) -3078510
а) 0010110001100110
б) 1010001111010000
Вариант 15
1. Винчестер
2. 43 6F 6D 70 75 74 65 72 20 49 42 4D 20 50 43
3. а) 21710
б) 16110
4. а) 5310
б) -2410
5. а) 2338010
б) 2262010
6. а) 2423610
б) -3038810
7. а) 0100101101100011
б) 1001001000101100
6
Вариант 16
1. IBM PC
2. 8А АЕ AC AF ЕС ЕЕ Е2 А5 Е0
3. а) 17010
б) 24210
4. а) 7010
б) -5010
5. а) 2158110
б) 3101410
6. a) 1990310
б) -1743110
7. а) 0011111110001000
б) 1001011111011111
Вариант 17
1. Автоматизация
2. 50 72 6F 67 72 61 6D
3. а) 17210
б) 24710
4. а) 10410
б) -6710)
5. а) 1713410
б) 1799610
6. а) 2419710
б) -1985110
7. а) 0001010110011011
б) 1001010000111010
7
 Контрольные вопросы:
1. Что такое кодирование информации в общем смысле?
2. Что такое код? Приведите примеры кодирования и декодирования.
3. Что называется избыточностью кода?
4. Какова избыточность естественного кода? Для чего она служит?
5. Приведите примеры искусственного повышения избыточности кода.
6. В чем состоит содержание 1-й и 2-ой теорем Шеннона?
7. Какие коды называются двоичными? Приведите примеры.
8. Как получить прямой и дополнительный код целого числа?
9. Как представляются действительные числа в памяти ЭВМ?
10. Как кодируется графическая информация, если изображение черно-белое (цветное)?
8
Скачать