Информация в памяти компьютера Память компьютера состоит из ячеек. 0 1 1 0 0 0 1 1 1 0 0 0 1 1 0 0 1 0 1 1 0 0 0 1 1 0 1 1 0 1 1 1 1 0 1 0 1 1 0 1 1 0 1 1 1 0 0 0 1 1 0 1 1 0 1 0 0 1 0 0 1 1 0 1 1 1 0 0 0 1 1 0 0 1 1 0 1 1 0 1 Ячейка памяти компьютера называется БИТ и содержит только 0 и 1 Текстовая информация (документы, статьи) Видеоинформация (фильмы, видеоролики, анимация) В памяти компьютера представлены в виде ноликов и единичек Звуковая информация (голоса, музыка) Графическая информация (фотографии, рисунки) Кодирование числовой информации Как любое число записать 0 и 1? Десятичная позиционная система счисления: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 – итого 10 цифр Значение цифры зависит от ее ПОЗИЦИИ в записи числа: 5, 53, 531, 5314 1, 10, 100, 1000, 10000, 100000… Любое число можно записать в виде суммы разрядных слагаемых: 1327 = 1∙1000 + 3∙100 + 2∙10 + 7∙1 Двоичная позиционная система счисления 0, 1 – итого 2 цифры 1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048… Любое число можно записать в виде суммы этих разрядных слагаемых: 1327 = 1∙1024 + 0 ∙512 + 1∙256 + 0∙128 + 0∙64 + 1∙32 + 0∙16 + 1∙8 + 1∙4 + 1∙2 + 1∙1 = 101001011112 Перевод десятичных чисел в двоичные 1. Делим число на 2, справа от него записываем целую часть от результата, а снизу – остаток от деления. 2. То же самое делаем с результатом деления, повторяя процесс до тех пор, пока результат не станет равным 0. 3. Читаем двоичное число по остаткам от деления СПРАВА НАЛЕВО! Перевод двоичных чисел в десятичные Нужно представить число в виде суммы разрядных слагаемых: 64 32 16 8 4 2 1 1 1 0 0 1 0 12=64+32+4+1=10110 Арифметические операции Таблица сложения 0 + 0 = 0 0 + 1 = 1 1 + 0 = 1 0 ∙ 0 = 0 1 + 1 = 10 0 ∙ 1 = 0 1 ∙ 0 = 0 1 ∙ 1 = 1 Таблица умножения Таблица вычитания 0 - 0 = 0 0 - 1 = 11 1 - 0 = 1 1 - 1 = 0 Домашнее Задание 1. 2. Перевести в двоичную систему счисления: 3510 Перевести в десятичную систему счисления: 1011012 3. 10110101 + 10111000 1010 · 1100 Число Двоичная запись 0 0000 1 0001 2 0010 16=24 3 0011 4 0100 1610=100002 Числа от 0 до 15 записываются в двоичном виде ровно 4 двоичными цифрами: 5 0101 6 0110 7 0111 8 1000 9 1001 10 1010 11 1011 12 1100 13 1101 14 1110 15 1111 Шестнадцатеричная система счисления Шестнадцатеричная система счисления Шестнадцатеричные цифры используются для более компактной записи двоичного кода : 4 двоичным цифрам соответствует 1 шестнадцатеричная Число Двоичная запись Шестнадцатерич ная цифра 0 0000 0 1 0001 1 2 0010 2 3 0011 3 4 0100 4 5 0101 5 6 0110 6 7 0111 7 8 1000 8 9 1001 9 10 1010 A 11 1011 B 12 1100 C 13 1101 D 14 1110 E 15 1111 F Шестнадцатеричная система счисления Один байт (8 двоичных цифр) можно разделить на две группы по 4 цифры, и записать ровно двумя шестнадцатеричными цифрами. ← байт → ← байт → ← байт → 1 0 0 1 1 0 1 0 1 1 1 0 0 1 0 0 1 1 0 0 1 1 0 1 9 A E 4 C D Перевод шестнадцатеричных чисел в десятичные Нужно представить число в виде суммы разрядных слагаемых: 4096 256 16 1 A 1 6 F 16 = A∙4096+ 1∙256 +6∙16+F∙1= = 10∙4096+1∙256+ 6∙16+15 = 4132710 Кодирование текстовой информации Один символ кодируется одним байтом! Каждому символу ставится в соответствие уникальная цепочка из 8 двоичных цифр: А - 01000001 Всего существует 256 таких разных цепочек, то есть одним байтом можно закодировать 256 символов. Соответствие символов и кодов задается с помощью кодовой таблицы. Существуют множество кодовых таблиц: ASCII, КОИ-8, Windows и т.д. Структура кодовой таблицы .0 В Т.1 .2 О Р.3 .4 А .5 Я .6 .7 П .8 О .9 Л .A О с и м в о л ы .B В .C И .D Н .E А и Е 0. П Е1. Р2. 3. В 4. А 5. Я L с о т в в е т с т к о д а м 6. 7. П 8. О 9. Л A. О B. В C. И D. Н E. А F. A7 в у ю щ .F Код ASCII – первая кодировка алфавита .0 .1 0. .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C у п р а в л я ю щ и е с и м в о л ы * + 1. 2. ! " # $ % & ' ( ) : ; .D .E .F , — . / < = > ? 3. 0 1 2 3 4 5 6 7 8 9 4. @ A B C D E F G H I J K L M N O 5. P Q R S T U V W X Y Z [ \ ] ^ _ 6. ` a b c d e f g h i j k l m n o 7. p q r s t u v w x y z { | } ~ Верхняя часть кодовой таблицы содержит английские буквы, знаки, управляющие символы. Остается неизменной до сих пор. Кодирование русских букв Изначальная вторая часть кодировки ASCII содержит европейские буквы и символы псевдографики: Кодирование русских букв На место европейских букв были вставлены русские буквы. Сейчас это называется «кодировка MS-DOS» или Code Page 866 (cp866): Кодирование русских букв Для преодоления разрыва в расположении русских букв была предложена новая кодовая страница, которая называется “кодировка Windows” или cp1251: .0 .1 .2 .3 .4 .5 .6 .7 .8 8. Ђ Ѓ ‚ ѓ „ … † ‡ € ‰ Љ ‹ Њ Ќ Ћ Џ 9. ђ ‘ ’ “ ” • – — Ў ў Ј ¤ Ґ ¦ A. .9 .A .B .C .E .F ™ љ › њ ќ ћ џ § Ё © Є « ¬ ® Ї · ё № є » ј ѕ ї B. ° ± І і ґ µ ¶ C. А Б В Г Д Е Ж З D. Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь E. а б в г д е ж з F. р с т у ф х ч ш щ ъ ы ц .D Ѕ И Й К Л М Н О П и й к Э Ю Я л м н ь о п э ю я Проблемы Наличие разных кодовых страниц порождает следующие проблемы: 1. Вывод текста не в той кодировке, в какой он был создан (кракозябры); 2. Невозможность использовать в одном документе символы разных языков (например, грузинского и арабского); 3. Невозможно создать кодовые страницы для китайского и японского языков. Пример кракозябр Юникод – решение проблем Юникод – международная система кодирования для обмена информацией. Стандарт UNICODE 4.0 позволяет закодировать до 1 114 112 символов, что достигается путем расширения кодового пространства: каждый символ кодируется 1 байтом (8-битная UTF-8, для совместимости) 2 байтами (16-битная форма UTF-16) 4 байтами (32-битная UTF-32) Сейчас наиболее часто используется 2-х байтовая форма UTF-16. Кодирование текста в Microsoft Office Word 2007 Система письма Стандарты кодировки Используемый шрифт Многоязычная Юникод (UCS-2 little-endian и bigendian, UTF-8, UTF-7) Арабская Windows 1256, ASMO 708 Шрифт по умолчанию основан на стиле Normal для соответствующей языковой версии Word Courier New Китайская (упрощенное письмо) Китайская (традиционное письмо) Кириллица GB2312, GBK, EUC-CN, ISO-2022CN, HZ BIG5, EUC-TW, ISO-2022-TW SimSun Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 Windows 1250, 1252-1254, 1257, ISO8859-x Courier New Windows 1253 Courier New Иврит Windows 1255 Courier New Японская Shift-JIS, ISO-2022-JP (JIS), EUC-JP MS Gothic Вьетнамская Windows 1258 Courier New Индийская: тамильский язык ISCII 57004 Latha Индийская: непальский язык ISCII 57002 (Devanagari) Mangal Английская, западноевропейская или другая латинская система письма Греческая MingLiU Courier New Кодирование графической информации Растровое кодирование Рисунок делится вертикальными и горизонтальными линиями на крошечные фрагменты – пиксели. Цвет каждого пикселя кодируется двоичным числом. Совокупность всех пикселей – двумерный массив точек, цвет каждой из которых задается независимо – называется растр. Основная характеристика растра – размер: количество точек по вертикали Х количество точек по горизонтали Кодирование графической информации Для монохромного (черно-белого) изображения каждый пиксель можно кодировать 1 битом: 0 – нет цвета, 1 – есть цвет. Для цветного изображения (Truecolor) каждый пиксель кодируется смешением оттенков трех основных цветов: Красного, Зеленого и Синего. На каждый цвет отводится по 8 битов, в которых можно записать 256 различных оттенков. Это называется «цветовая схема RGB» (Red, Green, Blue). Точное число цветов можно вычислить если перемножить 256∙256∙256=? Объем памяти на 1 пиксель Монохромное изображение Цветное изображение 1 бит на пиксель 24-разрядный рисунок (глубина цвета – 24 бита) 16 777 216 цветов 24 бита (3 байта) на пиксель Векторное кодирование Рисунок представляется как состоящий из геометрических фигур. Каждая фигура может быть математически описана: отрезки – координатами своих концов, прямоугольники – координатами углов, окружности – координатами центра и радиусом и т.д. Преимущества растрового и векторного кодирования Векторное кодирование: Независимость размера файла от размеров рисунка; Удобно преобразовывать (поворачивать, растягивать) Растровое кодирование: Возможность кодировать реальные изображения (фотографии, факсы) Кодирование звуковой информации Давление звуковой волны Из курса физики известно, что звук есть колебания среды (например, воздуха). Время Временная дискретизация и квантование звука Значения звукового давления фиксируются с определенной точностью Квантование Измерения проводятся через определенные промежутки времени Дискретизация Параметры дискретизации Частота дискретизации звука - это количество измерений громкости звука за одну секунду (8000 – 48 000). Глубина кодирования звука - это количество бит, используемое для кодирования уровней громкости звука. При глубине кодирования звука в 16 битов количество уровней громкости звука равно N = 216 = 65 536. Оцифровывание звуковой информации Аналоговый (непрерывный) звуковой сигнал АЦП (Аналогово -цифровой преобразо ватель) Оцифрованный сигнал Воспроизведение цифрового звука Оцифрованный сигнал ЦАП (ЦифроАналоговый преобразователь) Аналоговый (непрерывный) звуковой сигнал Звуковая карта ЦАП АЦП Звуковая карта Правила вычисления информационного объема объектов разных типов Текст (только английские буквы и цифры): 1символ = 1 байт Текст в Юникоде (кириллица, многоязычный текст): 1 символ = 2 байта Черно-белое изображение: 1 пиксель = 1 бит Цветное изображение: 1 пиксель = 3 байта Звук: 1 секунда = глубина кодирования ∙ частота дискретизации ∙ количество каналов (в битах) Задачи на измерение информации На странице учебника немецкого языка содержится 40 строк, в каждой строке – примерно 60 символов. Каков информационный объем страницы? 60 ∙ 40 ∙ 2 = 4 800 байт Весь учебник содержит 176 страниц, каков информационный объем учебника в Килобайтах? 4 800 ∙ 176 = 844 800 байт = 825 К Задачи на измерение информации Пьерро объясняется в любви Мальвине с помощью SMS-ок. Текст его письма содержит 15 строк по 60 символов каждая. На сколько SMS-ок будет разбито его письмо, если размер одной SMS-ки 140 байт? Символов в письме: 15 ∙ 60 = 900 Информационный объем письма: 900 ∙ 2= 1800 Количество SMS: 1800 / 140 = 13 (12.8) Задачи на измерение информации Информационный объем доклада 75,6 К. На каждом листе содержатся 43 строки, в каждой строке – в среднем 75 символов. Сколько листов занимает доклад? Информационный объем доклада: 75,6 ∙ 1024 ≈ 77 414 байт Количество символов в докладе: 77 414 / 2 ≈ 38 707 Количество строк в докладе: 38 707 / 75 ≈ 516 Количество листов: 516 / 43 = 12 Задачи на измерение информации Ромео нарисовал для Джульетты чернобелый рисунок размером 800 пикселей на 400 пикселей. Каков информационный объем рисунка в килобайтах? Сколько пикселей содержится в рисунке? (Сколько пикселей – столько бит) 400 ∙ 800 = 320 000 пикселей = 320 000 бит 320 000 / 8 = 40 000 байт 40 000 / 1024 ≈ 39 К Задачи на измерение информации А Джульетта изменила формат представления на цветной и раскрасила ее. Каков теперь информационный объем картинки? Сколько пикселей содержит картинка? 400 ∙ 800 = 320 000 пикселей 320 000 ∙ 3 = 960 000 байт = 937,5 К Задачи на измерение информации Информационный объем цветного изображения составляет 360 К. Какова ширина картинки, если ее высота равна 240 пикселей? Сколько байт содержит изображение? 360 ∙ 1024 = 368 640 байт А сколько пикселей? 368 640 / 3 = 122 880 пикселей Чему равна ширина картинки? 122 880 / 240 = 512 пикселей Задачи на измерение информации Информационный объем картинки 42,8 К. Размер растра – 500 на 700. Изображение цветное или монохромное? Информационный объем: 42,8 ∙ 1024 ≈ 43827 байт ≈ 350616 бит Количество пикселей: 500 ∙ 700 = 350 000 Бит на пиксель: 350616 / 350 000 ≈ 1 Следовательно, изображение монохромное Задачи на измерение информации Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука: а) моно, 8 битов, 8000 измерений в секунду; б) стерео, 16 битов, 48 000 измерений в секунду. а) 10 ∙ 8 ∙ 8000 ∙ 1 = 640 000 бит = 80 000 байт = 78,125 К б) 10 ∙ 16 ∙ 48000 ∙ 2 = 15 360 000 бит = 1 920 000 байт = 1875 К ≈ 1,8 М Задачи на измерение информации Определить длительность звукового файла, который уместится на дискете 3,5" (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый): а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду; б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду. Объем файла: 512 ∙ 2847 = 1457664 байт = 11 661 312 бит а) 11 661 312 бит / 8 / 8000 ≈ 182 сек б) 11 661 312 бит / 2 / 16 / 48000 ≈ 7 сек Самостоятельная работа I вариант II вариант 1. Пьеро написал Мальвине 1. На свадьбе Пьеро и объяснение в любви на 10 Мальвины сделали цветную страницах. На каждой странице по фотографию размером 1250 40 строк, в каждой строке на 960 пикселей. Каков примерно 75 символов. Каков информационный объем информационный объем письма в изображения в Мегабайтах? Килобайтах? 2. Информационный объем 2. Информационный объем черно- книги 1,5 М. В книге 512 белого изображения 53,125 К. Если страниц, на каждой странице ширина изображения 850 64 строки. Сколько символов пикселей, то какова высота? в каждой строке? Самостоятельная работа 1. 2. 3. Что такое растровое кодирование? Информационный объем черно-белого изображения 53,125 К. Если ширина изображения 850 пикселей, то какова высота? Пьеро написал Мальвине объяснение в любви на 10 страницах, используя итальянский, латинский, греческий и английский языки. На каждой странице по 40 строк, в каждой строке примерно 75 символов. Каков информационный объем письма в Килобайтах? 1. 2. 3. Что такое векторное кодирование? Информационный объем книги 1,5 М. В книге 512 страниц, на каждой странице 64 строки. Сколько символов в каждой строке? На свадьбе Пьеро и Мальвины сделали цветную фотографию размером 1250 на 960 пикселей. Каков информационный объем изображения в Мегабайтах?