Поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными. Существует множество подходов к измерению информации Алфавитный подход к измерению информации Познакомимся с способом измерения информации, который не связывает количество информации с содержанием сообщения, и называется он алфавитным подходом. При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы. Применение алфавитного подхода удобно прежде всего при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые — старые», «понятные — непонятные» сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода. Алфавит и его мощность Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами. Полное количество символов алфавита принято называть м о щ н о с т ь ю алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из заглавных русских букв и отмеченных дополнительных символов равна 54. А Б В ГД Е Ё Ж З И Й К Л М Н О П Р С Т УФ Х Ц Ч ШЩЬЪЭЮЯ0123456789().,!?«»:-; (пробел) Алфавит — это вся совокупность символов, используемых в некотором языке для представления информации. Мощность алфавита — это число символов в алфавите ( N). Информационный вес символа Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Двоичным называется алфавит, мощность которого равна 2. Информационный вес 1 символа двоичного алфавита принят за единицу информации и равен 1 бит. Информационный вес 1 символа двоичного алфавита принят за единицу информации и называется 1 бит. Алфавит- 0,1 Мощность N= 2 Порядковый номер символа Двузначный двоичный код 0 0 1 1 Кодируется одним битом(0,1)- 2 комбинации С увеличение мощности алфавита увеличивает информационный вес символов алфавита Один символ из четырехсимвольного алфавита (N = 4) «весит» 2 бита. Порядковый номер символа 0 1 2 3 Двузначный двоичный код 00 01 10 11 Используя три двоичные цифры, можно составить 8 различных комбинаций. Порядковый номер символа Трехзначный двоичный код 0 1 2 3 4 5 6 7 000 001 010 011 100 101 110 111 Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита (0,1) назовем двоичным кодом. Используя три двоичные цифры, можно составить 8 различных комбинаций. Порядковый номер символа Трехзначный двоичный код 0 1 2 3 4 5 6 7 000 001 010 011 100 101 110 111 Используя четыре двоичные цифры, можно составить 16 различных комбинаций. 0 1 2 3 4 5 6 7 0000 0001 0010 0011 0100 0101 0110 0111 8 9 10 11 12 13 14 15 1000 1001 1010 1011 1100 1101 1110 1111 Зависимость между мощностью алфавита N и количеством знаков в коде i. N 2 4 i 1 бит 1 Заметим 2 = 2 8 16 2 бита 3 бита 4 бита 2 3 4=2 8=2 16 = 2 В общем виде это записывается следующим образом: N= 2 i 4 1 27= 128 2 28= 256 3 29= 512 2 =2 2 =4 2 =8 4 2 = 16 26= 64 2 10= 1024 Информационный вес каждого символа, выраженный в битах (i) и мощность алфавита (N) связаны между собой формулой: N= 2 i . N= 2 i Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита? i N=8 8=2 i-? 2 =2 3= i 3 i Задание: Определите информационный объем страницы книги (3000), если для записи текста использовались только заглавные буквы русского алфавита, кроме буквы Ё. Решение: 1. 2. 3. 4. 5. N = 32 2I = N 2I = 32 I=5 На странице 3000 знаков, тогда информации = 3000 * 5 = 15000 бит. объем I= K · i , I - количество информации в тексте K – количество символов в тексте i - информационный вес 1 символа Какой объем информации несет слово «информация»? i N=32 32=2 K=10 2 =2 i =5 бит – 1 буква I-? I = K· i I = 10 · 5=50 Ответ: 50 бит 5 i Алфавит и его мощность Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами. Полное количество символов алфавита принято называть м о щ н о с т ь ю алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из заглавных русских букв и отмеченных дополнительных символов равна 54. А Б В ГД Е Ё Ж З И Й К Л М Н О П Р С Т УФ Х Ц Ч ШЩЬЪЭЮЯ0123456789().,!?«»:-; (пробел) Сколько информации несет один символ в русском языке Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле 2I = N , каждый такой символ несет I бит информации, которое можно определить из решения уравнения: 2I = 54. Получаем: I = 5.755 бит. Вот сколько информации несет один символ в русском тексте! Количество информации в тексте А теперь для того, чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на I. Посчитаем количество информации на одной странице книги. Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит. При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита. Двоичный алфавит А что если алфавит состоит только из двух символов 0 и 1? В этом случае: N = 2; 2I = N; 2I = 2; I = 1! При использовании двоичной системы (алфавит состоит из двух знаков: 0 и 1) каждый двоичный знак несет 1 бит информации. Интересно, что сама единица измерения информации «бит» получила свое название от английского сочетания «binary digit» - «двоичная цифра». Найти информационный объем текста, записанного с помощью двоичного алфавита: 1101001011000101110010101101000111010010 содержит 40 символов, Так как мощность алфавита N=2 i 1 i 2=2 2 =2 1= i I = K· i I = 40 · 1= 40. Ответ: информационный объем равен 40 битам. Достаточный алфавит Удобнее всего измерять информацию, когда размер алфавита N равен целой степени двойки. Например, 4если N=16, то каждый символ несет 4 бита информации потому, что 2 = 16. А если N =32, то один символ «весит» 5 бит. Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы имеем дело при работе с компьютером. Это алфавит мощностью 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания.... Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт. 1 байт = 8 бит Количество информации в тексте Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов. В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах. Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Значит страница содержит 40x60=2400 байт информации. Объем всей информации в книге: 2400 х 150 = 360 000 байт. Выполнить в тетради: 28= 256 8*7=56 Один символ алфавита «весит» 8 бит, сколько символов в алфавите? И какой объем будет занимать сообщение, 256*9=2304 состоящее из 7 символов? Подсчитать информационный объем слова «компьютер» Более крупные единицы информации Условное Название обозначение Соотношение с другими единицами Килобит Кбит 1 Кбит = 1024 бит = 210 бит ==1024 бит Мегабит Мбит 1 Мбит = 1024 Кбит = 220 бит ==1024*1024 бит Гигабит Гбит 1 Гбит = 1024 Мбит = 230 бит==1024*1024*1024 бит Килобайт Кбайт (Кб) 1 Кбайт = 1024 байт = 210 байт=1024*8 бит Мегабайт Мбайт (Мб) 1 Мбайт = 1024 Кбайт = 220 байт=1024* 1024*8 бит Гигабайт 1 Гбайт = 1024 Мбайт = 230 байт=1024*1024*1024*8 бит Гбайт (Гб) Скорость передачи информации Прием-передача информации могут происходить с разной скоростью. Количество информации, передаваемое за единицу времени, есть скорость передачи информации или скорость информационного потока. Очевидно, эта скорость выражается в таких единицах, как бит в секунду (бит/с), байт в секунду (байт/с), килобайт в секунду (Кбайт/с) и т.д. Задачи: С помощью модема (скорость 16 Кб/с) скачали сообщение за 7 секунд. Определите информацион-ный объем и количество символов в сообщение, если он закодированы в кодах ASCII (8 бит- «вес» символа). Задачи: 1. Сколько килобайтов составляет сообщение, содержащее 12288 битов? 2. С помощью модема (скорость 64 Кб/с) скачали сообщение за 5 секунд. Определите информационный объем и количество символов в сообщение, если он закодированы в кодах ASCII (8 бит- «вес» символа). 3. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 32 символа, второй – мощностью 64 символа. Во сколько раз отличается количество информации в этих текстах? Практическая работа «Измерение информации» Минимальным адресуемым элементом жесткого диска является кластер, размер которого зависит от типа используемой таблицы размещения файлов FAT и емкости жесткого диска. Таблица FAT32, NTFS логически разбивает жесткий диск на кластеры, содержащие по восемь секторов. Таким образом, независимо от информационной емкости жесткого диска размер кластера составляет 4 Кбайта. На жестком диске с файл будет занимать один кластер, объем которого равен 4 Кбайта. Каждый файл на диске занимает определенное количество секторов (кластеров). Кластеры нумеруются и каталог диска содержит указание на начало файла (содержит номер первого кластера файла). Информация о последовательность кластеров (номера кластеров), в которых хранится Вопросы: Что такое «алфавит»? Что такое «мощность алфавита»? Как определяется количество информации в сообщении с алфавитной точки зрения? Что больше 1 Кбайт или 1000 байт? Расположите единицы измерения информации в порядке возрастания: Гигабайт; Байт; Мегабайт; Килобайт. Сколько информации содержится в сообщении, если для кодирования одного символа использовать 1 байт: «Компьютер – универсальный прибор.» Задание 1: Племя Мумбу-Юмбу использует алфавит из букв: αβγδεζηθλμξσφψ, точки и для разделения слов используется пробел. Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов? Задание 2: Вычислите какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1.25 Кбайта. АЛФАВИТНЫЙ ПОДХОД К ИЗМЕРЕНИЮ ИНФОРМАЦИИ МОЩНОСТЬ АЛФАВИТА 2 = N N i ИНФОРМАЦИОННЫЙ ВЕС СИМВОЛА I = K·i K ЧИСЛО СИМВОЛОВ В СООБЩЕНИИ i I число символов в алфавите (его размер) количество информации в одном символе (в битах) КОЛИЧЕСТВО ИНФОРМАЦИИ В СООБЩЕНИИ