Двоичное кодирование текстовой информации copyright © МОУ "СОШ №58" г. Магнитогорска, 2008г., Понкратова М.В. Введение Лекция, объяснение учителя, сочинение, контрольные и т.д. Домашнее задание Литературное творчество Записи проблемы замазывание зачёркивание стирание заклеивание РЕЗУЛЬТАТ Испорченный вид текста Лишний расход бумаги ► Имея компьютер, можно создавать тексты, не тратя на это бумаги. ► Носителем текста становится память ЭВМ. ► Для длительного сохранения текста должна быть использована внешняя память – магнитные диски (винчестер, floppy), Flash-память, лазерные диски. Преимущества Компактное размещение (500 стр. текста=1 дискета); Ненужный текст можно стереть; Нужные файлы можно скопировать в любом количестве на другие носители; Файл с текстом можно быстро переслать по электронной почте. Неудобство Решение Прочтение текста только с помощью компьютера ЭКОНОМЯ БУМАГУ, МЫ СОХРАНЯЕМ ЛЕСА НА НАШЕЙ ПЛАНЕТЕ Кодирование текстов Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и др. символов Алфавит – это множество всех символов, с помощью которых записывается текст. Мощность алфавита – это число символов в нём. Компьютерный алфавит N = 256 Информационный вес символа 8 бит (1 байт ) Двоичный код каждого символа в компьютерном тексте 1 байт Какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления. Таблица кодировки – это таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера. • Для разных типов компьютеров используются различные таблицы кодировки. • С распространением ПК типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена. Стандартная часть таблицы: 0(00000000)…31(00011111) – служебные символы 32(00111111)…127(01111111) – латинский алфавит, цифры, знаки препинания Вариативная часть таблицы: 128(10000000) - 255(11111111) – русский алфавит Обратите внимание!!! В таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется ив машинном представлении символьной информации. ПРИМЕРЫ Запишем внутреннее представление слова «file». Очевидно, в памяти компьютера оно займёт 4 байта со следующим содержанием: 01100110 01101001 01101100 01100101 Какое слово записано следующим двоичным кодом? 01100100 01101001 01110011 01101011 «disk» Самостоятельная работа Закодируйте в двоичной форме свою фамилию, записанную латинскими буквами, используя таблицу 3.1. Закодируйте короткую фразу на русском языке. Обменяйтесь полученными кодами с соседом по парте и раскодируйте тексты друг друга.