Текстовая информация и компьютер Виды информации текстовая графическая числовая звуковая При ручной записи или даже при использовании пишущей машинки часто неприятной проблемой становится необходимость исправлять ошибки или вносить какие - то изменения в текст. У лукоморья дуб зеленый, а Злотая цепь на дубе том. И днем и ночью кот ученый и Все ходет по цепи кругом Имея компьютер, можно создавать тексты, не тратя на это бумаги. СПОСОБЫ ОБРАБОТКИ И ХРАНЕНИЯ ТЕКСТОВ Ручная запись текста на бумаге Печать на пишущей машинке Тексты на бумаге Печать на принтере Бумажная технология Файлы Компьютерная технология Недостатки бумажной технологии Достоинства компьютерной технологии • проблемы редактирования бумажных документов (зачеркивание, стирание, заклеивание, переписывание заново) • компактное хранение в файлах на носителях • книги, документы на бумажном носителе занимают очень много места • одноразовое бумаги использование, перерасход • трудности копирования бумажных текстовых документов • трудности передачи текстовой бумажной информации на большие расстояния • возможность носителя многократного использования • простота копирования и размножения • простота изменений редактирования – внесения • быстрая передача по сетевым каналам СВОЙСТВА КОМПЬЮТЕРНЫХ ДОКУМЕНТОВ Возможность внесения любых изменений непосредственно в файле, не расходуя при этом бумагу Компактность хранения текстовой информации Возможность многократного внешних носителей Легкость носители использования копирования файлов на любые с помощью компьютера Оперативная связь – передача текстовой информации через компьютерные сети Легкость удаления (стирания) ненужных текстовых файлов Возможность просмотра компьютерных текстов на экране дисплея Тексты в компьютерной памяти Урок 1 ТЕКСТОВАЯ ИНФОРМАЦИЯ И КОМПЬЮТЕР Представление текста в памяти компьютера Представление символов Таблица кодировки Код ASCII 256 символов 1 символ – 1 байт стандартная часть коды 0 – 127 альтернативная часть коды 128 - 255 Структура документов Структурные единицы • • • • • слово строка абзац страница раздел Программы создания и редактирования текста Текстовые редакторы Текстовые процессоры ОСНОВНЫЕ РЕЖИМЫ • ввод текста • редактирование • поиск и замена • работа с файлами • правописание • печать документа • помощь ДОПОЛНИТЕЛЬНЫЕ ФУНКЦИИ • стили, шаблоны • списки • таблицы • графика • формулы Интеллектуальные системы работы с текстом Гипертекст Программы переводчики Программы распознавания печатного текста Кодирование текстов А теперь заглянем в память компьютера и разберемся, как же представлена в нем текстовая информация. 1ва4 символы символы vbmlf Цифры: 1 2 3 4 5 6 7 8 9 буквы Знаки препинания С точки зрения компьютера текст – это любая последовательность символов из компьютерного алфавита. Самое главное, чтобы все используемые символы входили бы в компьютерный алфавит. Тексты в компьютерной памяти Мощность компьютерного алфавита 256 символов. Сколько информации несет один символ данного алфавита? 2i = N 2i = 256 2i = 28 i=8 (бит) двоичный код каждого символа в компьютерном тесте занимает 1 байт памяти. ТЕКСТЫ В КОМПЬЮТЕРНОЙ ПАМЯТИ • Каждый символ текста представлен в памяти компьютера двоичным кодом (1 байт) • Слово – последовательность символов, отделенная разделительным знаком или пробелом • Строка – это последовательность слов, отделенная от другой строки управляющими кодами “перевод строки” (ASCII=13) и “возврат каретки” (ASCII=10) • Текстовый файл содержит последовательность кодов символов, разделенную по строкам. В конце расположен управляющий код “конец файла” (ASCII=26) Строка слово символ Код ASCII слово символ ….. символ пробел символ Код ASCII Код ASCII Код ASCII Строка Код ASCII Управляющие коды (13 + 10) символ ….. символ Код ASCII Строка ..... Специальные управляющие коды для разделения текста на строки (13 + 10) Код ASCII Строка ..... Последовательность кодов ASCII cтрок – текстовый файл ..... Специальный управляющий код 26 (конец файла) Какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу? Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. ASCII КОИ-8 международный стандарт кодировки. (американский стандартный код для информационного обмена) код обмена информацией КОДИРОВАНИЕ ТЕКСТА. ТАБЛИЦА КОДИРОВКИ Структура кодовой таблицы Кодировка в ОС Windows – код ANSI № Символ Двоичный код 0 NUL 00000000 1 3OH 00000001 … ….. …………… 31 US 00011111 … ….. …………… 82 R 01010010 83 S 01010011 84 T 01010100 … ….. …………… 127 01111111 … ….. …………… 195 Г 11000011 Кодовая страница CP-1251 196 Д 11000100 128 (10000000) . . . 255 (11111111) 197 Е 11000101 … ….. …………… 254 ю 11111110 Содержит русские буквы, упорядоченные в алфавитной последовательности (это правило соблюдается не во всех кодовых страницах) 255 я 11111111 American National Standard Institute (американский институт стандартизации) Стандартная часть кода ANSI/ASCII 0 (00000000) . . . 127 (01111111) Символы с кодами 0 . . . 31 выполняют управляющие функции. При выводе текста они не отображаются графическими знаками. Кодирование. file file f - 01100110 i - 01101001 l - 01101100 e - 01100101 01100110 01101001 01101100 01100101 Кодирование. 01100100 01101001 01110011 01101011 d 01100100 01101001 01110011 01101011 i s k Кодовая таблица Windows (ANSI, CP-1251) Саша набирает текст на компьютере. Куда первоначально заносится набираемый текст? Текст заносится в оперативную память. А для длительного хранения текста должна быть использована внешняя память магнитные диски Текст на магнитном диске сохраняется в файле Гипертекст Самое поразительное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с текстом, информация в котором организована по принципу гипертекста. Смысловые связи между различными фрагментами текста – гиперсвязи, гиперссылки гиперсвязь При наведении курсора на гиперссылку курсор изменяет свой вид. Работа с текстовой информацией Способы обработки и хранения текстов Гипертекст Гипертекст – это способ организации текстовой информации, внутри которой установлены смысловые связи (гиперсвязи) между ее различными фрагментами Текст на бумажном носителе Компьютерный гипертекст Страница 1 гиперссылки Страница 2 Страница… гиперсвязи Домашнее задание • 1. C помощью кодировочной таблицы ASCII раскодируйте заданный текст: • 98 117 99 107 32 105 115 32 109 121 32 102 114 105 101 110 100 46 • 2. C помощью кодировочной таблицы ASCII закодируйте заданный текст: • I was born in 1995. • 3. Сколько символов содержится в тексте, использующем таблицу ASCII, если известно, что он занимает 24 576 бит памяти?