Тексты в компьютерной памяти.
Тексты в компьютерной памяти
1. Работа с текстами – одна из областей применения компьютера.
- Преимущества компьютерного
документа по сравнению с бумажным.
- Представление текстов в памяти
компьютера.
4. Гипертекст.
Текст на внешних носителях сохраняется в виде файла.
Преимущества компьютерного документа по сравнению с бумажным.
- Экономия бумаги.
- Компактное размещение текста и хранение на носителях внешней памяти в виде файлов.
- Возможность быстрого исправления ошибок.
- Возможность быстрой копии и печати.
- Оперативная передача текста по линиям компьютерной связи.
Недостаток компьютерного документа:
- Документ можно прочитать, только с помощью компьютера.
Представление текста в памяти компьютера.
Алфавит – это множество всех символов , с помощью которых записывается текст.
Код - система условных знаков для представления информации.
Кодирование - это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода.
Декодирование - это перевод закодированной информации в форму понятную человеку.
Кодирование одной и той же информации
разными способами
КНИГА – русский язык
BOOK – английский язык
BUCH – немецкий язык
Кодирование одной и той же информации
разными способами
КОМПЬЮТЕР русский язык
COMPUTER английский
язык
- - --- -- -- - - -- - - код Морзе
Кодирование символов
- Для представления текстовой информации в компьютере используется алфавит мощностью
- Один символ алфавита несёт 8 битов информации
3. Каждому символу – уникальный десятичный код 0..255 Таблица символов:
4. Коды – в двоичную систему .
256
256 = 2 8 8 бит на символ
коды
65
66
67
68
…
A
B
C
D
…
1 байт – это 8 битов .
Двоичное кодирование
– это кодирование всех видов
информации с помощью двух знаков
(обычно 0 и 1).
А
1100 0000
1100 0001
1100 0010
Б
В
числа
звук
Двоичное кодирование
кодировщик
символы
101011011101110110101
рисунки
- в такой форме можно закодировать все виды информации
- нужны только устройства с двумя состояниями
- практически нет ошибок при передаче
- компьютеру легче обрабатывать данные
- человеку сложно воспринимать двоичные коды
14
Двоичный код каждого символа занимает 1 байт памяти компьютера.
КОМПЬЮТЕР
9 символов - 9 байтов
Символы всей книги
Примерно 400 Кбайт
Таблица кодировки
устанавливается соответствие между
символами и их порядковыми номерами
в компьютерном алфавите.
- это внутреннее представление
символов в таблице.
Кодировка 1 байт на символ
127
128
254
255
0
1
таблица ASCII
( международная )
кодовая страница
ASCII = American Standard Code for Information Interchange
(Американский стандартный код для информационного обмена)
0-31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки
32 пробел
знаки препинания : . , : ; ! ?
специальные знаки : + - * / () {} []
48-57 цифры 0..9
65-90 заглавные латинские буквы A-Z
97 - 122 строчные латинские буквы a-z
- 0-31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки 32 пробел знаки препинания : . , : ; ! ? специальные знаки : + - * / () {} [] 48-57 цифры 0..9 65-90 заглавные латинские буквы A-Z 97 - 122 строчные латинские буквы a-z
Кодовая страница (расширенная таблица ASCII ) для русского языка:
CP-1251 для системы Windows ( Интернет )
Стандартная часть кода ASCII
Кодовая страница СР1251
Кодирование символов
Текстовый файл
- на экране ( символы )
- в памяти – двоичные коды
1000001 2
1000010 2
1000011 2
1000100 2
65
66
67
68
!
В файле хранятся не изображения символов, а их числовые коды в двоичной системе!
Какое слово записано двоичным кодом?
01100100
01101001
01110011
01101011
d i s k
Кодировка UNICODE
- Windows , MS Office , …
- 16 бит на символ
- 65536 или 2 16 символов в одной таблице
можно одновременно использовать символы разных языков ( Интернет )
размер файла увеличивается в 2 раза
Гипертекст
- это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами.
Такие связи называются ГИПЕРСВЯЗЯМИ
(ГИПЕРССЫЛКАМИ ).
Тексты в компьютерной памяти
1. Работа с текстами – одна из областей применения компьютера.
- Преимущества компьютерного
документа по сравнению с бумажным.
- Представление текстов в памяти
компьютера.
4. Гипертекст.