Открытый урок по информатике в 10 классе по теме «Представление текстов. Сжатие текстов»
Учитель Матвеева Оксана Владимировна
План урока
- Орг. момент. Постановка задачи
- Изучение нового материала. Презентация проектов
- Закрепление нового материала - решение задач ЕГЭ
- Конкурсное задание 1
- Закрепление нового материала - решение задач ЕГЭ
- Конкурсное задание 2
- Дополнительный материал
- Домашнее задание
- Подведение итогов
Таблицы кодировки
Кодировка символов (часто называемая также кодовой страницей ) – это набор числовых значений, которые ставятся в соответствие группе алфавитно-цифровых символов, знаков пунктуации и специальных символов. Для кодировки символов в Windows используется таблица ASCII (American Standard Code for Interchange of Information). В ASCII первые 128 символов всех кодовых страниц состоят из базовой таблицы символов. Первые 32 кода базовой таблицы, начиная с нулевого, размещают управляющие коды.
63 ? 78 N 123 { 93 ] 108 l 109 m 94 ^ 124 | 79 O 125 } 110 n 95 _ 126 ~ 111 o 127 " width="640"
Базовая таблица кодировки ASCII
32 пробел
48 0
33 !
64 @
49 1
34 “
35 #
80 P
65 A
50 2
96 `
81 Q
51 3
66 B
36 $
67 C
82 R
97 a
112 p
52 4
37 %
98 b
113 q
83 S
38 &
68 D
53 5
99 c
114 r
84 T
39 ‘
69 E
54 6
115 s
70 F
55 7
40 (
85 U
100 d
56 8
71 G
41 )
116 t
101 e
86 V
42 *
87 W
117 u
72 H
102 f
57 9
118 v
43 +
73 I
88 X
103 g
58 :
59 ;
44 ,
74 J
119 w
104 h
89 Y
45 -
90 Z
120 x
75 K
105 i
60
46 .
61 =
76 L
121 y
106 j
91 [
107 k
92 \
47 /
122 z
77 M
62
63 ?
78 N
123 {
93 ]
108 l
109 m
94 ^
124 |
79 O
125 }
110 n
95 _
126 ~
111 o
127
Символы с номерами от 128 до 255 представляют собой таблицу расширения и варьируются в зависимости от набора скриптов, представленных кодировкой символов. Набор символов таблицы расширения различается в зависимости от выбранной кодовой страницы:
200 И 140 Њ 170 Є 230 ж 245 х 185 № 215 Ч 171 « 186 є 231 з 156 њ 141 Ќ 216 Ш 246 ц 201 Й 172 ¬ 157 ќ 142 Ћ 187 » 247 ч 232 и 217 Щ 202 К 158 ћ 233 й 173 248 ш 143 Џ 188 j 218 Ъ 203 Л 249 щ 159 џ 204 М 174 ® 219 Ы 189 S 234 к 175 Ï 190 s 250 ъ 205 Н 220 Ь 235 л 221 Э 236 м 206 О 251 ы 191 ї 252 ь 222 Ю 237 н 207 П 253 э 223 Я 238 о 254 ю 239 п 255 я " width="640"
1251 – кодовая страница Windows
128 Ђ
129 Ѓ
144 Ђ
145 ‘
160
130 ‚
176 °
161 Ў
131 ѓ
146 ’
192 А
177 ±
132 „
147 “
162 ў
208 Р
193 Б
148 ”
163 J
178 I
133 …
209 С
224 а
194 В
134 †
164 ¤
149 •
179 i
240 р
225 б
195 Г
210 Т
180 ґ
150 –
165 Ґ
135 ‡
241 с
151 —
166 ¦
136 €
181 μ
196 Д
226 в
211 У
137 ‰
152 □
197 Е
167 §
212 Ф
182 ¶
242 т
227 г
168 Ё
183 ·
198 Ж
153 ™
243 у
138 Љ
213 Х
228 д
184 ё
169 ©
154 љ
244 ф
229 е
199 З
214 Ц
139
155
200 И
140 Њ
170 Є
230 ж
245 х
185 №
215 Ч
171 «
186 є
231 з
156 њ
141 Ќ
216 Ш
246 ц
201 Й
172 ¬
157 ќ
142 Ћ
187 »
247 ч
232 и
217 Щ
202 К
158 ћ
233 й
173
248 ш
143 Џ
188 j
218 Ъ
203 Л
249 щ
159 џ
204 М
174 ®
219 Ы
189 S
234 к
175 Ï
190 s
250 ъ
205 Н
220 Ь
235 л
221 Э
236 м
206 О
251 ы
191 ї
252 ь
222 Ю
237 н
207 П
253 э
223 Я
238 о
254 ю
239 п
255 я
866 – кодовая страница DOS
128 А
129 Б
144 Р
145 С
160 а
130 В
176 ░
161 б
131 Г
146 Т
192 └
177 ▒
132 Д
147 У
162 в
208 ╨
193 ┴
148 Ф
163 г
178 ▓
133 Е
209 ╤
224 р
194 ┬
134 Ж
164 д
149 Х
179 │
240 ≡Ё
225 с
195 ├
210 ╥
180 ┤
150 Ц
165 е
135 З
241 ±ё
151 Ч
166 ж
136 И
181 ╡
196 ─
226 т
211 ╙
137 Й
152 Ш
197 ┼
167 з
212 ╘
182 ╢
242 ≥
227 у
168 и
183 ╖
198 ╞
153 Щ
243 ≤
138 К
213 ╒
228 ф
184 ╕
169 й
154 Ъ
244 ⌠
229 х
199 ╟
214 ╓
139 Л
155 Ы
200 ╚
140 М
170 к
230 ц
245 ⌡
185 ╣
215 ╫
171 л
186 ║
231 ч
156 Ь
141 Н
216 ╪
246 ¸
201 ╔
172 м
157 Э
142 О
187 ╗
247 »
232 ш
217 ┘
202 ╩
158 Ю
233 щ
173 н
248 °
143 П
188 ╝
218 ┌
203 ╦
249 ·
159 Я
204 ╠
174 о
219 █
189 ╜
234 ъ
175 п
190 ╛
250 ∙
205 ═
220 ▄
235 ы
221 ▌
236 ь
206 ╬
251 √
191 ┐
252 ⁿ
222 ▐
237 э
207 ╧
253 ²
223 ▀
238 ю
254 ■
239 я
255
Кодировка UNICODE
Юникод (Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода».
В Unicode используются 16-битовые (2-байтовые) коды, что позволяет представить 65536 символов.
Применение стандарта Unicode позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Архивирование файлов
Архивирование – процесс сжатия данных таким образом, что заархивированный файл в итоге занимает меньше места. Чтобы получить возможность работы с данным файлом, необходимо провести обратную операцию – разархивирование.
Процесс архивирования упрощенно можно представить следующим образом. Пусть наш файл содержит следующую информацию: aaaaaaaaaa , но это же самое можно записать и по-другому: 10a , что занимает в 3 раза меньше места.
- архиватор WinRar для Windows, т.к. помимо своего формата RAR, он поддерживает все наиболее популярные форматы архивов (в том числе и формат ZIP другого не менее популярного архиватора WinZip).
- Преимущества архивов ZIP в их популярности, особенно в Интернете. Если вы хотите кому-то отправить архив, но не уверены, что у адресата есть программа WinRAR для распаковки архива, то имеет смысл использовать формат ZIP. Впрочем, в этом случае вы можете отправить и самораспаковывающийся (SFX) архив . Такие архивы чуть больше обычных, но для их распаковки не требуется наличие установленного архиватора. Другое преимущество ZIP — скорость. Архивы ZIP обычно создаются быстрее архивов RAR.
- Преимущества архивов RAR в обеспечении существенно лучшего сжатия, чем ZIP, особенно в режиме создания непрерывных архивов. Другая важная возможность RAR — поддержка многотомных архивов. Они намного удобнее и проще в использовании, чем так называемые "разделенные по дискам" архивы ZIP. WinRAR не поддерживает такие архивы ZIP — многотомные архивы можно создавать только в формате RAR
- Кроме того, у формата RAR есть несколько очень важных функций, отсутствующих у ZIP, например, добавление информации для восстановления, которая позволяет восстановить физически поврежденный файл, и блокировка архивов для предотвращения случайной модификации особенно ценных данных.
- Формат RAR позволяет обрабатывать файлы практически неограниченного размера (до 8 эксабайт, что равносильно 8 589 934 591 Гбайт), тогда как размер одного файла в архиве ZIP не может превышать 2 Гбайт.
- Архив - это обычный файл, имеющий специальное расширение архиватора (" .rar " или “ .zip ” для WinRAR и WinZIP ссответственно)
1. Каждый символ в Unicode закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:
Аппетит приходит во время еды .
1) 60 бит
2) 480 бит
3) 30 байт
4) 300 байт
Решение.
- Считаем количество всех символов, включая пробелы и точку.
- Так как каждый символ в Unicode закодирован двухбайтным словом, то умножаем найденное количество символов на 2 байта.
- Если ответ – в байтах, то записываем его. Если ответ – в битах, то умножаем результат второго действия умножаем на 8.
К = 30, 30 ∙ 2 байта = 60 байт, 60 ∙ 8 бит = 480 бит.
Ответ: 2.
2. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.
1) 384 бита
2) 192 бита
3) 256 бит
4) 48 бит
Решение.
- Количество всех символов, включая пробелы и точку, уже известно.
- Так как каждый символ в Unicode закодирован двухбайтным словом, то умножаем найденное количество символов на 2 байта.
- Если ответ – в байтах, то записываем его. Если ответ – в битах, то умножаем результат второго действия умножаем на 8.
К = 24, 24 ∙ 2 байта = 48 байт, 48 ∙ 8 бит = 384 бит.
Ответ: 1.
3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?
1) 30
2) 60
3) 120
4) 480
Решение.
- К 1 = I 1 / b 1 , а К 2 = I 2 / b 2 , .
- Каждый символ в Unicode закодирован двухбайтным словом (16 бит = 2 байта), а в КОИ-8 однобайтным (8 бит).
- Количество символов в обеих кодировках одинаковое. Значит, К 1 = К 2 . То есть, I 1 / b 1 = I 2 / b 2 .
- Откуда, I 1 / 2 = I 2 / 1, I 1 = 2 ∙ I 2 .
- Так как информационное сообщение уменьшилось на 480 бит, то так как I 1 - I 2 = 480, получаем уравнение относительно I 2 : 2 I 2 - I 2 = 480, I 2 = 480 бит.
- Так как К 2 = I 2 / b 2 , то К 2 = 480 бит / 8 бит = 60.
Ответ: 2.
4. Документ объёмом 80 Мбайт можно передать с одного компьютера на другой двумя способами:
А. Сжать архиватором, предать по каналу связи, распаковать;
Б. Передать документ без использования архиватора.
При этом передача и архивация происходит по следующим условиям:
- Средняя скорость передачи данных по этому каналу составляет 2 24 бит в секунду. Объем сжатого архиватором документа равен 50% от исходного. Время, требуемое на сжатие документа — 10 секунд, на распаковку — 2 секунды.
- Средняя скорость передачи данных по этому каналу составляет 2 24 бит в секунду.
- Объем сжатого архиватором документа равен 50% от исходного.
- Время, требуемое на сжатие документа — 10 секунд, на распаковку — 2 секунды.
Какой из этих двух способов быстрее и насколько? В ответе запишите сначала букву, и сразу после буквы время, насколько этот способ быстрее другого. Например, если способ А быстрее способа Б на 20 секунд, в ответе нужно написать А20.
Решение.
1. Сначала переведём скорость из бит/с в Мбайт/с. Для этого разделим биты сначала на 8, затем два раза на 1024. У нас получится:
2 24 /8/1024/1024 = 2 24 /2 3 /2 10 /2 10 = 2 24-3-10-10 = 2 1 = 2 Мбайт/с.
2. Таким образом, без использования архиватора документ объемом 80 Мбайт будет передан за 80 Мбайт / 2 Мбайт/с = 40 с.
- Объем сжатого документа равен 50% от 80 Мбайт, то есть 40 Мбайт. Время его передачи равно 40 Мбайт / 2 Мбайт/с = 20 с.
- Однако на сжатие и распаковку вместе уходит 12 секунд, то есть общее время, необходимое для передачи файла способом А равно 20+12=32 секунды .
- Выходит, что способ А быстрее способа Б на 8 секунд .
Ответ: А8.