СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Системы оптического распознавания документов

Категория: Информатика

Нажмите, чтобы узнать подробности

Цель: сформировать представление обучающихся о приемах создания текстовых документов с использованием сканера и программ OCR.

Задачи:

  • формировать умения и навыки приемов создания текстовых документов с использованием периферийного оборудования (сканер) и программных средств для распознавания полученного изображения (ABBYY FineReader);
  • развивать навыки использования средств информационных и коммуникационных технологий для работы с текстовой информацией, познавательный интерес;
  • воспитывать понимание социальной, общекультурной роли в жизни современного человека навыков работы с программным обеспечением, поддерживающим работу с текстовой информацией; интерес к предмету.

Просмотр содержимого документа
«Системы оптического распознавания документов»

17 урок. 7 класс

Учитель: Брух Т.В.

Дата ____________

Тема урока: «Системы оптического распознавания документов. ПР №9».

Цель: сформировать представление обучающихся о приемах создания текстовых документов с использованием сканера и программ OCR.

Задачи:

  • формировать умения и навыки приемов создания текстовых документов с использованием периферийного оборудования (сканер) и программных средств для распознавания полученного изображения (ABBYY FineReader);

  • развивать навыки использования средств информационных и коммуникационных технологий для работы с текстовой информацией, познавательный интерес;

  • воспитывать понимание социальной, общекультурной роли в жизни современного человека навыков работы с программным обеспечением, поддерживающим работу с текстовой информацией; интерес к предмету.

Планируемые образовательные результаты:

  • предметные – навыки работы с программами оптического распознавания документов;

  • метапредметные – широкий спектр умений и навыков использования средств информационных и коммуникационных технологий для работы с текстовой информацией;

  • личностные – понимание социальной, общекультурной роли в жизни современного человека навыков работы с программным обеспечением, поддерживающим работу с текстовой информацией.

Ход урока

1. Организационный момент

2. Актуализация (проблемная ситуация)

  1. На прошлых уроках мы учились форматировать символы, абзацы, таблицы, формулы. 
    Навык квалифицированного клавиатурного письма сегодня считается социальным, общекультурным. Он важен в учебной деятельности и в повседневной жизни.

  2. Очень часто возникает необходимость ввести в компьютер несколько страниц из книги, статью из журнала и т.д. Как вы поступите? (ответы учеников – затратить определенное время и просто набрать этот текст с помощью клавиатуры; сделать ксерокопию страниц).

  3. Но чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.

  4. С помощью, каких устройств мы можем получить копию страницы из книги или журнала? (сканер, фотоаппарат, камера мобильного телефона)

  5. В каком формате в этом случае мы получаем файл-копию (с помощью сканера можно получить изображение-картинку страницы текста, т.е. графический файл)

  6. Текст можно будет читать, распечатывать, но нельзя будет его редактировать и форматировать. Поэтому для получения документа в формате текстового файла необходимо применить специальные программы, способные перевести изображение в подходящий для редактирования формат.

Такие программы называют OCR (это сокращение слов optical character recognition, "оптическое распознавание символов").

3. Изучение нового материала

– А теперь давайте сформулируем тему нашего урока «Системы оптического распознавания символов»

Ребята, давайте поставим цели урока, продолжив предложение:

Узнать (что?): как создать текстовый документ с использованием сканера и программ оптического распознавания символов

Научиться (чему?): получать изображение страницы текста с помощью сканера, проводить распознавание текста

Получить практические навыки работы с (какой программой?)

«Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. Запишите это определение в тетрадь.

С помощью сканера несложно получить изображение страницы текста в графическом файле.

Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном.

Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого в наибольшей степени совпадает с изображением. Например, распознаваемый символ "Б" накладывается на растровые шаблоны символов (А, Б, В и т. д.)

При распознавании документов с низким качеством печати (машинописный текст, факс и т.д.) используется метод распознавания структурных элементов (отрезков, колец, дуг и др.) символов. В искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов.

Например, распознаваемый символ "Б" накладывается на векторные шаблоны символов (А, Б, В и т. д.)

В тетради запишите, что для распознавания символов используют растровый и векторный метод (ученики записывают).

При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Давайте подведем итоги теоретической части урока. Мы разобрались, с какой целью сохраняются печатные издания, что такое оптическое распознавание символов и поговорили о методах, применяемых в системах оптического распознавания символов. Все ли вам понятно?» (ответы учеников).

Давайте с вами узнаем, какие программы OCR существуют?

Наиболее распространенной программой оптического распознавания символов является ABBYY FineReader.

Упрощенно работу с программой распознавания символов можно представить так:

  1. Бумажный носитель помещается под крышку сканера.

  2. В программе отдается команда   – создаётся цифровая копия исходного документа в формате графического файла (изображение). 
    Замечание: так как цифровую копию документа можно получить, используя цифровой фотоаппарат или камеру мобильного телефона, то в программе можно   файл изображение

  3. В программе отдается команда  .

  4. Распознанный текст переносится в окно текстового редактора (например, Microsoft Word), для этого отдается команда 

так как файл изображение можно либо получить с помощью сканера, либо открыть, то работа с программой ABBYY FineReader может начаться либо с команды сканировать либо с команды открыть

Далее учитель демонстрирует этапы работы с программой ABBYY FineReader (непосредственно в программе ABBYY FineReader).

На этапе распознавания учитель дает пояснения:

Сначала программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки.

Блоки - это заключенные в рамку участки изображения. Блоки выделяют для того, чтобы указать системе, какие участки, отсканированной страницы, надо распознавать и в каком порядке. Также по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок.

Блоки текста, таблицы разбиваются на строки. Строки разбиваются на слова, а слова – на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста.

4. Первичное закрепление (практическая работа) 

Теперь потренируемся работать с программой ABBYY FineReader.

Будем использовать упрощенную версию программы, поставляемую со сканером.

5. Закрепление изученного материала (практическая работа) 

Практическая работа: Сканирование «бумажного» и распознавание электронного текстового документа.

Цель:

ознакомление с программой оптического распознавания текстов ABBYY Finereader 6.

Задание №1 «Сканирование и распознавание двух страниц любой книги средствами программы ABBYY Finereader»

Задание №2 «Распознавание уже имеющихся файлов или изображений в текстовый документ Word»

Каждый ученик получает ксерокопию страницы.

6. Подведение итогов урока

Вопросы:

  • Зачем нужны программы распознавания символов? (для создания текстового документа)

  • Какие программы распознания текста вы знаете? (ABBYY FineReader)

  • Перечислите этапы работы с программой распознавание текста? (учебник стр. 171)

  • Где в практической деятельности применяются технологии оптического распознавания символов? (при проведении переписей населения, ЕГЭ, создание электронных библиотек, оцифровка ценных и редких книг и т.д.).

7. Домашнее задание

Параграф 2.7




Скачать

Рекомендуем курсы ПК и ППК для учителей

Вебинар для учителей

Свидетельство об участии БЕСПЛАТНО!