Тема урока: «Системы перевода и распознавания текстов. Компьютерные словари и создание гипертекстового документа.» (2ч.)
Тип урока: Урок изучения нового материала.
Цели урока:
Образовательная: Дать представление о системах распознавания и перевода текста.
Развивающая: Развивать познавательный интерес, самоконтроль, умение конспектировать, развивать навык работы на компьютере.
Воспитательная: Воспитание информационной культуры учащихся, внимательности, аккуратности, дисциплинированности, усидчивости.
Вид занятий( тип урока): изучение нового материала.
Формы организации познавательной деятельности: комбинированная, фронтальная.
Методы обучения (приемы): объяснительно-иллюстративный, репродуктивный.
Материально-техническая база:
На рабочем месте ученика: тетрадь, ручка, компьютер.
На рабочем месте учителя: компьютер, проектор, доска, конспект урока.
Ход урока:
Организационный момент -2мин
Актуализация знаний – 6 мин
Объяснение нового материала – 20 мин
Практическое задание – 10 мин
Рефлексия – 1 мин
Домашнее задание – 1 мин
Организационный момент
Здравствуйте! Кто сегодня отсутствует?
Актуализация знаний
Знание хотя бы одного иностранного языка необходимо сегодня всем. В особенности пользователям компьютеров: ведь избежать столкновения с английским языком при работе на компьютере, увы, невозможно. Неудобно, если вы не знаете иностранного языка... В этом случаях удобно использовать программы-переводчики.
Кто-нибудь из вас уже пользовался такими программами, чтобы переводить текст с одного языка на другой? (отвечают на вопрос). Это очень удобно и быстро.
Скажите вы скачиваете из интернета книги? (ответ). А как это все туда попадает? Люди вводят текст вручную с помощью клавиатуры и текстового редактора? На это бы уходило очень много времени, поэтому существуют программы, позволяющие вводить тексты в ПК с помощью сканера. Итак, открываем тетради и записываем тему сегодняшнего занятия «системы перевода и распознавания текстов. Компьютерные словари и создание гипертекстового документа»(Слайд 1)
Объяснение нового материала
Компьютерные словари.
Ребята, скажите а что такое словарь?
Словарь – собрание слов (обычно в алфавитном порядке), устойчивых выражений с пояснениями, толкованиями или с переводом на другой язык .
Словарь – книга, содержащая перечень слов, обычно с пояснениями, толкованиями или переводом на другой язык.
Словарь – книга, содержащая перечень слов, расположенных по тому или иному принципу (например, по алфавиту), с теми или иными объяснениями.
(Слайд 2)
Словари необходимы для перевода текстов с одного языка на другой. Первые словари были созданы около 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделенные на две части. В одной части записывалось слово на шумерском языке, а в другой — аналогичное по значению слово на другом языке, иногда с краткими пояснениями.
Современные словари построены по такому же принципу. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц. Как вы думаете, удобно ли это? Если нет, то чем удобней пользоваться?
Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности.
Во-первых, компьютерные словари могут являться многоязычными, так как дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и так далее).
Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).
В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.
В-четвертых, компьютерные словари могут являться мультимедийными, то есть предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка. (Слайд 3)
(Слайд 4) Самыми распространенными компьютерными словарями явлеются:
Albion Explanatory Dictionary - говорящий толковый словарь английского языка, содержащий более 140 тысяч словарных статей с подробными толкованиями значений слов, а также с примерами на их употребление.
ABBYY Lingvo - очень неплохой и удобный электронный словарь, который позволяет переводить с русского языка на английский, немецкий, французский, итальянский и испанский и обратно.
DP Translator - помощью этого словарика Вы с легкостью сможете заниматься переводами ваших чатов, содержания, писем.
Dialetix - это очень компактный и удобный словарь-справочник.
Promt standart -Быстро переведет текстовые документы, электронную почту, PDF-документы и сообщения в ICQ.
Онлайн переводчик Dicter - бесплатная программа для перевода текста
Находясь на сайте в Интернете, либо в офисном приложении, в любом месте вы всегда можете выделить текст, нажать комбинацию клавиш CTRL+ALT и практически мгновенно получить перевод выделенного текста с любого языка, на любой переводимый язык. (Слайд 5)
(Слайд 6) Здесь представлены ссылки, где можно скачать электронные словари.
Эти программы позволяют работать с файлами различных типов, электронной почтой, гипертекстовыми документами.
Программы оптического распознавания документов
(Слайд 7) Системы оптического распознавания символов используются при создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат.
После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.
Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов. Реальный технический прорыв в этой области произошел лишь в последние годы. До этого распознавание текста было возможно только путем сравнения обнаруженных конфигураций точек со стандартным образцом (эталоном, хранящимся в памяти компьютера). Авторы программ задавали критерий «похожести», используемый при идентификации символов.
Подобные системы назывались OCR (Optical Character Recognition — оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие такой подход. Естественно приходилось сталкиваться с произвольным и, тем более, сложным шрифтом, программы такого рода начинали давать серьезные сбои.
Современные научные достижения в области распознавания образов буквально перевернули представление об оптическом распознавании символов. Современные программы вполне могут справляться с различными (и весьма вычурными) шрифтами без перенастройки. Многие распознают даже рукописный текст.
Поскольку потребность в распознавании текста отсканированных документов достаточно велика, неудивительно, что имеется значительное число программ, предназначенных для этой цели. Так как разные научные методы распознавания текста развивались независимо друг от друга, многие из этих программ используют совершенно разные алгоритмы.
Эти алгоритмы могут давать разные результаты на разных документах. Например, упоминавшиеся выше системы OCR способны распознавать только стандартный специально подготовленный шрифт и дают на этом шрифте наилучшие результаты, которые не может превзойти ни одна, из более универсальных программ.
Современные алгоритмы распознавания текста не ориентируются ни на конкретный шрифт, ни на конкретный алфавит. Большинство программ способно распознавать текст на нескольких языках. Одни и те же алгоритмы можно использовать для распознавания русского, латинского, арабского и других алфавитов и даже смешанных текстов. Разумеется, программа должна знать, о каком алфавите идет речь.
Нас, прежде всего, интересуют программы, способные распознавать текст, напечатанный на русском языке. Такие программы выпускаются отечественными производителями. Наиболее широко известна и распространена программа FineReader.
Наиболее распространенные системы оптического распознавания символов: (Слайд 8) FineReader, CuneiForm, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают.
Программа FineReader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных текстов.
Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.
CuneiForm — это программа для оптического распознавания текста документов, представленных в виде изображений, в редактируемый вид. Результаты работы программы можно редактировать в офисных программах и текстовых редакторах, сохранять в популярных форматах, проводить по ним полнотекстовый поиск.
ABBYY FineReader Professional 11.0.513.139- Профессиональная программа для оптического распознавания текста.
ABBYY PDF Transformer 3.0 -Универсальное решение для преобразования документов PDF с возможностью оптического распознавания текста.
Создание гипертекстовых документов
Ребята, начнем с того, что вы мне скажете встречались ли вы когда-нибудь с гипертекстовым документом? Вы правильно говорите, но сейчас я вам расскажу немного из истории, затем поговорим о том, где в жизни мы встречаемся с гипертекстами и в чем их удобство.
Итак, начнем : гипертекст – термин, введенный Тедом Нельсоном в 1965 году для обозначения «текста ветвящегося или выполняющего действия по запросу». Гипертекст - набор текстов, содержащих узлы перехода между ними, которые позволяют избирать читаемые сведения или последовательность чтения (учащиеся записывают определение). Далее, перечислим примеры гипертекста: словари, энциклопедии, web-страницы, гиперлитература (новое свойство/характеристика литературного прозаического произведения, для которого характерны черты гипертекста (внутренние корреляционные ссылки, отсутствие линейного повествования). Используется для создания эффекта игры, свойственного постмодернистской литературе.), справка. В компьютерной терминологии, (Слайд 9) гипертекст — текст, сформированный с помощью языка разметки, потенциально содержащий в себе гиперссылки. Гиперссылка представляет собой ссылку в документе, по щелчку которой открывается другая страница или файл.
Создание гипертекстового документа (Слайд 10).
Запустить программу Microsoft Word или
Разбить текст на фрагменты по смыслу и напечатать по частям на разные страницы.
Продумать связи с фрагментами.
Выделить фрагменты на которых будут ссылки и поставить на них закладки: выделить слово ( фрагмент), из меню Вставка выбрать закладку, в появившемся окне набрать имя закладки, затем выбрать команду добавить и нажать ОК.
Выбрать слово на которую нужно поставить гипертекстовую ссылку:
Выделить это слово.
Из меню вставка выбрать гиперссылка.
В появившемся окне выбрать с местом в документе, затем написать название закладки с которым нужно создать связь и нажать ОК.
Аналогично восстановить связь между другими фрагментами.
Практическое задание. Первичное закрепление изученного материала.
У вас на рабочем столе два документа «информация» и «информация 2». Вам нужно с помощью гиперссылки связать эти 2 документа.
Рефлексия
Сегодня на уроке мы познакомились с системами перевода и распознавания текста. Для чего используются системы перевода текста? Перечислите дополнительные возможности компьютерного словаря. Что должны уметь современные OCR? Назовите более распространенные системы оптического распознавания текстов. Что-то новое сегодня узнали на уроке? Все было понятным? Вопросы есть?
Домашнее задание
Параграф 17, страница 90.