Здравствуйте. Мы продолжаем готовится к основному государственному экзамену по информатике и сегодня у нас очередная консультация, на которой рассмотрим задание первой части повышенного уровня сложности, которое оценивается в 1 балл и отводится 5 минут на выполнение. | Задача 1. Приведены запросы к поисковому серверу. для каждого запроса указан его код – соответствующая буква от А до В. Запишите в таблицу коды запросов слева направо в порядке возрастания количества страниц, которые нашёл поисковый сервер по каждому запросу. По всем запросам было найдено равное количество страниц. Для обозначения логической операции ИЛИ в запросе используется символ «|»а для логической операции «И» - символ «&» КОД | ЗАПРОС | А | КОШКА | МЫШКА | Б | КОШКА & МЫШКА | В | КОШКА | |
Ребята, как Вы думаете, какая тема нашего занятия? -Правильно! Сегодня мы с вами будем изучать привлекательную для вас тему «Поиск информации в Интернете». -Всегда ли вы удовлетворены результатом поиска в сети? Сегодня в конце занятия мы с вами разберемся, как рациональнее всего искать информацию в Интернете. | Интернет, браузеры, поиск информации -Нет, не всегда! |
Способы поиска информации совершенствовались и менялись с развитием форм хранения информации. Еще ваши мамы и папы, будучи в вашем возрасте, искали информацию в самом распространенном на то время источнике – печатной продукции (книги, журналы, газеты). В современном мире главным источником информации признан, конечно, Интернет. Количество информации, хранящейся на веб-страничках невероятно, как же среди этого огромного моря сведений найти те, которые нам так необходимы? На этот вопрос мы с вами и ответим сегодня. | |
При использовании всемирной компьютерной сети Интернет достаточно часто требуется найти в ней сайт или страницу, которую вы раньше не посещали, но которая, возможно, содержит нужную вам информацию. Для этого существуют специальные поисковые службы, называемые поисковые серверы. Наиболее известные из них -……. и другие. | Yandex. Ru; google.ru |
Тот текст, который пользователь пишет в специальном поле поиска, называется | поисковым запросом |
В тот момент, когда пользователь отправляет поисковый запрос на поисковый сервер, тот не начинает в этот момент рыскать по всем просторам Интернета в поисках нужной информации. Поиск осуществляется только в базе ключевых слов, которая хранится в поисковой системе. Поисковая система анализирует слова, написанные в поисковом запросе, выделяет из них важные (ключевые) слова и по ним уже осуществляет поиск в собственных хранилищах. | |
Ссылки на найденные страницы выдаются пользователю в качестве результата поискового запроса. | |
Откуда же при этом поисковая система знает эту информацию (ключевые слова и ссылки), которая хранится у неё? | Для этого работают две основные технологии. |
Первая – владельцы сайтов, которые хотят, чтобы их сайты/страницы часто посещались и приносили соответствующий доход/ престиж/предоставляли информационные услуги, сами регистрируют в поисковых системах свой сайты/страницы по ключевым словам. | |
Вторая – поисковые системы сами «просматривают» сайты и страницы сети Интернет, анализируя их, выделяя ключевые слова и сохраняя ссылки в них. (ещё раз уточним, это происходит не в момент обращения пользователя) | |
Для того чтобы обеспечить гибкость поиска, поисковые серверы позволяют указывать ключевые слова, по которым осуществляется поиск с использованием различных логических операций | |
Среди логических операций нас будет интересовать: - логическое ИЛИ (дизъинкция), обозначается в поисковых запросах символом «|»(вертикальная черта); - логическое И (конъюнкция), обозначаемая в поисковых запросах символом «&» | |
Рассмотрим влияние этих логических операций на результат (количество найденных страниц) поискового запроса. | |
Для начала сделаем это на примере двух ключевых слов | |
А поможет нам в этом универсальный способ. Диаграммы Эйлера -Венна | |
Ранжирование поисковых запросов |
Операция «И» | Документ содержит: | Документ найден? | синий | зеленый | красный | | | | нет | + | | | нет | | + | | нет | | | + | нет | + | + | | нет | | + | + | нет | + | | + | нет | + | + | + | да | Вывод: Операция «И» сокращает объем получаемого при поиске результата (уменьшает количество найденных сайтов), причем чем больше в ней задействовано операндов, тем меньше будет объем получаемого списка найденных сайтов |
Операция «ИЛИ» | Документ содержит: | Документ найден? | синий | зеленый | красный | | | | нет | + | | | да | | + | | да | | | + | да | + | + | | да | | + | + | да | + | | + | да | + | + | + | да | Вывод: Операция «ИЛИ» увеличивает объем получаемого при поиске результата (увеличивает количество найденных сайтов), причем чем больше в ней задействовано операндов, тем больше будет объем получаемого списка найденных сайтов |
Смешанные запросы | Уменьшение или увеличение количества найденных документов логических операций «И» и «ИЛИ» «ослабляется», когда они стоят в скобках, и «усиливается», когда эти операции расположены вне скобок. То есть когда операция «И» стоит в скобках, а «ИЛИ» - вне скобок, будет найдено больше документов, чем когда операция «ИЛИ» стоит в скобках, а «И» - вне скобок. |
(Кошки|Собаки) &Кролики | (Кошки&Собаки)|Кролики |
Задача 1. Приведены запросы к поисковому серверу. для каждого запроса указан его код – соответствующая буква от А до В. Запишите в таблицу коды запросов слева направо в порядке возрастания количества страниц, которые нашёл поисковый сервер по каждому запросу. По всем запросам было найдено равное количество страниц. Для обозначения логической операции ИЛИ в запросе используется символ «|»а для логической операции «И» - символ «&» КОД | ЗАПРОС | А | КОШКА | МЫШКА | Б | КОШКА & МЫШКА | В | КОШКА | | Первый способ решения задачи: Используем диаграммы Эйлера –Венна. Построим их для каждого из запросов и сравним площади заштрихованных областей А. КОШКА | МЫШКА | Б. КОШКА & МЫШКА | Это логическое ИЛИ – объединение. В результате попадут все области, которые входят хотя бы в один овал | Это логическое И – пересечение. В результат попадет только область, которая входит в оба овала | | | В. КОШКА | Это просто овал, соответствующий « кошке» | | |
кошка | мышка | КОШКА | МЫШКА | КОШКА & МЫШКА | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | 1 | 1 | В | | А | Б | Теперь подсчитываем количество единиц в каждом интересующем нас столбце | 2 | | 3 | 1 | Эти количества располагаем, как требуется в условии задачи, в порядке возрастания: 1-2-3 и записываем в качестве ответа соответствующие им коды запросов: БВА. Ответ: БВА | | Второй способ решения задачи Составим таблицу истинности для каждого выражения В Качестве столбцов-аргументов используем «кошка» и «мышка». В качестве результатов этих столбцов используем 0 для обозначения того, что это слово не присутствует на странице, и 1, если присутствует. В таблице будет два столбца исходных данных (в запросе только два различных слова – «кошка» и «мышка»), столбец для результата операции А (КОШКА | МЫШКА) и столбец для результата операции Б (КОШКА & МЫШКА). Отдельного столбца для операции В (КОШКА) не требуется, потому что он такой же, как первый столбец. Заполняем таблицу и вычисляем результаты операций Ответ: БВА |
|
Третий вариант решения. Быстрый, но не очень надёжный. Рекомендуется только при высоком навыке решения подобных задач. Просто анализируем варианты запросов на предмет логическое И/ логическое ИЛИ. Понимаем, что логическое И уменьшает количество найденных страниц, а логическое ИЛИ - увеличивает. Получаем, что меньше всего страниц будет найдено для логического И. Значит, этот запроос нужно ставить в ответе на первое место(тркбуется упорядочить запосы по возрастянию) А больше всего страниц будет найдено для логического ИЛИ. Значит, этот запрос нужно ставить в ответе на последнее место. Посередине остаётся просто запрос «кошка». Ответ: БВА | |
Вычисление количества найденных страниц В подобных задачах считается, что существует некоторое ограниченное количество web-документов, часть которых (в том числе все они либо ни один из них) может быть найден при помощи определенного поискового запроса. В задаче рассматривается набор запросов, включающих одни и те же ключевые слова (полный или не полный набор) и связанных различными логическими операциями. Для этих запросов указаны количества найденных документов, а по одному из запросов это количество требуется определить. В этом случае найденные по каждому элементарному запросу (по какому-то одному ключевому слову) web-документы рассматриваются как пересекающиеся (операция И) либо объединяемые (операция ИЛИ) множества, а количества найденных документов вычисляются как объемы этих множеств и/или их подмножеств. Совокупность запросов можно представить в виде диаграммы Эйлера -Венна (ключевым словам соответствуют пересекающиеся круги), а получившиеся при этом сегменты нумеруются. | |
Подобные задачи можно решать путем логических рассуждений. Однако существует универсальный способ их решения, который позволяет сделать решение всех таких задач типовыми. Строится примерная диаграмма Венна. «Примерная» - потому что в таких задачах всегда лучше сначала рассовать пересекающиеся области, хотя, пересечение этих областей может и отсутствовать. Все получившиеся при этом «элементарные» области нумеруются по порядку слева на право, сверху вниз. Теперь, считая порядковые номера выделенных областей своеобразными «переменными» (под значениями которых понимаются объемы соответствующих множеств, т.е. количества найденных документов), для указанных в таблице в условии задачи запросов составляется система уравнений | |
Интернет представляет оперативный доступ к информации на любую тему, которая находится на сотнях тысячах информационных серверов. Очень часто у пользователя появляется необходимость найти сведения по какой -либо теме. Для этого предназначены специальные поисковые инструменты, они позволяют найти документы, содержащие какие-либо конкретные слова. Пользователь, задав ключевые слова и активизировав поиск, получает список документов. Этот список сортируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу. Наиболее развитый сервис поиска информации на русском языке предоставляет сервер Яндекс. В Яндекс можно написать фразу по-русски, описывающую то, что нужно найти. Система самостоятельно проанализирует запрос и постарается найти все, что относится к заданной теме. База Яндекс содержит порядка 2 000 000 документов и постоянно обновляется. | |
поиск с помощью поисковых систем Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете. По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы Поисковые каталоги служат для тематического поиска. Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных. Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог — структурированный набор ссылок на сайты с кратким их описанием. Каталог, в котором ссылки на сайты внутри категорий сортируются по популярности сайтов, называется рейтинг (или топ). Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, — и получает список ссылок на web-страницы, содержащие указанные термины. Как же работают поисковые индексы? Поисковые индексы автоматически, при помощи специальных программ (веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных. Поиско́вый робот («веб-пау́к») — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы. В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса. Какие плюсы вы можете отметить для данного способа? А минусы? С какими трудностями связан поиск информации через поисковую систему, кроме того, что количество ссылок огромно? У вас на столе находятся правила составления запроса, прочитайте их. (Приложение 5) Я надеюсь, что в дальнейшей работе они вам помогут. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге | |
Посмотрите еще раз на тему урока и попробуйте сначала про себя, затем вслух закончить следующие предложения Я узнал… Я научился… Я буду применять… Я оцениваю свою работу… | |