Поисковые системы
Поиско́вая систе́ма search engine ) — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине . Существуют также системы, способные выполнять поиск на FTP-серверах, товары в интернет - магазинах, информацию в группах новостей Usenet.
Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос, путем ввода ключевых слов. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-сервисы, изображения, аудифайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз - данных и каталогов ресурсов Интернет.
Поисковая система тем лучше, чем больше документов, она будет возвращать, тем выше релевантность. Результаты поиска могут становиться менее релевантными из-за особенностей алгоритмов. По состоянию на 2016 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам. Так, например, в России Yandex обгоняет Google больше, чем на 10 %.
По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы. В архитектуру поисковой системы обычно входят:
поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,
индексатор, обеспечивающий быстрый поиск по накопленной информации, и поисковик — графический интерфейс для работы пользователя.
- Поисковая система — это база данных по определенной информации в интернете. Многие пользователи считают, что после ввода запроса в поисковую систему, тут же начинается сканирование всего интернета. Сканирование интернета происходит постоянно, многими программами, данные о сайтах заносятся в базу данных, где по определенным критериям все сайты и все их страницы распределяются в различного рода списки и базы данных. То есть поиск происходит не по интернету, а по этой базе.
- Релевантность - Соответствие, определяемое путём сравнения образа поискового запроса с поисковым образом документа по определённому алгоритму. Одним из методов для оценки релевантности является TF IDF-метод. Он предполагает, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть, чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину — то есть документ будет выдаваться раньше в результатах поиска по данному термину.
Популярные поисковые системы
Yandex — крупнейшая поисковая система в рунете.
Кроме поисковой системы, компания Яндекс предлагает 77 дополнительных сервисов, самые популярные из них — почтовый сервис, yandex - браузер, Яндекс-диск, информация о пробках и погоде, Яндекс-деньги и многое другое. Поисковая система учитывает Ваше местоположение при выдаче результатов поиска. Так же поисковая программа постоянно модернизируется для выдачи более корректных результатов, рассчитанных на наибольшую информативность для пользователя.
Яндекс-поиск (значение от латинского Yet another indexer — еще один индексатор) — крупнейший ресурс в рунете по объему пользователей.
Имеется возможность поиска по картинке, видео, картам, новостям, блогам, товарам и словарям, так же имеется поисковик по организациям. В поиске можно использовать поиск по какому либо региону.
Поиск происходит не только заданного запроса, но так же учитываются морфология, то есть склонения, падежи и так далее. Например, при запросе «строить дом», будут выдаваться так же сайты, на которых есть «постройка дома», «строительство домов». Для уточнения всегда можно воспользоваться языком запроса.
Плюс поисковика еще в том, что он ищет информацию не только на страницах сайта, но и на страницах текстовых и табличных документов. Эти документы могут предназначаться для скачивания и находиться на сервере, но при этом их текст не показывается на сайтах.
Поддерживаемые операторы
- «…….» — заключая слова в кавычки, задается поиск именно той фразы, которая заключается в кавычки. То есть найдутся только сайты, где фраза идет именно в такой последовательности, как она написана.
- «… * …» — слова в кавычках и между слов звездочка. Звездочка ставится, чтобы показать поисковику, что в этом месте должно быть какое то слово. Будут найдены сайты, где есть точная последовательность «…(любое слово)…».
- слово1 & слово2 — означает, что оба должны присутствовать в одном предложение в любой
- слово1 /слово2— означает, что второе слово должно быть от первого не дальше второго по счету в любую сторону, то есть они могут идти подряд или между ними может быть одно слово, но не больше.
- слово1 /+2 слово2— второе слово должно идти только после первого и не дальше чем вторым по счету.
- слово1 && слово2 — оба слова должны присутствовать в одном тексте в любой последовательности.
- слово1 && /2 слово2 — второе слово находится не дальше, чем во втором предложение от первого, то есть между ними не больше одного предложения.
- текст+слово — поиск документов, в которых обязательно встречается слово после знака «+» (пробел после знака не ставится).
- слово1|слово2 —поиск сайтов, где встречается любое из слов, а возможно и оба, разделенных вертикальной чертой (пробелы не ставятся).
- слово1-слово2— исключает слово после знака «-». То есть исключает те сайты, где со словосочетанием «слово1» встречается слово «слово2».
- !Слово — поиск документов, где Слово начинается с заглавной буквы, если будет начинаться со строчной, то поиск их будет игнорировать.
- имя:pdf — поиск документов с расширением pdf (либо с любым другим расширением указанным в запросе).
- Выбор сайтов написанных только на определенном языке — необходимо к запросу добавить «lang:(необходимый язык)
Google — самая популярная поисковая система в мире.
Кроме поисковой системы, компания Google предлагает множество дополнительных сервисов, программ и аппаратного обеспечения, среди которых почтовый сервис, браузер Google Crome, крупнейшая видеотека youtube и многие другие проекты. Компания Google уверено скупает многие проекты приносящие крупную прибыль. Большинство сервисов направлены не на прямого пользователя, а на заработок в интернете и интегрирована с уклоном на интересы европейских и американских пользователей.
Mail — поисковая система, популярная в основном из-за почтового сервиса. Имеется множество дополнительных сервисов, ключевым из которых является почтовый сервис, на данный момент компании Mail принадлежит социальная сеть «Одноклассники», собственная сеть «Мой мир», сервис Деньги-mail, множество онлайн игр, три практически одинаковых браузера с различными названиями. Во всех приложениях и сервисах очень много рекламного наполнения. Поисковая система Mail появилась не так давно, но при этом развивается очень быстро. При поиске есть возможность искать по словам в самих сайтах, осуществлять поиск по картинкам, видеофайлам, переходить в поиск приложений.
Отдельным фильтром идут новостные сайты, чтобы выделить их от остальных, так же можно искать в обсуждениях или ответах на Mail. Ответы@Mail.ru один многочисленных сервисов этой системы.
Википедия
Википедия — поисковая справочная система.
Некоммерческая поисковая система, существующая на частные пожертвования, поэтому не наполняет страницы рекламой. Многоязычный проект, целью которого является создание полной справочной энциклопедии на всех языках мира. У нее нет определенных авторов, заполняется и управляется добровольцами со всех стран мира. Каждый пользователь может как написать, так и отредактировать статью.
Официальная страница — www.wikipedia.org.
Yahoo! — вторая по значимости поисковая система в мире. Имеются дополнительные сервисы, самым известным из которых является почта Yahoo. В рамках улучшения качества поисковой системы, Yahoo передает данные о пользователях и их запросах в компанию Microsoft. От этих данных формируется представление об интересах пользователей, а так же формируется рынок рекламного наполнения. Поисковая система Yahoo, так же как и Google, занимается поглощением других компаний, например, Yahoo принадлежат поисковой сервис Altavista и сайт электронной коммерции Alibaba. Официальная страница — www.yahoo.com.
Youtube — крупнейшая библиотека видеофайлов. Видеохостинг с элементами социальной сети, где каждый пользователь может добавить видео. С момента приобретения их компанией Google Ink, отдельная регистрация для YouTube не требуется, достаточно зарегистрироваться в почтовом сервисе ( почта gmail). Официальная страница — youtube.com.
WDL — цифровая библиотека.
В библиотеке собираются книги предоставляющие культурную ценность в цифровом виде. Основная цель — повышение уровня культурного содержания интернета. Доступ к библиотеке осуществляется бесплатно.
Официальная страница — www.wdl.org/ru/.
- Bing — поисковая система от компании Microsoft.
- Крупный конкурент поисковой системы Google. Очень схожие результаты поиска, имеются дополнительные фильтры для поиска по стране или сайтов на определенном языке. Почти не используется в России.
- Официальная страница — www.bing.com.
Baidu — крупнейшая китайская поисковая сеть.
Сервис предоставляется только на китайском языке, но при этом занимает 3 место в мире по количеству запросов. Производители так же выпускают бесплатную антивирусную программу «Baidu Antivirus».
Официальная страница — www.baidu.com.
Поисковые системы России
Рамблер — «проамериканская» поисковая система.
Изначально создавался как медийный интернет-портал. Как и другие многие поисковые системы, имеет сервисы поиска по картинкам, видеофайлы, карты, прогноз погоды, новостной раздел и многое другое. Так же издатели предлагают бесплатный браузер Рамблер – Нихром.
Официальная страница — www.rambler.ru.
Nigma — интеллектуальная поисковая система.
Более удобная поисковая система из-за наличия множества фильтров и настроек. Интерфейс позволяет включать, либо исключать предлагаемые подобные значения в поиске для получения более качественных результатов. Так же, при получении результата поиска позволяет использовать информацию других крупных поисковиков.
Официальная страница — www.nigma.ru.
Aport — каталог товаров онлайн.
В прошлом поисковая система, но в следсвие того, что разработки и нововведения были прекращены, быстро сдала позиции Yandex и Rambler. В настоящий момент Апорт является торговой площадкой, на которой представляются товары более 1500 фирм.
Официальная страница — www.aport.ru.
Спутник — национальная поисковая система и интернет-портал.
Создана компанией «Ростелеком». В настоящее время находится в стадии тестирования.
Официальная страница — www.sputnik.ru.
Metabot — развивающаяся поисковая система.
В задачах Metabot стоит создание поисковой системы по всем другим поисковым системам, создавая позиции выдачи результатов с учетом данных всего списка поисковых систем. То есть это поисковая система по поисковым системам.
Официальная страница — www.metabot.ru.
Работа поисковой системы приостановлена.
Официальная страница — www.turtle.ru.
KM — мультипортал.
Изначально сайт являлся мультипорталом с последующим внедрением поисковой системы. Поиск может проводиться как внутри сайта, так и по всем отслеженным сайтам рунета .
Официальная страница — www.km.ru.
Gogo — не работает, перенаправляет на поисковик Mail.ru .
Официальная страница — www.gogo.ru.
Российский мультипортал, не очень популярный, требует доработки. В поисковик включены новости, телевидение, игры, карта.
Официальная страница — www.zoneru.org.
Каталог сайтов, поиск осуществляется непосредственно по добавленным сайтам. Имеются дополнительные сервисы.
Официальная страница — www.ulitka.ru.
Поиск основывается на поисковой системе Yandex, но ищет только по узкоспециализированным сайтам с уклоном в тематику — история, новости и события.
Официальная страница — susanin.russianpulse.ru .
Крупный интернет портал, предоставляет пользователю большое количество дополнительных сервисов. В дополнение идут необычные элементы — ведение дневника, как элемент социальной сети и мощная статистика рейтингов сайтов.
Официальная страница — www.liveinternet.ru.
Поисковая система чем-то напоминает крупный поисковик, только без должного оформления, только поисковик и ссылки по тематикам.
Официальная страница — www.poisk.ru.
Nol9.
Метапоисковая система, основывается на результатах других крупных поисковых систем, но так же имеет свою базу. Иногда бывают сбои и ошибки доступа.
Официальная страница — www.nol9.ru.
Цифровая библиотека.
Название говорит само за себя — библиотека книг, журналов, справочников и так далее, в электронном виде. Удобная навигация по сайту, поиск по тематическим разделам, так же предлагается популярное и новинки. Но книги придется скачивать с популярных файлообменников, таких как Turbobit и Depositfiles.
Официальная страница — www.bookarchive.ru
Поисковая система основанная на ручном описании и определении релевантности при выдаче. Поиск сайтов производит не программа, как у остальных поисковиков, а сами пользователи. Пользователь может добавить сайт, создать описание, а так же оценить описание другого пользователя. Принцип похож на систему Википедия
Официальная страница — www.fasqu.com