Структура данных и система запросов на примерах баз данных различного назначения
На сегодняшний день накоплен обширный опыт разработки и внедрения структур данных, а также создания запросов на основе СУБД разных типов. К настоящему времени наибольшее развитие в нашей стране получили следующие классы баз данных:
- юридические;
- библиотечные;
- налоговые;
- социальные;
- кадровые.
Рассмотрим их подробнее:
- юридические (правовые) БД — структурируют огромный массив информации, позволяющий ориентироваться в российском законодательстве.
Например, правовой портал Референт (www.referent.ru) предоставляет пользователю круглосуточный on-line доступ ко всем материалам правовой базы данных: нормативным правовым актам, комментариям, методикам, рекомендациям, консультациям аудиторских компаний, формам документов, материалам профильных средств массовой информации. Для использования портала не требуется установки специального программного обеспечения — для работы достаточно любого браузера. Система позволяет задавать вопросы на естественном языке. Результат поиска — список найденных материалов сортируется по степени релевантности поисковому запросу. Имеется возможность сохранения результатов своей работы: закладки, списки ранее найденных материалов, свои поисковые запросы.
Осуществим поисковый запрос на тему «Налоговый кодекс Российской Федерации». Для этого введем соответствующую тему в поисковую строку и нажмем кнопку Найти. Через несколько секунд на экран будет выведена подборка выдержек из разных источников, соответствующих сделанному запросу (рис. 257).
Рис. 257. Результат выполнения запроса
По адресу www.systema.ru/ работает научно-технический центр (НТЦ) правовой информации «Система», содержащий базу данных правовых актов федерального уровня. Тексты правовых актов НТЦ «Система» получает непосредственно из Администрации Президента Российской Федерации, Аппарата Правительства Российской Федерации, Государственной Думы Федерального Собрания Российской Федерации и т.д.
Выполним поисковый запрос, результат которого должен содержать список документов, в которых имеется слово «компьютер». Для этого выберем ссылку Поиск документов, расположенную на главной странице. Откроется страница, представленная на рис. 258.
Рис. 258. Страница Поиск документов
Поиск документов можно организовать тремя способами:
- через форму запроса;
- по ключевым словам;
- через рубрикатор.
Выбрав ссылку «по ключевым словам», в перечне букв русского алфавита нажмем букву «К». Поставим флажок напротив слова «компьютер» и нажмем кнопку Поиск. Результат выполнения запроса представлен на рис. 259.
Рис. 259. Результат выполненного поиска
Откроем Федеральный закон от 28.09.2010 «Об инновационном центре “Сколково”». В статье 10 «Особенности деятельности участников проекта» искомое слово «компьютер» содержится в строке «стратегические компьютерные технологии и программное обеспечение». Следовательно, результат удовлетворяет выполненному запросу;
- налоговые БД — предназначены для автоматизации функций по обеспечению сбора налогов и других обязательных платежей в бюджет и внебюджетные фонды.
На официальном сайте Федеральной налоговой службы (www.nalog.ru) можно получить доступ к личному кабинету налогоплательщика, в котором пользователь имеет возможность осуществлять поиск информации о задолженности по имущественному, транспортному, земельному налогам, налогу на доходы физических лиц.
Реализуем запрос по поиску задолженностей конкретного физического лица. Для его реализации необходимо предварительно узнать свой индивидуальный номер налогоплательщика. Щелкнем на ссылке Личный кабинет налогоплательщика. Появится окно, представленное на рис. 260.
Рис. 260. Окно Личный кабинет налогоплательщика
Далее следует заполнить поля, отмеченные звездочками, а именно: ИНН, Фамилия, Имя, Регион, а также ввести цифры с картинки. Для реализации запроса нажмем кнопку Найти. Результат представлен на рис. 261;
- фактографические базы социальных данных — включают сведения о населении и социальной среде.
В качестве примера приведем сайт «Территориальное устройство России» (www.terrus.ru), который содержит базу данных «Социально-экономический справочник — Интернет-каталог “Вся Россия”». Авторы проекта определяют круг потенциальных пользователей сайта школьниками, начинающими изучать экономическую географию (население и хозяйство) России, учителями, студентами и преподавателями вузов. Перейдем по ссылке Вся Россия.
Рис. 261. Результат выполненного запроса
Организуем запрос, с помощью которого можно узнать прогнозируемую численность Москвы на 2015 год. Выполним команду Справочники-каталоги/ Анализ БД «Вся Россия». Процесс реализации запроса состоит из нескольких шагов.
На первом шаге указывается массив информации для выборки, поставим флажок напротив пункта г. Москва и нажмем кнопку Далее.
На втором шаге следует указать вид административно-территориального образования или населенного пункта. Выберем пункт Субъект Федерации и нажмем кнопку Далее.
На третьем шаге требуется выбрать отраслевой разрез информации. Укажем раздел Население и труд и нажмем кнопку Далее.
На четвертом шаге следует указать показатели для отображения. Выберем пункт 8 «Прогнозная среднегодовая численность населения, человек (высокий вариант прогноза)», поставив флажок в пункте 2015, и нажмем ссылку Динамика изменения показателя. Подобная ситуация представлена на рис. 262.
Рис. 262. Выбор ссылки Динамика изменения показателя
Результат выполнения запроса выводится в виде таблицы и в виде графика (рис. 263, 264);
Рис. 263. Результат выполнения запроса в виде таблицы
Рис. 264. Результат выполнения запроса в виде графика
— кадровые БД — предназначены для автоматизации кадрового делопроизводства, заключающегося в составлении кадровых документов, сохранении приказов и отчетов, разработке штатного расписания, ведения личной картотеки.
Однако создание и хранение приказов и других документов в компьютерной форме — это еще не автоматизация кадровой деятельности. Под автоматизацией следует понимать создание и ведение баз данных по личному составу. Документы, фиксирующие трудовую деятельность, требуют постоянного отражения продвижения работника по службе, корректировки, что значительно легче делается в автоматизированной системе, построенной на основе баз данных.
При работе с данными и БД по личному составу необходимо учитывать, что Федеральным законом «Об информации, информационных технологиях и защите информации» персональные данные отнесены к категории конфиденциальной информации и юридические и физические лица несут ответственность за нарушение режима защиты, обработки и порядка использования этой информации. Соответственно, любая база данных по личному составу, а особенно расположенная в сети, должна быть надежно защищена от несанкционированного доступа.
В качестве примера рассмотрим возможности программы для управления подбором персонала HR System Express (http://www.visol.ru/) от компании Vizavi
Solutions, предназначенной для автоматизации бизнес-процессов кадровых агентств, кадровых служб. Используется для ведения персональной или корпоративной базы данных в локальной сети.
К ее преимуществам относят:
- возможность получения бесплатной версии;
- ведение базы данных кандидатов;
- ведение базы данных клиентов, контактных лиц;
- ведение базы данных вакансий;
- интеллектуальный механизм определения дублей (для кандидатов);
- поиск по любым полям карточки кандидатов, поиск по тексту резюме с учетом словоформ русского языка;
- хранение результатов поисков в базе данных кандидатов;
- работа с выборками;
- автоматический импорт и разбор резюме из любых текстовых документов.
Для того чтобы установить бесплатную версию программы, следует перейти
на сайт компании-разработчика (ее web-адрес указан выше).
Далее следует щелкнуть на пункте меню Продукты и выбрать ссылку Загрузить программу. Процесс установки состоит из трех шагов, которые подробно описаны на сайте компании:
- загрузка предварительно требуемых компонентов, в частности Microsoft SQL ServerExpress — систему управления реляционными базами данных, разработанную корпорацией Microsoft, и программную платформу компании Microsoft, предназначенную для создания обычных программ и web- приложений — .Net Framework;
- установки серверной части программы;
- настройки клиентской части программы.
Рис. 265. Главное окно программы HR System Express
Для запуска программы следует выполнить команду Пуск/Все програм- мы/Vizavi Solutions/HR System Express. Откроется окно, представленное на рис. 265.
Для того чтобы программа могла обрабатывать запросы, следует создать базу данных, заполнив модули Кандидаты, Вакансии, Компании, Контактные лица. На рис. 266 представлен заполненный модуль Кандидаты.
Рис. 266. Заполненный модуль Кандидаты
Выполним запрос на поиск кандидата на вакансию «Программист». Для этого, выбрав модуль Вакансии, нажмем кнопку Поиск и введем название вакансии в соответствующее поле. Подобная ситуация представлена на рис. 267.
Рис. 267. Запрос на вакансию «Программист»
Результат выполнения запроса показан на рис. 268.
Рис. 268. Результат выполнения запроса
Выполним запрос на поиск необходимой компании. Откроем модуль компании и нажмем кнопку Поиск. Заполним необходимое поле. Подобная ситуация представлена на рис. 269.
Рис. 269. Запрос на поиск компании Результат выполнения запроса показан на рис. 270.
Рис. 270. Результат выполнения запроса
Теперь выполним сложный запрос на поиск нужного кандидата, удовлетво ряющего следующим критериям: возраст от 40 до 45 лет, пол Женский. Для это го, открыв модуль Кандидаты, нажмем кнопку Поиск и в соответствующем ок не (рис. 271) выставим необходимые критерии. Нажмем кнопку Найти.
Рис. 271. Формирование сложного запроса Результат запроса представлен на рис. 272.
Рис. 272. Результат запроса
Мы рассмотрели основные действия, связанные с созданием и заполнением базы данных кадрового агентства, а также приобрели навыки работы по созданию запросов. Внедрение подобных программ позволяет накапливать массивы информации (базы данных) и документы в электронной форме по всем сотрудникам организации, кадровому резерву, быстро находить и эффективно обрабатывать всю необходимую информацию по личному составу;
- библиотечные (библиографические) БД — содержат описания книг, статей, докладов, диссертаций и других документов, для которых обычно дается полное библиографическое описание, набор ключевых слов и руб- рикационных шифров, раскрывающих тематику и содержание документа, а также приводятся рефераты или аннотации работ.
Библиографические БД формируются преимущественно по отраслевому или тематическому признаку. В качестве примера отраслевой БД рассматриваемого типа можно привести базу данных Института научной информации по общественным наукам — ИНИОН (http://www.inion.ru).
На сервере ИНИОН предоставляется доступ к нескольким сводным каталогам, отражающим поступление литературы за определенные периоды времени (1993-1995, 1996-1998, 1999-2000 гг). Кроме того, пользователи могут работать с целым комплексом БД социально-экономического и гуманитарного профиля, куда входят БД по литературоведению; государству и праву; языкознанию; философии и социологии; экономике и демографии; истории, археологии и этнологии; науковедению; религиоведению; востоковедению.
Для того чтобы приступить к поиску информации в БД ИНИОН, выберем ссылку Электронные ресурсы/Подробнее, а затем Базы данных ИНИОН. Для использования всех возможностей и профессионального поиска требуется регистрация. В качестве примера выберем Базу данных по литературоведению, войдем в нее и заполним анкету. Подобная ситуация представлена на рис. 273.
Далее следует нажать кнопку Ввод и войти в базу данных по своему учетному имени (логину) и паролю. Откроется окно Начало сессии. В разделе Поисковый запрос выберем опцию Профессиональный поиск и нажмем кнопку Установка параметров и начало поиска. Откроется окно Параметры поиска и просмотра, представленное на рис. 274.
Рис. 273. Заполненная анкета
Рис. 274. Окно Параметры поиска и просмотра
Следует отметить, что поиск в БД ИНИОН можно проводить с помощью различных типов поисковых запросов (рис. 275).
Рис. 275. Различные типы поисковых запросов
1. По простому вхождению — поиск осуществляется по всем текстовым полям библиографических записей, таких как авторы, заглавие, сведения об ответственности, аннотация, ключевые слова и т.д. Этот режим поиска применяется в тех случаях, когда нужно найти максимальное количество записей, а информации недостаточно. Количество «нерелевантных» или не отвечающих вашему запросу записей в этом случае может быть довольно большим.
Примеры простых запросов
Режим 1. Искать строго по указанным словам.
Слово «царь» — по этому запросу будут отобраны все записи, содержащие слово «царь».
Режим 2. Нечеткий поиск. По вариантам словоформ.
В этом случае запрос можно построить, например, так: «царь*», будут отобраны записи «царский», «царевна», «царе», «царств» и т.п.
На рис. 276 показана формулировка простого запроса в режиме 1, а на рис. 277 — его результат. Всего найдено 223
записи.
Рис. 276. Формулировка простого запроса в режиме 1
Рис. 277. Результат запроса
На рис. 278 показана формулировка простого запроса в режиме 2, на рис. 279 — его результат. Всего найдено 840 записей.
Рис. 278. Формулировка запроса в режиме нечеткого поиска
Рис. 279. Результат запроса
2. По логическому выражению — этот режим позволяет вам выбрать поля, по которым будет производиться поиск (до 3 полей в одном запросе) и связать их логическими операторами «И», «ИЛИ» и «НЕ». Пользуясь этим режимом, вы можете максимально точно описать свой запрос.
Пример сложного запроса с использованием набора логических операторов и знаков маркировки:
- по запросу, представленному на рис. 280, можно найти все работы Пушкина А.С. ИЛИ Гоголя И.В. ИЛИ Толстого (с любыми инициалами).
Обратите внимание на то, что при формировании запроса сначала идет фамилия, затем через запятую — инициалы (иногда это может быть только первый инициал, а иногда имя полностью). Поэтому чтобы найти работы Александра Пушкина, нужно ввести такой ключ: ‘Пушкин, А’*. Обязательно следует поставить одиночные кавычки (обратите внимание, что знак усечения * нужно поставить после кавычек).
Рис. 280. Запрос с применением логического выражения
3. По образцу — в этом режиме поиск идет по заполненным пользователем полям в стандартной форме. Поля связаны логическим оператором "И". Этот режим может применяться тогда, когда запрос достаточно конкретен. Предположим, следует найти монографии с ключевым словом «Пушкин А.С.», изданные до 2000 года. Сформулированный запрос представлен на рис. 281, а его результат на рис. 282.
Рис. 281. Запрос по образцу
Рис. 282. Результат запроса
Следует отметить, что найденная с помощью запросов информация может быть использована пользователем в библиотеке ИНИОН, которая обеспечивает библиотечно-информационное и справочно-библиографическое обслуживание читателей. Вся информация о библиотеке (время работы, правила записи и т.д.) размещена на сайте ИНИОН.