МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждения высшего образования
«ПЕРМСКИЙ ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНО-ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ»
ЕСТЕСТВЕННОНАУЧНЫЙ Факультет
Кафедра анатомии, физиологии, химии и безопасности жизнедеятельности
Реферат
Хемометрия
| Работу выполнила: обучающийся ZМ 622 группы, направленность (профиль) «Химия» Уросова Нина Сергеевна Преподаватель: профессор, доктор фармацевтических наук Козьминых Владислав Олегович |
| |
ПЕРМЬ
2020
Оглавление
Введение ……………………………………………………………………… | 3 |
Глава 1. О ХЕМОМЕТРИИ…………………………………………….. 1.1 Метод главных компонент (Principal Component Analysis, PCA)…………………………………………………………...………. 1.2 Метод проекций на латентные переменные (projection on latent structures, PLS)…………………………………………………………….. | 4 5 7 |
Глава 2. ПОДРАЗДЕЛЫ ХЕМОМЕТРИКИ……………………….…… 2.1 Молекулярное моделирование………………………………..… 2.2 Хемоинформатика………..…………………………………….… 2.3 Геномика……………….……………………………………….… 2.4 Протеомика……………… ……………………..………………… 2.5 Метаболомика……….. ………………………….…………….… | 8 8 9 10 12 13 |
Глава 3. ОСНОВНЫЕ НАПРАВЛЕНИЯ ХЕМОМЕТРИИ………..…. 3.1 Градуировка (калибровка)……………………………………….. 3.2 Классификация………………………….………………….…….. 3.3 Планирование эксперимента……………………………….……. 3.4 Метрология……………………..………………………….……… 3.5 Контроль качества………………….………………………….…. 3.6 Тензорный анализ…………………………..…………………….. | 10 15 15 16 17 17 19 20 |
Заключение ……………………………………………………………..…….. | 22 |
БИБЛИОГРАФИЧЕСКИЙ СПИСОК ……………………………….…. | 25 |
Введение
С каждым годом учёные химики при проведении химического эксперимента, стараются снять точные данные о протекаемой химической реакции, но сделать это самостоятельно и не прибегая к различным техническим средствам почти невозможно! Именно поэтому в последние десятилетия стал, активно использоваться хемометрический подход к анализу получаемых данных при проведении различных химических экспериментов.
Хемометрический подход к анализу данных в последнее время все чаще применяется для решения различных задач в различных научных областях. Основанная изначально для использования математических методов в химии, но сейчас хемометрика широко используется и в смежных областях науки: физике, биологии, медицине, везде, где есть необходимость в анализе большого количества данных и поиске различного рода закономерностей.
Сбор и анализ полученных данных после проведения химических экспериментов является важной областью в развитии любой науки, так как от точности данных будет зависеть многое. Именно поэтому развитие хемомертии является важным вопросов в развитии химии, и в свою очередь очень актуальным.
Моей задачей является изучить различные источники справочной информации (книги, статьи и различные образовательные сайты) для получения ответов на вопросы: «что же такое хемометрия или хемометрика?», «для чего она необходима?» и «кто занимается развитием этой науки в России?».
Глава 1. О ХЕМОМЕТРИИ
Хемометрия (от англ. chemistry — «химия», и -metrics как в «эконометрике» или «психометрии») — раздел аналитической химии, ставящий целью получение химических данных с помощью математических методов обработки и добычи данных.
Для решения различных задач в последнее время все чаще используют хемометрический подход к анализу. Хемометрия, первоначально основанная на использовании методов математики в химии, в настоящее время широко используется в смежных областях наук: физике, биологии, медицине, косметологии, фармакологии, где необходимо анализировать большие объемы данных и искать различные типы формул.
Отвечая на вопрос: «что же такое хемометрия или хемометрика и кто занимается развитием этой науки в России?» мы можем сказать, что данной наукой занимается Российское хемометрическое общество (РХО) — это некоммерческая организация целью, которой является популяризация и развития хемометрики в России.
В проекте Устава Российского хемометрического общества даётся следующее определение хемометрики:
Хемометрика - это научная дисциплина, находящаяся на стыке химии и математики, предметом которой являются математические методы изучения химических явлений.
Данная дисциплина использует базовые методы из смежных областей (статистика, прикладная математика, информатика) для решения проблем, относящихся к химии, биохимии, медицине, биологии и технологии. Хемометрика зародилась в 1974 как раздел аналитической химии, которая до сих пор остаётся главным потребителем методов хемометрии. Сейчас хемометрия активно применяется для решения различных прикладных задач, если есть необходимость в анализе больших данных и поиске закономерностей.
Главный принцип хемометрии – использование многомерного подхода при планировании эксперимента и анализе его результатов, что позволяет уменьшить неопределённость результата за счёт увеличения числа переменных. Выявление в данных полезной информации, то есть отделение её от несодержательной информации, называемой шумом, всегда проводится с учётом поставленных целей.
Многомерность и шум приводят к тому, что в данных проявляются не систематические (или причинные), а случайные (или называемые корреляционные) связи между переменными. Для выявления связей используются проекционные методы, такие как метод главных компонент (principal component analysis, PCA) и метод проекций на латентные переменные (projection on latent structures, PLS).
В хемометрике применяются в основном формальные многофакторные линейные модели, которые полезны в тех случаях, когда нельзя использовать содержательный физико-химический подход. Применимость формальных моделей подтверждается эмпирически с помощью независимого проверочного набора или методом перекрёстной проверки.
Метод главных компонент (Principal Component Analysis, PCA)
Метод Главных Компонент (англ. Principal Components Analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен Карлом Пирсоном в 1901 г. Применяется во многих областях, таких как распознавание образов, компьютерное зрение, сжатие данных и т. п.
Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к сингулярному разложению матрицы данных. Иногда метод главных компонент называют преобразованием Кархунена-Лоэва или преобразованием Хотеллинга.
Другие способы уменьшения размерности данных — это метод независимых компонент, многомерное шкалирование, а также многочисленные нелинейные обобщения: метод главных кривых и многообразий, поиск наилучшей проекции (англ. Projection Pursuit), нейросетевые методы «узкого горла», самоорганизующиеся карты Кохонена и др.
Задача анализа главных компонент, имеет, как минимум, четыре базовых версии:
аппроксимировать данные линейными многообразиями меньшей размерности;
найти подпространства меньшей размерности, в ортогональной проекции на которые разброс данных (т.е. среднеквадратичное уклонение от среднего значения) максимален;
найти подпространства меньшей размерности, в ортогональной проекции на которые среднеквадратичное расстояние между точками максимально;
для данной многомерной случайной величины построить такое ортогональное преобразование координат, что в результате корреляции между отдельными координатами обратятся в ноль.
Первые три версии оперируют конечными множествами данных. Они эквивалентны и не используют никакой гипотезы о статистическом порождении данных. Четвёртая версия оперирует случайными величинами. Конечные множества появляются здесь как выборки из данного распределения, а решение трёх первых задач — как приближение к «истинному» преобразованию Кархунена – Лоэва. При этом возникает дополнительный и не вполне тривиальный вопрос о точности этого приближения.
Метод главных компонент — наиболее популярный метод сокращения размерности во многих приложениях, в том числе в следующих областях:
Визуализация данных;
Компрессия изображений и видео;
Подавление шума на изображениях;
Индексация видео;
Биоинформатика;
Хемометрика;
Психодиагностика;
Общественные науки (включая политологию);
Сокращение размерности динамических моделей (в том числе — в вычислительной гидродинамике).
Метод проекций на латентные переменные (projection on latent structures, PLS)
Проекция на латентные переменные или на скрытые структуры (PLS) - это первый шаг, который мы предпримем для расширения методов скрытых переменных с использованием более одного блока данных. В методе PLS мы делим наши переменные (столбцы) на два блока:X а также Y,
Обучение тому, как выбирать переменные в каждом блоке, станет очевидным позже, но сейчас вы можете использовать эмпирическое правило, которое гласит: X принимает переменные, которые всегда доступны при использовании модели, в то время как Y принимает переменные, которые не всегда доступны . Обе X а также Y должен быть доступен при построении модели, но позже, при использовании модели, только X необходимо. Как вы можете догадаться, одним из основных применений PLS является прогнозирование переменных в Y используя переменные в X, но это не единственное его назначение в качестве модели. Это очень хорошая модель для понимания процесса и устранения неполадок.
PLS может использоваться для мониторинга процесса и оптимизации производительности процесса. Он также широко используется для разработки новых продуктов или для улучшения существующих продуктов. Во всех этих случаях Y блок чаще всего содержит результат или качественные свойства.
Тем не менее, PLS чаще всего используется для прогнозирования. И это также хороший способ представить PLS. В (химических) технологических процессах мы используем его для разработки программных датчиков (также известных как логические датчики), которые в реальном времени прогнозируют трудоемкие лабораторные измерения, используя оперативные данные наших процессов. В лабораториях мы используем спектральные данные (например, NIR-спектры), чтобы предсказать состав жидкости; это известно как проблема калибровки; После калибровки образцов известного состава мы можем предсказать состав будущих образцов.
Глава 2. ПОДРАЗДЕЛЫ ХЕМОМЕТРИКИ
Некоторые крупные подразделы хемометрики выделились в самостоятоятельные научные дисциплины, например молекулярное моделирование (QSAR), хемоинформатика, а также вошли в такие дисциплины, как геномика, протеомика, метаболомика, статистический и аналитический контроль процессов.
Молекулярное моделирование (QSAR)
Молекулярное моделирование (ММ) — собирательное название методов исследования структуры и свойств молекул вычислительными методами с последующей визуализацией результатов, обеспечивающие их трехмерное представления при заданных в расчете условиях.
Методы молекулярного моделирования используются в компьютерной химии, вычислительной биологии и науке о материалах для изучения как индивидуальных молекул, так и взаимодействия в молекулярных системах.
Расчеты простейших систем при молекулярном моделировании могут быть выполнены вручную, но из-за большого объема вычислений при моделировании систем, представляющих практический интерес, особенно при исследовании молекулярной динамики, используются компьютерные методы расчета и визуализации, эта техника получила название компьютерного молекулярного моделирования (англ. computer-assisted molecular modeling, CAMM).
Общей чертой методов ММ является атомистический уровень описания молекулярных систем — наименьшими частицами являются атомы или небольшие группы атомов. В этом состоит отличие ММ от квантовой химии, где в явном виде учитываются и электроны. Таким образом, преимуществом ММ является меньшая сложность в описании систем, позволяющая рассмотрение большего числа частиц при расчётах.
Хемоинформатика
Хемоинформа́тика (от хемо… и информатика), область химии, охватывающая применение методов информатики для решения широкого круга химических задач, связанных с изучением веществ, их структуры, свойств и превращений.
Хемоинформатика оформилась как комплексная междисциплинарная область науки на рубеже 20–21 вв. в результате развития таких направлений исследований, как хранение и обработка химической информации, математическая химия, анализ связи структуры соединений с их свойствами и биологической активностью, молекулярное моделирование, анализ экспериментальных данных, конструирование соединений с заданными свойствами и оптимизация условий реакций. Это связано со значительной общностью и взаимосвязью решаемых задач и применяемых методов, а также необходимостью работы с огромными объёмами разнородной информации.
Наряду с методами химии и информатики в хемоинформатике активно применяются достижения многих разделов математики, физики, биологии, медицины.
Базовую роль в ней играют методы представления и обработки химической информации:
эффективное кодирование структурных формул и пространственных структур соединений, химических реакций (трансформаций структур), а также связанных с ними данных различных типов (логические, числовые, текстовые, спектральные и др.);
работа с содержащими такую информацию базами данных (включая её хранение, поиск по структурам, структурным фрагментам и др. полям, передачу и модификацию);
анализ и обработка химических текстов, в т. ч. названий соединений; численное описание структуры соединений с помощью молекулярных дескрипторов;
анализ и визуализация химического пространства как совокупности возможных молекул, включая генерацию структур, оценку их сходства и разнообразия.
К числу задач молекулярного моделирования принадлежат визуализация пространственной и электронной структуры низкомолекулярных соединений и макромолекул, в т. ч. биологических (молекулярная графика), а также моделирование их структуры и межмолекулярных взаимодействий с применением методов квантовой химии и молекулярной механики, молекулярной динамики и различных полуэмпирических и эвристических подходов (молекулярный докинг, фармакофорные модели и др.).
Хемоинформатика также изучает задачи анализа экспериментальных химических данных с целью выявления в них закономерностей и построения предсказательных моделей с применением методов статистического машинного обучения.
Важное место в ней занимают методы моделирования связи структуры соединений с их свойствами и прогнозирования для новых соединений таких свойств, как физико-химические характеристики и спектральные свойства, реакционная способность, биологическая активность, поведение в организме и др.
Хемоинформатика разрабатывает методы поиска оптимальных решений как в химическом пространстве (молекулярный дизайн соединений с заданными свойствами и/или биологической активностью, дизайн библиотек структур, определение структуры соединений на основе данных физико-химических методов анализа, планирование синтеза), так и в пространстве различных неструктурных параметров химических процессов (планирование экспериментов, оптимизация условий реакций, управление технологичными процессами).
Геномика
Геномика – это направление биологии исследующее структуру и функцию нуклеотидных последовательностей геномов живых организмов широком смысле: структурная геномика - последовательность нуклеотидов, наличия их модификаций, взаимодействий с белками, функциональная геномика - реалиация генетической информации, систематическая геномика - использование последовательностей специфических участков ДНК для уточнения систематического положения живых организмов. Ресурсный центр предоставляет возможность секвенирования на нескольких различных платформах. Сэнджеровское (капиллярное) секвенирование - классический метод, позволяющий одновременно проводить небольшое количество сиквенсов. Массивное параллельное секвенирование следующего поколения (NGS) доступно на двух платформах Roche 454 GS Junior и ABI Ion Torrent. В центре имеется оборудование для приготовления библиотек под NGS, в связи с этим, центр консультирует пользователей по возможностям оборудования и разработке подходящего экспериментального дизайна.
Помимо секвенирования, в центре доступно оборудование для количественного ПЦР (qPCR) и генотипирования. Центр консультирует по выбору подходящей платформы и расходных материалов, также как и по всем аспектам от разработки экспериментального дизайна до анализа данных. Цифровая ПЦР (DD-PCR) лучшим образом подходит для поиска одиночных полиморфизмов (SNP) и количественного ПЦР. Микрофлуидная система высокопроизводительного ПЦР (Fluidigm) является инструментом выбора для проектов, включающих большое количество измерений генной экспрессии.
Несмотря на бурное развитие направления исследований, отвечающего на вопросы «что?» и «как?» происходит в эксперименте, во многих случаях требуется отвечать на вопрос «где?» — уточнять локализацию описываемых изменений экспрессии генов. Особенно востребована такая задача в биологии развития и нейробиологии. Для реализации этого направления исследований доступна роботизированная платформа для проведения флуоресцентной in-situ гибридизации (FISH). Выделение микроучастков препарата для последующего анализа с максимальной чистотой возможно с использованием бесконтактного комплекса лазерной микродиссекции.
Важной вехой бурного развития геномики явилась доступность вычислительных ресурсов и появления специализированного программного обеспечения для задач биоинформатики. Для обработки получаемых в ходе количественного ПЦР, высокопроизводительного ПЦР, секвенирования, данных, центр обеспечивает доступ к соответствующим вычислительным ресурсам и программному обеспечению.
Протеомика
Протеомика — исследование белковых молекул, их аминокислотной последовательности, пространственной структуры, посттрансляционных модификаций. В центре это направление представлено оборудованием для масс-спектрометрии, хроматографии, анализа биомолекулярных взаимодействий.
Имеющееся оборудование для масс-спектрометрии может быть использовано для поисковых и полуколичественых исследований, идентификации одновременно нескольких белков или пептидов в составе сложных смесей, определения аминокислотной последовательности белков, наличия посттрансляционных изменений, выявления и идентификации биомаркеров различной органической природы, проведения молекулярной визуализации тканей, идентификации микроорганизмов.
Хроматографическое оборудование позволяет разделять белки и пептиды в составе сложных смесей по ряду параметров, проводить очистку интересующего белка, проводить оценку качества очистки белков и олигонуклеотидов.
Анализ биомолекулярных взаимодействий, поиск и ранжирование антител, картирование эпитопов, изучение взаимодействий белков другими белками, малыми молекулами и нуклеиновыми кислотами в растворе проводится на установке использующей эффект поверхностного плазмонного резонанса. Определение скорости диффузии белков, их концентрации и взаимодействия в живых клетках может быть проведено на конфокальном микроскопе, оснащённом для флуоресцентной корреляционной спектроскопии.
Определение пространственной структуры изучаемых белков и их комплексов в нативном гидратированном состоянии возможно с использованием метода витрификации на сеточках (bare-grid plunge freeze) и последующей электронной микроскопии с анализом единичных частиц (single particle analysis).
Для пробоподготовки образцов к исследованию на сложном аналитическом оборудовании в центре предусмотрено рутинное оборудование для гомогенизации и лизиса образцов, их очистки и концентрации, фракционирования при помощи хроматографии, одномерного и двумерного электрофореза, иммуноблоттинга, препаративного электрофореза.
Некоторые задачи структурной протеомики, такие, как исследование с применением рентгено-диффракционного подхода, ядерно-магнитного резонанса, а также задачи, требующие значительных вычислительных ресурсов могут быть решены при помощи оборудования
Метаболомика
Метаболомика изучает конечные и промежуточные продукты обмена веществ в клетке. Метаболомный анализ в настоящее время рассматриваться как одно из самых перспективных направлений развития молекулярных методов в области системной биологии.
Современная метаболомика далеко вышла за рамки рамки постгеномного анализа и оценки раннего фенотипического отклика. Биохимическое состояние системы, описываемое метаболитным профилем, вполне может выступать в роли альтернативного взгляда на биологический объект. Оценка устойчивости и динамики таких состояний может сопровождать практически любой биологический эксперимент, мониторинг или наблюдение. При этом полученные данные могут существенно помочь в понимании процессов, происходящих на молекулярном уровне и даже дать ключ к возможности реализации управления этими процессами. Залогом успеха применения подобного подхода является возможность одновременной качественной и количественной характеристики очень большого числа малых биомолекул в исследуемом образце (по некоторым оценкам среднее число компонентов метаболитной сети составляет более 5000 соединений). Метаболитный профайлинг может дать очень интересную информацию о состоянии и поведении сложных динамических систем, которыми, по сути, и являются биологические объекты. Для его успешной реализации необходима аналитическая техника высокого класса включая хроматоргафическое и масс-спектрометрическое оборудование, представленное в ресурсном центре.
Установленное оборудование для газовой хромато-масс-спектрометрии позволяет проводить анализ таких веществ, как:
сахара и их производные
аминокислоты
другие органические кислоты
гормоны растений (ауксин, салициловая кислота, этилен, абсцизовая кислота)
воски (сложные эфиры высших жирных кислот и высшие высокомолекулярные спирты)
Установленное оборудование для жидкостной хромато-масс-спектрометрии позволяет проводить анализ:
белков
пептидов ( пептидные гормоны, цитокины, тахикины)
глюкозинолатов
фенольных производных
Глава 3. ОСНОВНЫЕ НАПРАВЛЕНИЯ ХЕМОМЕТРИИ
В хемометрии выделяют три основных направления:
Градуировка (калибровка);
Классификация;
Разделение кривых – метод разделения составного сигнала (например, в спектроскопии) на составные части (так называемые чистые спектры).
В хемометрике развиваются и другие направления: планирование эксперимента, метрология, контроль качества, тензорный анализ.
Градуировка (калибровка)
Градуировка (калибровка) – метод, моделирующий причинные связи между двумя блоками переменных (X и Y) с целью предсказания значений переменных Y по известным значениям переменных X.
Суть задачи калибровки состоит в следующем. Пусть имеется некоторая переменная (свойство) y, величину которой необходимо установить. Однако, по ряду обстоятельств (недоступность, дороговизна, длительность), прямое измерение величины y невозможно. В то же время можно легко (быстро, дешево) измерить другие величины: x=(x1,x2,x3,…), которые связаны с искомой величиной y. Задача калибровки состоит в установлении количественной связи между переменными x и откликом y.
y=f(x1,x2,x3,…|a1,a2,a3,…)+ϵ
На практике это означает:
подбор вида зависимости f,
оценку неизвестных параметров a1,a2,a3,… в этой калибровочной зависимости.
Разумеется, калибровку нельзя построить абсолютно точно. Это не только невозможно, но и опасно. В калибровочной зависимости всегда присутствуют погрешности (ошибки) ε, источник которых – пробоотобор, измерения, моделирование, и т.д.
Простейший пример калибровки дает общеизвестный прибор, называемый безменом, т.е. пружинные весы. Искомая величина y – это вес образца, а x – это удлинение пружины весов.
Процедура калибровки очень проста – взвешиваем стандартный образец весом в 1 кг и отмечаем на шкале удлинение пружины, затем используем образец в 2 кг, и т.д. В результате этой калибровки (точнее, градуировки) получается шкала, по которой можно определить вес нового, нестандартного образца.
Этот элементарный пример демонстрирует основные черты процедуры калибровки. Во-первых, для калибровки необходимы несколько стандартных образцов, для которых величины y известны заранее. Во-вторых, диапазон, в котором предполагается измерять показатель y, должен полностью покрываться этими калибровочными образцами. Действительно, нельзя измерять образцы весом более 5 кг, если в калибровке использовались образцы, весом менее чем 5 кг.
Разумеется, на практике все обстоит не так просто, как в этом элементарном примере. Например, в калибровке может участвовать не один показатель y (отклик), а несколько откликов y1,y2,…yK, которые нас интересуют.
Задача калибровки состоит в построении математической модели, с помощью которой можно в дальнейшем предсказывать значения показателей y1,y2,…yK, по новой строке значений аналитического сигнала x.
Классификация
Классификация – метод моделирования групп переменных (классов) с целью выявления принадлежности нового объекта к одному или нескольким классам.
Исходными данными для классификации является матрица , в которой каждая строка представляет один объект, а каждый столбец – одну из переменных. Эта матрица называется исходным набором данных. Число объектов (строк в матрице ) мы будем обозначать буквой I, а число переменных (строк в матрице ) – буквой J. Число классов мы будем обозначать буквой K.
Классификацией называют не только саму процедуру распределения, но и ее результат. Употребляется также термин распознавание образов (pattern recognition), который можно считать синонимом. В математической статистике классификацию часто называют дискриминацией.
Метод (алгоритм), которым проводят классификацию, называют классификатором. Классификатор переводит вектор признаков объекта x в целое число, 1, 2, … , соответствующее номеру класса, в который он помещает этот объект.
Планирование эксперимента
Планирование эксперимента (или активный эксперимент) в химии, раздел математической статистики, изучающий методы организации совокупности опытов с различными условиями для получения наиболее достоверной информации о свойствах исследуемого объекта при наличии неконтролируемых случайных возмущений.
Величины, определяющие условия данного опыта, обычно называются факторами (например, температура или концентрация), их совокупность - факторным пространством.
Набор значений факторов характеризует некоторую точку факторного пространства, а совокупность всех опытов составляет так называемый факторный эксперимент. Расположение точек в факторном пространстве определяет план эксперимента, который задает число и условия проведения опытов с регистрацией их результатов.
Начало планированию эксперимента положили труды P. Фишера (1935). Он показал, что рациональное планирование эксперимента дает не менее существенный выигрыш в точности оценок, чем оптимальная обработка результатов измерений.
Планирование эксперимента используют для изучения и математического описания процессов и явлений путем построения математических моделей (в форме так называемых уравнений регрессии) – соотношений, связывающих с помощью ряда параметров значения факторов и результаты эксперимента, называемые откликами. Основное требование, предъявляемое к планам факторного эксперимента, в отличие от пассивного эксперимента – минимизация числа опытов, при которой получают достоверные оценки вычисляемых параметров при соблюдении приемлемой точности математических моделей в заданной области факторного пространства. В этом случае задача обработки результатов факторного эксперимента заключается в определении численных значений указанных параметров.
Метрология
Наука об измерениях, методах и средствах обеспечения их единства и способах достижения требуемой точности называется метрологией.
Метрологическая наука использует совокупность физических и математических методов обработки экспериментальных данных для получения из них достоверной информации.
Измерения бывают прямыми, когда объект непосредственно сопоставляется с носителем единицы измерения, и косвенными, когда измеряемая величина рассчитывается из других измеренных величин. Химия имеет дело только с косвенными измерениями. Поэтому воспроизведение процедуры обеспечения единства измерений, т. е. независимости результата измерений от времени, места, экспериментатора и т. д., химик может обеспечить только приблизительно.
Погрешность измерения – любое отличие результата измерений от истинного значения измеряемой величины.
Точность (достоверность) измерения характеризует малость погрешности, т. е. близость измеренной величины к истинной. Правильность (систематическая погрешность) – метрологическая категория, характеризующая малость систематической составляющей погрешности.
Воспроизводимость (случайная погрешность или разброс относительно среднего из результатов измерений) характеризует малость случайной составляющей погрешности.
В целях устранения систематических погрешностей химических измерений их удобно классифицировать следующим образом:
систематические погрешности известной природы, значения которых могут быть рассчитаны apriori и учтены путем введения соответствующих поправок (в качестве примера можно привести необходимость учета зависимостей плотности и удельного объема воды от температуры);
систематические погрешности известной природы, значения которых неизвестны, но могут быть оценены в ходе химического эксперимента или при постановке специального эксперимента (инструментальные погрешности, реактивные ошибки, погрешности индикаторов и стандартов, ошибки интерпретации, методические ошибки);
систематические погрешности невыясненной природы, значения которых неизвестны (в этом случае в результате тщательного исследования необходимо найти источник погрешности, которая должна быть устранена).
Контроль качества
Одной из важнейших задач, стоящих перед химической наукой в XXI веке, является совершенствование измерений, проводимых в химии и химической технологии. Вопросы измерений в целом — предмет метрологии, а проблемами измерений в химии занимается химическая метрология. Роль метрологии вообще и химической метрологии в частности постоянно растет. Это определяется логикой развития общества.
Развитие рыночных отношений неизбежно сопряжено с повышением требований к качеству продукции и эффективности производства. В химической промышленности это влечет за собой рост степени автоматизации, когда управление производственным процессом полностью или почти полностью осуществляется по результатам измерений физических величин (давление и температура в реакторах, масса и объем вводимых в реакторы веществ, концентрация веществ в реакционной смеси и конечных продуктах производства и т.д.). При этом качество исходной информации, т.е. точность измерения, прямо влияет на качество продукции. Ужесточение отношений "продавец—покупатель", "производитель-потребитель", перевод этих отношений на формально-правовую основу резко повышают требования к химическому анализу ("измерение химического состава") и измерениям других характеристик продуктов химического производства, причем особенно важным становится требование сопоставимости результатов измерений в разных лабораториях, что, собственно, и является предметом метрологии (обеспечение единства измерений).
Защита прав потребителей пищевых продуктов, других изделий и материалов также сопряжена с решением чисто метрологических проблем — обеспечением единства измерений в разных лабораториях и высокой точности этих измерений. Здесь речь идет главным образом о химическом анализе, а также о других видах лабораторных исследований пищевых продуктов. Аналогичные задачи обеспечения и контроля качества результатов химического анализа возникают при исследовании объектов окружающей среды, биологического и медицинского происхождения, в ходе научных исследований и т.д.
Как видно, метрологические проблемы существуют и требуют своего решения в большинстве областей профессиональной деятельности химиков. Для их решения постоянно развиваются действующие и создаются новые системы обеспечения и контроля качества, как измерений физических величин, так и химического анализа. Таким образом, метрология, смыкаясь с химическими дисциплинами, особенно с аналитической химией, проникает практически во все сферы деятельности химиков и химиков-технологов, и эффективность их профессиональной деятельности все больше зависит от умения решать метрологические задачи.
Особую роль метрологические аспекты играют в аналитической химии. Это связано с тем, что количественный химический анализ с метрологической точки зрения представляет собой сложное косвенное измерение, для выполнения которого применяется, как правило, несколько измерительных приборов и вспомогательных устройств, осложненное к тому же непосредственным вмешательством человека в процесс измерения (которое часто играет определяющую роль). В абсолютном большинстве случаев для химического анализа не удается построить корректную схему передачи размера единицы количества вещества от первичного эталона к рутинным пробам. Это невозможно либо по причине трудности создания такого эталона, либо (чаще всего) из-за отсутствия образцовых методов анализа, обеспечивающих передачу размера с требуемой точностью. Поэтому в химическом анализе широко используются специальные, отличающиеся от классических, способы обеспечения и контроля качества измерений. Специфика измерений в химическом анализе настолько велика, что для ее отражения потребовалась разработка специальной системы стандартов.
Тензорный анализ
Тензорный анализ — обобщение векторного анализа, раздел тензорного исчисления, изучающий дифференциальные операторы, действующие на алгебре тензорных полей дифференцируемого многообразия. Рассматриваются также операторы, действующие на более общие, чем тензорные поля, геометрические объекты: тензорные плотности, дифференциальные формы со значениями в векторном расслоении.
Наибольший интерес представляют операторы, действие которых не выводит за пределы алгебры, среди таковых:
ковариантная производная,
производная Ли,
внешняя производная,
тензор кривизны невырожденного, дважды ковариантного тензора.
Заключение
Что же такое хемометрия или хемометрика? Для чего она необходима хемометрика? Кто занимается развитием хамометрики в России?
Нам представляется, что развитие аналитики во всем мире будут определять следующие тенденции. Во-первых, объекты анализа станут более сложными и комплексными. Технологические потребности будут ставить перед аналитиками не частные вопросы – сколько вещества X в пробе, а общие вопросы – получится ли продукт нужного качества из этого сырья, или правильно ли развивается химическая реакция в этой колонке.
Во-вторых, методы анализа будут меняться таким образом, чтобы обеспечить получение необходимых данных не в лаборатории (at line), а непосредственно на производстве, в реальном времени (in line).
В-третьих, резко увеличится объем данных, которые повсеместно станут многомодальными и многомерными. Увеличится роль гибридных и композиционных методов анализа.
В-четвертых, искомая химическая информация будет очень глубоко спрятана в этих данных, и более того, она будет все менее формализована, что потребует применения самых изощренных методов ее извлечения.
В-пятых, изменится организация аналитического эксперимента – вместо исследования одной пробы в одном опыте, будет использоваться системный подход, в котором много разных проб автоматически испытываются одновременно разными методами, в разных условиях. Такой массовый компьютеризованный эксперимент, пример которого мы уже видим в технологии микрочипов, станет рутинной аналитической практикой.
В-шестых, акцент в аналитическом исследовании будет переноситься на биологические объекты и биохимические процессы, а также на исследование технологических процессов в целом.
Все эти тенденции, которые уже сейчас прослеживаются в аналитической химии, изменят и роль химика аналитика. Он неизбежно станет более аналитиком, чем химиком. Две главные задачи будут стоять перед этим исследователем.
Первая – как придумать, организовать, спланировать эксперимент с тем, чтобы получить данные, из которых, в принципе, можно получить нужную информацию. При этом искомой информацией может быть не количественный (концентрация) или качественный (да/нет) результат, а прогноз финального состояния исследуемой системы в будущем, после прохождения ее через много стадий химических и физических превращений.
Вторая – как извлечь эту информацию из данных, интерпретировать ее в категориях полезности и качества. Для решения этих задач исследователь должен, в значительной мере, использовать опыт и инструментарий хемометрики.
Все это свидетельствует о том, что хемометрика, как неотъемлемая часть аналитической химии, в значительной мере определяет направления ее развития. В 1825 году Огюст Конт (A. Comte), французский философ, основоположник позитивизма писал: – “Каждая попытка применить математические методы для исследования химических проблем должна рассматриваться как абсолютно абсурдная и противоречащая самому духу химии. Если математический анализ, когда-либо займет сколько-нибудь значительное место в химии – извращение, которое по счастью почти невероятно – это повлечет за собой повсеместно быстрое вырождение этой науки“.
Это пророчество, к счастью, оказалось неверным, и мы становимся свидетелями роста применения математических методов в аналитической химии и одновременного распространения этой науки далеко за пределы ее обычного ареала.
Если российские ученые хотят быть не только свидетелями, но и активными участниками этого процесса, нам необходимо предпринять срочные меры по развитию хемометрики. По нашему мнению, необходимо значительно усилить уровень преподавания хемометрики в университетах. Для этого нужно подготовить (написать или перевести) учебник по хемометрике, разработать несколько типовых программ обучения для химиков-аналитиков, технологов, инженеров и т.п. Считаем, что можно ставить вопрос о соответствующих специальностях в магистерских специализациях, а также в кандидатских и докторских Советах. И уж, конечно, надо незамедлительно решить вопрос о подписке на ведущие журналы в этой области: Journal of Chemometrics и Chemometrics and Intelligent Laboratory Systems, которые сейчас нельзя найти ни в одной российской библиотеке.
Несмотря на все имеющиеся объективные и субъективные трудности, мы с оптимизмом оцениваем перспективы развития хемометрики в России. Наблюдается растущий интерес к этой науке, как со стороны химиков-аналитиков, так и среди других специалистов – физиков и математиков.
Сравнивая современное положение дел с ситуацией, имевшей место еще пять-семь лет назад, нельзя не отметить значительный рост публикаций российских ученых в отечественных и международных журналах, посвященных хемометрике.
Аналитическая химия является разработчиком и носителем определенной идеологии и методологии, обеспечивает профессионализм в анализе. Последние 20 лет доказали, что включение хемометрики, как неотъемлемой части, в методологию химического анализа позволяет значительно расширить арсенал аналитических методов, сделать их более эффективными и быстрыми.
Хемометрика позволяет значительно расширить сферу применения аналитических методов, для этого необходимо тесное сотрудничество аналитиков с другими учеными: математиками, физиками, биологами.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
Родионова О. Е., Померанцев А. Л. Хемометрика: достижения и перспективы // Успехи химии. 2006. Т. 75. № 4;
М.А. Шараф, Д.Л. Иллмэн, Б.Р. Ковальски. Хемометрика, Пер. с англ. М. Мир: 1987 [M. Sharaf, D. Illman, B. Kowalski. Chemometrics. NY: Wiley. 1986
Ю.А. Золотов. Аналитическая химия: проблемы и достижения, М. Наука 1992
Ю.В. ГрановскийУспехи и проблемы. Вест. МГУ Сер 2 Химия, 38, 211 (1997)
Ю.А. Карпов, Т.М. Полховская. Стандартизация и метрология в металлургическом производстве: М. МИСИС 1989
Родионова О. Е., Померанцев А. Л. Хемометрика в аналитической химии. Институт химической физики им. Н.Н. Семенова РАН. (http://pca.narod.ru/chemometrics_review.pdf)
Померанцев А. Л. Хемометрика в Excel. Томск, 2014;
Practical guide to chemometrics / Ed. by P. Gemperline. 2nd ed. Boca Raton, 2006;
Chemoinformatics: A textbook / Ed. J. Gasteiger, T. Engel. Weinheim, 2003;
Handbook of chemoinformatics / Ed. J. Gasteiger. Weinheim, 2003. Vol. 1–4;
Chemoinformatics and computational chemical biology / Ed. J. Bajorath. N. Y., 2011.
Информация из сети Интернет:
https://bigenc.ru/chemistry/text/4664229 («Хемометрика» - 12.05.2020)
https://chemometrics.ru// («Российское хемометрическое общество» - 13.05.2020)
http://www.prometeus.nsc.ru/archives/exhibit2/chmetinf.ssi («Хемометрика и хемоинформатика» - 13.05.2020)
https://bigenc.ru/chemistry/text/4664214 («Хемоинформитика» - 13.05.2020)
https://rcs.chemometrics.ru/old/Tutorials/classification.htm («Классификация» -14.05.2020)
http://window.edu.ru/catalog/pdf2txt/371/59371/29439 («Основы химической метрологии и хемометрики» - 15.05.2020)