СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Реферат по теме - Хемометрия

Категория: Химия

Нажмите, чтобы узнать подробности

Просмотр содержимого документа
«Реферат по теме - Хемометрия»

МИНОБРНАУКИ РОССИИ

федеральное государственное бюджетное образовательное учреждения высшего образования

«ПЕРМСКИЙ ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНО-ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ»


ЕСТЕСТВЕННОНАУЧНЫЙ Факультет

Кафедра анатомии, физиологии, химии и безопасности жизнедеятельности




Реферат

Хемометрия








Работу выполнила:

обучающийся ZМ 622 группы, направленность (профиль) «Химия»

Уросова Нина Сергеевна

Преподаватель:

профессор, доктор фармацевтических наук

Козьминых Владислав Олегович









ПЕРМЬ

2020

Оглавление

Введение ………………………………………………………………………

3

Глава 1. О ХЕМОМЕТРИИ……………………………………………..

1.1 Ме­тод глав­ных ком­по­нент (Principal Component Analysis, PCA)…………………………………………………………...……….

1.2 Метод про­ек­ций на ла­тент­ные пе­ре­мен­ные (projection on latent structures, PLS)……………………………………………………………..

4


5


7

Глава 2. ПОДРАЗДЕЛЫ ХЕМОМЕТРИКИ……………………….……

2.1 Молекулярное моделирование………………………………..…

2.2 Хемоинформатика………..…………………………………….…

2.3 Геномика……………….……………………………………….…

2.4 Протеомика……………… ……………………..…………………

2.5 Метаболомика……….. ………………………….…………….…

8

8

9

10

12

13

Глава 3. ОСНОВНЫЕ НАПРАВЛЕНИЯ ХЕМОМЕТРИИ………..….

3.1 Градуировка (калибровка)………………………………………..

3.2 Классификация………………………….………………….……..

3.3 Планирование эксперимента……………………………….…….

3.4 Метрология……………………..………………………….………

3.5 Контроль качества………………….………………………….….

3.6 Тензорный анализ…………………………..……………………..

10

15

15

16

17

17

19

20

Заключение ……………………………………………………………..……..

22

БИБЛИОГРАФИЧЕСКИЙ СПИСОК ……………………………….….

25



Введение

С каждым годом учёные химики при проведении химического эксперимента, стараются снять точные данные о протекаемой химической реакции, но сделать это самостоятельно и не прибегая к различным техническим средствам почти невозможно! Именно поэтому в последние десятилетия стал, активно использоваться хемометрический подход к анализу получаемых данных при проведении различных химических экспериментов.

Хемометрический подход к анализу данных в последнее время все чаще применяется для решения различных задач в различных научных областях. Основанная изначально для использования математических методов в химии, но сейчас хемометрика широко используется и в смежных областях науки: физике, биологии, медицине, везде, где есть необходимость в анализе большого количества данных и поиске различного рода закономерностей.

Сбор и анализ полученных данных после проведения химических экспериментов является важной областью в развитии любой науки, так как от точности данных будет зависеть многое. Именно поэтому развитие хемомертии является важным вопросов в развитии химии, и в свою очередь очень актуальным.

Моей задачей является изучить различные источники справочной информации (книги, статьи и различные образовательные сайты) для получения ответов на вопросы: «что же такое хемометрия или хемометрика?», «для чего она необходима?» и «кто занимается развитием этой науки в России?».






Глава 1. О ХЕМОМЕТРИИ

Хемометрия (от англ. chemistry — «химия», и -metrics как в «эконометрике» или «психометрии») — раздел аналитической химии, ставящий целью получение химических данных с помощью математических методов обработки и добычи данных.

Для решения различных задач в последнее время все чаще используют хемометрический подход к анализу. Хемометрия, первоначально основанная на использовании методов математики в химии, в настоящее время широко используется в смежных областях наук: физике, биологии, медицине, косметологии, фармакологии, где необходимо анализировать большие объемы данных и искать различные типы формул.

Отвечая на вопрос: «что же такое хемометрия или хемометрика и кто занимается развитием этой науки в России?» мы можем сказать, что данной наукой занимается Российское хемометрическое общество (РХО) — это некоммерческая организация целью, которой является популяризация и развития хемометрики в России.

В проекте Устава Российского хемометрического общества даётся следующее определение хемометрики:

Хемометрика - это научная дисциплина, находящаяся на стыке химии и математики, предметом которой являются математические методы изучения химических явлений.

Данная дисциплина ис­поль­зу­ет ба­зо­вые ме­то­ды из смеж­ных об­лас­тей (стати­сти­ка, при­клад­ная ма­те­ма­ти­ка, ин­фор­ма­ти­ка) для ре­ше­ния про­блем, от­нося­щих­ся к хи­мии, био­хи­мии, ме­ди­ци­не, био­ло­гии и тех­но­ло­гии. Хемометрика за­ро­ди­лась в 1974 как раз­дел ана­ли­ти­че­ской хи­мии, ко­то­рая до сих пор ос­та­ёт­ся главным по­тре­би­те­лем ме­то­дов хемометрии. Сей­час хемометрия ак­тив­но при­меня­ет­ся для ре­ше­ния различных при­клад­ных за­дач, ес­ли есть не­об­хо­ди­мость в ана­ли­зе боль­ших дан­ных и по­ис­ке за­ко­но­мер­но­стей.


Главный прин­цип хемометрии – ис­поль­зо­ва­ние мно­го­мер­но­го под­хо­да при пла­ни­ро­ва­нии экс­пе­ри­мен­та и ана­ли­зе его ре­зуль­та­тов, что по­зво­ля­ет умень­шить не­оп­ре­де­лён­ность ре­зуль­та­та за счёт уве­ли­че­ния чис­ла пе­ре­мен­ных. Вы­яв­ле­ние в дан­ных по­лез­ной ин­фор­ма­ции, то есть от­де­ле­ние её от не­со­дер­жа­тель­ной ин­фор­ма­ции, на­зы­вае­мой шу­мом, все­гда про­во­дит­ся с учё­том по­став­лен­ных це­лей.

Мно­го­мер­ность и шум при­во­дят к то­му, что в дан­ных про­яв­ля­ют­ся не сис­те­ма­ти­че­ские (или при­чин­ные), а слу­чай­ные (или называемые кор­ре­ля­ци­он­ные) свя­зи ме­ж­ду пе­ре­мен­ны­ми. Для вы­яв­ле­ния свя­зей ис­поль­зу­ют­ся про­ек­ци­он­ные ме­то­ды, та­кие как ме­тод глав­ных ком­по­нент (principal component analysis, PCA) и ме­тод про­ек­ций на ла­тент­ные пе­ре­мен­ные (projection on latent structures, PLS).

В хемометрике при­ме­ня­ют­ся в основном фор­маль­ные мно­го­фак­тор­ные ли­ней­ные мо­де­ли, ко­то­рые по­лез­ны в тех слу­ча­ях, ко­гда нель­зя ис­поль­зо­вать со­дер­жа­тель­ный фи­зи­ко-хи­мический под­ход. При­ме­ни­мость фор­маль­ных мо­де­лей под­твер­жда­ет­ся эм­пи­ри­че­ски с по­мо­щью не­за­ви­си­мо­го про­ве­роч­но­го на­бо­ра или ме­то­дом пе­ре­крё­ст­ной про­вер­ки.


  1. Ме­тод глав­ных ком­по­нент (Principal Component Analysis, PCA)

Метод Главных Компонент (англ. Principal Components Analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен Карлом Пирсоном в 1901 г. Применяется во многих областях, таких как распознавание образов, компьютерное зрение, сжатие данных и т. п.

Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к сингулярному разложению матрицы данных. Иногда метод главных компонент называют преобразованием Кархунена-Лоэва  или преобразованием Хотеллинга.

Другие способы уменьшения размерности данных — это метод независимых компонент, многомерное шкалирование, а также многочисленные нелинейные обобщения: метод главных кривых и многообразий, поиск наилучшей проекции (англ. Projection Pursuit), нейросетевые методы «узкого горла», самоорганизующиеся карты Кохонена и др.

Задача анализа главных компонент, имеет, как минимум, четыре базовых версии:

  • аппроксимировать данные линейными многообразиями меньшей размерности;

  • найти подпространства меньшей размерности, в ортогональной проекции на которые разброс данных (т.е. среднеквадратичное уклонение от среднего значения) максимален;

  • найти подпространства меньшей размерности, в ортогональной проекции на которые среднеквадратичное расстояние между точками максимально;

  • для данной многомерной случайной величины построить такое ортогональное преобразование координат, что в результате корреляции между отдельными координатами обратятся в ноль.

Первые три версии оперируют конечными множествами данных. Они эквивалентны и не используют никакой гипотезы о статистическом порождении данных. Четвёртая версия оперирует случайными величинами. Конечные множества появляются здесь как выборки из данного распределения, а решение трёх первых задач — как приближение к «истинному» преобразованию Кархунена – Лоэва. При этом возникает дополнительный и не вполне тривиальный вопрос о точности этого приближения.

Метод главных компонент — наиболее популярный метод сокращения размерности во многих приложениях, в том числе в следующих областях:

  • Визуализация данных;

  • Компрессия изображений и видео;

  • Подавление шума на изображениях;

  • Индексация видео;

  • Биоинформатика;

  • Хемометрика;

  • Психодиагностика;

  • Общественные науки (включая политологию);

  • Сокращение размерности динамических моделей (в том числе — в вычислительной гидродинамике).


  1. Метод про­ек­ций на ла­тент­ные пе­ре­мен­ные (projection on latent structures, PLS)

Проекция на латентные переменные или на скрытые структуры (PLS) - это первый шаг, который мы предпримем для расширения методов скрытых переменных с использованием более одного блока данных. В методе PLS мы делим наши переменные (столбцы) на два блока:X а также Y,

Обучение тому, как выбирать переменные в каждом блоке, станет очевидным позже, но сейчас вы можете использовать эмпирическое правило, которое гласит: X принимает переменные, которые всегда доступны при использовании модели, в то время как Y принимает переменные, которые не всегда доступны . Обе X а также Y должен быть доступен при построении модели, но позже, при использовании модели, только X необходимо. Как вы можете догадаться, одним из основных применений PLS является прогнозирование переменных в Y используя переменные в X, но это не единственное его назначение в качестве модели. Это очень хорошая модель для понимания процесса и устранения неполадок.

PLS может использоваться для мониторинга процесса и оптимизации производительности процесса. Он также широко используется для разработки новых продуктов или для улучшения существующих продуктов. Во всех этих случаях Y  блок чаще всего содержит результат или качественные свойства.

Тем не менее, PLS чаще всего используется для прогнозирования. И это также хороший способ представить PLS. В (химических) технологических процессах мы используем его для разработки программных датчиков (также известных как логические датчики), которые в реальном времени прогнозируют трудоемкие лабораторные измерения, используя оперативные данные наших процессов. В лабораториях мы используем спектральные данные (например, NIR-спектры), чтобы предсказать состав жидкости; это известно как проблема калибровки; После калибровки образцов известного состава мы можем предсказать состав будущих образцов.



Глава 2. ПОДРАЗДЕЛЫ ХЕМОМЕТРИКИ

Не­ко­то­рые круп­ные под­раз­де­лы хемометрики вы­де­ли­лись в са­мо­стоятоятельные на­учные дис­ци­п­ли­ны, например мо­ле­ку­ляр­ное мо­де­ли­ро­ва­ние (QSAR), хе­мо­ин­фор­ма­ти­ка, а так­же во­шли в та­кие дис­ци­п­ли­ны, как ге­но­мика, про­те­о­ми­ка, ме­та­бо­ло­ми­ка, ста­ти­стический и ана­ли­тический кон­троль про­цессов.

  1. Мо­ле­ку­ляр­ное мо­де­ли­ро­ва­ние (QSAR)

Молекулярное моделирование (ММ) — собирательное название методов исследования структуры и свойств молекул вычислительными методами с последующей визуализацией результатов, обеспечивающие их трехмерное представления при заданных в расчете условиях.

Методы молекулярного моделирования используются в компьютерной химии, вычислительной биологии и науке о материалах для изучения как индивидуальных молекул, так и взаимодействия в молекулярных системах.

Расчеты простейших систем при молекулярном моделировании могут быть выполнены вручную, но из-за большого объема вычислений при моделировании систем, представляющих практический интерес, особенно при исследовании молекулярной динамики, используются компьютерные методы расчета и визуализации, эта техника получила название компьютерного молекулярного моделирования (англ. computer-assisted molecular modeling, CAMM).

Общей чертой методов ММ является атомистический уровень описания молекулярных систем — наименьшими частицами являются атомы или небольшие группы атомов. В этом состоит отличие ММ от квантовой химии, где в явном виде учитываются и электроны. Таким образом, преимуществом ММ является меньшая сложность в описании систем, позволяющая рассмотрение большего числа частиц при расчётах.





  1. Хемоинформатика

Хемоинформа́тика (от хе­мо… и ин­фор­ма­ти­ка), об­ласть хи­мии, ох­ва­ты­ваю­щая при­ме­не­ние ме­то­дов ин­фор­ма­ти­ки для ре­ше­ния ши­ро­ко­го кру­га хи­мических за­дач, свя­зан­ных с изу­че­ни­ем ве­ществ, их струк­ту­ры, свойств и пре­вра­ще­ний.

Хемоинформатика офор­ми­лась как ком­плекс­ная меж­дис­ци­п­ли­нар­ная об­ласть нау­ки на ру­бе­же 20–21 вв. в ре­зуль­та­те раз­ви­тия та­ких на­прав­ле­ний ис­сле­до­ва­ний, как хра­не­ние и об­ра­бот­ка хи­мической ин­фор­ма­ции, ма­те­ма­тическая хи­мия, ана­лиз свя­зи струк­ту­ры со­еди­не­ний с их свой­ст­ва­ми и био­ло­гической ак­тив­но­стью, мо­ле­ку­ляр­ное мо­де­ли­ро­ва­ние, ана­лиз экс­пе­риментальных дан­ных, кон­струи­ро­ва­ние со­еди­не­ний с за­дан­ны­ми свой­ст­ва­ми и оп­ти­ми­за­ция ус­ло­вий ре­ак­ций. Это свя­за­но со зна­чительной общ­но­стью и взаи­мо­свя­зью ре­шае­мых за­дач и при­ме­няе­мых ме­то­дов, а так­же не­об­хо­ди­мо­стью ра­бо­ты с ог­ром­ны­ми объ­ё­ма­ми раз­но­род­ной ин­фор­ма­ции.

На­ря­ду с ме­то­да­ми хи­мии и ин­фор­ма­ти­ки в хемоинформатике ак­тив­но при­ме­ня­ют­ся дос­ти­же­ния многих раз­де­лов ма­те­ма­ти­ки, фи­зи­ки, био­ло­гии, ме­ди­ци­ны.

Ба­зо­вую роль в ней иг­ра­ют ме­то­ды пред­став­ле­ния и об­ра­бот­ки хи­мической ин­фор­ма­ции:

  • эф­фек­тив­ное ко­ди­ро­ва­ние струк­тур­ных фор­мул и про­стран­ст­вен­ных струк­тур со­еди­не­ний, хи­мических ре­ак­ций (транс­фор­ма­ций струк­тур), а так­же свя­зан­ных с ни­ми дан­ных различных ти­пов (ло­ги­че­ские, чи­сло­вые, тек­сто­вые, спек­траль­ные и др.);

  • ра­бо­та с со­дер­жа­щи­ми та­кую ин­фор­ма­цию ба­за­ми дан­ных (вклю­чая её хра­не­ние, по­иск по струк­ту­рам, струк­тур­ным фраг­мен­там и др. по­лям, пе­ре­да­чу и мо­ди­фи­ка­цию);

  • ана­лиз и об­ра­бот­ка хи­мических тек­стов, в т. ч. на­зва­ний со­еди­не­ний; чис­лен­ное опи­са­ние струк­ту­ры со­еди­не­ний с по­мо­щью мо­ле­ку­ляр­ных де­ск­рип­то­ров;

  • ана­лиз и ви­зуа­ли­за­ция хи­мического про­стран­ст­ва как со­во­куп­но­сти воз­мож­ных мо­ле­кул, вклю­чая ге­не­ра­цию струк­тур, оцен­ку их сход­ст­ва и раз­но­об­ра­зия.

К чис­лу за­дач мо­ле­ку­ляр­но­го мо­де­ли­ро­ва­ния при­над­ле­жат ви­зуа­ли­за­ция про­стран­ст­вен­ной и элек­трон­ной струк­ту­ры низ­ко­мо­ле­ку­ляр­ных со­еди­не­ний и мак­ро­мо­ле­кул, в т. ч. био­ло­ги­че­ских (мо­ле­ку­ляр­ная гра­фи­ка), а так­же мо­де­ли­ро­ва­ние их струк­ту­ры и меж­мо­ле­ку­ляр­ных взаи­мо­дей­ст­вий с при­ме­не­ни­ем ме­то­дов кван­то­вой хи­мии и мо­ле­ку­ляр­ной ме­ха­ни­ки, мо­ле­ку­ляр­ной ди­на­ми­ки и различных по­лу­эм­пи­рических и эв­ри­стических под­хо­дов (мо­ле­ку­ляр­ный до­кинг, фар­ма­ко­фор­ные мо­де­ли и др.).

Хемоинформатика так­же изу­ча­ет за­да­чи ана­ли­за экс­пе­риментальных хи­мических дан­ных с це­лью вы­яв­ле­ния в них за­ко­но­мер­но­стей и по­строе­ния пред­ска­за­тель­ных мо­де­лей с при­ме­не­ни­ем ме­то­дов ста­ти­стического ма­шин­но­го обу­че­ния.

Важ­ное ме­сто в ней за­ни­ма­ют ме­то­ды мо­де­ли­ро­ва­ния свя­зи струк­ту­ры со­еди­не­ний с их свой­ст­ва­ми и про­гно­зи­ро­ва­ния для но­вых со­еди­не­ний та­ких свойств, как фи­зи­ко-хи­мические ха­рак­те­ри­сти­ки и спек­траль­ные свой­ст­ва, ре­ак­цион­ная спо­соб­ность, био­ло­гическая ак­тив­ность, по­ве­де­ние в ор­га­низ­ме и др.

Хемоинформатика раз­ра­ба­ты­ва­ет ме­то­ды по­ис­ка оп­ти­маль­ных ре­ше­ний как в хи­мическом про­стран­ст­ве (мо­ле­ку­ляр­ный ди­зайн со­еди­не­ний с за­дан­ны­ми свой­ст­ва­ми и/или био­ло­гической ак­тив­но­стью, ди­зайн биб­лио­тек струк­тур, оп­ре­де­ле­ние струк­ту­ры со­еди­не­ний на ос­но­ве дан­ных фи­зи­ко-хи­мических ме­то­дов ана­ли­за, пла­ни­ро­ва­ние син­те­за), так и в про­стран­ст­ве различных не­струк­тур­ных па­ра­мет­ров хи­мических про­цес­сов (пла­ни­ро­ва­ние экс­пе­ри­мен­тов, оп­ти­ми­за­ция ус­ло­вий ре­ак­ций, управ­ле­ние тех­но­ло­гичными про­цес­са­ми).


  1. Геномика

Геномика – это направление биологии исследующее структуру и функцию нуклеотидных последовательностей геномов живых организмов широком смысле: структурная геномика - последовательность нуклеотидов, наличия их модификаций, взаимодействий с белками, функциональная геномика - реалиация генетической информации, систематическая геномика - использование последовательностей специфических участков ДНК для уточнения систематического положения живых организмов. Ресурсный центр предоставляет возможность секвенирования на нескольких различных платформах. Сэнджеровское (капиллярное) секвенирование - классический метод, позволяющий одновременно проводить небольшое количество сиквенсов. Массивное параллельное секвенирование следующего поколения (NGS) доступно на двух платформах Roche 454 GS Junior и ABI Ion Torrent. В центре имеется оборудование для приготовления библиотек под NGS, в связи с этим, центр консультирует пользователей по возможностям оборудования и разработке подходящего экспериментального дизайна.

Помимо секвенирования, в центре доступно оборудование для количественного ПЦР (qPCR) и генотипирования. Центр консультирует по выбору подходящей платформы и расходных материалов, также как и по всем аспектам от разработки экспериментального дизайна до анализа данных. Цифровая ПЦР (DD-PCR) лучшим образом подходит для поиска одиночных полиморфизмов (SNP) и количественного ПЦР. Микрофлуидная система высокопроизводительного ПЦР (Fluidigm) является инструментом выбора для проектов, включающих большое количество измерений генной экспрессии.

Несмотря на бурное развитие направления исследований, отвечающего на вопросы «что?» и «как?» происходит в эксперименте, во многих случаях требуется отвечать на вопрос «где?» — уточнять локализацию описываемых изменений экспрессии генов. Особенно востребована такая задача в биологии развития и нейробиологии. Для реализации этого направления исследований доступна роботизированная платформа для проведения флуоресцентной in-situ гибридизации (FISH). Выделение микроучастков препарата для последующего анализа с максимальной чистотой возможно с использованием бесконтактного комплекса лазерной микродиссекции.

Важной вехой бурного развития геномики явилась доступность вычислительных ресурсов и появления специализированного программного обеспечения для задач биоинформатики. Для обработки получаемых в ходе количественного ПЦР, высокопроизводительного ПЦР, секвенирования, данных, центр обеспечивает доступ к соответствующим вычислительным ресурсам и программному обеспечению.

  1. Протеомика

Протеомика — исследование белковых молекул, их аминокислотной последовательности, пространственной структуры, посттрансляционных модификаций. В центре это направление представлено оборудованием для масс-спектрометрии, хроматографии, анализа биомолекулярных взаимодействий.

Имеющееся оборудование для масс-спектрометрии может быть использовано для поисковых и полуколичественых исследований, идентификации одновременно нескольких белков или пептидов в составе сложных смесей, определения аминокислотной последовательности белков, наличия посттрансляционных изменений, выявления и идентификации биомаркеров различной органической природы, проведения молекулярной визуализации тканей, идентификации микроорганизмов.

Хроматографическое оборудование позволяет разделять белки и пептиды в составе сложных смесей по ряду параметров, проводить очистку интересующего белка, проводить оценку качества очистки белков и олигонуклеотидов.

Анализ биомолекулярных взаимодействий, поиск и ранжирование антител, картирование эпитопов, изучение взаимодействий белков другими белками, малыми молекулами и нуклеиновыми кислотами в растворе проводится на установке использующей эффект поверхностного плазмонного резонанса. Определение скорости диффузии белков, их концентрации и взаимодействия в живых клетках может быть проведено на конфокальном микроскопе, оснащённом для флуоресцентной корреляционной спектроскопии.

Определение пространственной структуры изучаемых белков и их комплексов в нативном гидратированном состоянии возможно с использованием метода витрификации на сеточках (bare-grid plunge freeze) и последующей электронной микроскопии с анализом единичных частиц (single particle analysis).

Для пробоподготовки образцов к исследованию на сложном аналитическом оборудовании в центре предусмотрено рутинное оборудование для гомогенизации и лизиса образцов, их очистки и концентрации, фракционирования при помощи хроматографии, одномерного и двумерного электрофореза, иммуноблоттинга, препаративного электрофореза.

Некоторые задачи структурной протеомики, такие, как исследование с применением рентгено-диффракционного подхода, ядерно-магнитного резонанса, а также задачи, требующие значительных вычислительных ресурсов могут быть решены при помощи оборудования


  1. Метаболомика

Метаболомика изучает конечные и промежуточные продукты обмена веществ в клетке. Метаболомный анализ в настоящее время рассматриваться как одно из самых перспективных направлений развития молекулярных методов в области системной биологии.

Современная метаболомика далеко вышла за рамки рамки постгеномного анализа и оценки раннего фенотипического отклика. Биохимическое состояние системы, описываемое метаболитным профилем, вполне может выступать в роли альтернативного взгляда на биологический объект. Оценка устойчивости и динамики таких состояний может сопровождать практически любой биологический эксперимент, мониторинг или наблюдение. При этом полученные данные могут существенно помочь в понимании процессов, происходящих на молекулярном уровне и даже дать ключ к возможности реализации управления этими процессами. Залогом успеха применения подобного подхода является возможность одновременной качественной и количественной характеристики очень большого числа малых биомолекул в исследуемом образце (по некоторым оценкам среднее число компонентов метаболитной сети составляет более 5000 соединений). Метаболитный профайлинг может дать очень интересную информацию о состоянии и поведении сложных динамических систем, которыми, по сути, и являются биологические объекты. Для его успешной реализации необходима аналитическая техника высокого класса включая хроматоргафическое и масс-спектрометрическое оборудование, представленное в ресурсном центре.

Установленное оборудование для газовой хромато-масс-спектрометрии позволяет проводить анализ таких веществ, как:

  • сахара и их производные

  • аминокислоты

  • другие органические кислоты

  • гормоны растений (ауксин, салициловая кислота, этилен, абсцизовая кислота)

  • воски (сложные эфиры высших жирных кислот и высшие высокомолекулярные спирты) 

Установленное оборудование для жидкостной хромато-масс-спектрометрии позволяет проводить анализ:

  • белков

  • пептидов ( пептидные гормоны, цитокины, тахикины)

  • глюкозинолатов

  • фенольных производных




Глава 3. ОСНОВНЫЕ НАПРАВЛЕНИЯ ХЕМОМЕТРИИ

В хемометрии вы­де­ля­ют три основных на­прав­ле­ния:

  • Гра­дуи­ров­ка (ка­либ­ров­ка);

  • Клас­си­фи­ка­ция;

  • Раз­де­ле­ние кри­вых – метод разделения составного сигнала (например, в спектроскопии) на составные части (так называемые чистые спектры).

В хемометрике раз­ви­ва­ют­ся и другие на­прав­ле­ния: пла­ни­ро­ва­ние экс­пе­ри­мен­та, мет­ро­ло­гия, кон­троль ка­че­ст­ва, тен­зор­ный ана­лиз.


  1. Градуировка (калибровка)

Гра­дуи­ров­ка (ка­либ­ров­ка) – ме­тод, мо­де­ли­рую­щий при­чин­ные свя­зи ме­ж­ду дву­мя бло­ка­ми пе­ре­мен­ных (X и Y) с це­лью пред­ска­за­ния зна­че­ний пе­ре­мен­ных Y по из­вест­ным зна­че­ни­ям пе­ре­мен­ных X.

Суть задачи калибровки состоит в следующем. Пусть имеется некоторая переменная (свойство) y, величину которой необходимо установить. Однако, по ряду обстоятельств (недоступность, дороговизна, длительность), прямое измерение величины y невозможно. В то же время можно легко (быстро, дешево) измерить другие величины: x=(x1,x2,x3,…), которые связаны с искомой величиной y. Задача калибровки состоит в установлении количественной связи между переменными x и откликом y. 

y=f(x1,x2,x3,…|a1,a2,a3,…)+ϵ

На практике это означает:

  1. подбор вида зависимости f,

  2. оценку неизвестных параметров a1,a2,a3,… в этой калибровочной зависимости.

Разумеется, калибровку нельзя построить абсолютно точно. Это не только невозможно, но и опасно. В калибровочной зависимости всегда присутствуют погрешности (ошибки) ε, источник которых – пробоотобор, измерения, моделирование, и т.д.

Простейший пример калибровки дает общеизвестный прибор, называемый безменом, т.е. пружинные весы. Искомая величина y – это вес образца, а x – это удлинение пружины весов. 

Процедура калибровки очень проста – взвешиваем стандартный образец весом в 1 кг и отмечаем на шкале удлинение пружины, затем используем образец в 2 кг, и т.д. В результате этой калибровки (точнее, градуировки) получается шкала, по которой можно определить вес нового, нестандартного образца.

Этот элементарный пример демонстрирует основные черты процедуры калибровки. Во-первых, для калибровки необходимы несколько стандартных образцов, для которых величины y известны заранее. Во-вторых, диапазон, в котором предполагается измерять показатель y, должен полностью покрываться этими калибровочными образцами. Действительно, нельзя измерять образцы весом более 5 кг, если в калибровке использовались образцы, весом менее чем 5 кг.

Разумеется, на практике все обстоит не так просто, как в этом элементарном примере. Например, в калибровке может участвовать не один показатель y (отклик), а несколько откликов y1,y2,…yK, которые нас интересуют.

Задача калибровки состоит в построении математической модели, с помощью которой можно в дальнейшем предсказывать значения показателей y1,y2,…yK, по новой строке значений аналитического сигнала x.


  1. Классификация

Клас­си­фи­ка­ция – ме­тод мо­де­ли­ро­ва­ния групп пе­ре­мен­ных (клас­сов) с це­лью вы­яв­ле­ния при­над­леж­но­сти но­во­го объ­ек­та к од­но­му или не­сколь­ким клас­сам.

Исходными данными для классификации является матрица , в которой каждая строка представляет один объект, а каждый столбец – одну из переменных. Эта матрица называется  исходным набором  данных. Число объектов (строк в матрице ) мы будем обозначать буквой I, а число переменных (строк в матрице ) – буквой J. Число классов мы будем обозначать буквой K.

Классификацией называют не только саму процедуру распределения, но и ее результат. Употребляется также термин распознавание образов (pattern recognition), который можно считать синонимом. В математической статистике классификацию часто называют дискриминацией.

Метод (алгоритм), которым проводят классификацию, называют классификатором. Классификатор переводит  вектор признаков объекта x в целое число, 1, 2, … , соответствующее номеру класса, в который он помещает этот объект.


  1. Планирование эксперимента

Планирование эксперимента (или активный эксперимент) в химии, раздел математической статистики, изучающий методы организации совокупности опытов с различными условиями для получения наиболее достоверной информации о свойствах исследуемого объекта при наличии неконтролируемых случайных возмущений.

Величины, определяющие условия данного опыта, обычно называются факторами (например, температура или концентрация), их совокупность - факторным пространством.

Набор значений факторов характеризует некоторую точку факторного пространства, а совокупность всех опытов составляет так называемый факторный эксперимент. Расположение точек в факторном пространстве определяет план эксперимента, который задает число и условия проведения опытов с регистрацией их результатов.

Начало планированию эксперимента положили труды P. Фишера (1935). Он показал, что рациональное планирование эксперимента дает не менее существенный выигрыш в точности оценок, чем оптимальная обработка результатов измерений.

Планирование эксперимента используют для изучения и математического описания процессов и явлений путем построения математических моделей (в форме так называемых уравнений регрессии) – соотношений, связывающих с помощью ряда параметров значения факторов и результаты эксперимента, называемые откликами. Основное требование, предъявляемое к планам факторного эксперимента, в отличие от пассивного эксперимента – минимизация числа опытов, при которой получают достоверные оценки вычисляемых параметров при соблюдении приемлемой точности математических моделей в заданной области факторного пространства. В этом случае задача обработки результатов факторного эксперимента заключается в определении численных значений указанных параметров.


  1. Метрология

Наука об измерениях, методах и средствах обеспечения их единства и способах достижения требуемой точности называется метрологией.

Метрологическая наука использует совокупность физических и математических методов обработки экспериментальных данных для получения из них достоверной информации.

Измерения бывают прямыми, когда объект непосредственно сопоставляется с носителем единицы измерения, и косвенными, когда измеряемая величина рассчитывается из других измеренных величин. Химия имеет дело только с косвенными измерениями. Поэтому воспроизведение процедуры обеспечения единства измерений, т. е. независимости результата измерений от времени, места, экспериментатора и т. д., химик может обеспечить только приблизительно.

Погрешность измерения – любое отличие результата измерений от истинного значения измеряемой величины.

Точность (достоверность) измерения характеризует малость погрешности, т. е. близость измеренной величины к истинной. Правильность (систематическая погрешность) – метрологическая категория, характеризующая малость систематической составляющей погрешности.

Воспроизводимость (случайная погрешность или разброс относительно среднего из результатов измерений) характеризует малость случайной составляющей погрешности.

В целях устранения систематических погрешностей химических измерений их удобно классифицировать следующим образом:

  1. систематические погрешности известной природы, значения которых могут быть рассчитаны apriori и учтены путем введения соответствующих поправок (в качестве примера можно привести необходимость учета зависимостей плотности и удельного объема воды от температуры);

  2. систематические погрешности известной природы, значения которых неизвестны, но могут быть оценены в ходе химического эксперимента или при постановке специального эксперимента (инструментальные погрешности, реактивные ошибки, погрешности индикаторов и стандартов, ошибки интерпретации, методические ошибки);

  3. систематические погрешности невыясненной природы, значения которых неизвестны (в этом случае в результате тщательного исследования необходимо найти источник погрешности, которая должна быть устранена).


  1. Контроль качества

Одной из важнейших задач, стоящих перед химической наукой в XXI веке, является совершенствование измерений, проводимых в химии и химической технологии. Вопросы измерений в целом — предмет метрологии, а проблемами измерений в химии занимается химическая метрология. Роль метрологии вообще и химической метрологии в частности постоянно растет. Это определяется логикой развития общества.

Развитие рыночных отношений неизбежно сопряжено с повышением требований к качеству продукции и эффективности производства. В химической промышленности это влечет за собой рост степени автоматизации, когда управление производственным процессом полностью или почти полностью осуществляется по результатам измерений физических величин (давление и температура в реакторах, масса и объем вводимых в реакторы веществ, концентрация веществ в реакционной смеси и конечных продуктах производства и т.д.). При этом качество исходной информации, т.е. точность измерения, прямо влияет на качество продукции. Ужесточение отношений "продавец—покупатель", "производитель-потребитель", перевод этих отношений на формально-правовую основу резко повышают требования к химическому анализу ("измерение химического состава") и измерениям других характеристик продуктов химического производства, причем особенно важным становится требование сопоставимости результатов измерений в разных лабораториях, что, собственно, и является предметом метрологии (обеспечение единства измерений).

Защита прав потребителей пищевых продуктов, других изделий и материалов также сопряжена с решением чисто метрологических проблем — обеспечением единства измерений в разных лабораториях и высокой точности этих измерений. Здесь речь идет главным образом о химическом анализе, а также о других видах лабораторных исследований пищевых продуктов. Аналогичные задачи обеспечения и контроля качества результатов химического анализа возникают при исследовании объектов окружающей среды, биологического и медицинского происхождения, в ходе научных исследований и т.д.

Как видно, метрологические проблемы существуют и требуют своего решения в большинстве областей профессиональной деятельности химиков. Для их решения постоянно развиваются действующие и создаются новые системы обеспечения и контроля качества, как измерений физических величин, так и химического анализа. Таким образом, метрология, смыкаясь с химическими дисциплинами, особенно с аналитической химией, проникает практически во все сферы деятельности химиков и химиков-технологов, и эффективность их профессиональной деятельности все больше зависит от умения решать метрологические задачи.

Особую роль метрологические аспекты играют в аналитической химии. Это связано с тем, что количественный химический анализ с метрологической точки зрения представляет собой сложное косвенное измерение, для выполнения которого применяется, как правило, несколько измерительных приборов и вспомогательных устройств, осложненное к тому же непосредственным вмешательством человека в процесс измерения (которое часто играет определяющую роль). В абсолютном большинстве случаев для химического анализа не удается построить корректную схему передачи размера единицы количества вещества от первичного эталона к рутинным пробам. Это невозможно либо по причине трудности создания такого эталона, либо (чаще всего) из-за отсутствия образцовых методов анализа, обеспечивающих передачу размера с требуемой точностью. Поэтому в химическом анализе широко используются специальные, отличающиеся от классических, способы обеспечения и контроля качества измерений. Специфика измерений в химическом анализе настолько велика, что для ее отражения потребовалась разработка специальной системы стандартов.


  1. Тензорный анализ

Тензорный анализ — обобщение векторного анализа, раздел тензорного исчисления, изучающий дифференциальные операторы, действующие на алгебре тензорных полей  дифференцируемого многообразия. Рассматриваются также операторы, действующие на более общие, чем тензорные поля, геометрические объекты: тензорные плотности, дифференциальные формы со значениями в векторном расслоении.

Наибольший интерес представляют операторы, действие которых не выводит за пределы алгебры, среди таковых:

  • ковариантная производная,

  • производная Ли,

  • внешняя производная,

  • тензор кривизны невырожденного, дважды ковариантного тензора.



Заключение

Что же такое хемометрия или хемометрика? Для чего она необходима хемометрика? Кто занимается развитием хамометрики в России?

Нам представляется, что развитие аналитики во всем мире будут определять следующие тенденции. Во-первых, объекты анализа станут более сложными и комплексными. Технологические потребности будут ставить перед аналитиками не частные вопросы – сколько вещества X в пробе, а общие вопросы – получится ли продукт нужного качества из этого сырья, или правильно ли развивается химическая реакция в этой колонке.

Во-вторых, методы анализа будут меняться таким образом, чтобы обеспечить получение необходимых данных не в лаборатории (at line), а непосредственно на производстве, в реальном времени (in line).

В-третьих, резко увеличится объем данных, которые повсеместно станут многомодальными и многомерными. Увеличится роль гибридных и композиционных методов анализа.

В-четвертых, искомая химическая информация будет очень глубоко спрятана в этих данных, и более того, она будет все менее формализована, что потребует применения самых изощренных методов ее извлечения.

В-пятых, изменится организация аналитического эксперимента – вместо исследования одной пробы в одном опыте, будет использоваться системный подход, в котором много разных проб автоматически испытываются одновременно разными методами, в разных условиях. Такой массовый компьютеризованный эксперимент, пример которого мы уже видим в технологии микрочипов, станет рутинной аналитической практикой.

В-шестых, акцент в аналитическом исследовании будет переноситься на биологические объекты и биохимические процессы, а также на исследование технологических процессов в целом.

Все эти тенденции, которые уже сейчас прослеживаются в аналитической химии, изменят и роль химика аналитика. Он неизбежно станет более аналитиком, чем химиком. Две главные задачи будут стоять перед этим исследователем.

Первая – как придумать, организовать, спланировать эксперимент с тем, чтобы получить данные, из которых, в принципе, можно получить нужную информацию. При этом искомой информацией может быть не количественный (концентрация) или качественный (да/нет) результат, а прогноз финального состояния исследуемой системы в будущем, после прохождения ее через много стадий химических и физических превращений.

Вторая – как извлечь эту информацию из данных, интерпретировать ее в категориях полезности и качества. Для решения этих задач исследователь должен, в значительной мере, использовать опыт и инструментарий хемометрики.

Все это свидетельствует о том, что хемометрика, как неотъемлемая часть аналитической химии, в значительной мере определяет направления ее развития. В 1825 году Огюст Конт (A. Comte), французский философ, основоположник позитивизма писал: – “Каждая попытка применить математические методы для исследования химических проблем должна рассматриваться как абсолютно абсурдная и противоречащая самому духу химии. Если математический анализ, когда-либо займет сколько-нибудь значительное место в химии – извращение, которое по счастью почти невероятно – это повлечет за собой повсеместно быстрое вырождение этой науки“.

Это пророчество, к счастью, оказалось неверным, и мы становимся свидетелями роста применения математических методов в аналитической химии и одновременного распространения этой науки далеко за пределы ее обычного ареала.

Если российские ученые хотят быть не только свидетелями, но и активными участниками этого процесса, нам необходимо предпринять срочные меры по развитию хемометрики. По нашему мнению, необходимо значительно усилить уровень преподавания хемометрики в университетах. Для этого нужно подготовить (написать или перевести) учебник по хемометрике, разработать несколько типовых программ обучения для химиков-аналитиков, технологов, инженеров и т.п. Считаем, что можно ставить вопрос о соответствующих специальностях в магистерских специализациях, а также в кандидатских и докторских Советах. И уж, конечно, надо незамедлительно решить вопрос о подписке на ведущие журналы в этой области: Journal of Chemometrics и Chemometrics and Intelligent Laboratory Systems, которые сейчас нельзя найти ни в одной российской библиотеке.

Несмотря на все имеющиеся объективные и субъективные трудности, мы с оптимизмом оцениваем перспективы развития хемометрики в России. Наблюдается растущий интерес к этой науке, как со стороны химиков-аналитиков, так и среди других специалистов – физиков и математиков.

Сравнивая современное положение дел с ситуацией, имевшей место еще пять-семь лет назад, нельзя не отметить значительный рост публикаций российских ученых в отечественных и международных журналах, посвященных хемометрике.

Аналитическая химия является разработчиком и носителем определенной идеологии и методологии, обеспечивает профессионализм в анализе. Последние 20 лет доказали, что включение хемометрики, как неотъемлемой части, в методологию химического анализа позволяет значительно расширить арсенал аналитических методов, сделать их более эффективными и быстрыми.

Хемометрика позволяет значительно расширить сферу применения аналитических методов, для этого необходимо тесное сотрудничество аналитиков с другими учеными: математиками, физиками, биологами.


БИБЛИОГРАФИЧЕСКИЙ СПИСОК

  1. Ро­дио­но­ва О. Е., По­ме­ран­цев А. Л. Хе­мо­мет­ри­ка: дос­ти­же­ния и пер­спек­ти­вы // Ус­пе­хи хи­мии. 2006. Т. 75. № 4;

  2. М.А. Шараф, Д.Л. Иллмэн, Б.Р. Ковальски. Хемометрика, Пер. с англ. М. Мир: 1987 [M. Sharaf, D. Illman, B. Kowalski. Chemometrics. NY: Wiley. 1986

  3. Ю.А. Золотов. Аналитическая химия: проблемы и достижения, М. Наука 1992

  4. Ю.В. ГрановскийУспехи и проблемы. Вест. МГУ Сер 2 Химия, 38, 211 (1997)

  5. Ю.А. Карпов, Т.М. Полховская. Стандартизация и метрология в металлургическом производстве: М. МИСИС 1989

  6. Ро­дио­но­ва О. Е., По­ме­ран­цев А. Л. Хе­мо­мет­ри­ка в аналитической химии. Институт химической физики им. Н.Н. Семенова РАН. (http://pca.narod.ru/chemometrics_review.pdf)

  7. По­ме­ран­цев А. Л. Хе­мо­мет­ри­ка в Excel. Томск, 2014;

  8. Practical guide to chemometrics / Ed. by P. Gemperline. 2nd ed. Boca Raton, 2006; 

  9. Chemoinformatics: A textbook / Ed. J. Gas­teiger, T. Engel. Weinheim, 2003;

  10. Handbook of chemoinformatics / Ed. J. Gasteiger. Weinheim, 2003. Vol. 1–4;

  11. Chemoinformatics and computational chemical biology / Ed. J. Bajorath. N. Y., 2011.



Информация из сети Интернет:

  1. https://bigenc.ru/chemistry/text/4664229 («Хемометрика» - 12.05.2020)

  2. https://chemometrics.ru// («Российское хемометрическое общество» - 13.05.2020)

  3. http://www.prometeus.nsc.ru/archives/exhibit2/chmetinf.ssi («Хемометрика и хемоинформатика» - 13.05.2020)

  4. https://bigenc.ru/chemistry/text/4664214 («Хемоинформитика» - 13.05.2020)

  5. https://rcs.chemometrics.ru/old/Tutorials/classification.htm («Классификация» -14.05.2020)

  6. http://window.edu.ru/catalog/pdf2txt/371/59371/29439 («Основы химической метрологии и хемометрики» - 15.05.2020)