Свежие записи
12 мая 2022

Автор: ГалинаРаздел: Анализ микроструктуры материалов

20 апреля 2022

Автор: ГалинаРаздел: Анализ микроструктуры материалов

14 апреля 2022

Автор: Раздел: Атомно-силовая микроскопия

28 марта 2022

Автор: ГалинаРаздел: Анализ микроструктуры материалов

09 февраля 2022

Автор: ВикторРаздел: Атомно-силовая микроскопия

24 января 2022

Автор: ВикторРаздел: Атомно-силовая микроскопия

01 декабря 2021

Автор: ГалинаРаздел: Анализ микроструктуры материалов

Подписка на новые статьи


Нажимая кнопку «Подписаться», вы принимаете условия «Соглашения на обработку персональных данных».

Спектральная предварительная обработка рамановских данных для количественного анализа

СЕН032021

Рамановская спектроскопия становится все более распространенным методом анализа технологических процессов в фармацевтической и химической промышленности благодаря неразрушающим измерениям, быстрому времени анализа и способности выполнять как качественный, так и количественный анализ.

Алгоритмы спектральной предварительной обработки обычно применяются к количественным спектроскопическим данным для улучшения спектральных характеристик при минимизации изменчивости, не связанной с рассматриваемым определяемым веществом. Понимание возможных этапов предварительной обработки и того, как их правильно применять, может быть пугающим для тех, кто не имеет формального опыта в хемометрике.

Цель этой статьи – осветить основные этапы предварительной обработки, относящиеся к рамановской спектроскопии, с примерами реальных применений, а также рассмотреть алгоритмы, доступные в программном обеспечении компаний B&W Tek и Metrohm, чтобы пользователь почувствовал себя комфортно, применяя их для построения количественных моделей комбинационного рассеяния.

Спектральная предварительная обработка рамановских данных

Спектральная предобработка используется для удаления или минимизации эффектов в спектральных данных, которые не связаны напрямую со спектральными изменениями, связанными с исследуемой системой. Предобработка также применяется для улучшения способности различать тонкие спектральные различия, такие как небольшая пиковая интенсивность или спектральные сдвиги. Ниже рассмотрены некоторые этапы предварительной обработки спектра, особенно актуальные для рамановских данных.

Коррекция (удаление) базовой линии

Удаление базовой линии или коррекция базовой линии (в программном обеспечении Vision называется отклонением от тренда «de-trend») особенно полезно при удалении переменных фонов, таких как флуоресценция или мешающий окружающий свет, из данных комбинационного рассеяния, когда в спектре все еще присутствуют четкие пики комбинационного рассеяния. Существует множество тонких математических подходов к удалению базовой линии, но обычно операнд включает в себя вычисление аппроксимации полинома методом наименьших квадратов для описания базовой линии спектра и последующее вычитание этой функции из спектра.

На рис. 1 показан пример коррекции базовой линии в программном обеспечении BWSpec, примененной к спектру порошка сажи. Углеродные образцы имеют различный фон и должны быть скорректированы по базовой линии перед дополнительным спектральным анализом, например, расчетом отношения интенсивностей полос D и G.

Рис. 1. Спектр образца углеродной сажи после применения коррекции базовой линии: перемещение ползунка (Lambda) изменяет степень полиномиальной аппроксимации.

Алгоритмы коррекции базовой линии доступны в программах BWSpec, BWIQ и Vision. Следует проявлять осторожность при применении коррекций базовой линии для больших наборов данных с различными уровнями базовых линий, так как одна аппроксимация не может быть оптимизирована для всех спектров в наборе. Вместо этого рекомендуется использовать производные для устранения исходных эффектов из наборов количественных данных.

Производные

Производные – это общие шаги предобработки как для данных комбинационного рассеяния, так и для БИК данных. Производные применяются к спектральным данным для улучшения спектральных характеристик и устранения базовых эффектов. Обычно используются производные первого и второго порядка, поскольку производные более высокого порядка могут усиливать нежелательный шум. Существует несколько операндов для взятия производных в программах от B&W Tek и Vision, но, безусловно, наиболее часто используемым для данных комбинационного рассеяния является производная Савицкого-Голая.

Производные Савицкого-Голая выполняются путем подбора полинома к короткому сегменту точек данных, а затем производная этой функции вычисляется в центральной точке сегмента. Сегмент часто называют «размером окна w». Как правило, лучше всего использовать окно большого размера, так как при небольшом размере окна генерируются более шумные данные, которые более чувствительны к небольшим изменениям рамановского сдвига.

На рис. 2 показано сравнение двух производных Савицкого-Голая первого порядка с разными размерами окна, примененными к одному и тому же набору данных; спектр с большим размером окна показывает значительно меньше шума, чем спектр с меньшим окном.

Рис. 2. Данные, обработанные с помощью 1-й производной СГ с окном w = 5 (сверху); данные, обработанные с помощью 1-й производной СГ с окном w = 25 (снизу). Спектры представляют собой образцы эмульгатора, используемого в пестицидах с увеличивающимся количеством исследуемого вещества.

Выбор области спектра

Модели могут быть построены по конкретным спектральным областям, чтобы исключить области, в которых мало информации или несвязанная изменчивость; это приводит к более простым моделям с меньшим количеством скрытых переменных. В программах BWIQ и Vision спектральные области можно выбирать вручную.

Обычно для построения рамановской модели достаточно выбрать всю характеристическую область спектра (обычно ≈ 200 – 1800 см-1). Опытный спектроскопист может выбрать более адаптированные области, но распространенной ошибкой при использовании многомерной регрессии является выбор слишком узкой области, которая содержит только функции, соответствующие интересующему исследуемому веществу.

Определение концентрации исследуемого вещества требует количественной оценки как самого вещества, так и эталона (всего остального). Поэтому, если включены только характеристики исследуемого вещества, в модели не будет эталона, и она может стать нестабильной. Это особенно выражено, если также применяется шаг предобработки в виде нормализации.

В качестве примера рассмотрим простую модель частичных наименьших квадратов (PLS) для количественного определения бензонитрила в смеси с циклогексаном. Модель состоит из 12 спектров от 6 образцов с концентрацией бензонитрила от 10% до 35% объемного содержания. Как показано на рис. 3, бензонитрил имеет сильный пик при 2232 см-1, который приписывается валентному колебанию связи C≡N нитрила.

Рис. 3. Необработанные рамановские спектры смеси бензонитрила и циклогексана.

 На рис. 4 показаны графики, полученные в результате расчетов и измерений для двух PLS моделей, созданных на основе имеющихся данных. Если выбран диапазон от 300 до 2300 см-1 (рис. 4а), получается модель с хорошей линейностью с очень низким среднеквадратичным отклонением 0.21%. С другой стороны, если выбрана узкая область 2150 – 2300 см-1 (рис. 4б), модель будет иметь плохую линейность и высокое среднеквадратичное значение ошибки 1.64%. Плохая производительность последней модели связана с отсутствием эталона, что приводит к идентичной спектральной интенсивности всех спектров после нормализации.

Рис. 4. а) PLS модель с выбранной областью анализа 300 – 2300 см-1 и б) PLS модель с выбранной областью анализа 2150 – 2300 см-1

Нормализация

На количественные рамановские модели сильно влияют флуктуации общей спектральной интенсивности. Колебания интенсивности могут возникать из-за многих факторов, таких как дрейф пропускной способности спектрометра, нестабильность мощности возбуждения, различия в длине пути и физические различия в позиционировании выборки образцов. Хотя за короткий период эти колебания можно предотвратить, в долгосрочной перспективе они неизбежны. Спектральная нормализация может эффективно устранять эффекты общего изменения интенсивности и, следовательно, является необходимым шагом для построения надежной регрессионной модели.

Существует много различных математических подходов к нормализации в спектроскопии. Стандартная нормальная переменная (SNV) и коррекция мультипликативного рассеяния (MSC) – два наиболее распространенных алгоритма нормализации для колебательной спектроскопии, которые доступны для использования в программах BWIQ и Vision.

Спектроскописты склонны отдавать предпочтение SNV перед MSC, потому что MSC – это поправка на разброс, основанная на среднем значении всего набора данных, в то время как SNV основывается на стандартном отклонении отдельного спектра образца и не зависит от всего набора данных.

На рис. 5 показаны спектры водных растворов, содержащих различные количества глюкозы и лактата. SNV применяется и сравнивается с ненормализованными данными с базовыми вариациями (вставка вверху справа). Выбор области спектра должен быть осуществлен до нормализации, чтобы исключенные области не учитывались.

Рис. 5. Набор данных комбинационного рассеяния глюкозы и лактата в воде с примененной SNV (вставка вверху справа показывает необработанные ненормализованные данные).

Центрирование по среднему

Центрирование путём вычитания среднего значения вычитает усредненный спектр набора данных из каждого спектра. Это необходимый шаг для моделей на основе PLS и PCA, поскольку оба метода анализируют дисперсию набора данных. BWIQ имеет отдельный шаг для центрирования по среднему и поэтому должен быть включен явно как этап предварительной обработки, в то время как программное обеспечение Vision центрирует тестовые спектры в неявной форме.

Пример реального использования спектральной предобработки

Рассмотрим пример реального применения, чтобы использовать информацию, которую мы узнали в предыдущем разделе. Тестовые данные были собраны с использованием рамановского портативного спектрометра QTRam, работающего по технологии пропускания TRS. Образцы представляют собой набор таблеток толщиной 3.0 мм, содержащих низкую дозу ацетаминофена (также известного как парацетамол), а также вспомогательные вещества целлюлозы, маннитола, МКЦ и стеарата магния. Концентрация ацетаминофена колеблется от 0 до 1.5 весовых %, а целевая концентрация составляет 0.5%, что соответствует целевой дозе 1.5 мг ацетаминофена на ≈ 300 мг таблетку. Чтобы построить модель для прогнозирования новых образцов на QTRam, калибровочные спектры были собраны с использованием времени интегрирования 3 секунды и при усреднении по 10 сканированиям.

На рис. 6 показаны необработанные данные; никакая другая предварительная обработка не применяется, кроме вычитания темнового шума и коррекции относительной интенсивности (см. дополнительную статью «Важность коррекции относительной интенсивности рамановских данных и способы ее использования для приборов серии i-Raman в программе BWSpec» в нашем блоге). Спектры были импортированы в BWIQ для обработки и создания PLS модели.

Рис. 6. Необработанные рамановские спектры таблеток тайленола, концентрация ацетаминофена в которых колеблется от 0 до 1.5 весовых %.

После сбора данных полезно сравнить спектры образцов со спектрами отдельных чистых компонентов. На рис. 7 показано сравнение образца, содержащего 1.5% ацетаминофена, со спектрами чистого ацетаминофена, целлюлозы и маннитола (характеристики МКЦ и стеарата магния слишком широкие или слишком слабые, чтобы их можно было различить визуально). Пики спектра образца (красный), отмеченные зелеными звездочками, связаны с ацетаминофеном в образце.

Рис. 7. Сравнение спектров образца таблетки с 1.5% содержанием парацетамола (красный), целлюлозы (синий), ацетаминофена (зеленый), маннитола (черный).

Шаги спектральной предобработки

Вспомогательные вещества в таблетках создают высокий фон флуоресценции при лазерном возбуждении на длине волны 785 нм. Коррекция базовой линии не рекомендуется для удаления фона флуоресценции в этом случае, поскольку не ожидается, что одно полиномиальное совпадение будет соответствовать каждому спектру. Вместо этого, как более простой метод, предпочтительнее использовать производную Савицкого-Голая. Производная первого порядка Савицкого-Голая (третья степень, w = 25) применяется к данным для удаления фона флуоресценции.

При просмотре спектров мы видим, что есть значительный сигнал комбинационного рассеяния в характеристической области спектра и никакого значительного сигнала за пределами 1800 см-1. Чтобы исключить ненужную спектральную область от 1800 до 2800 см-1 в модели, мы можем применить ручной выбор области спектра, чтобы указать только интересующую нас область в 200 – 1800 см-1 для создаваемой модели. Когда в BWIQ выбран шаг ручного выбора области спектра, программное обеспечение всегда перемещает его, чтобы он происходил до шага нормализации.

На рис. 8 показаны данные, обработанные после взятия 1-й производной Савицкого-Голая, ручного выбора области спектра и SNV нормализации. Сигнал при ≈ 860 см-1 и ≈ 1500 см-1 четко показывает изменение интенсивности, которое соответствует возрастающей концентрации ацетаминофена.

Рис. 8. Спектры, обработанные с помощью 1-й производной СГ, ручного выбора области и SNV. Спектры показывают четкие изменения интенсивности с увеличением концентрации ацетаминофена при ≈ 860 см-1 и 1500 – 1650 см-1, что соответствует пикам комбинационного рассеяния ацетаминофена.

В BWIQ центрирование по среднему применяется как отдельный шаг (в программе Vision это делается автоматически). Когда применяется данный шаг, спектры центрируются вокруг нулевой линии. На рис. 9 показан набор данных со всеми примененными алгоритмами предварительной обработки, включая центрирование по среднему. Обработанные данные теперь подходят для построения надежной PLS модели.

Рис. 9. Набор предварительно обработанных данных, включая центрирование по среднему.

В таблице 1 показаны шаги предварительной обработки, используемые в модели, а также их назначение. Применяя эти этапы предварительной обработки, надежную модель обычно могут создать даже те, кто еще плохо знаком с рамановской спектроскопией и не разбирается в хемометрике.

Таблица 1. Шаги спектральной предварительной обработки для построение модели.

Используемый алгоритм предобработки Цель
Производная первого порядка Савицкого-Голая (третья степень, w = 25) Удаление шумовой составляющей флуоресценции
Ручной выбор области спектра Указание интересующей спектральной области и удаление неинформативного сигнала
SNV нормализация Нормализация спектров относительно флуктуаций их интенсивности
Центрирование по среднему Удаление среднего из набора данных

Ссылки

  1. J. Huang, S. Romero-Torres and M. Moshgbar. American Pharmaceutical Review. 13, 116-127 (2010). 
  2. J.M. Shaver. Chemometrics for Raman Spectroscopy. In Handbook of Raman Spectroscopy: From the Research Laboratory to the Process Line; I.R. Lewis, H.G.M. Edwards, Eds.; Marcel Dekker, Inc.: New York, 2001; Vol. 28, pp 275-306.
  3. M.J. Pelletier. Appl. Spectroscopy. 57, 20A-42A. (2003)
  4. Руководство пользователя программного обеспечения Vision
  5. Руководство пользователя программного обеспечения BWIQ
  6. QTRam для анализа однородности состава
  7. QTRam для анализа однородности содержимого фармацевтических таблеток с низкой дозой
Предыдущая статья
АВГ272021

Автор: ВикторРаздел: Рамановская спектроскопия (спектроскопия комбинационного рассеяния)

Следующая статья
СЕН132021

Автор: ВикторРаздел: Тонкие пленки