Лекция № 15. Статистическая обработка результатов количественного анализа

При проведении количественного анализа обычно измеряют или определяют расчетным путем на основании проведенных измерений различные физические величины: массу вещества, концентрацию раствора, объем жидкости, интенсивность окраски вещества, оптическую плотность среды, окислительно-восстановительные потенциалы, показатели преломления света и другие аналитические сигналы.

Однако даже если строго соблюдены все требования, предусмотренные методикой, результаты отдельных независимых анализов одного и того же объекта все равно, как правило, несколько различаются. Эти различия целесообразно оценить количественно, чтобы понять, насколько достоверны найденные результаты. Подобная оценка обычно подразумевает получение метрологических характеристик на основе положений теории вероятности (теории ошибок).

Метрология (от греч. metron ‑ мера и logos ‑ слово, учение) — наука об измерениях и методах достижения их единства и требуемой точности. Один из основных разделов метрологии посвящен методам определения погрешности измерений и созданию эталонов.

Классификация погрешностей

Погрешностью измерения называют отклонение результата измерения от истинного значения измеряемой величины.

Погрешности могут быть классифицированы по нескольким признакам. При классификации по способу выражения различают абсолютные и относительные погрешности, по характеру проявления —систематические, случайные и грубые, по способу обработки результатов параллельных определений —средние арифметические и средние квадратичные и так далее.

Абсолютную погрешность анализа Δxопределяют из соотношения:

Δxхi x,

где xi— результат анализа; — истинное содержание анализируемого компонента в пробе.

Отношение абсолютной погрешности измерения к истинному значению измеряемой величины называют относительной погрешностью измерения.

Обычно относительную погрешность выражают в процентах, хотя могут быть использованы и доли единицы.

Истинное содержание анализируемого компонента в пробе остается неизвестным вследствие погрешности анализа. В практических расчетах вместо истинного используют так называемое действительное содержание, равное среднему арифметическому нескольких параллельных определений.

Погрешность измерения зависит от многих факторов: от класса точности применяемых приборов, методики измерения, индивидуальных особенностей наблюдателя и так далее.

Погрешность измерения, которая при повторных измерениях остается постоянной или закономерно изменяется, называют систематической погрешностью.

Знак данной систематической погрешности от опыта к опыту не меняется. Систематическая погрешность или только занижает, или только завышает результат.

Погрешность, которая при повторных измерениях изменяется случайным образом, называют случайной погрешностью измерения.

Знак случайной величины в серии измерений не остается постоянным и от опыта к опыту меняется.

Грубые погрешности, существенно превышающие ожидаемые при данных условиях, называют промахами.

Они обычно бывают следствием грубых оперативных погрешностей аналитика (потеря раствора с осадком при фильтровании, потеря осадка при прокаливании или взвешивании и так далее).

Систематические погрешности

Систематические погрешности обусловлены либо постоянно действующими причинами (и поэтому повторяются при многократном проведении анализа), либо изменяются по постоянно действующему закону.

Источники систематических ошибок

Невозможно с исчерпывающей полнотой перечислить все источники систематических ошибок. Основные источники систематических погрешностей следующие.

Методические —обусловлены особенностями методики анализа. Например, аналитическая реакция прошла не до конца; имеются потери осадка вследствие его частичной растворимости в растворе или при его промывании; наблюдается соосаждение примесей с осадком, вследствие чего масса осадка возрастает, и так далее.

Инструментальные —обусловлены несовершенством используемых приборов и оборудования. Так, например, систематическая погрешность взвешивания на лабораторных аналитических весах составляет ±0,0002 г. Систематическая погрешность в титриметрических методах анализа вносится вследствие неточности калибровки бюреток, пипеток, мерных колб, мерных цилиндров, мензурок и так далее.

Индивидуальные —обусловлены субъективными качествами аналитика. Так, например, дальтонизм может влиять на определение конечной точки титрования при визуальной фиксации изменения окраски индикатора.

Правильность результатов анализа определяется наличием или отсутствием систематических погрешностей.

Существуют следующие способы выявления систематических погрешностей. 

Использование стандартных образцов 

Общий состав стандартного образца должен быть близким к составу анализируемой пробы, а содержание определяемого компонента в стандартном образце должно быть точно известно.

Анализ стандартного образца — наиболее надежный способ выявления наличия или отсутствия систематической погрешности и оценки правильности результата анализа.

Анализ исследуемого объекта другими методами

Исследуемый объект анализируют методом или методами, которые не дают систематической погрешности (метрологически аттестованы), и сравнивают результаты анализа с данными, полученными при анализе того же объекта с использованием оцениваемой методики. Сравнение позволяет охарактеризовать правильность оцениваемой методики (или метода) анализа.

Метод добавок или метод удвоения — используют при отсутствии стандартных образцов и метрологически аттестованной методики (или метода) анализа.

Анализируют образец, используя оцениваемую методику. Затем удваивают массу анализируемой пробы или увеличивают (уменьшают) массу в иное число раз, снова находят содержание определяемого компонента в уже новой пробе и сравнивают результаты анализов.

Случайные погрешности

Случайные ошибки показывают отличие результатов параллельных определений друг от друга и характеризуют воспроизводимость анализа. Причины случайных погрешностей однозначно указать невозможно. При многократном повторении анализа они или не воспроизводятся, или имеют разные численные значения и даже разные знаки.

Некоторые понятия математической статистики и их использование в количественном анализе

Случайная величина (применительно к количественному анализу) — измеряемый аналитический сигнал (масса, объем, оптическая плотность и др.) или результат анализа.

Варианта —отдельное значение случайной величины, то есть отдельное значение измерения аналитического сигнала или определяемого содержания.

Генеральная совокупность —идеализированная совокупность результатов бесконечно большого числа измерений (вариант) случайных величин.

Относительная вероятность результатов в генеральной совокупности при выполнении химико-аналитических определений в большинстве случаев описывается функцией Гаусса (распределением Гаусса).

Однако на практике невозможно (да и не нужно) проводить бесконечно большое число аналитических определений, поэтому используют не генеральную совокупность, а выборочную совокупность — выборку.

Выборка (выборочная совокупность) —совокупность ограниченного числа статистически эквивалентных вариант, рассматриваемая как случайная выборка из генеральной совокупности. Другими словами, выборочная совокупность — это совокупность результатов измерений аналитических сигналов или определяемых содержаний, рассматриваемая как случайная выборка из генеральной совокупности, полученной в указанных условиях.

Объем выборки —число вариант п, составляющих выборку. При статистической обработке результатов количественного анализа используют выборку, описываемую распределением 

Стьюдента.

Распределением Стьюдента предпочтительно пользоваться при объеме выборки п < 20.

Правильностью измерений называют качество измерений, отражающее близость к нулю систематических погрешностей.

Сходимостью измерений называют качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях.

Более широкий смысл вкладывается в понятие «воспроизводимость».

Воспроизводимостью измерений называют качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях (в разное время, разными методами и так далее).

Точностью измерений называют качество измерений, отражающее близость их результатов к истинному значению измеряемой величины.

Высокая точность измерений соответствует малым погрешностям всех видов как систематическим, так и случайным. Количественно точность может быть выражена обратной величиной модуля относительной погрешности. Если, например, относительная погрешность измерения характеризуется значением 0,01 %, то точность будет равна 1/10-4 = 104.

Результат анализа, приближающийся к истинному содержанию компонента настолько, что может быть использован вместо него, следует называть действительным содержанием.

Статистическая обработка и представление результатов количественного анализа

Расчет метрологических параметров

На практике в количественном анализе обычно проводят не бесконечно большое число определений, а п = 56 независимых определений, то есть имеют выборку (выборочную совокупность) объемом 5 — 6 вариант. В оптимальном случае рекомендуется проводить 5 параллельных определений (объем выборки п 5).

При наличии выборки рассчитывают следующие метрологические параметры в соответствии с распределением Стьюдента.

Среднее, то есть среднее значение определяемой величины:

 

Среднее из конечной выборки отличается от действительного значения а (которое обычно не известно).

Доверительный интервал (доверительный интервал среднего) — интервал, в котором с заданной доверительной вероятностью Р находится действительное значение определяемой величины (генеральное среднее):

Доверительная вероятность Р —вероятность нахождения действительного значения определяемой величины а в пределах доверительного интервала. Изменяется от 0 до 1 или (что то же самое) от 0 % до 100 %. В фармацевтическом анализе при контроле качества лекарственных препаратов доверительную вероятностьчаще всего принимают равной Р == 0,95 = 95 % и обозначают как Р0,95При оценке правильности методик или методов анализа доверительную вероятность обычно считают равной Р = 0,99 = 99 %.

Численные значения рассчитаны для различных возможных величин Р и и табулированы в справочниках.

В табл. 1.1 приведены численные значения коэффициента Стьюдента, рассчитанные при разных величинах п и Р.

Чем больше п,тем меньше tP,sОднако при п > 5 уменьшение tP,s уже сравнительно невелико, поэтому на практике обычно считают достаточным проведение пяти параллельных определений (п = 5).

Исключение грубых промахов

Некоторые из результатов единичных определений (вариант), входящих в выборочную совокупность, могут заметно отличаться от величин остальных вариант и вызывать сомнения в их достоверности. Для того чтобы статистическая обработка результатов количественного анализа была достоверной, выборка должна быть однородной, то есть она не должна быть отягощена сомнительными вариантами — так называемыми грубыми промахами. Эти грубые промахи необходимо исключить из общего объема выборки, после чего можно проводить окончательное вычисление статистических характеристик.

Если объем выборки невелик 5 < п <10, то выявление сомнительных результатов анализа —исключение грубых промахов — чаще всего проводят с помощью так называемого Q-критерия. Для этого варианты xвначале располагают в порядке возрастания их численного значения от хдо хn, где п —объем выборки, то есть представляют в виде упорядоченной выборки. Затем для крайних вариант — минимальной хи максимальной хn —вычисляют величину пр формулам :

Q1 =

х2 ‑ x2

Q1 =

хn ‑ xn-1

R

R

где хи xп1 —значения вариант, ближайших по величине к крайним вариантам, а

xn ‑ x1

— размах варьирования, то есть разность между максимальным хи минимальным xзначениями вариант (между крайними вариантами), составляющих выборку.

Рассчитанные значения Qи Qсравнивают с табличными при заданных п и доверительной вероятности Р. Если рассчитанные значения Qили Q(или оба) оказываются больше табличных то варианты хили х(или обе) считаются грубыми промахами и исключаются из выборки.

Для полученной выборки меньшего объема проводят аналогичные расчеты до тех пор, пока не будут исключены все грубые промахи, так что окончательная выборка окажется однородной и не будет отягощена грубыми промахами.

Нормальное распределение

Анализ экспериментальных данных показывает, что большие по значению погрешности наблюдаются реже, чем малые. Отмечается также, что при увеличении числа наблюдений одинаковые погрешности разного знака встречаются одинаково часто. Эти и некоторые другие свойства случайных погрешностей описываются нормальным распределением или уравнением Гаусса:

где Ψ(х) — плотность вероятности; х — значение случайной величины; μ — генеральное среднее (математическое ожидание); σ2— дисперсия.

Равные по площади кривые нормального распределения 

Рис.1. Кривые нормального распределения при различной средней квадратичной погрешности

Как видно, чем больше стандартное отклонение (дисперсия), тем более пологой становится кривая.

Классическая теория погрешностей, основанная на нормальном распределении, нашла широкое применение в астрономии, геодезии и других областях, где выполняется большое число измерений одной величины. Однако при обработке данных по анализу вещества она оказалась недостаточно эффективной, так как обычно приводила к заниженным, слишком оптимистичным значениям погрешности. Действительно, в соответствии с законом нормального распределения вероятность появления малых погрешностей значительно больше, чем вероятность появления больших, поэтому при небольшом числе наблюдений (параллельных проб) большие погрешности обычно не появляются, что и приводит к занижению погрешности, если небольшое число результатов обрабатывать в соответствии с нормальным распределением. Более корректная величина погрешности получается при использовании статистики малых выборок, развивающейся с начала XX в. (— распределение, так называемое распределение Стьюдента и другие).

Рис. 2. Интегрирование уравнения Гаусса и пределах: а —μ ± σ (68,3% );б — μ ± 2 σ (95,0% );в — μ ± 3 σ (99,7%, )

При расчетах окончательный результат обычно округляют. Округление следует проводить с соблюдением определенных правил, так как излишнее округление может ухудшить результаты анализа, а вычисления с неоправданно большим числом десятичных знаков без округления требуют больших, но напрасных затрат труда, поскольку не улучшают реальной точности результата.

При округлении обычно придерживаются следующих правил. Если за последней округляемой стоит цифра меньше 5, округляемую цифру оставляют без изменения (округление с уменьшением), а если больше 5, округляемую цифру увеличивают на единицу (округление с увеличением), например 4,7252 округляют до 4,725, но 4,7257 округляют до 4,726. Несколько сложнее правила округления, когда за последней округляемой цифрой стоит 5. Если за этой цифрой 5 нет более никаких цифр, то округляют до четной цифры, например, 4,7255 — 4,726, но 4,7245 — 4,724. Если за цифрой 5 имеется еще какая-либо отличная от нуля цифра, то округляют с увеличением, однако если 5 получено уже в результате округления, то округляют с уменьшением, то есть 5 просто отбрасывают. Например, 4,72551  4,726, но 4,72548  4,7255 — 4,725.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *