Дисперсионным анализом именуется статистический способ анализа результатов от действия качественных факторов.
Пускай
— случайная величина, воображающая результативный показатель. Изучается воздействие фактора Ф на результативный показатель. Фактор Ф не поддается количественному измерению, он есть неизучаемым показателем. Этот фактор возможно поделить на рядуровней. (группу уровней).
Приведем примеры:
Пример 1.Интересуемся зависимостью количества выполненной работы за смену от трудящейся бригады. Результативным показателем
будет количество выполненной работы за смену. Трудящаяся бригада есть причиной Ф, а номер
трудящейся бригады есть уровнем
фактора Ф.
Пример 2.Изучаем влияние упаковки товара на количество реализации. Рассматривается пара различных видов упаковки одного и того же товара. Результативным показателем будет количество реализованного за сутки товара. Все виды упаковок перенумерованы. Упаковка есть причиной Ф. Вид упаковки с номером
будет
-м уровнем фактора Ф.
В однофакторном дисперсионном анализе исследуется влияние либо отсутствие влияния на результатирующий показатель одного качественного фактора.
Случайной величиной
будем обозначать результативный показатель, на протяжении опыта мы приобретаем значения данной случайной величины.
Пускай
— уровни фактора Ф. При каждом уровне фактора Ф производятся наблюдения. Обозначим через
итог
наблюдения при
-м уровне фактора Ф. Возможно совершено разное число наблюдений при различных уровнях фактора Ф. Предположим, что при
уровня фактора Ф произведено
наблюдений, тогда
значения результативного показателя при этих наблюдениях. Всего произведено
наблюдений при разных уровнях Ф. Опыт может проводиться какое количество угодно раз, исходя из этого
рассматриваются как случайные размеры.
Согласно данным опыта находятся групповые средние
и групповые выборочные дисперсии
Результаты опыта, групповые математические ожидания и групповые выборочные дисперсии комфортно расположить в таблице 7.1.
Таблица 7.1.
… | ||||
Уровень фактора Ф | ||||
Номер
наблюдения в столбце |
||||
… | ||||
… | ||||
… | … | … | … | … |
… | … | … | … | … |
Число наблюдений в группе | … | |||
Групповое среднее | … | |||
Групповая выборочная дисперсия | … |
Предварительные суждения о том, зависит ли результативный показатель от фактора Ф, возможно вынести сравнив групповые средние: в случае если различие между ними значительно, то, по-видимому, такая зависимость имеется. Но, мы имеем результаты одного опыта, а ответ на вопрос, существует ли зависимость результативного показателя от фактора, должен быть дан применительно к главной совокупности.
Пускай
— математическое ожидание результативного показателя при уровне
,
. В случае если при трансформации уровня фактора групповые математические ожидания не изменяются, то думаем, что результативный показатель не зависит от фактора Ф. Мы имеем лишь выборку из главной совокупности, сами значения
, нам не известны. Исходя из этого появляется задача проверки догадки:
(7.1)
Эта догадка проверяется лишь при исполнении последовательности требований:
1. При каждом уровне фактора наблюдения свободны и проводятся в однообразных условиях. Наблюдения свободны при различных уровнях фактора.
2. При каждом уровне фактора результативный показатель имеет обычный закон распределения с постоянной для каждого уровня дисперсий.
Итак,
свободны и нормально распределены, причем
,
Условия проведения опыта дают нам условие независимости случайных размеров, воображающих результативный показатель.
Применяя критерий Пирсона, возможно узнать, приемлема ли догадка о нормальности распределения.
Диагностику догадки равенства дисперсий результативного показателя при различных уровнях фактора возможно осуществить при помощи критерии Барлетта. Перейдем к описанию проверки догадки равенства дисперсий результативного показателя при различных уровнях фактора.
Обозначим
главную дисперсию результативного показателя при
-м уровне фактора,
Сами значения
нам не известны. Требуется проверить догадку
(7.2)
с заданным уровнем значимости
.
Перейдем к построению критерия.
Находим несмещенные оценки групповых дисперсий:
Вычисляем промежуточные размеры:
Определяем замечаемые значения критерия:
Величина
именуется критерием Барлетта. При гипотезе
и условии равенства дисперсий результативного показателя при различных уровнях фактора величина
имеет распределение, близкое к
— распределению с
степенью свободы.
Определим критическую область. Используем таблицу 3:определяются значения
, при которых выполняется соотношение
где
есть случайной величиной, распределенной по закону
с
степенями свободы.
Дано
и
по таблице 3 определяем критическую точку
Критической областью есть промежуток
В случае если
то догадку
(7.2) отвергаем. В случае если
, то догадка о равенстве дисперсий результативного показателя при различных уровнях фактора не противоречит итогам наблюдений с заданным уровнем значимости
Допустим, что требования 1 и 2 выполнены. Приступим к рассмотрению догадки
(7.1).
Вычислим среднее
всех замечаемых значений результативного показателя:
Величину
именуют общимсредним показателя
. Разброс замечаемых значений результативного показателя
возможно позван трансформацией уровня фактора Ф и изменчивостью значений случайных неконтролируемых факторов, воздействующих на
, каковые именуются остаточными.
Чем посильнее влияние фактора Ф не результативный показатель
, тем посильнее изменчивость групповых средних
и тем больше разброс их около неспециализированного среднего
. Показателем этого разброса помогает величина
Величина
именуется выборочной взвешенной дисперсией групповых средних.
При зафиксированном уровне фактора
, разброс наблюдений вызывается влиянием остаточного фактора, данный разброс измеряется групповой дисперсией
Находится среднее значение групповых дисперсий:
Неспециализированная вариация результативного показателя
измеряется неспециализированной выборочной дисперсией
Рассматривается среднее квадратов отклонений всех замечаемых значений от выборочного среднего
Неспециализированная выборочная дисперсия равна сумме выборочной взвешенной дисперсии групповых средних и средней групповых дисперсий:
.
Проверка догадки
(7.1) о равенстве групповых математических ожиданий основывается на сравнении размеров
и
В случае если догадка о равенстве групповых математических ожиданий верна, то величина
имеет F – распределение с числом степенной свободы
и
Случайная величина
подчиняется распределению Фишера с
степенями свободы. Это распределение именуют еще F – распределение с
степенями свободы. В таблице 4 приводятся правосторонние критические границы
этого распределения для различных значений степеней свободы:
Для различных значений
необходимо приводить соответствующие таблицы. В таблице 4 приводятся правосторонние критические значения
при
.
Согласно данным наблюдений вычислено
значение величины
Будем вычислять, что уровень значимости
Применяя таблицу 4, по степеням свободы
находим критическое значение
В случае если
то догадку
о равенстве групповых математических ожиданий отвергаем.
В случае если же
то догадка
о равенстве групповых математических ожиданий не отвергаем с уровнем значимости
В этом случае говорят, что влияние фактора Ф на результативный показатель
не подтвердилось выборочными наблюдениями.
Допустим, что фактор Ф воздействует на результативный показатель. Для измерения степени влияния применяют выборочный коэффициент детерминации
что показывает, какую долю выборочной дисперсии
образовывает выборочная дисперсия групповых средних. Итак, выборочный коэффициент детерминации показывает, какая часть неспециализированной выборочной дисперсии разъясняется зависимостью результативного показателя от фактора Ф.
Пример 1.Совершено 15 опробований, из них 4 – на первом уровне фактора, 6 – на втором и 5 – на третьем. Способом дисперсионного анализа при уровне значимости 0,05 проверить нулевую догадку о равенстве групповых средних. Предполагается, что выборки извлечены из обычных главных совокупностей с однообразными дисперсиями.
Номер опробований
|
Уровни фактора | ||
83 — Мат. статистика. Однофакторный дисперсионный анализ