Как рассчитать критерий Фишера в примере Excel

Обновлено: 21.11.2024

Численный пример линейного дискриминантного анализа (LDA)

Вот пример LDA. Мы собираемся решить линейный дискриминант, используя MS Excel. Вы можете скачать компаньон этого числового примера здесь.

Фабрика "АВС" производит очень дорогие и качественные чип-кольца, качество которых измеряется кривизной и диаметром. Результат проверки качества экспертами представлен в таблице ниже.

Кривизна

Диаметр

Результат контроля качества

В качестве консультанта фабрики вы получаете задание установить критерии автоматического контроля качества. Затем менеджер фабрики также хочет проверить ваши критерии на новом типе чип-колец, которые даже люди-эксперты спорят друг с другом. Новые стружечные кольца имеют кривизну 2,81 и диаметр 5,46.

Можно ли решить эту проблему с помощью дискриминантного анализа?

Решения

При построении объектов мы видим, что данные линейно разделимы. Мы можем провести линию, чтобы разделить две группы. Задача состоит в том, чтобы найти линию и повернуть объекты таким образом, чтобы максимально увеличить расстояние между группами и минимизировать расстояние внутри группы.

= характеристики (или независимые переменные) всех данных. Каждая строка (обозначенная ) представляет один объект; каждый столбец соответствует одной функции.

= группа объекта (или зависимой переменной) всех данных. Каждая строка представляет один объект и имеет только один столбец.

В нашем примере и

= данные строки. Например,

= количество групп в . В нашем примере = 2

= содержит данные для группы . Каждая строка представляет один объект; каждый столбец обозначает одну функцию. Мы разделяемся на несколько групп в зависимости от количества категорий в .

= среднее значение признаков в группе , которое является средним значением

= вектор глобального среднего, то есть среднее значение всего набора данных.

В этом примере

= средние скорректированные данные, то есть данные объектов для группы , минус глобальный средний вектор

= ковариационная матрица группы

= объединены в групповую ковариационную матрицу. Он рассчитывается для каждой записи в матрице. В нашем примере , и , поэтому

Инверсия сводной ковариационной матрицы

= вектор априорной вероятности (каждая строка представляет априорную вероятность группы). Если мы не знаем априорную вероятность, мы просто предполагаем, что она равна общей выборке каждой группы, деленной на общее количество выборок, то есть

Мы должны отнести объект к группе с максимальным значением

Результаты наших расчетов представлены в MS Excel, как показано на рисунке ниже.

Функция дискриминанта — это наши правила классификации для выделения объекта в отдельную группу. Если мы введем новые чип-кольца с кривизной 2,81 и диаметром 5,46, обнаружится, что они не проходят контроль качества.

Преобразовав все данные в дискриминантную функцию, мы можем вывести данные обучения и данные прогноза в новую координату. В дискриминантной строке представлены все данные дискриминантной функции и . В MS Excel вы можете удерживать клавишу CTRL, перетаскивая вторую область, чтобы выбрать обе области.

Для выборок любого заданного размера n оказывается, что r не имеет нормального распределения, когда ρ ≠ 0 (даже когда совокупность имеет нормальное распределение), поэтому мы не можем использовать свойство 1 из корреляционного тестирования через t-тест.

Однако существует простое преобразование r, позволяющее обойти эту проблему и проверить, соответствует ли ρ = ρ0 для некоторого значения ρ0 0.

Определение 1. Для любого r определите преобразование Фишера для r следующим образом:

Свойство 1: если x и y имеют совместное двумерное нормальное распределение или n достаточно велико, то преобразование Фишера r' коэффициент корреляции r для выборок размера n имеет нормальное распределение со средним значением ρ′ и стандартным отклонением sr′ где

Следствие 1. Предположим, что r1 и r2 такие же, как в свойстве 1, где r 1 и r2 основаны на независимых выборках и дополнительно предполагают, что ρ1 = ρ2.Если z определяется следующим образом, то z ~ N(0, 1).

Доказательство: из свойства 1

где s определено выше. Так как ρ1 = ρ2, то , а значит ~ N(0,s ), из которого следует, что z ~ N(0,1).

Функции Excel: Excel предоставляет следующие функции, которые вычисляют преобразование Фишера и обратное ему.

Наблюдение: мы можем использовать теорему 1 для проверки нулевой гипотезы H0: ρ = ρ0. Этот тест очень чувствителен к выбросам. Если присутствуют выбросы, может быть лучше использовать критерий ранговой корреляции Спирмена или тау-критерий Кендалла.

Следствие можно использовать для проверки того, взяты ли две выборки из совокупностей с одинаковыми корреляциями.

Пример 1. Предположим, мы вычислили r = 0,7 для выборки размером n = 100. Проверьте следующую нулевую гипотезу и найдите доверительный интервал 95 %.< /p>

sr′ = 1 / SQRT(n – 3) = 1 / SQRT(100 – 3) = 0,102

Поскольку r′ > ρ′, мы рассматриваем правый хвост двустороннего теста

значение p = 2*(1–НОРМ.РАСП(r′, ρ′, sr′, ИСТИНА)) = 2*(1–НОРМ. .РАСП(.867, .693, .102, ИСТИНА)) = .0863 > 0,05 = α

В любом случае мы не можем отвергнуть нулевую гипотезу.

Конфиденциальный интервал 95 % для ρ составляет

Поскольку zcrit = ABS(NORM.S.INV(.025)) = 1,96, 95% доверительный интервал для ρ′ равно (FISHERINV(0,668), FISHERINV(1,066)) = (0,584, 0,788). Обратите внимание, что 0,6 лежит в этом интервале, подтверждая наш вывод не отвергать нулевую гипотезу.

Пример 2. Повторите анализ примера 2 проверки корреляции с помощью t-критерия с использованием теоремы 1, на этот раз выполнив двусторонний тест (H0: ρ = 0) с использованием стандартного нормального критерия z = (r′– ρ′) / sr′

r = КОРРЕЛ(R1, R2) = 0,564

r′ = ФИШЕР(r) = ФИШЕР(0,564) = 0,639

ρ′ = FISHER(ρ) = FISHER(0) = 0 (на основе нулевой гипотезы)

Поскольку z > 0, мы выполняем стандартный нормальный тест на правом хвосте:

значение p = 1 – НОРМ.СТ.РАСП(z, ИСТИНА) = НОРМ.СТ.РАСП(4,38, ИСТИНА) = 5,9E-06

В любом случае мы отклоняем нулевую гипотезу (H0: ρ = 0) и делаем вывод, что между переменными существует некоторая связь.

Мы также можем рассчитать 95% доверительный интервал для ρ′ следующим образом:

С помощью FISHERINV мы преобразуем этот интервал в доверительный интервал 95 % для ρ:

(FISHERINV(.353), FISHERINV(.925)) = (.339, .728)

Поскольку ρ = 0 находится вне этого интервала, мы снова отвергаем нулевую гипотезу.

Функции реальной статистики. В пакете ресурсов Real Statistics предусмотрены следующие функции.

CorrTest(exp, obs, size, tails) = p-значение одновыборочного двустороннего теста коэффициента корреляции с использованием теоремы 2, где exp равно ожидаемый коэффициент корреляции генеральной совокупности, а obs — наблюдаемый коэффициент корреляции, основанный на выборке указанного размера. Если tails = 2 (по умолчанию), используется двусторонний тест, а если tails = 1, используется односторонний тест.

CorrLower(r, size, alpha) = нижняя граница доверительного интервала 1 – alpha коэффициента корреляции генеральной совокупности на основе коэффициента корреляции выборки r для образца указанного размера.

CorrUpper(r, size, alpha) = верхняя граница доверительного интервала 1 – alpha коэффициента корреляции генеральной совокупности на основе коэффициента корреляции выборки r для образца указанного размера.

CorrelTest(r, size, rho, alpha, lab, tails): функция массива, которая выводит z, p-значение, нижний и верхний (т.е. нижний и верхний граница доверительного интервала 1 – альфа), где rho, r и размер такие же, как описано выше. Если lab = True, то вывод принимает форму диапазона 4 × 2 с первым столбцом, состоящим из меток, а если lab = False (по умолчанию), то вывод принимает форму диапазона 4 × 1 без меток.

CorrelTest(R1, R2, rho, alpha, lab, tails) = CorrelTest(r, size, rho, alpha, lab, tails), где r = CORREL(R1, R2) и размер = общий размер выборки, т. е. количество пар из R1 и R2, которые содержат числовые данные.

Если альфа не указана, по умолчанию используется значение 0,05. Если tails = 2 (по умолчанию), используется двусторонний тест, а если tails = 1, используется односторонний тест.

Наблюдение: для примера 1 CorrTest(0,6, 0,7, 100) = 0,0864, ​​CorrLower(0,7, 100, 0,05) = 0,584 и CorrLower(0,7, 100, 0,05) = 0,788. . Также =CorrelTest(.7, 100, .6, 100, .05, TRUE) генерирует следующий вывод:

Пример 3. Проверьте, значительно ли коэффициент корреляции для данных в диапазонах K12:K18 и L12:L18 рабочего листа на рис. 1 отличается от 0,9.

Рисунок 1. Проверка гипотезы о коэффициенте корреляции

Мы вычисляем коэффициент корреляции для двух выборок, равный 0,975 (ячейка O12), используя формулу =CORREL(K12:K18,L12:L18). Двусторонний тест проводится в диапазоне N14:O17 по формуле массива =CorrelTest(K12:K18,L12:L18,0,9,0,05,ИСТИНА). Поскольку p-значение = 0,15 > 0,05 = α, мы не можем отвергнуть нулевую гипотезу о том, что данные взяты из совокупности с корреляцией 0,9.

Пример 1: повторите пример 2 из теста независимости, используя данные в диапазоне A5:D8 на рисунке 1; т. е. определить, не зависит ли показатель излечения от используемой терапии.

Рисунок 1. Данные и критерий хи-квадрат для примера 1

Как видно из рисунка 1, математическое ожидание для двух ячеек меньше 5. Поскольку мы имеем дело с таблицей непредвиденных обстоятельств 2 × 2 с относительно небольшим размером выборки, лучше использовать точный критерий Фишера.

Подход заключается в том, чтобы определить, сколькими различными способами могут быть достигнуты вышеуказанные предельные частоты, а затем определить вероятность того, что наблюдаемая выше конфигурация ячеек может быть получена просто случайно.

Мы можем ограничить наше внимание любой из ячеек, поскольку, как только частота для одной ячейки определена, частоты для других ячеек могут быть определены из предельных сумм. Мы выбираем ячейку B6, так как она имеет наименьший предельный итог (а именно 9 в ячейке D6) и меньше, чем другой элемент, который составляет этот предельный итог (а именно 7 в ячейке C6).

Теперь ячейка B6 может принимать любое значение от 0 до 9; как только это значение установлено, значения трех других ячеек можно скорректировать, чтобы сохранить предельные итоги.

Вероятность того, что ячейка B6 примет определенное значение x, эквивалентна вероятности получения x успехов в выборке размером 9 (ячейка D6), взятой без замены. из популяции размером 21 (ячейка D8), которая содержит 11 (ячейка B8) удачных выборов. Это можно рассчитать с помощью гипергеометрического распределения. Здесь ячейки D6 и B8 — это ячейки с предельными суммами, соответствующими ячейке B6, а ячейка D8 содержит общую сумму.

Рисунок 2 содержит таблицу вероятностей для каждого возможного значения x.

Рисунок 2. Точный критерий Фишера для примера 1

Используемые формулы Excel

Таким образом, например, ячейка L11 содержит формулу

Наш тест состоит в том, чтобы определить, является ли вероятность того, что не более 2 из тех, кто принимает терапию 1, излечены (наблюдаемое количество в ячейке B6), меньше 0,05. На рисунке 2 мы видим, что вероятность подсчета 0 равна 3,4E-05, вероятность подсчета 1 равна 0,001684, а вероятность подсчета 2 равна 0,022454 для совокупной вероятности 0,024172

Существуют односторонняя и двусторонняя версии теста. Значение p для одностороннего теста (ячейка L17) задается формулой =СУММ(L6:L8) или эквивалентной (для версий Excel, начиная с Excel 2010)

Значение p для двустороннего теста (ячейка L18), полученное по формуле

где K14 – это крайняя левая ячейка в правом хвосте, значение PDF которой ≤ L8 (поскольку 0,005614 ≤ 0,022454, но 0,050522 > 0,022454). Точно так же мы можем использовать формулу (для версий Excel, начиная с Excel 2010)

Функция рабочего листа

Функция Real Statistics Excel: в пакете ресурсов Real Statistics предусмотрена следующая функция:

FISHERTEST(R1, решка) = вероятность, рассчитанная с помощью точного критерия Фишера для 2 × 2, 2 × 3, 2 × 4, 2 × 5, 2 × 6, 2 × 7. , 2 × 8, 2 × 9, 3 × 3, 3 × 4 или 3 × 5 таблица непредвиденных обстоятельств, содержащаяся в диапазоне R1.

R1 должен содержать только числовые значения. Для таблицы непредвиденных обстоятельств 2 × 2 существует необязательный второй аргумент, tails = 1 (односторонний тест) или 2 (двусторонний тест, по умолчанию). Для таблиц непредвиденных обстоятельств другого размера может быть возвращено только p-значение двустороннего критерия.

Для примера 1 FISHERTEST(B6:C7,1) = 0,024172 и FISHERTEST(B6:C7, 2) = 0,029973.

Ограничения

Поскольку тесты Fisher Exact могут быть ресурсоемкими, были установлены ограничения на сумму всех ячеек в поддерживаемых таблицах непредвиденных обстоятельств. Эти ограничения в настоящее время установлены на уровне 2000 для стола 2 × 3, 1250 для стола 2 × 4, 360 для стола 2 × 5, 175 для стола 2 × 6, 110 для стола 2 × 7, 75 для стола 2. × 8 стол, 40 для стола 2 × 9, 320 для стола 3 × 3, 95 для стола 3 × 4 и 30 для стола 3 × 5. Для таблиц 2 × 2 ограничений нет.

Если вы хотите превысить эти пределы, вы можете добавить третий аргумент в функцию FISHERTEST, который описывает, насколько вы хотите увеличить предел. Например. если вы хотите использовать точный критерий Фишера для таблицы непредвиденных обстоятельств 3 × 3 в диапазоне A1: C3, сумма ячеек которого равна 350, вы можете использовать формулу массива = FISHERTEST (A1: C3,, 1.1). В версии 1.1 указано, что вы увеличили ограничение для таблицы непредвиденных обстоятельств 3 × 3 с 320 до 320 × 1,1 = 352. С 350

Пример таблицы непредвиденных обстоятельств 3 × 2

Пример 2. Определите, не зависит ли движение за право выбора или за жизнь от политической партии гражданина США, на основе выборки, показанной в диапазоне A3:D7 на рис. 3.

Мы можем использовать точный критерий Фишера, используя формулу рабочего листа =FISHERTEST(B4:C6). Результат, как показано в ячейке H13 на рисунке 3, состоит в том, что сторонники выбора или защиты жизни не зависят от партийной принадлежности, поскольку значение p = 4,574E-06

Рисунок 3. Точный критерий Фишера для примера 2

Инструмент анализа данных

Мы также можем использовать инструмент анализа данных Real Statistics Chi-square Test for Independence, чтобы получить тот же результат (как показано в правой части рисунка 3), отметив параметр Fisher Exact Test в появившемся диалоговом окне ( как показано на рисунке 3 теста хи-квадрат на независимость).

Ссылки

Фриман, Г. Х. и Халтон, Дж. Х. (1951). Примечание о точном подходе к непредвиденным обстоятельствам, критерию согласия и другим важным проблемам. Биометрика, 38, 141-149.

120 мыслей о «Точном тесте Фишера»

Привет, Чарльз!
У меня есть таблица 2 на 15, и я выполнил точный тест Фишера для подсчета данных. Я смог получить значение p 0,6, используя R. Можно ли узнать пределы доверительного интервала? или правда кол-во данных для таблицы непредвиденных обстоятельств больше двух, никто не может знать лимиты?

Здравствуйте, Ирэн!
Для какой статистики вы ищете доверительный интервал?
Чарльз

Спасибо за еще одно отличное резюме, Чарльз. Очень надеюсь, что когда-нибудь вы опубликуете все это в формате книги.
Небольшой вопрос: для A/B-тестирования, в ходе которого мы отслеживаем процент ответов (в %, количество посетителей веб-сайта, перешедших по ссылке от общего числа посетителей) для экспонированной и контрольной группы (каждая из которых видит две разные версии стр.), какой статистический тест является лучшим?

Мы сравниваем пропорции, и похоже, что t-критерий, точный критерий Фишера, хи-квадрат, биномиальный критерий, биномиальная регрессия и даже однофакторный дисперсионный анализ являются допустимыми кандидатами? Какой из них вы бы порекомендовали?

Это руководство поможет вам настроить и интерпретировать дискриминантный анализ (DA) в Excel с помощью программного обеспечения XLSTAT.

Набор данных для проведения дискриминантного анализа

Данные взяты из [Fisher M. (1936). Использование множественных измерений в таксономических задачах. Annals of Eugenics, 7, 179-188] и соответствуют 150 цветкам ириса, описываемым четырьмя переменными (длина чашелистика, ширина чашелистика, длина лепестка, ширина лепестка) и их видом. В это исследование были включены три разных вида: setosa, versicolor и virginica.

Цель этого дискриминантного анализа

Наша цель — проверить, позволяют ли четыре переменные различать виды, и визуализировать наблюдения на двухмерной карте, которая как можно лучше показывает, насколько разделены группы.

Iris setosa, versicolor и virginica.

Настройка дискриминантного анализа

После открытия XLSTAT выберите команду XLSTAT / Анализ данных / Дискриминантный анализ или нажмите соответствующую кнопку на панели инструментов Анализ данных (см. ниже).

После нажатия кнопки открывается диалоговое окно Дискриминантный анализ.Качественная зависимая переменная соответствует здесь переменной «Виды». Количественные объясняющие переменные — это четыре описательные переменные.

Мы снимаем флажок с параметра "Равенство ковариационных матриц", потому что, как мы увидим на примере теста Бокса, предположение о равенстве ковариационных матриц трех видов было бы неверным.

Многие результаты дополнительно отображаются с помощью XLSTAT. Ниже мы видим, какие опции были активированы для этого конкретного случая.

Чтобы не добавлять слишком много информации на графики, мы сняли флажок с параметра "Ярлыки" на вкладке "Диаграммы".

Вычисления начинаются после того, как вы нажмете OK. Затем будут отображены результаты.

Интерпретация результатов дискриминантного анализа

Первыми отображаемыми результатами являются различные матрицы, используемые для вычислений. Два теста Бокса подтверждают необходимость отвергнуть гипотезу о равенстве ковариационных матриц между группами.

Лямбда-тест Уилкса позволяет проверить, равны ли векторы средних значений для различных групп (вы можете понимать его как многомерную версию тестов LSD Фишера или HSD Тьюки). Мы видим, что разница между средними векторами групп значительна.

В следующей таблице показаны собственные значения и соответствующий % дисперсии. Мы видим, что 99% дисперсии представлено первым фактором. Факторов всего два: максимальное количество факторов равно k-1, когда n>p>k, где n — количество наблюдений, p — количество объясняющих переменных и k — количество групп.

На следующей диаграмме показано, как исходные переменные коррелируют с двумя факторами (эта диаграмма соответствует таблице факторных нагрузок). Мы видим, что фактор F1 коррелирует с длиной чашелистика, длиной лепестка и шириной лепестка, а F2 коррелирует с шириной чашелистика.

В следующей таблице показаны дискриминантные функции. Когда мы предполагаем равенство ковариационных матриц, дискриминантные функции линейны. Когда равенство не предполагается, как в этом руководстве, дискриминантные функции являются квадратичными. Правило, основанное на этих функциях, заключается в том, что мы относим наблюдение к группе, соответствующей функции, которая дает наибольшее значение. Эти функции можно использовать в режиме прогнозирования для новых наблюдений, чтобы распределить их по группам.

В следующей таблице для каждого наблюдения перечислены факторные оценки (координаты наблюдений в новом пространстве), вероятность принадлежности к каждой группе и квадраты расстояний Махаланобиса до центра тяжести группы. Каждое наблюдение классифицируется в группу, для которой вероятность принадлежности наибольшая. Вероятности - это апостериорные вероятности, которые учитывают априорные вероятности с помощью формулы Байеса. Мы замечаем, что три наблюдения (5,9,12) были переклассифицированы. Есть несколько способов интерпретировать эти результаты: либо человек, производивший измерения, допустил ошибку при записи значений, либо соответствующие цветы ириса имели очень необычный рост, либо критерии, использованные специалистом для определения вида, были ошибочными. недостаточно точны, или некоторая информация, необходимая для различения цветов, здесь отсутствует.

На следующей диаграмме представлены наблюдения на осях факторов. Это позволяет подтвердить, что виды очень хорошо различаются по осям факторов, извлеченным из исходных объясняющих переменных.

Матрица путаницы обобщает повторную классификацию наблюдений и позволяет быстро увидеть процент хорошо классифицированных наблюдений, который представляет собой отношение количества хорошо классифицированных наблюдений к общему количеству наблюдений.Здесь он равен 98%.

Поскольку соответствующий параметр был активирован на вкладке «Выводы» диалогового окна, вычисляются прогнозы для перекрестной проверки. Перекрестная проверка позволяет увидеть, каким будет прогноз для данного наблюдения, если его не включить в выборку оценки. Здесь мы видим, что только одно наблюдение (Obs8) не классифицировано.

Читайте также: