Как рассчитать критерий Манна-Уитни в Excel
Обновлено: 21.11.2024
Знакомьтесь, StatPlus:mac LE — бесплатная версия StatPlus:mac Professional, разработанная AnalystSoft. Если вы используете Mac и Microsoft Excel 2004–2021 для Mac или Apple Numbers для ежедневных аналитических и статистических целей, StatPlus:mac LE — это именно то, что вам нужно для начала работы! Получите мощный статистический инструмент бесплатно — теперь с набором новых важных функций — не выходя из Excel.
Попробуйте бесплатную версию прямо сейчас и узнайте, почему (по статистике) большинство людей перестают искать какие-либо другие инструменты, как только находят StatPlus:mac!
СКАЧАТЬ БЕСПЛАТНО СРАВНИТЬ С PRO
Установив это программное обеспечение, вы принимаете все положения и условия лицензионного соглашения с конечным пользователем, приведенные здесь. EULA
Независимо от того, являетесь ли вы опытным пользователем, переходящим со знакомого набора инструментов, или новичком, изучающим возможности нового программного обеспечения, StatPlus:mac LE предоставляет вам легко настраиваемое рабочее пространство с широким набором инструментов. Это бесплатное приложение демонстрирует качества, которые обычно доступны только в дорогостоящих специализированных пакетах: согласованность и точность результатов, надежность, множество моделей и инструментов анализа данных, различные типы данных, графики, диаграммы и многое-многое другое.
Пакет инструментов анализа для Mac
Обновить до Pro
StatPlus:mac Pro позволяет пользователям Microsoft Excel для Mac выполнять все формы анализа данных, от самых основ до комплексного анализа, включая непараметрический и регрессионный анализ, анализ выживания и множество других методов. . Пользователи Pro имеют право на неограниченную приоритетную поддержку в течение одного года (и даже по выходным).
Зарегистрируйтесь, чтобы получить дополнительные преимущества
Зарегистрируйтесь сейчас без каких-либо обязательств и узнайте больше! Как зарегистрированный пользователь вы сможете получить доступ к последним версиям StatPlus:mac LE и документации, получить базовую поддержку и даже выиграть бесплатное обновление до версии Pro.
Бесплатно для вашего проекта
StatPlus:mac LE предоставляется бесплатно и без каких-либо скрытых особенностей — нет рекламы, ограничений по времени или ограничений по количеству переменных/случаев. Если у вас возникнут вопросы, обращайтесь в нашу службу поддержки.
Стандартное решение
Университеты, научные центры, государственные учреждения и исследовательские институты по всему миру уже выбрали StatPlus:mac в качестве стандартного статистического инструмента и теперь пожинают плоды его универсальности, надежности, скорости и совместимости с популярной средой Microsoft Office. маленький>
Требования
StatPlus:mac требует macOS 10.10 или новее (версия 6 по-прежнему поддерживает 10.7+). Последние сборки поддерживают macOS 12 Monterey и чип Apple M1. StatPlus:mac поддерживает Microsoft Excel для Mac (поддерживаемые версии: 2004, 2008, 2011, 2016, 2019, 2021; Office 365 для Mac v16) и Apple Numbers в качестве источника данных. StatPlus:mac не требует подключения к Интернету (за исключением дополнительной функции автоматического обновления).
Скриншоты
Ищете больше?
Обновите сейчас до версии Pro и получите более 70 функций и мультиплатформенную совместимость. StatPlus:mac — самое доступное решение для анализа данных на Mac с Excel. Вы получите выгоду от сокращения кривой обучения и привлекательных цен, а также от преимуществ точных процедур и расчетов. Лицензия для Mac/ПК является постоянной, плата за продление не взимается.
Бесплатно или премиум? Сравнение функций — StatPlus:mac Pro и LE
- Только в StatPlus:mac Pro.
- Доступно в бесплатной версии LE.
- Профессиональные функции
- Автономная электронная таблица с поддержкой Excel (XLS и XLSX), OpenOffice/LibreOffce Calc (ODS) и текстовых документов.
- Режим надстройки для Excel 2004, 2008, 2011, 2016, 2019 и 2021.
- Режим надстройки для Apple Numbers.
- Приоритетная поддержка.
- Постоянная лицензия и бесплатные основные обновления в течение периода обслуживания.
- Доступ к версии для Windows.
- Параметры для эмуляции результатов Excel Analysis ToolPak и руководство по миграции для пользователей, переключающихся с Analysis ToolPak.
- Подробная описательная статистика.
- Одновыборочный t-критерий.
- Две выборки t-критерия.
- Две выборки t-критерия для обобщенных данных.
- F-критерий Фишера.
- Z-тесты с одной и двумя выборками.
- Корреляционный анализ и ковариация.
- Тесты нормальности (критерии Жака-Бера, Шапиро-Уилка, Шапиро-Франсиа, Крамера-фон Мизеса, Андерсона-Дарлинга, Колмогорова-Смирнова, Д'Агостино).
- Перекрестная таблица и хи-квадрат.
- Анализ таблиц частот (для дискретных и непрерывных переменных).
- Несколько определений для расчета квантильной статистики.
- Однофакторный и двусторонний дисперсионный анализ (с повторениями и без них).
- Трехфакторный анализ отклонений.
- Апостериорные сравнения: Бонферрони, Тьюки-Крамер, Тьюки Б., Тьюки HSD, Нойман-Кеулс, Даннетт.
- Общие линейные модели (GLM) ANOVA.
- Внутрисубъектный дисперсионный анализ и смешанные модели.
- Анализ главных компонентов (АГК).
- Факторный анализ (FA).
- Анализ дискриминантной функции.
- Иерархическая кластеризация и K-средние.
- Анализ таблиц 2 x 2 (хи-квадрат, хи-квадрат Йейтса, точный критерий Фишера и т. д.).
- Ранг и процентиль.
- Тест хи-квадрат.
- Ранговые корреляции (Кендалл Тау, Спирмен Р., Гамма, Фехнер).
- Сравнение независимых выборок
U-критерий Манна-Уитни, критерий Колмогорова-Смирнова, критерий Вальда-Вольфовица, критерий Розенбаума. Дисперсионный анализ Крускала-Уоллиса и медианный критерий. - Сравнение зависимых выборок
критерий сопоставленных пар Уилкоксона, критерий знаков, дисперсионный анализ Фридмана, W Кендалла (коэффициент конкордации). - Тест Кокрана Q.
- Анализ латинских и греко-латинских квадратов.
- Регрессионный анализ
- Многомерная линейная регрессия (анализ остатков, диагностика коллинеарности, диапазоны достоверности и прогнозирования).
- Регрессия методом наименьших квадратов (WLS).
- Логистическая регрессия.
- Пошаговая (прямая и обратная) регрессия.
- Полиномиальная регрессия.
- Подгонка кривой.
- Тесты на гетероскедастичность: тест Бреуша-Пагана (BPG), тест Харви, тест Глейзера, тест ARCH Энгла (множитель Лагранжа) и тест Уайта.
- Обработка данных.
- Анализ Фурье.
- Сглаживание.
- Скользящее среднее.
- Анализ.
- Автокорреляция (ACF и PACF).
- Прерванный анализ временных рядов.
- Тесты единичного корня: Дики–Фуллера, расширенный Дики–Фуллера (тест ADF), Филлипса–Перрона (тест PP), Квятковского–Филлипса–Шмидта–Шина (тест KPSS).
- Таблицы жизни.
- Каплан-Мейер (логарифмический ранговый критерий, коэффициент опасности).
- Регрессия пропорциональных рисков Кокса.
- Пробит-анализ (Finney и LPM).
Значения LD (LD50/ED50 и др.), расчет кумулятивного коэффициента. - Анализ кривых рабочих характеристик приемника (анализ ROC).
Методы AUC - DeLong's, Hanley и McNeil's. Отчет включает: AUC (с доверительными интервалами), координаты кривой, показатели эффективности - чувствительность и специфичность (с доверительными интервалами), точность, положительные и отрицательные прогностические значения, J Юдена (индекс Юдена), график Precision-Recall. - Сравнение ROC-кривых.
- Размер выборки опроса о распространенности.
- Биномиальный точный доверительный интервал.
- Размер выборки необходим для наблюдения как минимум N событий.
- Размер выборки для исследования случай-контроль.
-
>Преобразование данных (расчет) с помощью формул.
- Выборка (случайная, периодическая, условная).
- Генерация случайных чисел.
- Стандартизация.
- Операции стека/распаковки.
- Операции с матрицами.
- Гистограмма
- Диаграмма рассеяния.
- Коробчатая диаграмма.
- Сюжет "стебель-листья".
- Сюжет Блэнда-Альтмана.
- График Бленда-Альтмана с несколькими измерениями для каждого субъекта.
- Квантиль-квантильные графики Q-Q для различных распределений.
- Контрольные диаграммы — X-столбец, R-диаграмма, S-диаграмма, IMR-диаграмма, P-диаграмма, C-диаграмма, U-диаграмма, CUSUM-диаграмма.
Учебники
Узнайте, как использовать StatPlus:mac. Учебники для текущей версии v6 скоро появятся.
Это руководство поможет вам запустить и интерпретировать критерий Манна-Уитни на двух независимых выборках в Excel с помощью XLSTAT.
Что такое критерий Манна-Уитни?
Тест Манна-Уитни — это непараметрический тест, позволяющий сравнивать две независимые выборки.
Три исследователя, Манн, Уитни и Уилкоксон, по отдельности усовершенствовали очень похожий непараметрический тест, который может определить, можно ли считать образцы идентичными или нет на основе их рангов.
Этот тест можно использовать только для изучения взаимного расположения образцов. Например, если мы сгенерируем выборку из 500 наблюдений, взятых из распределения N(0,1), и выборку из распределения 500 наблюдений из распределения N(0,4), тест Манна-Уитни не найдет различий между образцы.
Результаты, предложенные XLSTAT, основаны на U-статистике Манна-Уитни.
Набор данных для выполнения теста Манна-Уитни в Excel
Данные взяты из [Fisher M. (1936), The Use of Multiple Measurements in Taxonomic Problems.Annals of Eugenics, 7, 179-188] и соответствуют 100 цветкам ириса, описываемым четырьмя переменными (длина чашелистика, ширина чашелистика, длина лепестка, ширина лепестка) и их видом. Исходный набор данных содержит 150 цветов и 3 вида, но для этого урока мы выделили наблюдения, относящиеся к видам versicolor и virginica. Наша цель — проверить, есть ли четкое различие между двумя видами по четырем переменным.
Целью этого руководства является независимое сравнение двух видов по четырем переменным.
Настройка теста Манна-Уитни на двух независимых выборках
После активации XLSTAT-Pro выберите команду XLSTAT / Непараметрические тесты / Сравнение двух образцов (Wilcoxon, Mann-Whitney, . ).
После нажатия кнопки появляется диалоговое окно. Затем вы можете выбрать данные на листе Excel. Выберите один столбец для каждой переменной, потому что у нас есть 4 столбца данных и один столбец, соответствующий идентификаторам видов.
На вкладке параметров мы предполагаем, что разница между выборками равна 0. Обратите внимание, что точное значение p можно вычислить с помощью XLSTAT.
После того, как вы нажмете кнопку OK, результаты отобразятся на новом листе Excel (поскольку для вывода выбран параметр "Лист").
Интерпретация результатов теста Манна-Уитни на двух независимых выборках
Первыми отображаемыми результатами являются статистические данные для различных выборок. Для каждой переменной мы получаем результат теста.
Мы видим, что для первой переменной нулевая гипотеза равенства отвергается. Мы можем считать, что длина чашелистика значительно отличается от одного вида к другому.
U-критерий Манна-Уитни, по существу, представляет собой альтернативную форму критерия суммы рангов Уилкоксона для независимых выборок и полностью эквивалентен ему.
Определите следующую тестовую статистику для выборок 1 и 2, где n1 – размер выборки 1, а n2< /sub> — размер выборки 2, а R1 — скорректированная сумма рангов для выборки 1 и R2< /sub> — скорректированная сумма рангов выборки 2. Не имеет значения, какая выборка больше.
Что касается версии теста Уилкоксона, если наблюдаемое значение U равно
Пример 1. Повторите пример 1 теста суммы рангов Уилкоксона, используя U-критерий Манна-Уитни.
Рисунок 1. U-критерий Манна-Уитни
Свойство 2. Для n1 и n2 достаточно больших U статистика приблизительно нормальная N(μ, σ), где
Наблюдение: нажмите здесь, чтобы просмотреть доказательства свойств 1 и 2.
Свойство 3. При наличии нескольких совпадений следующая пересмотренная версия дисперсии дает лучшие результаты:
где n = n1 + n2, t варьируется в зависимости от набора связанных рангов, а ft — это количество раз (то есть частота) появления ранга t. Эквивалентная формула
Наблюдение: еще одна сложность заключается в том, что часто желательно учитывать тот факт, что мы аппроксимируем дискретное распределение через непрерывное, применяя поправку на непрерывность. Это делается с помощью z-показателя
вместо той же формулы без поправочного коэффициента непрерывности 0,5.
Пример 2. Повторите пример 2 теста суммы рангов Уилкоксона, используя U-критерий Манна-Уитни.
Мы показываем результаты одностороннего теста (без использования поправки на связи), показанные на рисунке 2. В столбце W отображаются формулы, использованные в столбце T.
Рисунок 2. U-критерий Манна-Уитни с использованием нормального приближения
Как видно из ячейки T19, значение p для одностороннего критерия совпадает со значением, найденным в примере 2 Уилкоксона с использованием критерия суммы рангов Уилкоксона. Мы снова отвергаем нулевую гипотезу и делаем вывод, что некурящие живут значительно дольше.
Наблюдение. Размер эффекта для данных с использованием критерия Манна-Уитни можно рассчитать так же, как и для критерия суммы рангов Уилкоксона, а именно
и результат будет таким же, что и для примера 2: r = 0,31, как показано в ячейке T21.
Есть еще один показатель размера эффекта, а именно
Это представляет собой вероятность того, что оценка, случайно сгенерированная из совокупности A, будет больше, чем оценка, случайно сгенерированная из совокупности B, где A и B — совокупности, соответствующие двум выборкам, а A соответствует выборке с более высоким значением. Чем выше это значение, тем сильнее эффект.
Функции Real Statistics Excel: в пакет Real Statistics входят следующие функции:
MANN(R1, R2) = U для выборок, содержащихся в диапазонах R1 и R2
MANN(R1, n) = U для выборки, содержащейся в первых n столбцах диапазона R1, и выборки, состоящей из остальные столбцы в диапазоне R1. Если второй аргумент опущен, по умолчанию он равен 1.
MWTEST(R1, R2, tails, ties, cont) = p-значение U-критерия Манна-Уитни для выборок, содержащихся в диапазонах R1 и R2, с использованием нормального приближения. хвосты = 1 или 2 (по умолчанию). Если ties = TRUE (по умолчанию), применяется коэффициент коррекции связей. Если cont = TRUE (по умолчанию), применяется коррекция непрерывности.
Любые пустые или нечисловые ячейки в R1 или R2 игнорируются.
Наблюдение: в примере 2 мы можем использовать функцию MANN реальной статистики, чтобы получить значение 486 для U, показанное в ячейке T9 на рисунке 2, а именно =MANN(J6:M15,N6 :Q15) = 486. Точно так же значение p, равное 0,003081, в ячейке T19 можно рассчитать с помощью =MWTEST(J6:M15,N6:Q15,1,FALSE,TRUE).
Наблюдение: обратите внимание, что z-показатель и размер эффекта r можно рассчитать с помощью функции реальной статистики MWTEST следующим образом:
z-оценка = НОРМ.С.ОБР(MWTEST(R1, R2))
r = НОРМ.С.ОБР(MWТЕСТ(R1, R2))/КОРЕНЬ(СЧЁТ(R1)+СЧЁТ(R2))
Наблюдение. Результаты анализа примера 2 можно резюмировать следующим образом: ожидаемая продолжительность жизни некурящих (Mdn = 76,5) значительно выше, чем у курильщиков (Mdn< /em> = 70,5), U = 486, z = -2,74, p = 0,0038
Конечно, вы также можете использовать двусторонний тест с коррекцией связей, что мы вскоре продемонстрируем.
Функция реальной статистики. Следующая функция предоставляется в пакете реальной статистики и возвращает выходные данные, состоящие из U-stat, z-stat, r< /em> размер эффекта и три типа p-значений (нормальное приближение, точный тест и имитация).
MW_TEST(R1, R2, лаборатория, хвосты, связи, продолжение, точное, итерация): возвращает массив столбцов с выходными данными, описанными выше для выборок, содержащихся в диапазонах R1 и R2. хвосты = 1 или 2 (по умолчанию). Для нормального приближения, если ties = TRUE (по умолчанию), применяется поправочный коэффициент связей; если cont = TRUE (по умолчанию), применяется коррекция непрерывности; если exact = TRUE (по умолчанию FALSE), то выводится p-значение точного теста, а если iter ≠ 0, то p-значение моделируемой версии теста выводится, когда симуляция состоит из iter сэмплов (по умолчанию 10 000). Если lab = TRUE (по умолчанию FALSE), к выходным данным добавляется дополнительный столбец меток.
Любые пустые или нечисловые ячейки в R1 или R2 игнорируются. Дополнительную информацию о точном тесте и p-значениях моделирования см. в разделах «Точный критерий Манна-Уитни» и «Моделирование Манна-Уитни».
На рис. 3 показаны выходные данные команды =MW_TEST(A6:A17,B6:B17,TRUE) для примера 2.
Рисунок 3. Выходные данные MW_TEST
Наблюдение: даже если для аргумента задано значение FALSE, p-значение точного теста будет получено при условии, что обе выборки содержат менее 800 элементов, а меньшая выборка содержит не более 300 элементов.
Инструмент анализа данных Real Statistics. Ресурсный пакет Real Statistics также предоставляет инструмент анализа данных, который выполняет критерий Манна-Уитни для независимых выборок, автоматически вычисляя медианы, суммы рангов, статистику теста U, z-показатель, p-значения. и размер эффекта r.
Например, чтобы выполнить анализ в примере 1, нажмите Ctrl-m и выберите инструмент анализа данных T-критерия и непараметрических эквивалентов в появившемся меню (или на вкладке «Разное», если используется многостраничный пользовательский интерфейс). Появится диалоговое окно, показанное на рисунке 4.
Рисунок 4. Диалоговое окно критерия Манна-Уитни для реальных статистических данных
Введите A5:B17 в качестве входного диапазона 1 (в качестве альтернативы вставьте A5:A17 в входной диапазон 1 и B5:B17 в входной диапазон 2), щелкните заголовки столбцов, включенных в данные, выберите две независимые выборки и непараметрические параметры. и нажмите на кнопку ОК. Оставьте значение по умолчанию 0 для гипотетического среднего/медианы и 0,05 для альфа-канала (хотя эти значения не используются). опция не отмечена.
Вывод показан на рис. 5.
Рисунок 5. Выходные данные инструмента анализа данных теста Манна-Уитни
Обратите внимание, что отображаются как односторонние, так и двусторонние критерии. Также показаны три варианта теста: тест с использованием нормального приближения (диапазон E17:F17), тест с использованием точного теста (диапазон E18:F18) и тест с имитацией (диапазон E19:F19). Тот факт, что используется поправочный коэффициент непрерывности «Йейтса», отмечен в ячейке F15.
Если мы отметим параметр «Использовать коррекцию связей» на рис. 4, мы получим результат, показанный на рис. 6.
Рисунок 6. Критерий Манна-Уитни с коррекцией связей
В этом случае к нормальному приближению применяется поправка на связи свойства 3. Как видите, разница между результатами, показанными на рисунках 5 и 6, очень мала.
Обратите внимание, что поправка на связи (как и поправка на непрерывность) применяется только к нормальному приближению. Поправки на связи и непрерывность не применяются к точной и имитационной версиям теста. Разница в p-значениях моделирования (строка 19) на рисунках 5 и 6 связана со случайностью моделирования, а не с коррекцией связей.
Функция реальной статистики: Пакет реальной статистики предоставляет следующую функцию для расчета поправки на связи, используемой в инструменте анализа данных.
TiesCorrection(R1, R2, тип) = значение коррекции связей для данных в диапазоне R1 и, необязательно, диапазоне R2, где тип = 0: одна выборка, тип = 1: парная выборка и тип = 2: независимые выборки
Для теста Манна-Уитни тип = 2. Поправка на связи используется при расчете стандартного отклонения (ячейка U15 на рис. 6) следующим образом
Точная проверка
Нажмите здесь, чтобы просмотреть описание точной версии теста Манна-Уитни с использованием функции перестановки.
Моделирование
Нажмите здесь, чтобы узнать, как использовать моделирование для определения p-значения для теста Манна-Уитни. При таком подходе учитываются связи.
Доверительный интервал медианы
Нажмите здесь, чтобы узнать, как рассчитать доверительный интервал медианы на основе критерия Манна-Уитни.
Статистическая мощность и размер выборки
Нажмите здесь, чтобы узнать, как рассчитать статистическую мощность или минимальный размер выборки, необходимые для теста Манна-Уитни.
123 мысли на тему «Тест Манна-Уитни для независимых выборок»
Я определил, что мои данные не распределены нормально, поэтому мне нужно выполнить непараметрический тест. Я делаю проект, в котором мне нужно сравнить характеристики пациентов с литературой. В некоторых статьях у меня есть только медиана или только среднее значение группы. Используя набор инструментов реальной статистики, мне удалось найти p-значение для характеристик, где у меня есть только медиана. Мне было интересно, как я мог бы выполнить тест Манна-Уитни, если я хочу сравнить среднее значение моей выборки со средним значением, найденным в статье.
Николь,
У вас есть данные или только два средства?
ЧарльзУ меня есть данные, состоящие из 48 измерений (например, возраст пациента), для которых я могу получить среднее значение, медиану, стандартное отклонение и т. д. В некоторых статьях для своих пациентов они предоставляют только медиану, поэтому я использовал критерий Уилкоксона. Знаковый ранговый тест для одной выборки, чтобы сравнить их медиану с моей медианой (правильно ли это?). Но в других статьях у меня есть только средства для группы, и я не знаю, как это сделать. Спасибо!
Являются ли имеющиеся у вас данные достаточно симметричными?
ЧарльзЯ нарисовал гистограмму возраста и веса моих пациентов, и она не очень симметрична. Для этого мне необходимо использовать тест U Mann Whitney.
Извините, Николь, но я не знаю, как проверить, получена ли выборка данных из генеральной совокупности с заданным средним значением, используя тест Манна-Уитни или критерий знаковых рангов Уилкоксона. Когда данные симметричны, среднее значение и медиана одинаковы, и если предположить, что это верно и для генеральной совокупности, из которой взята выборка, то критерий знаковых рангов Уилкоксона может быть полезен.
ЧарльзПривет, Чарльз, надеюсь, у тебя все хорошо!
Я использую тест MW U для данных по шкале Лайкерта (5 баллов).
Я просто хотел спросить, если образец 1 получил более высокий средний ранг, чем образец 2, это означает, что баллы Лайкерта для образца 1 имеет более высокое среднее значение, чем в образце 2. Но для этого теста Z-показатель дал отрицательное значение, что также означает, что он ниже среднего распределения.Разве это не противоречит? Если нет, то какую еще важность Z-показателя я упускаю?
Заранее спасибо.
Кен,
Если вы пришлете мне файл Excel с вашими данными и результатами тестов, мне будет легче ответить на ваш вопрос.
ЧарльзПривет, Чарльз!
Почему при операционализации U-критерия Манна-Уитни после вычисления U1 и U2 мы выбираем минимум из них в качестве U-статистики?Есть ли для этого какие-либо логические или статистические причины? Пожалуйста, уточните.
Здравствуйте, Ананд,
Я точно не знаю, но, вероятно, это связано с постоянным использованием одного и того же набора критических значений (то есть одного и того же хвоста распределения).
ЧарльзЗдравствуйте, очень хорошая информация.
Я хотел спросить вас, что мне нужно сделать статистический проект по U-Mann Whitney/ANOV-систолическому давлению (мм рт. ст.) для первых 20 мужчин и 15 первых женщин. Я понятия не имею, как начать свою работу, но если вы можете помочь мне с этой работой, я был бы очень рад. Кроме того, мне нужно руководствоваться книгой Марио Триолы, издание 10, стр. 786–787.
Если бы вы могли помочь мне, я был бы признателен.
То, что требуется учителю для этой работы:
Введение/Цель
Сбор данных или предоставление данных
Тема проектов - определения, гипотезы, формулы, расчеты, таблицы, графики и т. д.Спасибо!!
Кто-нибудь может помочь мне с этим?Язмин,
Я с удовольствием отвечу на конкретные вопросы, но домашнее задание нужно выполнить самостоятельно.
ЧарльзСпасибо за помощь с этим пакетом реальной статистики. Мои запросы могут быть слишком простыми, поэтому заранее извиняюсь. У меня есть две независимые группы предприятий: группа 1 с низким использованием финансовых бюджетов и группа 2 с высоким использованием финансовых бюджетов. Я хочу показать, что группа 2 предприятий с высоким использованием бюджета имеет более высокий доход. Это исследование было основано на опросе (по шкале Лайкерта), а не на экспериментальной основе.
a) какую тестовую статистику вы бы порекомендовали мне сообщить? Я читал, что это должно быть точно P. Я не применял здесь непрерывность.
b) Существует ли особое правило относительно того, данные какой из двух независимых групп я должен вводить в поле ввода 1 в вашем пакете статистики? Должна ли она быть группой 1 по естественному порядку? У меня нет контрольной группы как таковой, так как я проводил опросное исследование.
c) Причина, по которой я задаю вопрос B выше, заключается в том, что когда я переключаю его и помещаю данные группы 2 на вход 1, это не имеет значения для тестовой статистики, представленной в таблице статистики. Как реальная статистика узнает, какая группа с какой сравнивается? Как я узнаю, что моя гипотеза о высоком доходе группы 2 подтверждена?
Я надеюсь, что это имеет смысл, и спасибо за вашу помощь!
Здравствуйте, Саад,
a) Если у вас нет ничьих (или мало ничьих), точный тест, вероятно, является правильным выбором. Если размер выборки не слишком мал, то нормальная аппроксимация, вероятно, лучше всего подходит, если возникает проблема равенства.
b) Порядок не должен иметь значения.
c) С двумя группами две группы сравниваются друг с другом. Если вы получаете значительный результат, то группа, чья выборка имеет более высокий доход, является группой, чей доход населения будет выше.
ЧарльзU-критерий Манна-Уитни используется для сравнения различий между двумя независимыми группами, когда зависимая переменная является порядковой или непрерывной, но не имеет нормального распределения. Например, вы можете использовать U-тест Манна-Уитни, чтобы понять, различается ли отношение к дискриминации в оплате труда, где отношение измеряется по порядковой шкале, в зависимости от пола (т.т. е. вашей зависимой переменной будет «отношение к дискриминации в оплате труда», а вашей независимой переменной будет «гендер», который состоит из двух групп: «мужской» и «женский»). В качестве альтернативы вы можете использовать U-критерий Манна-Уитни, чтобы понять, различаются ли оклады, измеренные по непрерывной шкале, в зависимости от уровня образования (т. е. вашей зависимой переменной будет «зарплата», а вашей независимой переменной будет «образовательный уровень», что имеет две группы: «средняя школа» и «университет»). U-критерий Манна-Уитни часто считается непараметрической альтернативой независимому t-критерию, хотя это не всегда так.
В отличие от t-критерия для независимых выборок, U-критерий Манна-Уитни позволяет делать разные выводы о данных в зависимости от ваших предположений о распределении данных. Эти выводы могут варьироваться от простого определения того, различаются ли две популяции, до определения различий в медианах между группами. Эти разные выводы зависят от формы распределения ваших данных, о чем мы расскажем подробнее позже.
В нашем расширенном руководстве по U-тесту Манна-Уитни мы проведем вас через все шаги, необходимые для понимания того, когда и как использовать U-критерий Манна-Уитни, покажем вам необходимые процедуры в SPSS Statistics, а также как интерпретировать и составлять отчеты. ваш вывод. Вы можете получить доступ к этому расширенному руководству по U-тестированию Манна-Уитни, подписавшись на Laerd Statistics. В этом кратком руководстве мы покажем вам основы U-критерия Манна-Уитни с использованием одной из процедур SPSS Statistics, когда критическое предположение этого теста нарушается. Прежде чем мы покажем вам, как это сделать, мы объясним различные предположения, которым должны соответствовать ваши данные, чтобы U-критерий Манна-Уитни дал вам достоверный результат. Далее мы обсудим эти предположения.
Статистика SPSS
Предположения
Если вы решите анализировать данные с помощью U-критерия Манна-Уитни, часть процесса включает в себя проверку того, что данные, которые вы хотите проанализировать, действительно можно проанализировать с помощью U-критерия Манна-Уитни. Вы должны сделать это, потому что использовать U-критерий Манна-Уитни уместно только в том случае, если ваши данные «проходят» четыре предположения, которые необходимы для того, чтобы U-критерий Манна-Уитни дал вам достоверный результат. На практике проверка этих четырех допущений лишь немного увеличивает время анализа, требуя от вас нажатия еще нескольких кнопок в SPSS Statistics при выполнении анализа, а также еще немного обдумывания ваших данных, но это не сложная задача.
Прежде чем мы познакомим вас с этими четырьмя допущениями, не удивляйтесь, если при анализе ваших собственных данных с помощью SPSS Statistics одно или несколько из этих допущений будут нарушены (т. е. не соблюдены). Это не редкость при работе с реальными данными, а не с примерами из учебников, которые часто только показывают, как выполнять U-критерий Манна-Уитни, когда все идет хорошо! Однако не волнуйтесь. Даже если ваши данные не соответствуют определенным предположениям, часто есть решение, позволяющее обойти это. Во-первых, давайте рассмотрим эти четыре предположения:
Авторское право 2013. Laerd Statistics
На двух приведенных выше диаграммах распределение баллов для мужчин и женщин имеет одинаковую форму. На диаграмме слева вы не можете видеть распределение баллов для «мужчин» (показано синим цветом на диаграмме справа), потому что эти два распределения идентичны (т. е. оба распределения идентичны, поэтому они находятся «поверх остальных»). друг друга» на диаграмме, с распределением мужчин синего цвета под распределением женщин красного цвета). Однако на диаграмме справа, несмотря на то, что оба распределения имеют одинаковую форму, они имеют разное расположение (т. е. распределение одной из групп независимой переменной имеет более высокие или более низкие значения по сравнению со вторым распределением — в нашем например, женщины в целом имеют «более высокие» значения, чем мужчины).
Когда вы анализируете свои собственные данные, крайне маловероятно, что ваши два распределения будут идентичными, но они могут иметь одинаковую (или «похожую») форму. Если они имеют одинаковую форму, вы можете использовать SPSS Statistics для проведения U-критерия Манна-Уитни, чтобы сравнить медианы вашей зависимой переменной (например, показатель вовлеченности) для двух групп (например, мужчин и женщин) независимой переменная (например, пол), которая вас интересует. Однако, если ваши два распределения имеют разную форму, вы можете использовать только U-критерий Манна-Уитни для сравнения средних рангов.
В разделе «Процедура тестирования в SPSS Statistics» этого краткого руководства мы иллюстрируем процедуру SPSS Statistics для выполнения U-критерия Манна-Уитни, предполагая, что ваши два распределения имеют разную форму и вам необходимо интерпретировать средние ранги. а не медианы.Во-первых, мы приводим пример, который мы используем для объяснения процедуры U-теста Манна-Уитни в SPSS Statistics.
Статистика SPSS
Пример
Концентрация холестерина (типа жира) в крови связана с риском развития сердечных заболеваний, так что более высокие концентрации холестерина указывают на более высокий уровень риска, а более низкие концентрации указывают на более низкий уровень риска. Если вы снизите концентрацию холестерина в крови, риск развития сердечно-сосудистых заболеваний может быть снижен. Избыточный вес и/или отсутствие физической активности повышают концентрацию холестерина в крови. И физические упражнения, и потеря веса могут снизить концентрацию холестерина. Однако неизвестно, что лучше всего подходит для снижения концентрации холестерина: физические упражнения или снижение веса. Поэтому исследователь решил выяснить, что более эффективно для снижения уровня холестерина: физические упражнения или меры по снижению веса. С этой целью исследователь набрал случайную выборку неактивных мужчин, которые были классифицированы как имеющие избыточный вес. Затем эта выборка была случайным образом разделена на две группы: группа 1 подвергалась диете с контролем калорийности (т. е. группа «диеты»), а группа 2 выполняла программу упражнений и тренировок (т. Чтобы определить, какая программа лечения была более эффективной, концентрации холестерина сравнивали между двумя группами в конце программ лечения.
Статистика SPSS
Настройка в SPSS Statistics
В SPSS Statistics мы ввели показатели концентрации холестерина, нашей зависимой переменной, под именем переменной Cholesterol . Затем мы создали группирующую переменную с именем Group, которая представляла нашу независимую переменную. Поскольку у нашей независимой переменной было две группы — «диета» и «упражнения», мы присвоили группе диеты значение «1», а группе упражнений — значение «2». Если вы не пометите две группы, SPSS Statistics не сможет их различить, и U-критерий Манна-Уитни не будет выполнен.
Примечание. В SPSS Statistics есть две разные процедуры для выполнения U-критерия Манна-Уитни: процедура Непараметрические критерии > Независимые выборки и Процедура Устаревшие диалоговые окна > 2 независимых выборки. То, как мы объяснили вышеприведенную настройку данных, относится к обеим процедурам, когда ваша зависимая переменная является непрерывной, что мы и рассмотрим в следующем разделе «Процедура тестирования» в разделе «Статистика SPSS». Однако если вы используете процедуру Непараметрические тесты > Независимые выборки, вам необходимо внести изменения в настройку данных, если ваша зависимая переменная является порядковой (т. е., а не непрерывной). Мы объясняем, как это сделать, в нашем расширенном руководстве по U-тестированию Манна-Уитни, доступ к которому вы можете получить, подписавшись на Laerd Statistics.
В нашем расширенном руководстве по U-тестированию Манна-Уитни мы покажем вам все шаги, необходимые для правильного ввода данных в SPSS Statistics для выполнения U-критерия Манна-Уитни как для непараметрических критериев > независимых выборок, так и для устаревших диалоговых окон > 2 независимых выборок. процедуры, описанные в примечании выше.
Статистика SPSS
Процедура тестирования в SPSS Statistics
Чтобы использовать SPSS Statistics, чтобы определить, имеют ли ваши два распределения одинаковые или разные формы, или если вы хотите узнать, как использовать SPSS Statistics для выполнения U-критерия Манна-Уитни, когда ваши два распределения имеют одинаковую форму, например что вам нужно сравнивать медианы, а не средние ранги, вам потребуется доступ к разделу «Процедуры» нашего расширенного руководства по U-тестированию Манна-Уитни (обратите внимание, вы можете сделать это, подписавшись на Laerd Statistics). Кроме того, приведенные ниже 10 шагов также показывают, как выполнить U-критерий Манна-Уитни с помощью процедуры Устаревшие диалоговые окна > 2 независимых выборки в SPSS Statistics. Как мы объясняли ранее, в SPSS Statistics есть две разные процедуры для запуска U-критерия Манна-Уитни: процедура Непараметрические критерии > Независимые выборки и процедура Устаревшие диалоговые окна > 2 независимых выборки. Мы рекомендуем процедуру Непараметрические тесты > Независимые выборки, если ваши два распределения имеют одинаковую форму, потому что ее немного проще выполнить, но процедура Устаревшие диалоговые окна > 2 независимых выборки подойдет, если ваши два распределения имеют разные формы. Мы покажем вам обе процедуры в нашем расширенном руководстве по U-тестированию Манна-Уитни.
В конце 9 шагов ниже мы покажем вам, как интерпретировать результаты этого теста, используя средние ранги.
Примечание. Описанная ниже процедура идентична для версий SPSS Statistics с 17 по 28, а также для подписной версии SPSS Statistics, при этом версия 28 и подписная версия являются последними версиями SPSS Statistics.Однако в версии 27 и версии по подписке SPSS Statistics представила новый вид своего интерфейса под названием «SPSS Light», заменив предыдущий вид для версий 26 и более ранних версий, который назывался «SPSS Standard». Таким образом, если у вас есть версия SPSS Statistics 27 или 28 (или версия SPSS Statistics по подписке), последующие изображения будут светло-серыми, а не синими. Однако процедура идентична.
-
Нажмите Аанализировать Nпараметрические тесты >LДиалоговые окна egacy > 2 Независимыевыборки. в верхнем меню, как показано ниже:
Опубликовано с письменного разрешения SPSS Statistics, IBM Corporation.
Опубликовано с письменного разрешения SPSS Statistics, IBM Corporation.
Опубликовано с письменного разрешения SPSS Statistics, IBM Corporation.
Примечание. Убедитесь, что флажок Mann-Whitney U установлен в области –Тип теста–, а поле Переменная группировки: выделено желтым цветом ( как видно выше). Если он не выделен желтым цветом, просто щелкните курсором в поле GПеременная группировки:, чтобы выделить его.
Присоединяйтесь к 10 000 студентов, ученых и специалистов, которые полагаются на статистику Laerd. ПОЛУЧИТЕ ТУРПЛАНЫ И ЦЕНЫ
- Нажмите кнопку. Кнопка не будет активна, если вы не выделили поле Grouting Variable:, как указано в шаге 4. Появится следующий экран: ол>р>
Опубликовано с письменного разрешения SPSS Statistics, IBM Corporation.
Перейдите на следующую страницу, чтобы узнать об оставшейся процедуре и о том, как интерпретировать вывод.
Читайте также: