Проверка гипотезы о равномерном распределении excel

Обновлено: 21.11.2024

Непараметрический тест (иногда называемый тестом свободного распределения) ничего не предполагает относительно базового распределения (например, что данные поступают из нормального распределения). Это можно сравнить с параметрическим тестом, который делает предположения о параметрах совокупности (например, среднее значение или стандартное отклонение); Когда в статистике используется слово «непараметрический», это вовсе не означает, что вы ничего не знаете о населении. Обычно это означает, что вы знаете, что данные о населении не имеют нормального распределения.

Посмотрите видео, чтобы узнать о различиях между параметрическими и непараметрическими тестами и узнать, когда вам может понадобиться использовать непараметрические тесты:

Например, одним из предположений для однофакторного дисперсионного анализа является то, что данные поступают из нормального распределения. Если ваши данные не распределены нормально, вы не можете запустить дисперсионный анализ, но вы можете запустить непараметрическую альтернативу — тест Крускала-Уоллиса.

По возможности следует использовать параметрические тесты, так как они более точны. Параметрические тесты обладают большей статистической мощностью, что означает, что они, скорее всего, обнаружат действительно значимый эффект. Используйте непараметрические тесты только в случае необходимости (т. е. вы знаете, что такие предположения, как нормальность, нарушаются). Непараметрические тесты могут хорошо работать с ненормальными непрерывными данными, если у вас достаточно большой размер выборки (обычно 15–20 элементов в каждой группе).

Когда использовать

Непараметрические тесты используются, когда ваши данные не соответствуют норме. Поэтому ключ в том, чтобы выяснить, есть ли у вас нормально распределенные данные. Например, вы можете посмотреть на распределение ваших данных. Если ваши данные примерно в норме, то вы можете использовать параметрические статистические тесты.
В. Если у вас нет графика, как узнать, нормально ли распределены ваши данные?
А. Проверьте асимметрию и эксцесс распределения с помощью программного обеспечения, такого как Excel (см.: Асимметрия в Excel 2013 и эксцесс в Excel 2013).
Нормальное распределение не имеет перекоса. В основном, это центрированная и симметричная форма. Эксцесс относится к тому, сколько данных находится в хвостах и ​​в центре. Асимметрия и эксцесс для нормального распределения составляют около 1.

Отрицательный эксцесс (слева) и положительный эксцесс (справа)


Если ваше распределение не нормальное (другими словами, асимметрия и эксцесс сильно отклоняются от 1,0), вам следует использовать непараметрический тест, например критерий хи-квадрат. В противном случае вы рискуете, что ваши результаты будут бессмысленными.

Типы данных

Подходят ли ваши данные для параметрического теста или вам нужно использовать непараметрический тест, такой как хи-квадрат? Эмпирическое правило:

  • Для номинальных или порядковых шкал используйте непараметрическую статистику.
  • Для шкал интервалов или шкал отношений используйте параметрическую статистику.

Асимметричное распределение — одна из причин для проведения непараметрического теста.

  • Одно или несколько допущений параметрического теста были нарушены.
  • Размер вашей выборки слишком мал для проведения параметрического теста.
  • В ваших данных есть выбросы, которые нельзя удалить.
  • Вы хотите проверить медиану, а не среднее значение (вы можете сделать это, если у вас очень асимметричное распределение).

Типы непараметрических тестов

Когда слово "параметрический" используется в статистике, оно обычно означает такие тесты, как ANOVA или t-критерий. Оба этих теста предполагают, что данные о населении имеют нормальное распределение. Непараметрические не предполагают, что данные нормально распределены. Единственный непараметрический тест, который вы, вероятно, встретите в элементарной статистике, — это тест хи-квадрат. Однако есть несколько других. Например: критерий Крускала-Уиллиса – это непараметрическая альтернатива однофакторному дисперсионному анализу, а критерий Манна Уитни – непараметрическая альтернатива двухвыборочному t-критерию.

В следующей таблице перечислены непараметрические тесты и их параметрические альтернативы.

Непараметрический тест Параметрическая альтернатива
критерий знака с 1 выборкой Z-критерий с одной выборкой, t-критерий с одной выборкой
критерий знакового ранга Вилкоксона с 1 выборкой Z-критерий для одной выборки, t-критерий для одной выборки
Критерий Фридмана Двусторонний дисперсионный анализ
Тест Краскела-Уоллиса Однофакторный дисперсионный анализ
Тест Манна-Уитни Т-критерий независимых выборок
Медианный тест настроения Однофакторный дисперсионный анализ
Ранговая корреляция Спирмена Коэффициент корреляции

Преимущества и недостатки

По сравнению с параметрическими тестами непараметрические тесты имеют ряд преимуществ, в том числе:

  • Больше статистической мощности, когда допущения для параметрических тестов были нарушены. Когда допущения не нарушаются, они могут быть почти такими же действенными.
  • Меньше допущений (т. е. предположение о нормальности не применяется).
  • Допускается небольшой размер выборки.
  • Их можно использовать для всех типов данных, включая номинальные переменные, интервальные переменные или данные, содержащие выбросы или данные, измеренные неточно.
  • Менее эффективны, чем параметрические тесты, если допущения не были нарушены.
  • Более трудоемкий расчет вручную (для компьютерных расчетов это не проблема).
  • Таблицы критических значений для многих тестов не включены во многие компьютерные пакеты программного обеспечения. Это сравнивается с таблицами для параметрических тестов (такими как z-таблица или t-таблица), которые обычно включаются.

Ссылки

Коц, С.; и др., ред. (2006), Энциклопедия статистических наук, Wiley.
Линдстрем, Д. (2010). «Простое наброски статистики Шаума», второе издание (Простые наброски Шаума), 2-е издание. Образование McGraw-Hill

Нужна помощь с домашним заданием или контрольным вопросом? С Chegg Study вы можете получить пошаговые решения ваших вопросов от эксперта в этой области. Ваши первые 30 минут занятий с репетитором Chegg бесплатны!

Комментарии? Нужно опубликовать исправление? Оставьте комментарий на нашей странице Facebook.

Запрос случайного набора, скажем, 100 чисел от 1 до 10 эквивалентен созданию выборки из непрерывного равномерного распределения, где α = 1 и β = 10 в соответствии со следующим определением.

Определение 1. Непрерывное равномерное распределение имеет функцию плотности вероятности (pdf)

где α и β — любые параметры с α

Наблюдение: соответствующая кумулятивная функция распределения (cdf) равна

Обратная кумулятивная функция распределения

Рисунок 1. Статистические свойства равномерного распределения

Функции реальной статистики: Excel не предоставляет никаких функций для равномерного распределения. Вместо этого вы можете использовать следующие функции, предоставляемые пакетом ресурсов Real Statistics.

UNIFORM_DIST(x, α, β, совокупность) = PDF непрерывного равномерного распределения f(x) в x, когда cum = FALSE, и соответствующую кумулятивную функцию распределения F(x), когда cum = ИСТИНА.

UNIFORM_INV(p, α, β) = x так, что UNIFORM_DIST(x, α, β, TRUE) = п. Таким образом, UNIFORM_INV является обратным кумулятивному равномерному распределению

Наблюдение: непрерывное равномерное распределение в интервале (0, 1) может быть выражено как бета-распределение с параметрами α = 1 и β = 1.

Примеры

Пример 1. Автобус ходит регулярно каждые 20 минут в течение дня. Какова вероятность того, что вам придется ждать более 15 минут, если вы прибудете в случайное время?

Пусть x = время, когда вы попадаете в интервал от a = 0 до b = 20. Случайная величина имеет равномерное распределение . Таким образом, вероятность того, что вы будете ждать не более 15 минут, равна F(15) = (–a)/(b а) = (15–0)/(20–0) = 0,75. Это означает, что вероятность того, что вам придется ждать более 15 минут, составляет 1–0,75 = 0,25.

Пример 2. Случайная выборка размером 40 берется из совокупности с равномерным распределением, как показано в диапазоне A3:E10 на рисунке 2. Какова вероятность того, что любой случайный элемент выборки будет меньше 5?

Рисунок 2. Пример равномерного распределения

Это похоже на пример 1, за исключением того, что мы не знаем значений конечных точек a и b равномерного распределения. Начнем с вычисления выборочного среднего и стандартного отклонения (ячейки H3 и H4 на рис. 2). Мы предполагаем, что это разумные оценки среднего значения генеральной совокупности и стандартного отклонения.

Из рисунка 1 видно, что 12,425 = 2μ = a + b и 9,809 = √12 σ = b – a. Решая эти одновременные уравнения для a и b, мы получаем a = 1,308 и b = 11,117. Пусть x будет значением элемента, случайно взятого из распределения. Вероятность того, что x

Похожие темы

Существует также дискретная версия равномерного распределения. С равномерными распределениями связаны порядковые статистики. Нажмите на любую из следующих ссылок для получения дополнительной информации:

video-placeholder

4,6 (2117 классификаций)

45 000 000 000 000 записей

Транскрипция видео

Полезные количественные модели помогают принимать обоснованные решения как в ситуациях, когда факторы, влияющие на ваше решение, ясны, так и в ситуациях, когда некоторые важные факторы вообще не ясны. В этом курсе вы узнаете, как создавать количественные модели, отражающие сложные реалии, и как включать в свою модель элементы риска и неопределенности. Вы также изучите методы создания прогностических моделей для определения оптимального выбора; и как этот выбор меняется в ответ на изменения допущений модели. Вы также изучите основы измерения и управления рисками. К концу этого курса вы сможете создавать свои собственные модели с вашими собственными данными, чтобы вы могли начать принимать решения на основе данных. Вы также подготовитесь к следующему курсу специализации.

Habilidades que você aprenderá

Моделирование, риск, Microsoft Excel, имитация

Avaliações

4,6 (2117 классификаций)

28 ноября 2019 г.

Сложный курс, но сложный в хорошем смысле. Этот курс заставит вас думать по-новому и улучшит ваши навыки во многих областях, включая анализ, критическое мышление и числа.

5 апреля 2020 г.

Благодаря этому курсу я научился связывать данные и решения с помощью электронных таблиц. Я построил модели и использовал их для принятия решений в неопределенных условиях бизнеса. Курс был хорошим.

Неделя 3. Выбор дистрибутивов, соответствующих вашим данным

Принимая бизнес-решения, мы часто смотрим в прошлое, чтобы делать прогнозы на будущее. В этом модуле вы изучите часто используемые распределения случайных величин для моделирования будущего и прогнозирования. Вы узнаете, как создавать значимые визуализации данных в Excel, как выбрать правильное распределение для ваших данных, изучить различия между дискретными распределениями и непрерывными распределениями, а также проверить выбранную вами модель и вашу гипотезу на соответствие. К концу этого модуля вы сможете представлять свои данные с помощью графиков, выбирать наилучшую модель распределения для своих данных и проверять свою модель и свою гипотезу, чтобы увидеть, подходят ли они наилучшим образом для ваших данных.

Вывод статистики в Excel: вероятности, доверительные интервалы, проверка гипотез, тест Anova, регрессионный анализ и т. д. в Excel

Алькосер, Джованни

Это конкретное издание ISBN в настоящее время недоступно.

Эта книга задумана как расширенное руководство по математическим методам в науке.Он охватывает многие темы: классическая вероятность, распределение вероятностей для дискретной и непрерывной случайной величины, совместное распределение вероятностей, математическое ожидание, дисперсия и ковариация, теорема Чебышева, дискретные распределения: равномерное, биномиальное, полиномиальное, пуассоновское, геометрическое, гипергеометрическое и биномиальное отрицательное распределение. , непрерывное равномерное распределение: равномерное, экспоненциальное, гамма, хи-квадрат, нормальное логарифмическое, Вейбулла, нормальное, центральная предельная теорема, доверительные интервалы, выбор правильного размера выборки, проверка гипотезы выборки, проверка, связанная с пропорциями, гипотеза тестирование для двух выборок для независимых и зависимых выборок, проверка пропорции двух выборок, тест Anova, регрессионный анализ, коэффициент корреляции и т. д. Он включает вывод многих формул, чтобы прояснить концепции логической статистики, применяемые в науке. Мы надеемся, что эта книга удовлетворит все потребности учащихся в изучении основ статистического вывода и вызовет интерес и мотивацию учащихся к этой теме.

«Синопсис» может принадлежать другому изданию этого названия.

Джованни Алькосер, инженер-электронщик, магистр физики и магистр естественных наук со специализацией в области астрофизики и медицинской физики. Он получил степень магистра наук в Германии. Профессор физики, высшей математики и естественных наук в целом. Он отличный научный исследователь и профессор с различными успешными исследовательскими проектами и книгами.

Читайте также: