Размер образца в Excel

Обновлено: 20.11.2024

Центральная предельная теорема утверждает, что выборочное распределение выборочного среднего приблизительно нормально, если размер выборки достаточно велик, даже если распределение генеральной совокупности не является нормальным.

Центральная предельная теорема также утверждает, что выборочное распределение будет обладать следующими свойствами:

<р>1. Среднее значение распределения выборки будет равно среднему значению распределения генеральной совокупности:

х = мк

<р>2. Стандартное отклонение выборочного распределения будет равно стандартному отклонению генеральной совокупности, деленному на размер выборки:

s = σ / √ n

В этом руководстве мы объясним, как применить центральную предельную теорему в Excel к заданному распределению.

Применение центральной предельной теоремы в Excel

Предположим, у нас есть распределение со средним значением 8 и стандартным отклонением 4. Мы можем использовать следующие формулы в Excel, чтобы найти как среднее значение, так и стандартное отклонение выборочного распределения с объемом выборки 15:

Среднее значение выборочного распределения просто равно среднему значению распределения генеральной совокупности, равному 8.

Стандартное отклонение выборочного распределения равно стандартному отклонению генеральной совокупности, деленному на размер выборки, то есть: 4 /√15 = 1,0328.

Мы также можем использовать центральную предельную теорему, чтобы ответить на вопросы о вероятностях. Например, если данная совокупность имеет среднее значение 8 и стандартное отклонение 4, какова вероятность того, что данная выборка размером 15 имеет среднее значение меньше или равно 7?

Чтобы ответить на этот вопрос, мы можем использовать функцию НОРМ.РАСП() в Excel, которая использует следующий синтаксис:

НОРМ.РАСП(x, среднее, стандартное_отклонение, совокупное)

  • x: пример означает, что вы хотите протестировать
  • mean: ожидаемое среднее значение выборочного распределения
  • standard_dev: ожидаемое стандартное отклонение выборочного распределения.
  • кумулятивный: TRUE возвращает значение обычного CDF; FALSE возвращает значение обычного PDF. В нашем случае мы всегда будем использовать TRUE.

Эта функция вернет вероятность того, что среднее значение выборки меньше или равно определенному значению.

Вот формула, которую мы будем использовать в этом примере:

Это говорит нам о том, что для совокупности со средним значением 8 и стандартным отклонением 4 вероятность того, что данная выборка размера 15 имеет среднее значение меньше или равное 7, составляет 0,1665.

Мы также можем найти вероятность того, что заданный объем выборки имеет среднее значение больше определенного числа, просто используя формулу 1 – НОРМ.РАСП().

Например, следующая формула показывает, как найти вероятность того, что для данного размера выборки, равного 15, среднее значение больше 7:

Наконец, мы можем найти вероятность того, что заданный объем выборки будет иметь среднее значение между двумя числами, используя формулу НОРМ.РАСП(большее число) – НОРМ.РАСП(меньшее число).< /p>

Например, следующая формула показывает, как найти вероятность того, что для данного размера выборки, равного 15, среднее значение находится в диапазоне от 7 до 9:

Определение размера выборки является очень важным вопросом, поскольку слишком большие выборки могут привести к пустой трате времени, ресурсов и денег, а слишком маленькие выборки могут привести к неточным результатам. Следовательно, необходимо определить минимальный рекомендуемый размер вашего опроса. Если вы опросите такое количество людей, вы получите результаты, которые точно отражают целевую группу населения.

Граница погрешности
Граница погрешности или доверительный интервал обычно указывается в результатах опроса общественного мнения. Это 95-процентный доверительный интервал, т. е. каждые 20 раз, когда вы повторяете этот опрос, согласно статистике, один раз вы получите совершенно неожиданный ответ.Например: опрос имел погрешность плюс-минус три процентных пункта (3%) и 51% процентов вашей выборки выбрали ответ, вы можете быть «уверены», что если бы вы задали вопрос всей релевантной совокупности между 48% (51-3) и 54% (51+3) выбрали бы этот ответ.

Об авторе:

Deepanshu основала ListenData с простой целью: сделать аналитику простой для понимания и использования. Он имеет более чем 10-летний опыт работы в области науки о данных. За время своего пребывания в должности он работал с глобальными клиентами в различных областях, таких как банковское дело, страхование, частный капитал, телекоммуникации и управление персоналом.

Хотя мне нравится иметь друзей, которые согласны, я учусь только у тех, кто не
Отправьте электронное письмо LinkedIn о связи с нами

Отличный и достойный пост. Я нашел это очень информативным относительно того, что я именно искал. Спасибо за такой пост и так держать.

Размер выборки — самый важный термин, используемый в статистике. Это часть или процент, который вы выбираете из совокупности для опроса или эксперимента, или мнений или поведения, которые вас беспокоят. Важно выбрать наиболее подходящий размер выборки, потому что очень меньший размер выборки даст вам только неподходящие результаты, а очень большой размер выборки приведет к пустой трате времени, денег, ресурсов и т. д. И когда у вас больше или меньше населения , на основании чего можно проводить опрос. Для этого опрос проводится по набору случайных выборок. Формула Кокрана является наиболее подходящей формулой для определения размера выборки вручную. Чтобы использовать эту формулу, необходимо знать желаемый уровень точности и размер популяции.

Загрузить корпоративную оценку, инвестиционно-банковские услуги, бухгалтерский учет, калькулятор CFA и другие

Формула для размера выборки может быть записана математически следующим образом:

  • Если вы хотите определить размер выборки для большей совокупности, можно использовать следующую формулу.
  • Если вы хотите определить размер выборки для меньшей совокупности, приведенную выше формулу можно изменить, как показано ниже.

Примеры формулы размера выборки

Давайте рассмотрим пример, чтобы лучше понять расчет размера выборки.

Предположим, что балл GRE отсутствует для коучингового центра бренда X для 1000 студентов. Полученная оценка равна 3002, а среднее значение равно 1480. Стандартное отклонение равно 480. Вы ожидаете, что допустимая погрешность составит 80%. Соотношение устанавливается равным 0,8. Рассчитайте размер выборки, используя информацию:

Решение:

Z — оценка рассчитывается по формуле, приведенной ниже

Z = (X – M) / σ

  • Z – балл = (3002–1480) / 480
  • Z — оценка = 3,17

Размер выборки рассчитывается по приведенной ниже формуле

S = (Z 2 * P * Q) / E 2

  • Размер выборки = (3,17 2 * 0,8 * 0,2) / (80 %) 2.
  • Размер выборки = 2,51

Для этого набора данных соответствующий размер выборки – 2,51

.

Все в одном пакете для финансового аналитика: более 250 курсов, более 40 проектов, более 250 онлайн-курсов | 1000+ часов | Поддающиеся проверке сертификаты | Пожизненный доступ
4,9 (3296 оценок)

Предположим, что на горной станции X всего 52 отеля. Нам нужно найти, сколько отелей предоставляют завтрак в X. Половина отеля может предоставлять завтрак для клиентов; поэтому примем P равным 0,5. Уровень достоверности составляет 95%, а допустимая погрешность также считается равной 85%. Рассчитайте размер выборки, используя информацию:

Предполагая, что это нормальное распределение, давайте найдем значение Z из таблицы Z. Для 95 % доверительного значения значение Z будет равно 1,96 для обычной таблицы. Z = 1,96.

Решение:

Для большого населения

Размер выборки рассчитывается по приведенной ниже формуле

S = (Z 2 * P * Q) / E 2

  • Размер выборки = (1,96 2 * 0,5 * 0,5) / (85 %) 2.
  • Размер выборки = 1,33

Для небольшого населения

Размер выборки рассчитывается по приведенной ниже формуле

Sмаленький = S / (1 + ((S – 1) / N))

  • Размер выборки = 1,33 / (1 + ((1,33 - 1) / 52))
  • Размер выборки = 1,32

Для этого набора данных соответствующий размер выборки – 1,32

.

Пояснение

Шаг 1. Запишите значение. Значение Z можно назвать показателем Z или значением стандартного показателя. Это число стандартного отклонения, которое имеет средняя точка данных совокупности. То есть, скажем, у вас есть определенный размер населения, и у него есть некоторое среднее значение, которое является точкой данных. Таким образом, Z-показатель — это общее количество стандартных отклонений до и после этой средней точки данных. Как правило, это значение можно найти в таблице Z. У оценки Z тоже есть базовая формула.

Z = (X – M) / σ

Здесь X — общая численность населения, M — среднее значение населения, а σ — стандартное отклонение. Предположим, у вас есть нормально распределенный набор данных 80, среднее значение набора данных равно 50 и стандартное отклонение 15. Теперь

Эта Z-оценка показывает число стандартных отклонений вашего набора данных от средней точки данных. Здесь оно имеет 2 стандартных отклонения выше своего среднего значения.

Шаг 2. Запишите значение P. P – это не что иное, как доля населения.

Шаг 3. Запишите значение E. E – это предел погрешности, который представляет собой значение в %, показывающее, как долго вы можете ждать своих результатов, чтобы отразить конечные результаты или мнения всего населения. Чем меньше значение E, тем соответствующий размер выборки можно получить по этой формуле.

Шаг 4. Найдите значение Q. Q = 1 – P.

Шаг 5. Наконец, запишите значение N. Это общая численность населения или количество людей, которым вы хотите провести исследование.

Шаг 6. Теперь, если у вас большая группа населения, вы можете применить отмеченные значения в данной формуле.

S = (Z 2 * P * Q) / E 2

Шаг 7. Теперь, если у вас меньше населения, вы можете применить указанные значения в приведенной ниже формуле. Ssmall — это просто размер выборки для небольшой совокупности.

Sмаленький = S / (1 + ((S – 1) / N))

Релевантность и использование формулы размера выборки

Любая сфера бизнеса, которую вы выбираете, как она работает, какую реакцию получает от клиентов и насколько она хороша или плоха по сравнению с другими аналогичными вещами на рынке, все это следует часто оценивать, чтобы улучшить производительность. любого бизнеса и увеличить свой капитал и доход. В том случае, когда кто-то хочет провести какие-либо опросы или исследования, не весь объем данных может быть протестирован. Скажем, например, опрос миллионов людей за раз отнимает много времени и денег. Взятие 1 из миллионов не даст вам правильного результата, что также приведет к отрицательным результатам, что является ошибкой типа II. Следовательно, для выбранного процентного количества всего населения будет проведено обследование. Эта часть генеральной совокупности будет взята в качестве случайной выборки.

Калькулятор формулы размера образца

Вы можете использовать следующий калькулятор размера выборки

Формула размера выборки в Excel (с шаблоном Excel)

Здесь мы рассмотрим пример формулы размера выборки. Это очень легко и просто.

Ниже представлены два разных набора данных. Рассчитайте размер выборки, используя приведенную ниже информацию.

В шаблоне Excel для двух разных наборов данных мы нашли размер выборки. Для первого набора вручную мы нашли значение Z, поскольку даны общее значение, среднее значение и стандартное отклонение. Для второго набора дается непосредственная Z-оценка для 85 % уровня достоверности. Поскольку общий размер совокупности невелик, Ssmall также находится для соответствующего значения размера выборки.

Для большого населения

Размер выборки рассчитывается по приведенной ниже формуле

S = (Z 2 * P * Q) / E 2

  • Размер выборки = (3,23 2 * 0,7 * 0,3) / (95 %) 2.
  • Размер выборки = 2,43
  • Размер выборки = (1,96 2 * 0,6 * 0,4) / (88 %) 2.
  • Размер выборки = 1,19

Для небольшого населения

Размер выборки рассчитывается по приведенной ниже формуле

Sмаленький = S / (1 + ((S – 1) / N))

  • Размер выборки = 1,19 / (1 + ((1,19 – 1) / 38))
  • Размер выборки = 1,185

Рекомендуемые статьи

Это руководство по формуле размера выборки. Здесь мы обсудим, как рассчитать размер выборки вместе с практическими примерами. Мы также предоставляем калькулятор размера выборки с загружаемым шаблоном Excel. Вы также можете прочитать следующие статьи, чтобы узнать больше –

Выборочное распределение — это вероятностное распределение определенной статистики, основанное на множестве случайных выборок из одной совокупности.

В этом учебном пособии объясняется, как выполнить следующие действия с выборочными распределениями в Excel:

  • Создайте выборочное распределение.
  • Визуализируйте распределение выборки.
  • Рассчитать среднее значение и стандартное отклонение выборочного распределения.
  • Рассчитать вероятности относительно выборочного распределения.

Создание выборочного распределения в Excel

Предположим, мы хотим создать выборочное распределение, состоящее из 1000 выборок, в котором размер каждой выборки равен 20 – нормальное распределение со средним значением 5,3 и стандартным отклонением 9.

Это легко сделать, введя следующую формулу в ячейку A2 нашего рабочего листа:

Затем можно навести указатель мыши на правый нижний угол ячейки, пока не появится крошечный +, и перетащить формулу на 20 ячеек вправо и на 1000 ячеек вниз:

Каждая строка представляет выборку размера 20, в которой каждое значение получено из нормального распределения со средним значением 5,3 и стандартным отклонением 9.

Найти среднее значение и стандартное отклонение

Чтобы найти среднее значение и стандартное отклонение этого выборочного распределения выборочных средних, мы можем сначала найти среднее значение каждой выборки, введя следующую формулу в ячейку U2 нашего рабочего листа:

Затем мы можем навести указатель мыши на правый нижний угол ячейки, пока не появится крошечный +, и дважды щелкнуть, чтобы скопировать эту формулу в каждую другую ячейку в столбце U:

Мы видим, что первая выборка имела среднее значение 7,563684, вторая выборка — 10,97299 и т. д.

Затем мы можем использовать следующие формулы для расчета среднего значения и стандартного отклонения выборочных средних:

Теоретически среднее значение выборочного распределения должно быть 5,3. Мы видим, что фактическое среднее значение выборки в этом примере равно 5,367869, что близко к 5,3.

Теоретически стандартное отклонение выборочного распределения должно быть равно s/√n, то есть 9 / √20 = 2,012. Мы видим, что фактическое стандартное отклонение выборочного распределения составляет 2,075396, что близко к 2,012.

Визуализируйте распределение выборки

Мы также можем создать простую гистограмму для визуализации выборочного распределения выборочных средних.

Для этого просто выделите все средние значения выборки в столбце U, нажмите вкладку "Вставка", затем выберите параметр "Гистограмма" в разделе "Диаграммы".

В результате получается следующая гистограмма:

Мы видим, что распределение выборки имеет форму колокола с пиком около значения 5.

Однако из хвостов распределения видно, что для некоторых выборок средние значения больше 10, а для некоторых средние меньше 0.

Вычисление вероятностей

Мы также можем рассчитать вероятность получения определенного значения среднего значения выборки на основе среднего значения совокупности, стандартного отклонения совокупности и размера выборки.

Например, мы можем использовать следующую формулу, чтобы найти вероятность того, что среднее значение выборки меньше или равно 6, учитывая, что среднее значение генеральной совокупности равно 5,3, стандартное отклонение генеральной совокупности равно 9, а размер выборки равен:< /p>

Мы видим, что вероятность того, что среднее значение выборки меньше или равно 6, составляет 0,638.

Это очень близко к вероятности, рассчитанной калькулятором распределения выборки:

Читайте также: