Как рассчитать отклонение в Excel
Обновлено: 21.11.2024
Расчет разброса ваших данных с использованием дисперсии и стандартного отклонения
Доктор. Джоди Мюландер — бывший внештатный сотрудник Lifewire, чьи статьи публиковались в рецензируемых журналах и отчетах аэрокосмической отрасли.
Что нужно знать
- Чтобы рассчитать дисперсию на основе всей совокупности в Excel, используйте функцию ДИСП.П. Синтаксис VAR.P(число1;[число2]. )
- Чтобы рассчитать стандартное отклонение на основе всей совокупности, заданной в качестве аргументов, используйте функцию СТАНДОТКЛОН.П.
В этой статье объясняется суммирование данных и использование формул отклонения и дисперсии в Excel для Microsoft 365, Excel 2019, 2016, 2013, 2010, 2007 и Excel Online.
Обобщение данных: центральная тенденция и распространение
Центральная тенденция показывает, где находится середина данных или среднее значение. Некоторые стандартные меры центральной тенденции включают среднее значение, медиану и моду.
Разброс данных означает, насколько отдельные результаты отличаются от средних. Наиболее простой мерой разброса является диапазон, но он не очень полезен, поскольку имеет тенденцию увеличиваться по мере того, как вы отбираете больше данных. Дисперсия и стандартное отклонение являются гораздо лучшими показателями спреда. Дисперсия — это просто квадрат стандартного отклонения.
Выборка данных часто обобщается с использованием двух статистических данных: среднего значения и степени их разбросанности. Дисперсия и стандартное отклонение являются мерами того, насколько она разбросана. Несколько функций позволяют вычислить дисперсию в Excel. Ниже мы объясним, как решить, какой из них использовать, и как найти отклонение в Excel.
Формула стандартного отклонения и дисперсии
И стандартное отклонение, и дисперсия показывают, насколько в среднем каждая точка данных отличается от среднего значения.
Если бы вы вычисляли их вручную, вы бы начали с поиска среднего значения для всех ваших данных. Затем нужно найти разницу между каждым наблюдением и средним значением, возвести в квадрат все эти различия, сложить их все вместе, а затем разделить на количество наблюдений.
Это даст дисперсию, своего рода среднее значение для всех квадратов разностей. Извлечение квадратного корня из дисперсии корректирует тот факт, что все различия были возведены в квадрат, что приводит к стандартному отклонению. Вы будете использовать его для измерения распространения данных. Если это сбивает с толку, не волнуйтесь. Excel выполняет фактические расчеты.
Выборка или совокупность?
Часто ваши данные будут выборкой, взятой из более крупной совокупности. Вы хотите использовать эту выборку для оценки дисперсии или стандартного отклонения для совокупности в целом. В этом случае вместо деления на количество наблюдений (n) вы делите на n-1. Эти два разных типа вычислений имеют разные функции в Excel:
- Функции с P: дает стандартное отклонение для введенных вами фактических значений. Предполагается, что ваши данные — это все население (деленное на n).
- Функции с S: дает стандартное отклонение для всей совокупности, предполагая, что ваши данные являются выборкой, взятой из нее (деление на n-1). Это может сбивать с толку, так как эта формула дает расчетную дисперсию для населения; S означает, что набор данных является выборкой, но результат относится к генеральной совокупности.
Использование формулы стандартного отклонения в Excel
Чтобы рассчитать стандартное отклонение в Excel, выполните следующие действия.
Введите данные в Excel. Прежде чем вы сможете использовать функции статистики в Excel, вам необходимо иметь все данные в диапазоне Excel: столбец, строку или групповую матрицу столбцов и строк. Вы должны иметь возможность выбирать все данные, не выбирая никаких других значений.
Для остальной части этого примера данные находятся в диапазоне A1:A20.
Если ваши данные представляют все население, введите формулу "=СТАНДОТКЛОН.P(A1:A20)". В качестве альтернативы, если ваши данные представляют собой выборку из большей совокупности, введите формулу "=СТАНДОТКЛОН(A1:A20)".
Если вы используете Excel 2007 или более раннюю версию или хотите, чтобы ваш файл был совместим с этими версиями, используйте формулы "=СТАНДОТКЛОН(A1:A20)", если ваши данные представляют собой всю совокупность; "=STDEV(A1:A20)", если ваши данные являются выборкой из большей совокупности.
В ячейке будет отображаться стандартное отклонение.
Как рассчитать дисперсию в Excel
Расчет дисперсии очень похож на расчет стандартного отклонения.
Убедитесь, что ваши данные находятся в одном диапазоне ячеек в Excel.
Если ваши данные представляют все население, введите формулу "=VAR.P(A1:A20)". В качестве альтернативы, если ваши данные представляют собой выборку из большей совокупности, введите формулу "=VAR.S(A1:A20)".
БЕН СТОКТОН, ОБНОВЛЕНО 7 ЯНВАРЯ 2022 Г. Чтение: 11 минут
Вычисление дисперсии позволяет определить разброс чисел в наборе данных по отношению к среднему значению. Это отличный инструмент для аналитиков данных, которые могут использовать Excel для расчета дисперсии с помощью таких функций, как VAR.S и VAR.P. В этом пошаговом руководстве мы объясним, как использовать функции дисперсии.
С математической точки зрения дисперсия – это расчет того, насколько набор значений отличается от среднего значения (среднего). Если дисперсия равна нулю, разнообразия нет — все числа, скорее всего, будут одинаковыми. По мере роста этого числа растет и дисперсия.
Аналитики могут использовать это в самых разных целях: от определения разного возраста в группе до расчета распределения доходности по различным инвестиционным портфелям. Excel позволяет вычислять такую дисперсию, используя функции, предназначенные для целых наборов данных (дисперсия генеральной совокупности) или небольшого подмножества большей группы данных (дисперсия выборки).
Это важное отличие, так как Excel вычисляет дисперсию по-разному в зависимости от размера набора данных. Если вы работаете с выборкой меньшего размера, вам нужно будет использовать функции VAR, VAR.S или VARA для расчета дисперсии. Для дисперсии популяции вам потребуется вместо этого использовать VARP, VAR.P или VARPA.
Несмотря на то, что между этими функциями есть сходство, перед их использованием необходимо учитывать некоторые важные моменты. В этой статье мы объясним:
Как работают функции отклонения в Excel? Чтобы помочь вам, давайте рассмотрим основы.
1. Что такое функции дисперсии в Excel и для чего они используются?
Дисперсия работает, определяя разброс значений по отношению к среднему значению. Если у вас есть набор результатов экзаменов для группы студентов, вы можете получить совершенно разные значения на двух отдельных экзаменах, но с одним и тем же средним значением. Определив дисперсию, вы можете определить, насколько хорошо работает группа в целом.
Вы можете рассчитать этот спред (дисперсию) с помощью функций дисперсии Excel. Как мы уже упоминали, есть две основные формы дисперсии, которые вы можете рассчитать в Excel: дисперсия генеральной совокупности и дисперсия выборки. В этом контексте генеральная совокупность — это весь набор данных, а не его выборка (или меньшая часть).
Для расчета этих значений можно использовать одну из шести функций отклонения в Excel. Для выборочной дисперсии вы можете использовать функции VAR, VAR.S или VARA. VAR — это исходная функция, а VAR.S — более новая замена, предлагающая некоторые улучшения скорости по сравнению с оригиналом.
VAR и VAR.S поддерживают только числовые значения, но если вы хотите использовать текстовые строки или логические тесты для набора образцов, вам нужно вместо этого использовать VARA.
Для дисперсии совокупности вам необходимо использовать функции VARP, VAR.P или VARPA. Как и в случае функций выборочной дисперсии, VARP является исходной, а VAR.P является более новой (и рекомендуемой) заменой, при этом обе функции работают только с числовыми значениями. Для работы с текстовыми строками или логическими выражениями используйте VARPA.
Если вы думаете, что это очень похоже на стандартное отклонение, то это потому, что оно (почти) так и есть. Стандартное отклонение вычисляет, в среднем, насколько ваши значения далеки от среднего. Вариация — это просто квадрат значения стандартного отклонения, который дает вам представление о том, насколько далеко все ваши числа отклоняются от среднего.
2. Как работают функции дисперсии в Excel?
Как мы уже упоминали, существует шесть функций дисперсии, которые вы можете использовать в Excel, разделенных на две категории для работы либо с популяцией, либо с выборкой.
Из этих шести функций две (VAR и VARP) считаются устаревшими, поскольку их заменили на VAR.S и VAR.P. В настоящее время они взаимозаменяемы, но в будущем могут быть удалены из Excel.
Четыре из этих функций (VAR, VARP, VAR.S и VAR.P) ориентированы на числовые данные. Это означает, что если вы начинающий аналитик данных и пытаетесь вычислить дисперсию набора чисел, используя либо выборку набора данных, либо весь набор данных, вам следует использовать эти функции.
Однако, если ваши данные смешаны, вам нужно будет использовать вместо них VARA или VARPA. Эти функции поддерживают текст, числа и логические значения (ИСТИНА, ЛОЖЬ, 1 или 0).
Под поддержкой мы подразумеваем, что текстовые строки и логические результаты преобразуются в числовой эквивалент, где текстовая строка считается 0 (или FALSE). Логические значения считаются как их числовой эквивалент (0 для FALSE или 1 для TRUE). Это может повлиять на ваши общие результаты, поэтому тщательно выбирайте функции.
Если вы хотите создать формулу с использованием любой из этих функций дисперсии, вам потребуется использовать заданную структуру. Структура остается неизменной для каждых шести функций:
Единственным обязательным аргументом в формуле отклонения, использующей эти функции, является ссылка на используемые вами данные (значение1). На это можно ссылаться как на диапазон ячеек или непосредственно как на значения (где значение1 — ваше первое значение, значение2 — ваше второе значение и т. д.).
Для работы функции дисперсии требуется только одно значение (value1). Для диапазонов ячеек это считается одним значением (value1) для целей создания формулы.
3. На что следует обратить внимание перед использованием функций дисперсии в Excel
Прежде чем вы решите рассчитать дисперсию в Excel с помощью этих функций, необходимо принять во внимание множество соображений. В частности, вам необходимо учитывать:
4. Как рассчитать дисперсию в Excel: пошаговое руководство
Если у вас есть небольшая выборка из большого набора данных, вы можете использовать функции VAR, VAR.S или VARA для расчета дисперсии. Если вы пытаетесь рассчитать дисперсию в Excel, используя набор данных генеральной совокупности (то есть весь набор данных, а не меньшую выборку), вы можете сделать это с помощью VARP, VAR.P или VARPA.
В данном руководстве ссылки на VAR и VAR.S взаимозаменяемы. Мы использовали VAR.S, более новую и рекомендуемую функцию, но более старую VAR можно использовать (на данный момент) в старых книгах. Однако, если вы можете, используйте VAR.S.
Точно так же взаимозаменяемы ссылки на VARP и VAR.P, но в первую очередь следует использовать VAR.P. VARA и VARPA остаются доступными для всех пользователей Excel, независимо от используемой версии.
Шаг 1. Выберите пустую ячейку
Чтобы вставить функцию отклонения в новую формулу, начните с открытия книги Excel, содержащей ваши данные, и выбора пустой ячейки. Кроме того, вы можете открыть новую книгу, убедившись, что лист с вашими данными остается открытым и свернутым.
Выделив ячейку, нажимайте строку формул в нижней части панели ленты, пока не увидите мигающий курсор.
Когда появится мигающий курсор, вы готовы приступить к вставке новой формулы.
Шаг 2. Вставьте набор данных напрямую или с помощью ссылок на ячейки
Как мы объясняли ранее, все функции дисперсии в Excel используют одну и ту же структуру для создания новых формул. Чтобы вставить новую функцию дисперсии с использованием выборочного набора данных (меньшая выборка из большего набора данных), начните с ввода =VAR.S( или =VARA( в строке формул вверху.
Если вы работаете с набором данных о населении (всем набором данных), введите =VAR.P( или =VARPA( вместо этого.
Когда формула открыта, вам нужно будет вставить свои данные.Большинство пользователей, скорее всего, предпочтут ссылаться на данные в другом месте вашей текущей книги (или в свернутой книге), используя диапазон ячеек.
Например, =VAR.S(C2:C10) или =VAR.P(C2:C20) завершает формулу, используя числовые данные в диапазоне ячеек между ячейками C2 и C10 (для выборки) или C2. и C20 (для набора населения). Обязательно замените эти ссылки своими собственными.
Если вы работаете с данными, содержащими числа, текст и/или логические значения, лучше всего подойдет =ДИСПЕР(C2:C10) или =ДСП(C2:C20). Вместо того, чтобы игнорировать текст или логические значения (как это делают VAR, VAR.S, VARP или VAR.P), значения в формулах VARA или VARPA будут учитываться при подсчете общего результата.
Вы также можете ссылаться на каждую ячейку отдельно. Например, =VARA(C2:C10) и =VARA(C2,C3,C4,C5,C6,C7,C8,C9,C10) вернут один и тот же результат.
Если вы добавляете числовые значения непосредственно в формулу, вам нужно добавлять значения по одному. Каждое значение должно быть разделено запятыми. Например, =VAR.S(1,2,3,4,5,6) или =VAR.P(1,2,3,4,5,6,7,8,9,10) даст вам разница между числами 1 и 6 (или 1 и 10 для совокупности) напрямую.
То же самое можно сделать с VARA или VARPA. Например, =VARA(1,2,TRUE,3) будет работать, при этом значение TRUE будет считаться его числовым эквивалентом (1). Аналогично, =VARPA(1,2,TRUE,3,4,10,8) подсчитывает эти значения таким же образом, при этом TRUE считается равным 1.
Если вы добавили ссылку на диапазон ячеек, не забудьте после этого закрыть формулу закрывающей скобкой, а затем нажмите клавишу ВВОД, чтобы просмотреть результаты (или щелкните другую пустую ячейку). Для значений, добавляемых напрямую, поместите закрывающую скобку после того, как окончательное значение будет вставлено в формулу.
Заключительные мысли
Рассчитывая дисперсию, вы можете многое узнать о данных, с которыми работаете. Это делает жизнь типичного аналитика данных еще проще, позволяя вам подтверждать теории и гипотезы с помощью одной формулы Excel. Функции дисперсии входят в число многих формул Excel, которые аналитики данных регулярно используют для поиска результатов.
Excel упрощает работу с математическими функциями, такими как дисперсия и стандартное отклонение, особенно для начинающих. В Интернете также есть скрипты, которые немного облегчают задачу, например этот калькулятор дисперсии, но намного полезнее научиться рассчитывать дисперсию самостоятельно!
Если вы новичок в этой области и хотите узнать больше, попробуйте этот бесплатный пятидневный вводный курс по анализу данных. А если вы хотите разобраться с другими формулами Excel, ознакомьтесь со следующими материалами:
Что нужно сделать сейчас
Получите практическое введение в аналитику данных и проведите свой первый анализ с помощью нашего бесплатного краткого курса по аналитике данных для самостоятельного изучения.
Примите участие в одном из наших БЕСПЛАТНЫХ онлайн-мероприятий по анализу данных с участием экспертов отрасли.
Поговорите с консультантом программы, чтобы обсудить смену карьеры и то, как вы можете стать квалифицированным аналитиком данных всего за 4–7 месяцев с гарантией работы.
Хотите стать женщиной в сфере технологий в 2022 году? Подайте заявку на получение стипендии «Женщины в технологиях» до конца марта, чтобы обеспечить себе место в нашей программе анализа данных для тех, кто меняет карьеру.
Эта статья является частью:
Аналитика данных
Бен Стоктон — независимый технический писатель из Великобритании. Ранее он был преподавателем в британском колледже, обучая подростков и взрослых. Покинув класс, он стал техническим писателем, пишет практические статьи и учебные пособия для таких сайтов, как How-To Geek, MakeUseOf и Help Desk Geek. Он имеет степень по истории и аспирантуру в области вычислительной техники.
Статьи по теме об аналитике данных
Что такое описательная аналитика? Полное руководство
Что такое диагностическая аналитика? Полное руководство
Как найти выбросы в данных с помощью Python (и как с ними справиться)
Что такое CareerFoundry?
CareerFoundry — это онлайн-школа для тех, кто хочет начать карьеру в сфере высоких технологий. Выберите программу, обратитесь к опытному наставнику и репетитору и станьте готовым к работе дизайнером, разработчиком или аналитиком с нуля или верните свои деньги.
Дисперсия — один из самых полезных инструментов в теории вероятностей и статистике. В науке он описывает, насколько далеко каждое число в наборе данных от среднего. На практике это часто показывает, насколько сильно что-то меняется. Например, температура вблизи экватора имеет меньшую дисперсию, чем в других климатических зонах. В этой статье мы проанализируем различные методы расчета дисперсии в Excel.
Что такое дисперсия?
Дисперсия – это мера изменчивости набора данных, показывающая, насколько далеко разбросаны разные значения. Математически это определяется как среднее квадратов отличий от среднего.
Чтобы лучше понять, что вы на самом деле рассчитываете с помощью дисперсии, рассмотрите этот простой пример.
Предположим, что в вашем местном зоопарке есть 5 тигров в возрасте 14, 10, 8, 6 и 2 лет.
Чтобы найти отклонение, выполните следующие простые действия:
Итак, дисперсия равна 16. Но что на самом деле означает это число?
По правде говоря, дисперсия просто дает вам общее представление о дисперсии набора данных. Значение 0 означает отсутствие изменчивости, т. е. все числа в наборе данных одинаковы. Чем больше число, тем больше разбросаны данные.
Этот пример относится к дисперсии популяции (т. е. 5 тигров — это вся интересующая вас группа). Если ваши данные являются выборкой из большей совокупности, вам нужно рассчитать выборочную дисперсию, используя немного другую формулу.
Как рассчитать дисперсию в Excel
В Excel есть 6 встроенных функций для расчета отклонений: VAR, VAR.S, VARP, VAR.P, VARA и VARPA.
Ваш выбор формулы отклонения определяется следующими факторами:
- Используемая версия Excel.
- Вычисляете ли вы дисперсию выборки или генеральной совокупности.
- Хотите ли вы оценивать или игнорировать текстовые и логические значения.
Функции отклонения Excel
В приведенной ниже таблице представлен обзор функций изменения, доступных в Excel, которые помогут вам выбрать формулу, наиболее подходящую для ваших нужд.
Имя | Версия Excel | Тип данных | Текст и логика | tr>
VAR | 2000–2019 | Образец | Игнорируется |
VAR .S | 2010–2019 | Образец | Игнорируется |
VARA | 2000–2019 | Образец | Оценка |
VARP | 2000–2019 | Население | Игнорируется |
VAR.P | 2010–2019 | Население | < td>Игнорируется|
VARPA | 2000–2019 | Население | Оценивается | tr>
VAR.S против VARA и VAR.P против VARPA
VARA и VARPA отличаются от других функций дисперсии только тем, как они обрабатывают логические и текстовые значения в ссылках. В следующей таблице приведены сводные данные о том, как оцениваются текстовые представления чисел и логических значений.
Тип аргумента | VAR, VAR.S, VARP, VAR.P | VARA & VARPA | < /tr>
Логические значения в массивах и ссылках | Игнорируется | Оценивается (TRUE=1, FALSE=0) | tr>
Текстовое представление чисел в массивах и ссылках | Игнорируется | Оценивается как ноль |
Логические значения и текстовые представления чисел, введенных непосредственно в аргументы | Оценено (TRUE=1, FALSE=0) | tr> |
Пустые ячейки | Игнорируется |
Как рассчитать выборочную дисперсию в Excel
Выборка – это набор данных, извлеченных из всего населения. А дисперсия, рассчитанная по выборке, называется выборочной дисперсией.
Например, если вы хотите узнать, как меняется рост людей, технически невозможно измерить каждого человека на земле. Решение состоит в том, чтобы взять выборку населения, скажем, 1000 человек, и оценить рост всего населения на основе этой выборки.
Выборочная дисперсия рассчитывается по следующей формуле:
- x̄ — это среднее (простое среднее) значений выборки.
- n — размер выборки, т. е. количество значений в выборке.
В Excel есть 3 функции для нахождения выборочной дисперсии: VAR, VAR.S и VARA.
Функция VAR в Excel
Это старейшая функция Excel для оценки дисперсии на основе выборки. Функция VAR доступна во всех версиях Excel с 2000 по 2019.
Примечание. В Excel 2010 функция VAR была заменена функцией VAR.S, которая обеспечивает повышенную точность. Хотя VAR по-прежнему доступен для обратной совместимости, рекомендуется использовать VAR.S в текущих версиях Excel.
Функция VAR.S в Excel
Это современный аналог функции Excel VAR. Используйте функцию VAR.S, чтобы найти выборочную дисперсию в Excel 2010 и более поздних версиях.
Функция VARA в Excel
Функция Excel VARA возвращает примерную дисперсию на основе набора чисел, текста и логических значений, как показано в этой таблице.
Пример формулы отклонения в Excel
При работе с числовым набором данных вы можете использовать любую из вышеперечисленных функций для расчета выборочной дисперсии в Excel.
В качестве примера найдем дисперсию выборки, состоящей из 6 элементов (B2:B7). Для этого вы можете использовать одну из следующих формул:
Как показано на снимке экрана, все формулы возвращают один и тот же результат (округленный до 2 знаков после запятой):
Чтобы проверить результат, давайте посчитаем var вручную:
-
Найдите среднее значение с помощью функции СРЗНАЧ:
=СРЗНАЧ(B2:B7)
Как видите, результат нашего ручного вычисления var точно такой же, как число, возвращаемое встроенными функциями Excel:
Если ваш набор данных содержит логические и/или текстовые значения, функция VARA вернет другой результат. Причина в том, что VAR и VAR.S игнорируют любые значения, отличные от чисел, в ссылках, в то время как VARA оценивает текстовые значения как нули, TRUE как 1 и FALSE как 0. Поэтому тщательно выбирайте функцию дисперсии для своих расчетов в зависимости от того, используете ли вы хотите обработать или игнорировать текст и логические операции.
Как рассчитать дисперсию генеральной совокупности в Excel
Население — это все члены данной группы, т. е. все наблюдения в области исследования. Дисперсия населения описывает, как распределены точки данных во всей совокупности.
Дисперсию населения можно найти по следующей формуле:
- x̄ — среднее значение генеральной совокупности.
- n — размер совокупности, т. е. общее количество значений в совокупности.
В Excel есть 3 функции для расчета дисперсии генеральной совокупности: VARP, VAR.P и VARPA.
Функция VARP в Excel
Функция Excel VARP возвращает дисперсию генеральной совокупности на основе всего набора чисел. Он доступен во всех версиях Excel с 2000 по 2019.
Примечание. В Excel 2010 VARP был заменен на VAR.P, но по-прежнему сохранен для обратной совместимости. В текущих версиях Excel рекомендуется использовать ДИСП.П, поскольку нет гарантии, что функция ДИСП будет доступна в будущих версиях Excel.
Функция VAR.P в Excel
Это улучшенная версия функции VARP, доступная в Excel 2010 и более поздних версиях.
Функция VARPA в Excel
Функция ДИСПЕРС вычисляет дисперсию генеральной совокупности на основе всего набора чисел, текста и логических значений. Он доступен во всех версиях Excel с 2000 по 2019.
Формула дисперсии населения в Excel
В примере расчета переменной var мы обнаружили отклонение в 5 экзаменационных баллов, предполагая, что эти баллы были выбраны из большей группы учащихся. Если вы соберете данные обо всех учащихся в группе, эти данные будут представлять всю совокупность, и вы рассчитаете дисперсию совокупности, используя приведенные выше функции.
Допустим, у нас есть экзаменационные баллы группы из 10 учащихся (B2:B11). Оценки составляют всю совокупность, поэтому мы будем использовать эти формулы для дисперсии:
И все формулы вернут одинаковый результат:
Чтобы убедиться, что Excel правильно рассчитал отклонение, вы можете проверить его с помощью формулы ручного расчета переменной, показанной на снимке экрана ниже:
Если кто-то из студентов не сдавал экзамен и вместо количества баллов указано N/A, функция VARPA вернет другой результат. Причина в том, что VARPA оценивает текстовые значения как нули, в то время как VARP и VAR.P игнорируют текстовые и логические значения в ссылках. Подробную информацию см. в разделе VAR.P и VARPA.
Формула отклонения в Excel — примечания по использованию
Чтобы правильно выполнить анализ отклонений в Excel, следуйте этим простым правилам:
Отклонение от стандартного отклонения в Excel
Дисперсия, несомненно, полезная концепция в науке, но она дает очень мало практической информации. Например, мы нашли возраст популяции тигров в местном зоопарке и вычислили дисперсию, которая равна 16. Вопрос в том, как мы можем использовать это число?
Дисперсию можно использовать для расчета стандартного отклонения, которое является гораздо лучшим показателем количества вариаций в наборе данных.
Стандартное отклонение рассчитывается как квадратный корень из дисперсии. Итак, мы извлекаем квадратный корень из 16 и получаем стандартное отклонение 4.
В сочетании со средним значением стандартное отклонение может сказать, сколько лет большинству тигров. Например, если среднее значение равно 8, а стандартное отклонение равно 4, возраст большинства тигров в зоопарке составляет от 4 (8 - 4) до 12 лет (8 + 4).
Microsoft Excel имеет специальные функции для расчета стандартного отклонения выборки и генеральной совокупности. Подробное объяснение всех функций можно найти в этом руководстве: Как рассчитать стандартное отклонение в Excel.
Вот как сделать дисперсию в Excel. Чтобы поближе познакомиться с формулами, обсуждаемыми в этом руководстве, вы можете загрузить наш образец рабочей книги для расчета дисперсии в Excel. Я благодарю вас за чтение и надеюсь увидеть вас в нашем блоге на следующей неделе!
Итак, вас попросили рассчитать дисперсию с помощью Excel, но вы не знаете, что это значит и как это сделать. Не волнуйтесь, это простая концепция и еще более простой процесс. Вы скоро станете профессионалом в области дисперсии!
Что такое дисперсия?
«Дисперсия» — это способ измерения среднего расстояния от среднего значения. «Среднее» — это сумма всех значений в наборе данных, деленная на количество значений. Дисперсия дает нам представление о том, имеют ли значения в этом наборе данных тенденцию в среднем равномерно придерживаться среднего значения или разбросаны повсюду.
Математически дисперсия не так уж сложна:
- Вычислить среднее значение набора значений. Чтобы вычислить среднее, нужно разделить сумму всех значений на количество значений.
- Возьмите каждое значение в наборе и вычтите его из среднего значения.
- Возвести полученные значения в квадрат (чтобы исключить отрицательные числа).
- Сложите все значения в квадрате вместе.
- Вычислите среднее квадратов значений, чтобы получить дисперсию.
Как видите, вычислить это значение несложно. Однако, если у вас есть сотни или тысячи значений, это займет целую вечность, чтобы делать это вручную. Хорошо, что Excel может автоматизировать этот процесс!
Для чего вы используете дисперсию?
Дисперсия сама по себе имеет множество применений. С чисто статистической точки зрения это хороший сокращенный способ выразить, насколько разбросан набор данных. Инвесторы используют дисперсию для оценки риска данной инвестиции.
Например, взяв стоимость акции за определенный период времени и рассчитав ее дисперсию, вы получите хорошее представление о ее волатильности в прошлом. Если предположить, что прошлое предсказывает будущее, это будет означать, что что-то с низкой дисперсией более безопасно и предсказуемо.
Вы также можете сравнить отклонения чего-либо за разные периоды времени. Это может помочь определить, когда другой скрытый фактор влияет на что-то, изменяя его дисперсию.
Дисперсия также тесно связана с другим статистическим показателем, известным как стандартное отклонение. Помните, что значения, используемые для расчета дисперсии, возводятся в квадрат. Это означает, что дисперсия не выражается в той же единице исходного значения. Стандартное отклонение требует извлечения квадратного корня из дисперсии, чтобы вернуть значение к исходной единице. Таким образом, если данные были в килограммах, то и стандартное отклонение тоже.
Выбор между генеральной совокупностью и выборочной дисперсией
Есть два подтипа дисперсии с немного разными формулами в Excel. Какой из них выбрать, зависит от ваших данных. Если ваши данные включают всю «популяцию», вам следует использовать дисперсию населения. В этом случае «население» означает, что у вас есть все значения для каждого члена целевой группы населения.
Например, если вы смотрите на вес левшей, то население включает всех людей на Земле, которые являются левшами. Если бы вы взвесили их все, вы бы использовали дисперсию населения.
Конечно, в реальной жизни мы обычно довольствуемся меньшей выборкой из большей совокупности. В этом случае вы должны использовать выборочную дисперсию. Дисперсия населения по-прежнему актуальна для небольших групп населения. Например, в компании может быть несколько сотен или несколько тысяч сотрудников с данными о каждом сотруднике. Они представляют собой «население» в статистическом смысле.
Выбор правильной формулы отклонения
В Excel есть три формулы выборочной дисперсии и три формулы дисперсии генеральной совокупности:
Вы можете игнорировать VAR и VARP. Они устарели и используются только для совместимости с устаревшими электронными таблицами.
Остается VAR.S и VAR.P, которые предназначены для расчета дисперсии набора числовых значений, и VARA и VARPA, которые включают текстовые строки.
VARA и VARPA преобразуют любую текстовую строку в числовое значение 0, за исключением «ИСТИНА» и «ЛОЖЬ». Они преобразуются в 1 и 0 соответственно.
Самое большое отличие состоит в том, что VAR.S и VAR.P пропускают любые нечисловые значения. Это исключает эти случаи из общего числа значений, что означает, что среднее значение будет другим, потому что вы делите на меньшее количество наблюдений, чтобы получить среднее значение.
Как рассчитать дисперсию в Excel
Все, что вам нужно для расчета дисперсии в Excel, — это набор значений. Мы будем использовать VAR.S в приведенном ниже примере, но формула и методы будут одинаковыми независимо от того, какую формулу дисперсии вы используете:
- Если у вас есть диапазон или дискретный набор значений, выберите нужную пустую ячейку.
- В поле формулы введите =VAR.S(XX:YY), где значения X и Y заменяются первым и последним номером ячейки диапазона.
- Нажмите Enter, чтобы завершить расчет.
Кроме того, вы можете указать конкретные значения, и в этом случае формула будет выглядеть так =VAR.S(1,2,3,4). С числами, замененными тем, что вам нужно для расчета дисперсии. Вы можете ввести до 254 значений вручную, но если у вас всего несколько значений, почти всегда лучше вводить данные в диапазон ячеек, а затем использовать версию формулы для диапазона ячеек, описанную выше.
Вы можете преуспеть в, э-э, в Excel
Вычисление дисперсии — это полезный прием, который должен знать каждый, кому нужно выполнить некоторую статистическую работу в Excel. Но если какая-либо терминология Excel, которую мы использовали в этой статье, сбивает с толку, рассмотрите возможность ознакомиться с Учебным пособием по основам Microsoft Excel — Обучение использованию Excel.
Если, с другой стороны, вы готовы к большему, ознакомьтесь со статьей Добавление линии тренда линейной регрессии на точечную диаграмму Excel, чтобы вы могли визуализировать дисперсию или любой другой аспект вашего набора данных по отношению к среднему арифметическому.< /p>
Сидни Батлер — социолог и фанатик технологий, пытающийся понять, как сосуществуют люди и технологии. Он имеет двадцатилетний опыт работы внештатным специалистом по компьютерам и более десяти лет в качестве исследователя технологий и преподавателя. Сидни уже более пяти лет является профессиональным писателем по технологиям и освещает такие темы, как виртуальная реальность, игры, кибербезопасность и трансгуманизм. Прочитать полную биографию Сидни
Понравился ли вам этот совет?Если это так, загляните на наш собственный канал на YouTube, где мы рассказываем о Windows, Mac, программном обеспечении и приложениях, а также предлагаем множество советов по устранению неполадок и видео с практическими рекомендациями. Нажмите кнопку ниже, чтобы подписаться!
Читайте также: