Как построить таблицу непредвиденных обстоятельств в Excel

Обновлено: 06.07.2024

cross-tabulating-variables-how-to-create-a-contingency-table-in-microsoft-excel

Таблицы непредвиденных обстоятельств (также называемые перекрестными таблицами) полезны в качестве элементарного инструмента для анализа связи между двумя переменными. В таблице непредвиденных обстоятельств одна переменная представлена ​​в столбцах, а другая в строках. Рассматривая распределение одной переменной по категориям другой, мы можем получить предварительное представление об ассоциации между переменными. Сопоставить переменные в таблицах с помощью Microsoft Excel довольно просто.

Таблицы непредвиденных обстоятельств наиболее полезны, когда переменные имеют ограниченное количество категорий ответов. Для полезного анализа переменных с несколькими категориями может потребоваться их группировка (но только если это имеет смысл). Например, в ходе опроса респондентов могут спросить об их доходах (в долларах или тысячах долларов и т. д.). Если информация будет собираться таким образом, скорее всего, будет множество уникальных вариантов ответа. Может иметь смысл сгруппировать данные по ограниченному набору категорий (например, диапазоны доходов) для таких переменных.

Примечание. Для создания таблицы непредвиденных обстоятельств данные должны быть уже введены в Microsoft Excel и правильно закодированы. Чтобы получить помощь в этом процессе, обратитесь к статье Анализ данных опроса в Microsoft Excel: кодирование, ввод данных и создание частотных распределений.

Давайте рассмотрим пример шаг за шагом. Мы можем создать таблицу непредвиденных обстоятельств (кросс-таблицу), используя функцию сводной таблицы Microsoft Excel. Для иллюстрации этого процесса будут использованы данные Общего социального исследования (GSS) 2008 года.

Шаг 1. Определите переменные, которые вы будете анализировать

Укажите две переменные, которые вы хотите проанализировать, в таблице непредвиденных обстоятельств. У вас должна быть причина хотеть проанализировать эти две переменные вместе. Определите, какую переменную вы считаете независимой и зависимой.

Обычно считается, что независимая переменная влияет на зависимую переменную. Иногда независимая переменная рассматривается как «причина», а зависимая переменная — как «следствие» (однако важно помнить, что переменные также могут быть связаны друг с другом, причем одна обязательно «вызывает» другую).

В этом руководстве показано, как создать кросс-таблицу, также называемую таблицей непредвиденных обстоятельств, из двух качественных переменных в Excel с помощью программного обеспечения XLSTAT.

Набор данных для создания кросс-таблицы или таблицы непредвиденных обстоятельств

Набор данных содержит информацию о 20 клиентах: их возраст, город проживания и пол. Мы создадим таблицу непредвиденных обстоятельств на основе переменных «Возраст» и «Город».

Создание кросс-таблицы или таблицы непредвиденных обстоятельств

XLSTAT Функция для создания таблицы сопряженности

После открытия XLSTAT выберите команду XLSTAT / Подготовка данных / Создать таблицу непредвиденных обстоятельств.

После того как вы нажмете соответствующую кнопку, появится диалоговое окно.

На вкладке "Общие" выберите переменную категории, которую вы хотите использовать в строках. Выберите переменную Age, выбрав весь столбец. Затем выберите переменную, которая будет использоваться в столбцах. Здесь мы выбираем переменную City. Столбцы B и C содержат метки переменных, поэтому необходимо отметить параметр Метки переменных.

Вы можете активировать поле Анализ по группам, если хотите использовать переменную слоя, например пол, и создать трехстороннюю кросс-таблицу.


На вкладке «Параметры» вы можете решить, как следует обрабатывать категории переменной. Также вы можете запустить тест Хи-квадрат. Однако в этом случае мы выберем только параметр Сортировать категории по алфавиту.


На вкладке «Выходные данные» выберите таблицу непредвиденных обстоятельств, а также наблюдаемую и теоретическую частоты.


Выберите следующие параметры на вкладке "Диаграммы".


Вычисления начинаются после того, как вы нажмете кнопку OK, а результаты отобразятся на новом листе.

Результаты создания кросс-таблицы или таблицы непредвиденных обстоятельств

Первый результат — это таблица непредвиденных обстоятельств.Обратите внимание, что клиенты отсутствуют в определенных пересекающихся категориях. Например, в Париже не обнаружен клиент возрастной категории 25–34 года.

Результаты: таблица сопряженности

Следующим результатом является трехмерный график, за которым следует гистограмма с накоплением, что является хорошей визуализацией распределения данных.

Результаты: трехмерное представление таблицы сопряженности
< br />

Далее две таблицы, содержащие частоты Возраст/Город. Вы можете сравнить фактическое распределение клиентов и теоретическое распределение, если бы распределение было случайным.

Результаты: наблюдаемые и теоретические частоты

Статистические тесты кросс-таблиц или таблиц непредвиденных обстоятельств

Можно проверить, являются ли две качественные переменные, формирующие таблицу непредвиденных обстоятельств, независимыми.

Преимущества использования кросс-таблиц XLSTAT вместо сводных таблиц Excel

Среди многих преимуществ использования функции таблицы сопряженности XLSTAT по сравнению со сводными таблицами Excel: - XLSTAT может автоматически выводить результаты тестов в таблицы сопряженности.

Вы можете ввести любое количество качественных переменных в поля переменной строки и столбца в XLSTAT. XLSTAT выдаст один результат для каждой возможной пары переменных строки/столбца.

Таблицы непредвиденных обстоятельств позволяют визуализировать взаимосвязь между двумя качественными переменными. Создайте их в Excel с помощью дополнительного программного обеспечения XLSTAT.

contingency-table-3D-view.jpg

Что такое таблица непредвиденных обстоятельств

V1 V2Категория 1Категория jКатегория m2
Категория 1n(1,1)n(1,j)n(1,m2)
…< /td>
Категория in(i,1)n(i,j)…< /td>n(i,m2)
Категория m1n( m1,1)n(m1,j)n( m1,m2)

где n(i,j) — частота наблюдений, которые показывают обе характеристики i для переменной V1 и характеристика j для переменной V2.

Чтобы создать таблицу сопряженности из двух качественных переменных V1 и V2 , первое преобразование состоит перекодирования двух качественных переменных V1 и V2 в виде двух дизъюнктивных таблиц Z1 и Z 2 или индикаторные (или фиктивные) переменные. Для каждой категории переменной есть столбец в соответствующей дизъюнктивной таблице. Каждый раз, когда категория c переменной V1 встречается для наблюдения i , значение Z 1(i,c) устанавливается равным единице (то же правило применяется к переменной V2). Другие значения Z1 и Z2 равны нулю. Таблица непредвиденных обстоятельств двух переменных — это таблица Z1'Z2 (где ‘ означает транспонирование матрицы).

Расстояние хи-квадрат было предложено для измерения расстояния между двумя категориями. Статистика Пирсона хи-квадрат, представляющая собой сумму расстояний хи-квадрат, используется для проверки независимости между строками и столбцами. Is имеет асимптотическое распределение хи-квадрат с (m1-1)(m2-1) степенями свободы.

Инерция — это мера, основанная на физике, которая часто используется в анализе соответствия, методе, используемом для подробного анализа таблиц непредвиденных обстоятельств. Инерция набора точек представляет собой взвешенное среднее квадратов расстояний до центра тяжести.

Инструмент XLSTAT для создания таблицы непредвиденных обстоятельств

Из двух или более качественных переменных XLSTAT позволяет мгновенно создавать таблицы непредвиденных обстоятельств, обобщающие структуру набора данных. Данные должны быть выбраны на общей вкладке инструмента с использованием следующих полей:

Переменные строки: выберите данные, соответствующие переменной (переменным), которые будут использоваться для построения строк таблицы (таблиц) непредвиденных обстоятельств.

Переменные столбца: выберите данные, соответствующие переменной (переменным), которые будут использоваться для построения столбцов таблицы (таблиц) непредвиденных обстоятельств.

По групповому анализу: активируйте этот параметр и выберите данные, описывающие, к какой группе относится каждое наблюдение. Затем XLSTAT проведет анализ для каждой группы отдельно. Полезно для создания трехсторонних кросс-таблиц.

Вес: активируйте этот параметр, если наблюдения взвешены. Если вы не активируете этот параметр, веса будут считаться равными 1. Веса должны быть больше или равны 0. Если выбран заголовок столбца, убедитесь, что параметр «Метки переменных» активирован.

XLSTAT тестирует таблицы непредвиденных обстоятельств

XLSTAT предоставляет вам два критерия для характеристики взаимосвязи между двумя переменными:

  • Расстояние хи-квадрат было предложено для измерения расстояния между двумя категориями. Статистика Пирсона хи-квадрат, представляющая собой сумму расстояний хи-квадрат, используется для проверки независимости между строками и столбцами.

Параметр Хи-квадрат по ячейке, доступный в диалоговом окне XLSTAT, позволяет отображать вклад в хи-квадрат каждой ячейки таблицы непредвиденных обстоятельств.

  • Инерция — это мера, основанная на физике, которая часто используется в анализе соответствий — методе, используемом для подробного анализа таблиц непредвиденных обстоятельств. Инерция набора точек представляет собой взвешенное среднее квадратов расстояний до центра тяжести.

Параметр Инерция по ячейке, доступный в диалоговом окне XLSTAT, позволяет отображать инерцию для каждой ячейки таблицы непредвиденных обстоятельств.

Вы также можете использовать более полную функцию, предназначенную для тестов по таблицам непредвиденных обстоятельств, доступную в меню тестов корреляции/ассоциации.

Диаграммы XLSTAT для таблиц непредвиденных обстоятельств

Трехмерное представление таблицы непредвиденных обстоятельств: активируйте этот параметр, чтобы отобразить трехмерную гистограмму, соответствующую таблице непредвиденных обстоятельств.

Параметры 2D-гистограмм

  • Сгруппировано: выберите этот параметр, чтобы отображать графики в виде столбцов, сгруппированных по модальности.
  • Полосы с накоплением: выберите этот параметр, чтобы отображать диаграмму как столбцы с накоплением. Эти диаграммы используются для сравнения частот подвыборок с частотами полной выборки.
  • Частоты: выберите этот параметр, чтобы отображать частоты, соответствующие каждой полосе.
  • Проценты. Выберите этот параметр, чтобы отобразить процент населения, соответствующий каждой полосе.

Преимущества использования кросс-таблиц XLSTAT вместо сводных таблиц Excel

Среди многих преимуществ использования функции резервной таблицы XLSTAT по сравнению со сводными таблицами Excel:

  • XLSTAT может автоматически выводить результаты тестов в таблицы непредвиденных обстоятельств.
  • Вы можете ввести любое количество качественных переменных в поля переменной строки и столбца в XLSTAT. XLSTAT выдаст один результат для каждой возможной пары переменных строки/столбца.

Учебное пособие по созданию и интерпретации таблицы непредвиденных обстоятельств

Доступно учебное пособие, в котором объясняется, как настроить диалоговое окно XLSTAT для создания кросс-таблицы на основе двух качественных переменных.

Таблица непредвиденных обстоятельств, также известная как кросс-таблица, используется для отображения взаимосвязи между двумя категориальными переменными. В Excel мы можем создать таблицу непредвиденных обстоятельств, используя функцию сводной таблицы. Они лучше всего подходят для обобщения отношений между категориальными переменными. Таблица непредвиденных обстоятельств похожа на таблицу частотного распределения, в которой мы можем одновременно отображать две переменные. Для дальнейшего получения результатов из таблицы непредвиденных обстоятельств используются тесты хи-квадрат. В этой статье мы узнаем, как создать таблицу непредвиденных обстоятельств.

Создание таблицы непредвиденных обстоятельств

Давайте возьмем следующий набор данных и преобразуем его в таблицу непредвиденных обстоятельств. Этот набор данных состоит из идентификаторов продуктов, названий продуктов и производителя продукта. Набор данных, который вы хотите преобразовать в таблицу непредвиденных обстоятельств, может иметь любое количество строк или столбцов. Т


Выполните следующие шаги, чтобы создать таблицу непредвиденных обстоятельств из этого набора данных.

Шаг 1. Выберите параметр «Сводная таблица» на вкладке «Вставка». Откроется диалоговое окно.

 Выберите параметр сводной таблицы

Шаг 2. В появившемся диалоговом окне выберите диапазон значений $A1:$C6, а затем выберите другую ячейку на листе, в которую вы хотите поместить сводную таблицу. Здесь мы выбрали ячейку G1. Диапазон значений — это все пространство, содержащее набор данных.

Выбор диапазона и местоположения

Шаг 3. Теперь нажмите "ОК", и вы увидите пустую таблицу непредвиденных обстоятельств в ячейке G1. Он появляется в ячейке G1, потому что именно это место мы выбрали на шаге 2.


Шаг 4. Теперь нам нужно заполнить таблицу. Другими словами, мы должны заполнить эту пустую таблицу значениями набора данных. Но нам не нужно делать это вручную. В окне слева перетащите "Изготовитель" в поле "Строки", перетащите "Имена" в поле "Столбцы" и перетащите "Идентификатор" в поле "Значения".


Обратите внимание, что значения частоты автоматически подставляются в таблицу непредвиденных обстоятельств. Это необходимая таблица сопряженности для предполагаемого выше набора данных.

Теперь, когда мы успешно создали таблицу непредвиденных обстоятельств, давайте посмотрим, как мы можем прочитать ее, чтобы извлечь из нее полезную информацию.

Интерпретация таблицы непредвиденных обстоятельств

Одно из основных преимуществ использования таблицы непредвиденных обстоятельств заключается в том, что она позволяет очень легко визуализировать взаимосвязь между переменными. Мы можем интерпретировать таблицу непредвиденных обстоятельств на основе строк, столбцов, а также ячеек.

Читайте также: