Анализ данных Cornell p в Excel, как два и два
Обновлено: 21.11.2024
Адам Хейс, доктор философии, CFA, финансовый писатель с более чем 15-летним опытом торговли деривативами на Уолл-Стрит. Помимо своего обширного опыта торговли деривативами, Адам является экспертом в области экономики и поведенческих финансов. Адам получил степень магистра экономики в Новой школе социальных исследований и докторскую степень. из Университета Висконсин-Мэдисон по социологии. Он является обладателем сертификата CFA, а также лицензий FINRA Series 7, 55 и 63. В настоящее время он занимается исследованиями и преподает экономическую социологию и социальные исследования финансов в Еврейском университете в Иерусалиме.
Доктор. ДжеФреда Р. Браун — финансовый консультант, сертифицированный инструктор по финансовому образованию и исследователь, которая помогла тысячам клиентов за свою более чем двадцатилетнюю карьеру. Она является генеральным директором Xaris Financial Enterprises и руководителем курса в Корнельском университете.
Кэтрин Бир — писатель, редактор и архивариус из Нью-Йорка. У нее большой опыт исследовательской и писательской деятельности. Она освещала такие разные темы, как история общественных садов Нью-Йорка и выступление Бейонсе на фестивале Coachella в 2018 году.
Что такое Т-тест?
T-критерий — это тип логической статистики, используемый для определения того, существует ли значительная разница между средними значениями двух групп, которая может быть связана по определенным признакам. Он в основном используется, когда наборы данных, такие как набор данных, записанный как результат 100-кратного подбрасывания монеты, подчиняются нормальному распределению и могут иметь неизвестные отклонения. В качестве инструмента проверки гипотез используется t-критерий, который позволяет проверить предположение, применимое к совокупности.
Стьюдент-критерий рассматривает t-статистику, значения t-распределения и степени свободы для определения статистической значимости. Чтобы провести тест с тремя или более средними значениями, необходимо использовать дисперсионный анализ.
Ключевые выводы
- T-критерий – это тип логической статистики, используемый для определения того, существует ли значительная разница между средними значениями двух групп, которая может быть связана с определенными функциями.
- Тестер Стьюдента – это один из многих тестов, используемых для проверки гипотез в статистике.
- Для расчета t-критерия требуются три ключевых значения данных. Они включают разницу между средними значениями из каждого набора данных (называемую средней разницей), стандартное отклонение каждой группы и количество значений данных в каждой группе.
- Существует несколько различных типов t-критерия, которые могут быть выполнены в зависимости от данных и типа требуемого анализа.
T-тест
Объяснение Т-теста
По сути, t-критерий позволяет сравнить средние значения двух наборов данных и определить, относятся ли они к одной и той же совокупности. В приведенных выше примерах, если бы мы взяли выборку учащихся из класса A и другую выборку учащихся из класса B, мы не ожидали бы, что они будут иметь точно такое же среднее значение и стандартное отклонение. Точно так же образцы, взятые из контрольной группы, получавшей плацебо, и образцы, взятые из группы, которой прописали лекарство, должны иметь несколько разные среднее значение и стандартное отклонение.
Математически t-критерий берет выборку из каждого из двух наборов и устанавливает постановку задачи, предполагая нулевую гипотезу о том, что два средних равны. На основе применимых формул определенные значения рассчитываются и сравниваются со стандартными значениями, после чего предполагаемая нулевая гипотеза принимается или отклоняется соответствующим образом.
Если нулевая гипотеза может быть отвергнута, это означает, что показания данных достоверны и, вероятно, не случайны.
Тест по критерию Стьюдента — это лишь один из многих тестов, используемых для этой цели. Статистики должны дополнительно использовать тесты, отличные от t-теста, для изучения большего количества переменных и тестов с большими размерами выборки. Для большого размера выборки статистики используют z-критерий. Другие варианты тестирования включают тест хи-квадрат и f-тест.
Существует три типа t-тестов, и они подразделяются на зависимые и независимые t-тесты.
Неоднозначные результаты теста
Представьте, что производитель лекарств хочет протестировать недавно изобретенное лекарство. Это следует стандартной процедуре испытания препарата на одной группе пациентов и назначении плацебо другой группе, называемой контрольной группой. Плацебо, данное контрольной группе, представляет собой вещество, не имеющее предполагаемой терапевтической ценности, и служит эталоном для измерения реакции другой группы, которой давали настоящее лекарство.
После испытания препарата члены контрольной группы, получавшей плацебо, сообщили об увеличении средней продолжительности жизни на три года, в то время как члены группы, которым прописали новое лекарство, сообщили об увеличении средней продолжительности жизни на четыре года. . Мгновенное наблюдение может указывать на то, что препарат действительно работает, поскольку результаты лучше для группы, принимающей препарат.Однако также возможно, что наблюдение может быть связано со случайностью, особенно с неожиданным везением. Стьюдентный тест полезен, чтобы сделать вывод, действительно ли результаты верны и применимы ко всей популяции.
В школе 100 учащихся класса А набрали в среднем 85 % со стандартным отклонением 3 %. Еще 100 учеников, принадлежащих к классу B, набрали в среднем 87% при стандартном отклонении 4%. Хотя среднее значение в классе B лучше, чем в классе A, может быть неверным делать поспешный вывод о том, что общая успеваемость учащихся в классе B лучше, чем у учащихся в классе A. Это связано с естественной изменчивостью в результатах тестов в обоих классах, поэтому разница может быть обусловлена только случайностью. Критерий Стьюдента может помочь определить, были ли результаты одного класса лучше, чем у другого.
Предположения Т-теста
- Первое предположение относительно t-тестов касается масштаба измерения. Предположение для t-теста состоит в том, что шкала измерения, применяемая к собранным данным, соответствует непрерывной или порядковой шкале, такой как баллы для теста IQ.
- Второе сделанное предположение относится к простой случайной выборке, когда данные собираются из репрезентативной, случайно выбранной части общей совокупности.
- Третье предположение заключается в том, что данные при построении графика дают нормальное распределение, колоколообразную кривую распределения.
- Последнее предположение — однородность дисперсии. Однородная или равная дисперсия существует, когда стандартные отклонения выборок приблизительно равны.
Расчет Т-тестов
Для расчета t-критерия требуются три ключевых значения данных. Они включают разницу между средними значениями из каждого набора данных (называемую средней разницей), стандартное отклонение каждой группы и количество значений данных в каждой группе.
Результат t-теста дает t-значение. Это рассчитанное t-значение затем сравнивается со значением, полученным из таблицы критических значений (называемой таблицей T-распределения). Это сравнение помогает определить влияние одной лишь случайности на разницу, а также определить, находится ли разница за пределами этого диапазона вероятности. Критерий Стьюдента определяет, представляет ли разница между группами истинную разницу в исследовании или это, возможно, бессмысленная случайная разница.
Таблицы T-распределения
Таблица Т-распределения доступна в одностороннем и двустороннем форматах. Первый используется для оценки случаев, которые имеют фиксированное значение или диапазон с четким направлением (положительным или отрицательным). Например, какова вероятность того, что выходное значение останется ниже -3 или будет больше семи при броске пары игральных костей? Последний используется для анализа границ диапазона, например, чтобы выяснить, находятся ли координаты в диапазоне от -2 до +2.
Расчеты можно выполнять с помощью стандартных программ, поддерживающих необходимые статистические функции, например, в MS Excel.
Т-значения и степени свободы
На выходе критерия Стьюдента выводятся два значения: значение Стьюдента и степени свободы. Значение t представляет собой отношение разницы между средним значением двух наборов выборок и вариацией, которая существует в наборах выборок. В то время как значение числителя (разницу между средним значением двух выборочных наборов) вычислить просто, знаменатель (изменение, существующее в выборочных наборах) может стать немного сложным в зависимости от типа задействованных значений данных. Знаменатель отношения является измерением дисперсии или изменчивости. Более высокие значения t-значения, также называемого t-показателем, указывают на то, что между двумя наборами выборок существует большая разница. Чем меньше значение t, тем больше сходства существует между двумя выборками.
- Большой t-показатель указывает на то, что группы разные.
- Небольшой t-показатель указывает на то, что группы похожи.
Степени свободы относятся к значениям в исследовании, которые могут варьироваться и необходимы для оценки важности и достоверности нулевой гипотезы. Вычисление этих значений обычно зависит от количества записей данных, доступных в выборке.
Коррелированный (или парный) Т-тест
Коррелированный t-критерий выполняется, когда выборки обычно состоят из совпадающих пар одинаковых единиц или когда есть случаи повторных измерений. Например, могут быть случаи, когда одни и те же пациенты проходят повторное тестирование — до и после получения конкретного лечения. В таких случаях каждый пациент используется в качестве контрольного образца против себя самого.
Этот метод также применим к случаям, когда образцы каким-либо образом связаны или имеют совпадающие характеристики, например сравнительный анализ с участием детей, родителей или братьев и сестер. Коррелированные или парные t-критерии относятся к зависимому типу, так как они включают случаи, когда два набора выборок связаны.
Формула для вычисления t-значения и степеней свободы для парного t-критерия:
Остальные два типа относятся к независимым t-тестам. Выборки этих типов выбираются независимо друг от друга, то есть наборы данных в двух группах не относятся к одним и тем же значениям. Они включают такие случаи, как разделение группы из 100 пациентов на две группы по 50 пациентов в каждой. Одна из групп становится контрольной и получает плацебо, а другая группа получает предписанное лечение. Это две независимые группы выборок, которые не связаны друг с другом.
Тест равной дисперсии (или объединенный) T-тест
Тест равной дисперсии используется, когда количество выборок в каждой группе одинаково или дисперсия двух наборов данных аналогична. Следующая формула используется для расчета t-значения и степеней свободы для t-критерия равной дисперсии:
T-тест неравной дисперсии
Неравный дисперсионный t-критерий используется, когда количество выборок в каждой группе различно, и дисперсия двух наборов данных также различна. Этот тест также называют t-критерием Уэлча. Следующая формула используется для расчета t-значения и степеней свободы для t-критерия неравной дисперсии:
Определение правильного Т-теста для использования
Следующую блок-схему можно использовать, чтобы определить, какой t-критерий следует использовать, исходя из характеристик наборов выборок. К ключевым элементам, которые необходимо учитывать, относятся сходство записей выборки, количество записей данных в каждой выборке и дисперсия каждой выборки.
Изображение Джули Банг © Investopedia 2019
Пример Т-теста с неравной дисперсией
Предположим, что мы измеряем по диагонали картины, полученные в художественной галерее. В одну группу образцов входит 10 картин, в другую – 20 картин. Наборы данных с соответствующими средними значениями и значениями дисперсии выглядят следующим образом:
Набор 1 | Набор 2 | |
19.7 | 28,3 | |
20,4 | 26,7 | |
19,6 | 20,1 | |
17,8 | 23,3 | |
18,5 | 25,2 | |
18,9 | 22,1 | |
18,3 | 17,7 | |
18,9 | 27,6 | |
19,5 | 20,6 | |
13,7 | ||
23,2 | ||
17,5 | 20,6 | |
18 | ||
23,9 | ||
21,6 | ||
24,3 | ||
20,4 | ||
23,9 | ||
13,3 | ||
Среднее | 19,4 | 21,6 |
Дисперсия | 1,4 | 17,1 |
Хотя среднее значение для набора 2 выше, чем для набора 1, мы не можем заключить, что совокупность, соответствующая набору 2, имеет более высокое среднее значение, чем совокупность, соответствующая набору 1. Является ли разница между 19,4 и 21,6 результатом только случайности? , или действительно существуют различия в общей совокупности всех картин, поступивших в картинную галерею? Мы устанавливаем проблему, принимая нулевую гипотезу о том, что среднее значение одинаково для двух наборов выборок, и проводим t-критерий, чтобы проверить, правдоподобна ли гипотеза.
Поскольку количество записей данных различно (n1 = 10 и n2 = 20) и дисперсия также различна, значение t и степени свободы вычисляются для вышеуказанного набора данных с использованием формулы, упомянутой в разделе «Неравная дисперсия». Раздел Т-тест.
Значение t равно -2,24787. Поскольку при сравнении двух t-значений можно игнорировать знак минус, вычисленное значение равно 2,24787.
Значение степени свободы составляет 24,38 и уменьшено до 24 из-за того, что определение формулы требует округления значения до наименьшего возможного целого числа.
Можно указать уровень вероятности (альфа-уровень, уровень значимости, p) в качестве критерия приемлемости. В большинстве случаев можно принять значение 5 %.
Используя значение степени свободы, равное 24, и уровень значимости 5 %, просмотр таблицы распределения t-значения дает значение 2,064. Сравнение этого значения с вычисленным значением 2,247 показывает, что рассчитанное значение t больше табличного значения при уровне значимости 5%. Следовательно, можно с уверенностью отвергнуть нулевую гипотезу об отсутствии разницы между средними значениями. Набор населения имеет внутренние различия, и они не случайны.
Чтобы лучше представить, как Ideas упрощает, ускоряет и делает анализ данных более интуитивным, эта функция была переименована в Анализ данных. Опыт и функциональность остались прежними и по-прежнему соответствуют тем же правилам конфиденциальности и лицензирования.Если вы используете Semi-Annual Enterprise Channel, вы все еще можете видеть "Идеи" до тех пор, пока Excel не будет обновлен.
Анализ данных в Excel позволяет анализировать данные с помощью запросов на естественном языке, которые позволяют задавать вопросы о данных без необходимости писать сложные формулы. Кроме того, Analyze Data предоставляет визуальные сводки высокого уровня, тенденции и закономерности.
Есть вопрос? Мы можем на него ответить!
Просто выберите ячейку в диапазоне данных > нажмите кнопку "Анализ данных" на вкладке "Главная". Анализ данных в Excel проанализирует ваши данные и вернет интересные визуальные эффекты в области задач.
Если вам нужна более конкретная информация, вы можете ввести вопрос в поле запроса в верхней части панели и нажать Enter. Анализ данных предоставит ответы с визуальными элементами, такими как таблицы, диаграммы или сводные таблицы, которые затем можно будет вставить в книгу.
Если вы заинтересованы в изучении своих данных или просто хотите узнать, что возможно, Анализ данных также предлагает персонализированные предлагаемые вопросы, к которым вы можете получить доступ, выбрав в поле запроса.
Попробуйте предлагаемые вопросы
Просто задайте свой вопрос
Выберите текстовое поле в верхней части панели "Анализ данных", и вы увидите список предложений, основанных на ваших данных.
Вы также можете ввести конкретный вопрос о ваших данных.
Анализ данных доступен подписчикам Microsoft 365 на английском, французском, испанском, немецком, упрощенном китайском и японском языках. Если вы являетесь подписчиком Microsoft 365, убедитесь, что у вас установлена последняя версия Office. Дополнительные сведения о различных каналах обновления для Office см. в статье Обзор каналов обновления для приложений Microsoft 365.
Функция «Запросы на естественном языке» в «Анализе данных» постепенно становится доступной для клиентов. Сначала он будет доступен подписчикам Microsoft 365 на Current Channel на английском языке.
Уточните детали с помощью Анализа данных
Если у вас нет вопросов, в дополнение к функции "Естественный язык" функция "Анализ данных" анализирует и предоставляет визуальные сводки высокого уровня, тенденции и закономерности.
Вы можете сэкономить время и получить более целенаправленный анализ, выбрав только те поля, которые хотите видеть. Когда вы выбираете поля и способ их суммирования, Анализ данных исключает другие доступные данные, что ускоряет процесс и предоставляет меньше, но более целенаправленных предложений. Например, вы можете захотеть увидеть только сумму продаж за год. Или вы можете попросить Analyze Data отобразить средние продажи по годам.
Выберите, какие поля вас интересуют больше всего?
Выберите поля и способ суммирования их данных.
Analyze Data предлагает меньше, но более целенаправленных предложений.
Примечание. Параметр "Не значение" в списке полей относится к полям, которые обычно не суммируются и не усредняются. Например, вы не будете суммировать отображаемые годы, но можете просуммировать значения отображаемых лет. При использовании с другим полем, которое суммируется или усредняется, Не значение работает как метка строки, но если используется само по себе, Не значение подсчитывает уникальные значения выбранного поля.
Анализ данных лучше всего работает с чистыми табличными данными.
Вот несколько советов, как максимально эффективно использовать анализ данных:
Анализ данных лучше всего работает с данными, отформатированными в виде таблицы Excel. Чтобы создать таблицу Excel, щелкните в любом месте данных и нажмите Ctrl+T.
Убедитесь, что у вас есть хорошие заголовки для столбцов. Заголовки должны представлять собой одну строку уникальных непустых меток для каждого столбца. Избегайте двойных рядов заголовков, объединенных ячеек и т. д.
Если у вас есть сложные или вложенные данные, вы можете использовать Power Query для преобразования таблиц с перекрестными таблицами или несколькими строками заголовков.
Не получили данные анализа? Вероятно, это мы, а не вы.
Вот несколько причин, по которым анализ данных может не работать с вашими данными:
Анализ данных в настоящее время не поддерживает анализ наборов данных, содержащих более 1,5 миллиона ячеек. В настоящее время нет обходного пути для этого. Тем временем вы можете отфильтровать свои данные, а затем скопировать их в другое место, чтобы выполнить анализ данных.
Строковые даты, такие как "2017-01-01", будут проанализированы, как если бы они были текстовыми строками. В качестве обходного пути создайте новый столбец, использующий функции DATE или DATEVALUE, и отформатируйте его как дату.
Анализ данных не будет работать, если Excel находится в режиме совместимости (т. е. когда файл имеет формат .xls). А пока сохраните файл в формате .xlsx, .xlsm или xslb.
Объединенные ячейки также могут быть трудными для понимания. Если вы пытаетесь центрировать данные, например заголовок отчета, то в качестве обходного пути удалите все объединенные ячейки, а затем отформатируйте ячейки, используя Center Across Selection. Нажмите Ctrl+1, затем выберите «Выравнивание» > «По горизонтали» > «По центру выделения».
Анализ данных лучше всего работает с чистыми табличными данными.
Вот несколько советов, как максимально эффективно использовать анализ данных:
Анализ данных лучше всего работает с данными, отформатированными в виде таблицы Excel. Чтобы создать таблицу Excel, щелкните в любом месте данных и нажмите +T.
Убедитесь, что у вас есть хорошие заголовки для столбцов. Заголовки должны представлять собой одну строку уникальных непустых меток для каждого столбца. Избегайте двойных рядов заголовков, объединенных ячеек и т. д.
Не получили данные анализа? Вероятно, это мы, а не вы.
Вот несколько причин, по которым анализ данных может не работать с вашими данными:
Анализ данных в настоящее время не поддерживает анализ наборов данных, содержащих более 1,5 миллиона ячеек. В настоящее время нет обходного пути для этого. Тем временем вы можете отфильтровать свои данные, а затем скопировать их в другое место, чтобы выполнить анализ данных.
Строковые даты, такие как "2017-01-01", будут проанализированы, как если бы они были текстовыми строками. В качестве обходного пути создайте новый столбец, использующий функции DATE или DATEVALUE, и отформатируйте его как дату.
Анализ данных не может анализировать данные, когда Excel находится в режиме совместимости (т. е. когда файл имеет формат .xls). А пока сохраните файл в формате .xlsx, .xlsm или xslb.
Объединенные ячейки также могут быть трудными для понимания. Если вы пытаетесь центрировать данные, например заголовок отчета, то в качестве обходного пути удалите все объединенные ячейки, а затем отформатируйте ячейки, используя Center Across Selection. Нажмите Ctrl+1, затем выберите «Выравнивание» > «По горизонтали» > «По центру выделения».
Анализ данных лучше всего работает с чистыми табличными данными.
Вот несколько советов, как максимально эффективно использовать анализ данных:
Анализ данных лучше всего работает с данными, отформатированными в виде таблицы Excel. Чтобы создать таблицу Excel, щелкните в любом месте данных и выберите Главная > Таблицы > Форматировать как таблицу.
Убедитесь, что у вас есть хорошие заголовки для столбцов. Заголовки должны представлять собой одну строку уникальных непустых меток для каждого столбца. Избегайте двойных рядов заголовков, объединенных ячеек и т. д.
Не получили данные анализа? Вероятно, это мы, а не вы.
Вот несколько причин, по которым анализ данных может не работать с вашими данными:
Анализ данных в настоящее время не поддерживает анализ наборов данных, содержащих более 1,5 миллиона ячеек. В настоящее время нет обходного пути для этого. Тем временем вы можете отфильтровать свои данные, а затем скопировать их в другое место, чтобы выполнить анализ данных.
Строковые даты, такие как "2017-01-01", будут проанализированы, как если бы они были текстовыми строками. В качестве обходного пути создайте новый столбец, использующий функции DATE или DATEVALUE, и отформатируйте его как дату.
Мы постоянно совершенствуем анализ данных
Даже если у вас нет ни одного из вышеперечисленных условий, мы можем не найти рекомендации. Это потому, что мы ищем определенный набор классов инсайтов, а сервис не всегда что-то находит. Мы постоянно работаем над расширением типов анализа, поддерживаемых службой.
Вот текущий доступный список:
Рейтинг: ранжирует и выделяет элемент, который значительно больше остальных элементов.
Тенденция. Подсвечивается при наличии устойчивого тренда во временном ряду данных.
Выброс: выделяет выбросы во временном ряду.
Большинство: находит случаи, когда большую часть общего значения можно отнести к одному фактору.
Если вы не получили никаких результатов, отправьте нам отзыв, выбрав «Файл» > «Отзыв».
Поскольку Analyze Data анализирует ваши данные с помощью служб искусственного интеллекта, вы можете беспокоиться о безопасности своих данных. Дополнительные сведения см. в заявлении о конфиденциальности Microsoft.
Analyze Data использует материалы третьих лиц. Если вы хотите прочитать подробности, см. раздел Информация о лицензировании для Анализа данных.
Нужна дополнительная помощь?
Вы всегда можете обратиться к эксперту в техническом сообществе Excel или получить поддержку в сообществе ответов.
Когда ваша аудитория сможет быстро и эффективно понять, о чем говорят данные, не просматривая каждую строку и столбец, она сможет более эффективно получать ценную информацию из вашего анализа. В этом курсе вы будете применять возможности сводных таблиц Excel, чтобы видеть свои данные с разных точек зрения, использовать методы визуализации данных, которые эффективно доносят ваш анализ до вашей аудитории, создавать диаграммы, которые быстро и четко визуализируют ваш анализ, а также применять принципы графического представления. целостность ваших диаграмм.
Вы должны пройти следующий курс или иметь аналогичный опыт, прежде чем проходить этот курс:
- Начало работы с табличным моделированием и бизнес-аналитикой
Ключевые выводы курса
- Применяйте сводные таблицы, чтобы просматривать данные с разных точек зрения.
- Используйте методы визуализации данных, чтобы эффективно донести свой анализ.
- Создавайте точные и привлекательные диаграммы на основе ваших данных.
- Понимать и применять принципы графической целостности к вашим данным и диаграммам
Как это работает
Продолжительность курса
Усилие
Формат
Автор курса
Донна Л. Хаегер — профессор практики Школы прикладной экономики и менеджмента Чарльза Х. Дайсона Корнельского университета. Она преподает вводные и продвинутые курсы моделирования электронных таблиц для прикладного принятия решений. Эти курсы используют Microsoft Excel в качестве инструмента бизнес-аналитики. До преподавания в Корнелле она вела курсы по теории управления, организационному поведению и маркетингу. За более чем двадцать лет работы в отрасли ее корпоративный опыт включает работу в сфере инвестиций, банковского дела и корпоративных финансов. Доктор Хегер является координатором концентрации бизнес-аналитики и возглавлял рабочую группу, ответственную за запуск концентрации. Ее исследовательские интересы находятся на стыке организационного поведения и цифровизации. Она исследует технологии на рабочем месте, лидерство, команды и управление. Ее вклад связан с влиянием и межпоколенческим обменом в стремлении объединить человеческие системы. Хегер представляет свои исследования в Академии управления и других ассоциациях лидеров. Ей также нравится наставлять студентов, заинтересованных в исследованиях бакалавриата, особенно когда продукты служат лучшему обществу. В настоящее время она входит в совет директоров Консультационной службы потребительского кредитования в Рочестере, которая специализируется на распространении финансовой грамотности среди населения.
В рамках усилий по разработке источника геотермальной энергии под своим кампусом Корнельский университет планирует исследовать «скучную» старую континентальную кору, на которой живет много людей.
Поделиться:
В 2013 году Корнельский университет поставил цель: к 2035 году деятельность кампуса в Итаке, штат Нью-Йорк, должна стать углеродно-нейтральной. Для достижения этих целей ни в Корнелле, ни в Нью-Йорке не было планов по исключению источников энергии на основе углерода из того, что они потребляли для обогрева жилых и коммерческих зданий (на которые приходится 31 % от общего потребления энергии в штате).
Один из возможных подходов, использование геотермальной энергии, может помочь заменить ископаемое топливо для прямого использования (в отличие от производства электроэнергии) для обогрева не только кампуса Корнелла, но и севера США, Канады и большей части северной Европы и Азии. .Такое более активное использование геотермального централизованного теплоснабжения — например, централизованное снабжение геотермальным теплом нескольких зданий по изолированным трубам — может значительно снизить глобальные выбросы углерода.
В Корнелле подход Earth Source Heat (ESH) эволюционировал, чтобы удовлетворить потребность в альтернативах углеродному топливу. ESH включает извлечение воды из горячих пород с использованием одного набора скважин, передачу тепла в существующий контур централизованного теплоснабжения кампуса, использование промышленных тепловых насосов для максимального извлечения тепла из геотермальных ресурсов и возврат воды под землю через другой набор скважин. (Рисунок 1).
На научном семинаре по планированию бурения скважин, спонсируемом Международной континентальной программой научного бурения (ICDP), который был проведен в Корнельском университете в январе прошлого года, участники обсудили новый план бурения пары испытательных скважин для оценки потенциала обогрева зданий кампуса Корнелла с помощью геотермальной энергии. тепло, добытое с глубины более 2 километров. Этот прагматичный план испытаний дает возможность объединить фундаментальные исследования, изучающие работу континентальной коры, с операцией бурения. Семинар, спонсируемый ICDP, позволил ученым-землянам изучить, как превратить эту возможность в эксперимент большой ценности.
Мы предполагаем обнаружить палеозойские осадочные и докембрийские метаморфические породы фундамента, которые залегают ниже Корнелла. Эти породы, как и во многих других местах, сложные, неоднородные и анизотропные (рис. 1). Вопреки здравому смыслу, отсутствие чего-либо геологически «особого» в центральной части Нью-Йорка, где уровни естественной сейсмичности также низки, является неотъемлемым атрибутом этого бурового проекта. На сегодняшний день континентальные научные буровые площадки были выбраны для изучения активных тектонических или вулканических особенностей, редких явлений, таких как удары метеоритов, или истории климата. Таким образом, исследование «скучного» (т. е. обычного) места имеет исключительную ценность, результаты которого будут широко применимы.
Практические проблемы с геотермальной энергией
Глубина сама по себе не является серьезной технической проблемой для проекта ESH — в наиболее стабильной континентальной коре Северной Америки подповерхностные температуры в диапазоне 50–100 °C наблюдаются на глубине менее 3 км от поверхности, что достаточно мелко, чтобы достигается экономично с помощью традиционной технологии бурения. Однако в настоящее время геотермально нагретая вода используется для централизованного теплоснабжения лишь в нескольких местах. Бойсе, штат Айдахо, на равнине Снейк-Ривер и некоторые места в Исландии необычны с геологической точки зрения, поскольку горячая вода находится у поверхности. Еще несколько термически приземленных мест, таких как парижский осадочный бассейн во Франции, имеют горные породы на подходящей глубине, через которые жидкость легко течет [Lopez et al., 2010].< /p>
Корнелл готов продвигать первоначальный демонстрационный проект по извлечению 100 гигаватт-часов геотермального тепла в год.
Несмотря на то, что породы на подходящей глубине под большей частью Нью-Йорка являются осадочными (и, следовательно, относительно пористыми), низкая проницаемость, к сожалению, по-прежнему является препятствием для внедрения геотермальной технологии для централизованного теплоснабжения [Camp et al. , 2018]. Теоретически можно стимулировать передачу флюидов горными породами путем соединения пор вдоль естественных сетей ранее существовавших микротрещин за счет использования давления жидкости, чтобы слегка нарушить эти трещины. Однако такие инженерные подходы сопряжены с высокими финансовыми рисками, поскольку они могут не обеспечить достаточную проницаемость для достижения целевых показателей извлечения энергии. Кроме того, бурение, строительство с искусственными проницаемостями и циркуляция жидкости вызывают возмущения в недрах, которые могут быть связаны с сейсмическим риском. В целом, отсутствие фундаментального научного и инженерного понимания горных пород и сопутствующих рисков приводит к высоким затратам и медленному прогрессу.
После многолетнего анализа экономической и технической осуществимости своего подхода ESH Корнелл готов продвигать первоначальный демонстрационный проект по извлечению 100 гигаватт-часов геотермального тепла в год, что достаточно для удовлетворения около 20% потребностей кампуса. Однако до тех пор, пока глубокие скважины не смогут получить доступ к недрам, нам не хватает ключевых данных, необходимых для проектирования геотермальной системы и оценки финансовых, технических и сейсмических рисков.
Корнеллский университет, специализирующийся на предоставлении земельных участков, преследует три взаимосвязанных цели бурения пробных скважин: достижение цели по снижению уровня выбросов углерода, демонстрация и снижение рисков, связанных с технологией, которая может быть широко распространена, а также содействие фундаментальным исследованиям.
Семинар ICDP собрал 35 посетителей и 26 преподавателей, технических специалистов и студентов Корнелльского университета из разных специальностей (но с небольшим общим опытом), включая бурение скважин, региональную геологию, индуцированные землетрясения, геотермальную инженерию и гидрологию.Около 90 % семинара было посвящено групповым обсуждениям ключевых научных вопросов и соображений по проектированию скважин, а не индивидуальным презентациям.
Новое поколение геологических исследований
В ходе обсуждений на семинаре были выявлены пять широких тем исследований, которым будет способствовать скважина Итака:
- жидкости и круговорот элементов
- поромеханическое поведение в диапазоне масштабов длины
- управление подземными трещинами и потоком жидкости
- подповерхностная эволюция Аппалачского бассейна и его фундамента.
Первые три темы тесно связаны друг с другом, и, поскольку для общественно важной деятельности, включая производство энергии и оценку сейсмического риска, необходимы более глубокие знания, они, вероятно, будут лежать в основе успешных усилий по сбору средств для многомиллионных проектов бурения. Изучение последних двух тем станет возможным благодаря доступу к образцам подземных флюидов и горных пород из скважины, и результаты этих тем могут повлиять на другие темы.
Общим корнем первых трех тем являются сложные гидрологические, термические, химические и механические взаимосвязи и процессы — естественные и антропогенные — действующие во временных масштабах от очень коротких (дней) до геологических. Участники семинара сосредоточились на описании экспериментов, измерений и образцов, необходимых для поддержки научных достижений в понимании гидрогеологии старой, тектонически неактивной коры и физических факторов, влияющих на сейсмическую опасность в недрах континентальных плит.
Одна из гипотез утверждает, что континентальная кора повсюду находится в состоянии критического разрушения [например, Townend and Zoback, 2000 – что горные породы под землей всегда близки к разрушению из-за разрушения. . Этот сценарий может оставить некоторые трещины открытыми как проницаемые пути, но это также означает, что породы очень восприимчивы к небольшим возмущениям напряжения. Наличие скважины глубиной в несколько километров, которая предоставляет непрерывные по вертикали данные о величине и ориентации напряжений, давлениях в порах и температурах в контексте литологических свойств и свойств трещин, позволит ученым проверить эту гипотезу.
Ценные знания могут быть получены при определении вертикального профиля подземных свойств в нетронутом месте и мониторинге его по мере продвижения геотермального проекта.
Участники семинара были очень заинтересованы в возможности лучше понять поромеханическое поведение и процессы, влияющие на напряжение и деформацию вблизи границы между палеозойскими осадочными породами и докембрийским кристаллическим фундаментом. Волоконно-оптическое зондирование по всей длине скважины, наряду с измерениями физических свойств образцов горных пород, может дать представление о механическом поведении недр в различных масштабах. Эти сведения важны для понимания индуцированной сейсмичности и снижения опасностей.
Присутствующие также с энтузиазмом восприняли возможность получить образцы керна, которые могут дать толчок новому поколению геологических исследований термической истории горных пород под северной частью штата Нью-Йорк. Это исследование может заполнить пробелы в знаниях о том, что произошло с горными породами в конце отложения в девоне (420–360 миллионов лет назад); через захоронение, поток жидкости, диагенез и трещиноватость аллеганского орогенеза; к среднемезозойскому размещению кимберлитов и топографическим перестройкам и денудации кайнозоя (от 66 миллионов лет назад до настоящего времени).
Несмотря на то, что геобиологи не участвовали, участники семинара согласились с тем, что отбор проб может позволить изучить формы жизни, обнаруженные в литологии и условиях, через которые проходит скважина. Обсуждения на семинаре показали, что участок в Корнелле имеет еще большую исследовательскую ценность, если вертикальный профиль тепловых, гидрологических, механических и химических свойств недр можно будет определить в первозданном месте, еще не подвергавшемся подповерхностным манипуляциям, а затем контролировать с помощью время по мере продвижения геотермального проекта.
Где пересекаются проблемы науки и техники
Основной вопрос о буровой скважине в Корнелле, где пересекаются научные и инженерные соображения, заключается в том, должен ли она иметь узкий или широкий диаметр. Независимо от диаметра, каждая скважина глубиной 3 километра и более будет стоить несколько миллионов долларов. Поскольку скважина большого диаметра до разведочной глубины 4–5 километров может впоследствии служить эксплуатационной скважиной с более высоким дебитом, чем узкая скважина, такой ствол можно обосновать, что также может облегчить обширные испытания и выборка. Альтернативной стратегией является бурение начальной узкой скважины, которая позволит изучить геологический контекст и характеристики на месте.Позже эта скважина могла служить обсерваторией для внутрискважинного мониторинга таких параметров, как температура, давление, сейсмическая активность и химия флюидов.
Риски этих двух альтернатив заметно различаются. Скважина большого диаметра, предназначенная для последующего использования для производства энергии, потребует, чтобы большая часть ее длины была обсажена цементом. Тем не менее, некоторые критические свойства и условия горных пород должны быть измерены или взяты пробы в необсаженной скважине, и большая часть оборудования для постоянного мониторинга должна быть установлена до обсадной колонны. Более того, несколько специалистов по бурению скважин предвидели такой сценарий, который приведет к высоким затратам и высоким техническим рискам потери эксплуатационной скважины, если вмещающая порода обрушится и скважина будет повторно заполнена.
Бурение узкой скважины до 4–5 км сопряжено со значительными практическими и дорогостоящими трудностями. Одной из таких проблем является ограниченная доступность компаний и оборудования, способных бурить такую скважину по рентабельной цене. Дискуссии о противоречиях между научными целями и эксплуатационными целями скважин выявили сценарии, которые могут привести к значительному увеличению затрат на бурение скважин и к скомпрометированным планам, которые сужают научный объем.
В результате этих обсуждений возникла еще одна альтернатива: узкая скважина, которая достигает всего 100 метров в подвал, будет иметь меньшие затраты и риски, чем глубокая скважина. Эта конструкция с узким отверстием по-прежнему позволяет проводить сейсмологические и гидрологические эксперименты для документирования подземных условий до и после создания искусственной проницаемости в соседней скважине, а также после того, как геотермальное месторождение начнет добычу. При таком подходе сниженный риск для целостности скважины большого диаметра, которую затем можно было бы немедленно обсадить для защиты от обрушения, мог бы, вероятно, снизить затраты настолько, чтобы позволить установку с тремя скважинами. Эта установка, включающая одну узкую скважину средней глубины и две широкие (и обсаженные) полноглубинные скважины, может стоить не намного больше, чем две широкие скважины, вырытые с многочисленными обходными путями и компромиссами.
Многообещающее начало предстоящей работы
Корнелл искал средства для бурения узкой скважины в осадочных породах примерно на 100 метров в кристаллический фундамент. А в конце июля Министерство энергетики США объявило об отборе проекта для финансирования.
После семинара ICDP Корнельский университет запросил средства у Министерства энергетики США (DOE) для бурения узкой скважины в осадочных породах примерно на 100 метров в кристаллический фундамент. А в конце июля Министерство энергетики объявило о выборе проекта Корнелла для финансирования. Присужденных средств должно быть достаточно для бурения скважины; получить несколько сотен метров сплошного и точечного керна; анализировать давление, напряжение, деформацию, гидрологические и горные свойства; и установить постоянные системы мониторинга.
С помощью этой основы Корнелл и эксперты, такие как те, кто участвовал в семинаре, могут решить многие научные и инженерные задачи, изложенные выше. Тем не менее, некоторые из увлекательных вопросов, сформулированных на семинаре, потребуют сопутствующих проектов. Нам нужно будет получить дополнительные образцы, установить другие типы датчиков, извлечь и проанализировать данные вскоре после бурения и в течение многих лет наблюдений, а также провести дополнительные эксперименты и геофизические исследования. Эти проекты с добавленной стоимостью потребуют, чтобы эксперты возглавили усилия по поиску средств в сотрудничестве с Корнеллом для достойных дополнительных проектов. Университет также стремится к широкому и быстрому публичному распространению всех данных, извлеченных из скважины.
Семинар по планированию бурения скважин, организованный при поддержке ICDP, в котором приняли участие заинтересованные стороны с разным опытом и обширным опытом, помог ускорить продвижение к использованию геотермальной энергии для достижения целей университета по углеродной нейтральности. Первоначальная идея заключалась в том, чтобы использовать геотермальную энергетическую скважину как возможность совместить некоторые увлекательные научные исследования с практическим проектом. Семинар ICDP показал, что это также возможность повысить вероятность того, что сам проект ESH будет успешным из-за «скучной» сопутствующей науки.
Ссылки
Смит, Дж. Д. (2019 г.), Исследовательский анализ пространственных данных и распространение неопределенности для оценки геотермальных ресурсов и моделей резервуаров, доктор философии. диссертация, 255 стр., Корнельский университет, Итака, Нью-Йорк.
Информация об авторе
Тереза Джордан (tej1@cornell.edu) и Патрик Фултон, факультет наук о Земле и атмосфере, Корнельский университет, Итака, Нью-Йорк; Джефферсон Тестер, Школа химической и биомолекулярной инженерии Смита, Корнельский университет, Итака, Нью-Йорк; Хироши Асанума, Фукусимский институт возобновляемых источников энергии, Национальный институт передовых промышленных наук и технологий, Корияма, Япония; и Дэвид Брюн, факультет гражданского строительства и наук о Земле Делфтского технологического университета, Делфт, Нидерланды
Цитирование:
Текст © 2020. Авторы. CC BY-NC-ND 3.0
Если не указано иное, изображения защищены авторским правом. Любое повторное использование без явного разрешения владельца авторских прав запрещено.
Читайте также: