Технология динамического управления тактовыми частотами процессорных ядер

Обновлено: 02.07.2024

Центральный процессор (ЦП или процессор) на вашем компьютере, безусловно, является одним из самых сильных факторов, определяющих его производительность. Без быстрого процессора остальная часть вашего оборудования будет перегружать его большим количеством задач, чем оно может выполнить. В середине 90-х, когда рынок настольных ПК значительно набирал обороты, процессоры имели только одно ядро. Современный ЦП — это архитектурное чудо с несколькими различными каналами для распределения и временного хранения задач. Они умнее, быстрее и динамичнее. Но новые процессоры вызвали новые вопросы у общественности. В частности, есть одна битва, которая, вероятно, никогда не закончится: битва между количеством ядер ЦП и его тактовой частотой.

Хотя это не битва

Во-первых, это не столько «битва», сколько спор о том, что должно быть приоритетным. Вы не найдете никого, кто хорошо разбирается в технологиях и говорит, что мы должны полностью отказаться от многоядерных процессоров и просто использовать как можно большую тактовую частоту. Есть причина, по которой ядра начали появляться в процессорах, и есть столь же веская причина, по которой производители чипов пытаются превзойти друг друга по тактовой частоте. Ежедневно производители должны тщательно разрабатывать свои следующие модели ЦП, чтобы убедиться, что они хорошо выдерживают конкуренцию и производят надежный продукт, который порадует своих потребителей. Это означает достижение реалистичного, но гармоничного баланса между ядрами, тактовой частотой и архитектурой.

coremuscle-cpuunit

Часовая частота? Почему важна тактовая частота

Многие считают ЦП мозгом вашей системы. Чтобы упростить понимание, думайте о процессоре не как о мозге, а как о мускулах. Если вычисление — это автомобиль, то процессор — это двигатель. Чем выше тактовая частота, тем быстрее будет двигаться машина (система). Тактовая частота измеряется в ГГц (гигагерцах), чем выше число, тем выше тактовая частота. Для запуска ваших приложений ваш процессор должен постоянно выполнять вычисления, если у вас более высокая тактовая частота, вы можете выполнять эти вычисления быстрее, и в результате этого приложения будут работать быстрее и плавнее. Тактовая частота ЦП, как следует из названия, сильно влияет на количество задач, которые каждое ядро ​​может выполнять за определенный период времени. Скорость, наряду с разрядностью, говорит вам, сколько данных может передаваться в секунду. Если один ЦП имеет разрядность 32 бита и скорость 3,93 ГГц, это означает, что он может обрабатывать почти 4 миллиарда единиц данных по 32 бита в секунду. Это 4 миллиарда целых чисел! Более высокая тактовая частота означает большую скорость отклика при выполнении тяжелых линейных задач, таких как запуск однопоточных приложений. Большинство программ по-прежнему работают линейно, используя только одно ядро. В этих случаях тактовая частота играет решающую роль.

 Dual-Mac-Pro-Processor-e1418294108516

Больше ядер? Почему ядра важны

Mac-Pro-Multi-Core-Processor-1-e1418658722889

Если у вас был компьютер в 90-х или даже в начале 2000-х, вы, возможно, помните, что когда одна программа зависала, вполне вероятно, что зависала и вся ваша система. Проблема заключалась не только в том, как операционные системы, такие как Windows, раньше справлялись с задачами. Наличие процессора только с одним ядром гарантирует, что вы сможете выполнять только одну задачу за раз. Наличие нескольких ядер позволяет ЦП обрабатывать несколько вещей одновременно, разделяя работу на несколько блоков. Если одно ядро ​​«забивается» задачей, которая просто продолжает зацикливаться (например, программа, использующая это ядро, зависает), общая работа чипа может продолжаться, пока вы выясняете, что не так, или в конечном итоге закрываете программу, чтобы освободить это ядро. Многоядерные процессоры стали популярными, поскольку увеличить тактовую частоту одноядерных процессоров становилось все труднее из-за технологических ограничений. Вместо того, чтобы неустанно работать над дополнительными 0,1 ГГц тактовой частоты, производители вместо этого добавили больше идентичных процессоров к отдельным процессорам. Ядро — это один процессор, многоядерные процессоры имеют несколько процессоров. Таким образом, двухъядерный процессор с частотой 3,0 ГГц имеет 2 процессора с тактовой частотой 3,0 ГГц каждый. 6-ядерный процессор с частотой 3,0 ГГц имеет 6 процессоров с тактовой частотой 3,0 ГГц каждый. 6-ядерный процессор, который мы только что описали, имеет общую тактовую частоту 18,0 ГГц. Значит, тогда ваши программы будут работать в 6 раз быстрее, чем на одноядерном процессоре с частотой 3,0 ГГц?Ну, не совсем… По сути, ядра — это многозадачные инструменты. Они обеспечивают большую динамичность и более легкий поток при работе на вашем компьютере. Сегодня даже смартфоны имеют процессоры с несколькими ядрами. Многоядерные процессоры кажутся более быстрыми, потому что они способны выдерживать гораздо больший объем рабочей нагрузки, чем их одноядерные аналоги. Они очень надежны при устранении заторов. Думайте о них как о взлетно-посадочных полосах в аэропорту. Чем их больше у вас будет, тем легче будет сажать самолеты на землю.

Более высокая тактовая частота или больше ядер?

Хорошо, теперь вы понимаете преимущества более высокой тактовой частоты и прироста производительности, который может предложить большее количество ядер. Выбираете процессор с меньшей тактовой частотой, но с большим количеством ядер? Или тот, у которого больше ядер, но более низкая тактовая частота? 12-ядерная система 2,66 ГГц или 6-ядерная 3,46 ГГц, что лучше? Стоит ли покупать 12-ядерную систему с частотой 3,46 ГГц или лучше взять 6-ядерную? На эти вопросы мы поможем вам ответить сегодня. Во-первых, если возможно, вы хотите выбрать тот, у которого самая высокая тактовая частота и наибольшее количество ядер. Однако из-за бюджета это не всегда возможно, и обычно существует компромисс между ядрами и тактовой частотой. Но что все это значит? Тактовая частота, многоядерность, гиперпоточность, двухпроцессорные системы. Есть много всего, что нужно понять, к счастью, мы собираемся разбить это так, чтобы каждый мог понять. Надеюсь, это поможет вам решить, какой процессор подходит для вашей системы.

Больше ядер, ниже тактовая частота

  • Плюсы
    • Приложения, поддерживающие многопоточность, значительно выиграют, если в их распоряжении будет больше ядер.
    • Увеличение количества ядер в вашем ЦП — это экономичный способ повышения производительности.
    • Поддержка многопоточности для приложений со временем будет улучшаться.
    • Вы сможете запускать больше приложений одновременно без снижения производительности.
    • Отлично подходит для запуска нескольких виртуальных машин
    • Производительность однопоточной обработки ниже, чем у процессора с более высокой тактовой частотой.

    Меньше ядер, выше тактовая частота

    • Плюсы
      • Более высокая производительность в однопоточном режиме.
      • Более дешевый вариант
      • Меньше ядер для разделения между приложениями
      • Не такая высокая производительность при многопоточности.

      Четырехъядерный процессор с частотой 2,66 ГГц или двухъядерный процессор с частотой 3,33 ГГц?

      Bad_Company2

      • 2 фактора изменили правила для четырехъядерных процессоров и игр:
      • Турбо-режим новых процессоров Intel I5 и I7 Core, использующих сокет 1156, может автоматически повышать частоту при активации только одного или двух ядер, в зависимости от приложений. Например, Core i5 750 работает на частоте 2,66 ГГц, когда задействованы все 4 ядра, но автоматически переключается на 3,2 ГГц, когда требуется только 2 ядра: поэтому нет причин выбирать между двухъядерным процессором 3,2 ГГц или четырехъядерным процессором 2,66 ГГц. ГГц, Core i5 750 соответствует обеим частотам.
      • Новые игры, такие как BattleField Bad Company 2 или Metro 2033, в значительной степени используют четырехъядерные процессоры по новой причине: «PhysX» или управление частицами (взрывы и т. д.) теперь управляются ЦП.
      • Согласно тесту, проведенному журналом Hardware Magazine № 46, четырехъядерный процессор с частотой 2,66 ГГц на 10 % лучше, чем двухъядерный с частотой 3,33 ГГц в игре Metro 2003, и на 20 % лучше в игре Bad Compagny 2.
      • В этой игре используются лучшие четырехъядерные процессоры с технологией Hyper-Threading (HT), такие как Core i7 800, с приростом на 25 % по сравнению с четырехъядерными процессорами без HT 2,66 ГГц и более чем на 50 % по сравнению с двухъядерными процессорами с тактовой частотой 3,33 ГГц!
      • В 2010 году ответ ясен: выбирайте четырехъядерные процессоры, предпочтительно с технологией Hyper-Threading, для любых приложений!

      Большой вопрос

      Производительность вашего ЦП — «мозга» вашего ПК — оказывает большое влияние на скорость загрузки программ и их бесперебойную работу. Однако есть несколько различных способов измерения производительности процессора. Тактовая частота (также «тактовая частота» или «частота») является одной из самых важных.

      Если вам интересно, как проверить тактовую частоту, откройте меню «Пуск» (или нажмите клавишу Windows*) и введите «Информация о системе». Название модели вашего ЦП и тактовая частота будут указаны в разделе «Процессор».

      Что такое тактовая частота?

      В целом более высокая тактовая частота означает более быстрый процессор. Однако в игру вступают многие другие факторы.

      Ваш процессор каждую секунду обрабатывает множество инструкций (низкоуровневых вычислений, таких как арифметические операции) из разных программ. Тактовая частота — это количество циклов, выполняемых ЦП в секунду, измеряемое в ГГц (гигагерцах).

      С технической точки зрения «цикл» — это импульс, синхронизированный внутренним генератором, но для наших целей это базовая единица, которая помогает понять скорость процессора.Во время каждого цикла миллиарды транзисторов внутри процессора открываются и закрываются.

      Частота – это большее количество операций за заданный промежуток времени, как указано выше.

      ЦП с тактовой частотой 3,2 ГГц выполняет 3,2 миллиарда циклов в секунду. (Скорость старых ЦП измерялась в мегагерцах или миллионах циклов в секунду.)

      Иногда за один такт выполняется несколько инструкций; в других случаях одна инструкция может обрабатываться в течение нескольких тактов. Поскольку процессоры разных конструкций обрабатывают инструкции по-разному, лучше сравнивать тактовые частоты ЦП одной марки и поколения.

      Например, ЦП с более высокой тактовой частотой пятилетней давности может уступать по производительности новому ЦП с более низкой тактовой частотой, поскольку новая архитектура более эффективно обрабатывает инструкции. Процессор Intel® серии X может превзойти процессор серии K с более высокой тактовой частотой, поскольку он распределяет задачи между большим количеством ядер и имеет больший кэш-память ЦП. Но в ЦП того же поколения процессор с более высокой тактовой частотой обычно превосходит процессор с более низкой тактовой частотой во многих приложениях. Вот почему важно сравнивать процессоры одной марки и поколения.

      Как тактовая частота влияет на игры?

      До появления многоядерных процессоров тактовая частота считалась ключевой характеристикой для сравнения одноядерных процессоров. Сегодня это учитывается наряду с количеством ядер, кэш-памятью ЦП и энергопотреблением.

      Влияние тактовой частоты на конкретную игру зависит от игрового движка и инструментов, используемых для его создания. Сайты сравнительного анализа, такие как Tom’s Hardware, обнаружили, что некоторые игровые движки, такие как Dunia для Far Cry: Primal, выигрывают больше от высокой однопоточной производительности, чем от многопоточной. 2 С другой стороны, многие новые игры ААА, особенно в многопоточных движках, таких как Unreal Engine 4, могут выиграть как от дополнительных ядер, так и от увеличения тактовой частоты. 3

      Конкретные тесты — лучший способ оценить производительность ЦП в конкретном игровом движке, но тактовая частота — хороший общий показатель относительной производительности процессоров в семействе продуктов.

      Что означает турбочастота?

      В спецификациях ЦП Intel указаны как максимальная частота в режиме Turbo, так и базовая частота процессора. Базовая частота процессора относится к обычной рабочей точке ЦП, а максимальная частота в режиме Turbo — к максимальной скорости, которую процессор может достичь с помощью технологии Intel® Turbo Boost.

      Технология Intel® Turbo Boost — это инструмент, динамически повышающий тактовую частоту для работы с большими нагрузками. Он работает, не требуя установки или настройки пользователем. Технология оценивает тепловой запас процессора, а также количество используемых ядер, а затем повышает тактовую частоту до максимально безопасного уровня. Подробнее о технологии читайте здесь.

      Как вы используете технологию Intel® Turbo Boost для ускорения процессора? Мы объясним, как это работает.

      Как вы используете технологию Intel® Turbo Boost для ускорения процессора? Мы объясним, как это работает.

      Как работает технология Intel® Turbo Boost?

      ЦП не всегда должен работать на максимальной частоте. Некоторые программы больше зависят от оперативной памяти для бесперебойной работы, в то время как другие интенсивно используют ЦП. Технология Intel® Turbo Boost — это энергосберегающее решение этого дисбаланса: она позволяет ЦП работать на базовой тактовой частоте при обработке легких рабочих нагрузок, а затем переключаться на более высокую тактовую частоту для тяжелых рабочих нагрузок.

      Работа с более низкой тактовой частотой (количество циклов, выполняемых процессором каждую секунду) позволяет процессору потреблять меньше энергии, что может снизить тепловыделение и положительно повлиять на срок службы батареи в ноутбуках. Но когда требуется более высокая скорость, технология Intel® Turbo Boost динамически увеличивает тактовую частоту для компенсации. Иногда это называют «алгоритмическим разгоном».

      Технология Intel® Turbo Boost потенциально может повысить скорость процессора до максимальной частоты в режиме Turbo, сохраняя при этом безопасные пределы температуры и мощности. Это может повысить производительность как однопоточных, так и многопоточных приложений (программ, использующих несколько процессорных ядер).

      Если вам интересно, как включить Turbo Boost, не беспокойтесь — он включен по умолчанию. Вам не нужно ничего скачивать или настраивать.

      Что такое максимальная турбочастота?

      При работе с легкими нагрузками ЦП работает на базовой частоте, указанной в его спецификациях. (Или ниже, когда энергосберегающая технология Intel SpeedStep® масштабирует скорость ЦП.) При обработке аппаратных потоков, отмеченных как высокопроизводительные, технология Intel® Turbo Boost увеличивает тактовую частоту до максимальной частоты Turbo.

      Например, процессор Intel® Core™ i9-9900K имеет базовую частоту 3,60 ГГц и максимальную частоту в режиме Turbo – 5,00 ГГц.Обратите внимание, что в зависимости от ситуации данный ЦП не всегда может достигать своей максимальной турбочастоты. Динамическое увеличение скорости изменяется в зависимости от рабочей нагрузки и доступного запаса тепла.

      При сравнении тактовых частот ЦП обычно следует помнить о максимальной частоте в режиме Turbo. Он отражает пиковую производительность процессора перед разгоном. 1 Наряду с количеством ядер и премиальными функциями это один из ключевых факторов при покупке ЦП.

      В чем разница между технологиями Intel® Turbo Boost 2.0 и 3.0?

      Технология Intel® Turbo Boost 2.0 2 соответствует описанному выше поведению и доступна на большинстве процессоров Intel® Core™ новее 2-го поколения (процессоры Intel® Core™ i5, i7, i9 и процессоры Intel® Xeon®).

      Технология Intel® Turbo Boost Max 3.0 — это усовершенствованная версия 2.0, которая повышает скорость самых быстрых ядер ЦП по отдельности, а также направляет критически важные рабочие нагрузки на эти усиленные ядра. Это может увеличить однопоточную производительность до 15%. 3 4 5

      Технология Intel® Turbo Boost 3.0 доступна в процессорах Intel® Core™ серии X, в том числе:

      • Процессоры Intel® Core™ i7-69xx/68xx
      • Процессоры Intel® Core™ i9-7900X/i9-7920X/i9-7940X/i9-7960X/i9-7980XE/i7-7820X/i7-9800X
      • Процессоры Intel® Core™ i9-9820X/i9-99x0XE/i9-99x0X
      • Семейство процессоров Intel® Xeon® E5-1600 v4 (однопроцессорные)

      Как использовать технологию Intel® Turbo Boost?

      Технология Intel® Turbo Boost работает автоматически, повышая скорость вашего ЦП, когда это необходимо. Пользователям не нужно устанавливать или настраивать его, так как он включен по умолчанию во всех операционных системах.

      Хотя вы также можете отключить технологию Intel® Turbo Boost в BIOS, делать это не рекомендуется, если только вы не устраняете определенные проблемы или не пытаетесь собрать согласованные данные о производительности. Вы увидите более эффективную производительность и более высокие пиковые тактовые частоты с включенной технологией Intel® Turbo Boost.

      Если вы хотите получить больше от своего ЦП, прочитайте наше руководство по разгону и другие ресурсы по оптимизации ЦП.

      Фактическая тактовая частота, на которой работают процессоры Intel, сложна и регулируется несколькими механизмами, которые выполняют динамическое масштабирование частоты на основе доступного запаса по энергопотреблению.

      По мере совершенствования технологии на единицу площади кремния приходится все больше транзисторов. Кроме того, общая площадь кремния микросхемы микропроцессора продолжает расти по мере того, как в микросхему интегрируется все больше функций. В результате растет энергопотребление микропроцессоров и растет рассеиваемая мощность на единицу площади. Именно рассеиваемая мощность на единицу площади ограничивает тактовые частоты процессора. Корпорация Intel внедрила в свои архитектуры ряд механизмов для получения дополнительной производительности за счет более высокой частоты, когда это позволяют энергетические и тепловые ресурсы.

      • Усовершенствованная технология Intel SpeedStep (EIST) — представлена ​​в Pentium M, 2005 г.
      • Технология динамического ускорения (DAT) — представлена ​​в модифицированном Pentium M/Core 2006
      • Технология Turbo Boost (TBT) — представлена ​​в Nehalem в 2008 г.
        • Технология Turbo Boost 2.0 (TBT 2.0) – представлена ​​в Sandy Bridge в 2010 году.
        • Технология Turbo Boost Max 3.0 (TBMT) – представлена ​​в Broadwell E в 2016 году.

        Базовые частоты, отличные от AVX, AVX-2.0 и AVX-512

        В прошлом микропроцессоры продавались с одной базовой частотой, указанной в спецификациях. Для современных микропроцессоров, доступных на Kogence, Intel указывает три базовые тактовые частоты для каждого ядра в сокете. Базовые тактовые частоты — это минимальная гарантированная производительность каждого ядра в сокете. Существует базовая частота для инструкций, отличных от AVX, базовая частота для инструкций AVX-2.0 и базовая частота для инструкций AVX-512. Базовая тактовая частота для инструкций, отличных от AVX, является самой высокой, и это то, что рекламируется в сводных таблицах данных. Поскольку инструкции AVX-2.0 и AVX-512 более сложны и потребляют больше энергии, они синхронизируются на более низких частотах. Базовые частоты, используемые для расчета фактической тактовой частоты, на которой работает каждое ядро, определяются для каждого ядра в сокете независимо от других ядер. Поэтому, если некоторые ядра выполняют инструкции, отличные от AVX, они могут работать на более высокой частоте, чем ядра, выполняющие инструкции AVX-512. Следует отметить, что инструкции AVX-2.0 и AVX-512 выполняют больше FLOPS за такт. Таким образом, даже при более низкой тактовой частоте часть вашего кода, использующая инструкции AVX-2.0 или AVX-512, будет достигать более высоких показателей FLOPS в секунду, чем код, использующий инструкции, отличные от AVX.

        Смешанные рабочие нагрузки avx-normal с avx512.jpg

        Режимы низкого энергопотребления (P-состояния)

        Благодаря усовершенствованной технологии Intel SpeedStep (EIST) каждое неиспользуемое ядро ​​можно "выключить" для снижения общего энергопотребления. Каждое ядро ​​имеет ряд частот и соответствующих напряжений. Этот кортеж известен как P-состояние, и эта таблица P-состояний хранится в специальном регистре модели процессора (MSR) только для чтения и используется для обеспечения того, чтобы частоты не превышали нижнюю или верхнюю границу. Пример таблицы частот: показано ниже. Нижняя граница называется низкочастотным режимом (LFM) и представляет собой самую низкую рабочую точку частоты-напряжения для данного процессора. Это режим «выключено» и срабатывает, когда ЦП ничего не делает. Верхняя граница называется высокочастотным режимом (HFM) и является максимальной рабочей точкой частоты-напряжения. Это «включенный» режим, который срабатывает при загрузке ЦП. Обратите внимание, что частота HFM обычно упоминается по рекламируемому названию: Базовая частота.

        < th>Частота
        Пример таблицы P-State
        Напряжение
        1,21 В 2,8 ГГц (HFM)
        1,18 В 2,4 ГГц
        1,05 В 2,0 ГГц
        0,96 В 1,6 ГГц
        0,93 В 1,3 ГГц
        0,86 В 900 МГц
        0,80 В 600 МГц (LFM)

        ЦП будет переключаться между различными P-состояниями по мере необходимости и в соответствии с требованиями операционной системы. Масштабируемые процессоры Intel Xeon, доступные в Kogence, поставляются с Per-Core-P-State (PCPS), что означает, что каждое ядро ​​работает с независимым напряжением и частотой для управления энергопотреблением.

        Турбоускорение 1.0 и 2.0

        Технология Turbo Boost (TBT) – это микропроцессорная технология, разработанная Intel, которая пытается обеспечить временное повышение производительности за счет случайного и автоматического повышения тактовой частоты каждого ядра сверх гарантированной минимальной производительности (т. е. заявленной базовой частоты).

        При различных рабочих нагрузках, особенно при относительно низком потреблении энергии и/или малом количестве потоков или их полном отсутствии, процессор может воспользоваться запасом, увеличив тактовую частоту, оставаясь при этом в пределах TDP (расчетная тепловая мощность). ) пределы. Решение о включении турбонаддува является автоматическим и алгоритмическим по своей природе, основанным на ряде факторов, таких как: расчетное потребление тока, расчетное энергопотребление, температура ядра и количество активных ядер. Верхний предел определяется количеством активных ядер, которые Intel определяет как ядра в состояниях «C0» или «C1» («состояния C3» и «C6» «неактивны»). Как правило, чем больше активных ядер, тем меньше турбонаддув, доступный сверх базовой тактовой частоты. Например, двухъядерный ЦП с тактовой частотой 2 ГГц может обеспечить повышение частоты на 266,66 МГц (до 2266,66 МГц), когда активно одно ядро, и только 133,33 МГц (до 2133,33 МГц), когда активны два ядра. Обратите внимание, что только базовая тактовая частота является гарантированной производительностью каждого ядра. Таким образом, если каждое ядро ​​​​не только активно, но и выполняет большую нагрузку, то весь сокет может работать на базовой частоте, и усиление не может быть применено. Точно так же, как базовые частоты контролируются независимо для каждого ядра в сокете, турбонаддув, применяемый к данному ядру, также контролируется независимо от других ядер в сокете. Но расчет ускорения для каждого ядра зависит от нагрузки на все остальные ядра.

        BIOS позволяет отключать или включать Turbo Boost для всего сокета и должен поддерживаться операционной системой. В оркестрациях Kogence технология Turbo Boost включена и поддерживается всем оборудованием и ОС, которые мы предлагаем.

        TBT 1.0 впервые был представлен в микроархитектуре Nehalem. Технология Intel Turbo Boost 1.0 была направлена ​​на повышение производительности однопоточных приложений на многоядерных процессорах Nehalem. TBT 2.0 был представлен позже в 2011 году в микроархитектуре Sandy Bridge и расширил диапазон метрик, отслеживаемых для расчета турбоускорения, помимо многопоточного характера рабочих нагрузок.

        Без AVX Turbo, AVX-2.0 Turbo, AVX-512 Turbo

        Подобно тому, как базовые частоты различаются для разных наборов инструкций, турбоускорение также зависит от набора инструкций. Если данное ядро ​​выполняет инструкции AVX-512, тогда базовая тактовая частота, применяемая к этому конкретному ядру, будет ниже, чем базовая частота, применяемая к другим ядрам, выполняющим инструкции, отличные от AVX. Точно так же ускорение, которое может получить ядро, выполняющее инструкции AX-512, также будет отличаться от ускорения, которое могут получить ядра, выполняющие инструкции без AVX.

        Технология Turbo Boost Max 3.0

        Не бывает двух одинаковых чипов; это верно, даже если оба штампа были изготовлены из одной и той же пластины.Аналогичным образом, при максимальном нагружении процессора даже отдельные ядра одной монолитной интегральной схемы дают несколько разные характеристики производительности. Тестирование отдельных ядер путем отключения всех остальных ядер покажет, какие из них имеют лучшие тепловые характеристики и характеристики напряжения и стабильны на более высоких частотах. Каждый из них будет немного отличаться.

        Intel пытается использовать эти "превосходные ядра" с помощью технологии Turbo Boost Max. В процессе производства Intel может протестировать каждый кристалл и определить, какие ядра обладают лучшими возможностями разгона. Затем эта информация сохраняется в ЦП в порядке от лучшего к худшему.

        С помощью BIOS и драйвера Intel для Windows или Linux ресурсоемкие рабочие нагрузки будут перенесены на лучшее доступное ядро. Затем процессор попытается временно увеличить частоту до диапазона TBMT (где-то примерно на 200 МГц выше максимальной частоты Turbo Boost). Требующие рабочие нагрузки — это рабочие нагрузки, которые превышают настроенный порог использования (значение по умолчанию, указанное Intel, равно 90%). Некоторое программное обеспечение можно пометить вручную, что автоматически отнесет его к вышестоящим ядрам.

        TBMT 3.0 впервые был представлен в процессорах, продаваемых под торговой маркой Broadwell. Для Broadwell TBMT применяется только к 1 ядру. Для Skylake TBMT относится к 2 ядрам. Выпустив Cascade Lake X, Intel улучшила работу TBMT, задействовав четыре ядра вместо двух.

        Выбор скорости

        Технология Speed ​​Select была представлена ​​в Cascade Lake. Технология Speed ​​Select Technology (SST) – это технология управления питанием микропроцессора, представленная корпорацией Intel. Она позволяет настраивать пропускную способность и производительность для каждого ядра, позволяя устанавливать приоритеты производительности для определенных рабочих нагрузок, выполняемых на определенных ядрах, за счет снижения производительности других ядер.

        Процессоры поддерживают до трех профилей мощности SST (SST-PP), которые можно использовать для настройки сервера для различных типов рабочих нагрузок. Профили позволяют выполнять точную настройку в зависимости от количества ядер, требующих более высокой производительности. Другими словами, чем меньше ядер, тем выше производительность приоритетных ядер. И наоборот, чем больше ядер, тем ниже производительность по приоритетным ядрам. Профили изготавливаются таким образом, чтобы базовые и турбочастоты работали в соответствии с требованиями в пределах TDP SKU.

        Технология выбора скорости — это набор элементов управления питанием, который позволяет системному администратору настраивать производительность каждого ядра. Настраивая производительность конкретных ядер и связывая рабочие нагрузки с этими ядрами, можно добиться более высокой производительности программного обеспечения. SST поддерживает несколько типов настроек:

        Переменная тактовая частота и управление питанием ЦП появились с Intel 386SL, но это завело бы нас слишком далеко в прошлое. Начнем с представления мобильных телефонов K6-2+ и PIII. С этого момента и Intel, и AMD используют динамическое масштабирование частоты и напряжения (DFVS) для каждого процессора. DFVS продается как «PowerNow!», «SpeedStep» и многие другие названия. В многоядерном процессоре это означает, что все ядра будут работать с тактовой частотой наиболее загруженного ядра. Тактовая частота требует соответствующего напряжения ядра, поэтому все ядра также используют одинаковое напряжение.

        Выпустив в 2007 году семейство K10h (также известное как "Барселона"), AMD снизила динамическую мощность с помощью трех различных технологий:

        1. Динамическое масштабирование частоты для каждого ядра. Каждое ядро ​​работает на своих собственных частотах.
        2. Отдельные плоскости питания для ядра и "неосновной" части ЦП.
        3. Тактирование на уровне блока ЦП

        Влияние (1) на производительность/ватт не является полным успехом: мощность прямолинейна с частотой, и некоторые планировщики ОС всегда пытаются «балансировать нагрузку» между ядрами, чтобы избежать перегрева одного ядра (что увеличивает статическую силу). В результате экономия энергии за счет (1) относительно невелика, а задержка при переходе из одного P-состояния в другое снижает производительность, что подтверждают наши тесты. AMD Opteron обычно поддерживает 4-5 P-состояний. Opteron "Shanghai" 2389 в этом тесте поддерживает частоты 2,9, 2,3, 1,7 и 0,8 ГГц. Шестиядерный Opteron 2435 поддерживает частоты 2,6, 2,1, 1,7, 1,4 и 0,8 ГГц. [2]

        Отдельные плоскости питания дают несколько преимуществ. Первое преимущество заключается в том, что ядра могут переходить в спящий режим (C-состояние), в то время как контроллер памяти все еще работает для другого внешнего устройства (например, через DMA). Еще одним преимуществом является то, что AMD может запускать северный мост и кэш L3 не синхронно с ядрами. Это значительно снижает мощность, а производительность снижается лишь незначительно. В целом соотношение производительность/ватт явно увеличилось.

        Согласно некоторым публикациям, стробирование тактовой частоты снижает энергопотребление на 20–40 % [3].Это, вероятно, самая важная технология для серверного рынка: поскольку серверный код не выполняет много кода с плавающей запятой, отключение тактирования FPU с помощью тактового вентиля экономит довольно много энергии. На самом деле, самые высокие значения мощности измеряются тестами с интенсивным использованием операций с плавающей запятой, такими как LINPAC; типичные серверные тесты, основанные на базах данных или веб-серверах, даже близко не подходят. LINPAC потребляет на 20-25 % больше энергии, чем наши целочисленные тесты, несмотря на то, что в обоих случаях загрузка ЦП составляет 100 %.


        AMD добавила Smart Fetch в более новый "Shanghai" Opteron, который, по сути, является стробированием тактовой частоты на уровне ядра (что делает его новой технологией номер четыре). Основная цель состоит в том, чтобы заставить бездействующие ядра переходить в состояние сна с отключенными часами (состояние AMD C1) вместо низкочастотного состояния (P-состояние). Проблема в том, что отслеживание от активных ядер может слишком быстро разбудить спящее ядро, и эти отслеживание получат очень медленный ответ «только что проснулся». Чтобы избежать этого, бездействующее ядро ​​будет сбрасывать содержимое своих кэшей L1 и L2 в кэш L3, прежде чем оно перейдет в состояние C1 с синхронизацией. Этого нельзя было сделать в Барселоне, так как 2 МБ кэш-памяти L3 быстро заполнялись, если бы три ядра выгружали свои данные L1 и L2 в кэш-память L3. Тем не менее, важно отметить, что даже когда три ядра синхронизированы, маловероятно, что они отнимут 1,7 МБ (512 КБ * 3 + 64 КБ * 3), поскольку общие кэш-линии между ядрами всегда хранятся внутри эксклюзивного L3. кэш всех четырехъядерных Opteron. Тактовая синхронизация на уровне ядра снижает динамическую мощность до нуля, что позволяет новому Opteron экономить до 5 Вт на ядро.

        Это было довольно впечатляюще: Shanghai Opteron потребляет около 10 Вт для четырехъядерного процессора в режиме ожидания, а четырехъядерный Opteron "Барселона" потребляет около 25 Вт. Это также подтверждается измерением процессоров для настольных ПК, проведенным LostCircuits. AMD еще предстоит наверстать упущенное: шестиядерный Opteron «Lisbon» (запуск которого намечен на март 2010 г.) перейдет из состояния C1 в состояние C1E, управляемое аппаратно.

        Управление питанием Intel

        В 2006 году Intel перешла к довольно агрессивному регулированию тактовой частоты на уровне блоков ЦП в своем серверном ЦП Woodcrest. Intel также ввела размер кэша: необходимые данные в кэше L2 сведены к минимуму, а блоки кэша отключены. В то время как Intel была новатором, когда дело дошло до блокировки тактовой частоты и снижения мощности кэша, AMD была первой с независимыми уровнями питания и независимыми частотами ядра. Это показывает, что даже в гонке за управление питанием AMD и Intel обгоняют друг друга. Intel догнала AMD и снова обогнала AMD, представив серию Xeon Nehalem 5500, в которой ядра и неядра получили независимые плоскости питания.

        Однако корпорация Intel пошла еще дальше. Это позволило не только стробировать тактовую частоту для каждого ядра, но и стробировать мощность. Стробирование тактовой частоты снижает только динамическую мощность, в то время как стробирование мощности снижает как динамическую, так и статическую (в основном утечку) мощность. Благодаря встроенному блоку управления питанием (PCU, аппаратная схема) Intel обещает нам, что ядра могут переходить в самое низкое состояние сна C6, в то время как другие ядра продолжают работать «без помех».


        Ниже показано, как это видит операционная система. Мы попросили ядро ​​Windows 2008 сообщить нам, какое состояние ACPI используют ядра, когда ЦП работает в режиме ожидания. Обратите внимание, что тактовая частота каждого логического ядра снижена до 1,2 ГГц, что является еще одним признаком того, что ЦП не обрабатывает ничего существенного.


        Таким образом, в то время как операционная система требует, чтобы ЦП перешел в состояние ACPI C2, PCU отменяет приказы операционной системы и должен заставить простаивающие ядра относительно быстро переходить в состояние C6, обеспечивая более низкое энергопотребление. В C6 ядро ​​не только полностью синхронизировано, но и потребляет мощность. Это означает, что утечка неработающего ядра сведена практически к нулю. Более старая серия 5400 Xeon могла одновременно размещать только два ядра в C6 (т. е. если не работало только одно ядро, оно не могло войти в C6). И чем глубже сон, тем медленнее просыпается ядро. Intel значительно сократила время, необходимое для перехода в состояние C6 и обратно в архитектуре Nehalem.


        Настоящая магия архитектуры на основе Nehalem заключается в том, что встроенный выключатель питания делает этот переход чрезвычайно быстрым. Вместо 200 мкс [4] в старом процессоре Penryn (Xeon 54xx основан на этой архитектуре) время перехода уменьшено до 60 мкс.Это должно позволить сериям Xeon 5500, 3500 и 3400 быстро перейти на C6 с небольшим влиянием на производительность. Мы проверим эти претензии.

        Последние процессоры Intel Xeon имеют множество P-состояний: по одному для каждого интервала частоты 133 МГц от 1,2 ГГц до максимальной объявленной тактовой частоты. Другими словами, каждое соотношение 133 МГц между P-состоянием с самой низкой частотой и P-состоянием с самой высокой частотой является действительным P-состоянием.

        Ниже вы найдете обзор методов AMD и Intel по снижению энергопотребления при обработке.


        В стабильном состоянии все активные ядра работают на одной и той же частоте, которая равна максимальной запрошенной частоте любого из активных ядер. Когда есть запрос на изменение частоты от одного ядра, который приводит к изменению разрешенной частоты, все ядра перейдут на эту новую разрешенную частоту. Однако не все ядра обязательно изменят частоту одновременно, поскольку поток инструкций на каждом ядре должен достичь конца границы макрокоманд, прежде чем он сможет изменить частоту. Если ядро ​​выполняет очень длинную инструкцию, когда поступает запрос на изменение частоты, это ядро ​​изменит частоту позже, чем другие ядра, которые раньше достигли точки прерывания. В результате в течение очень коротких периодов времени ядра могут работать на разных частотах.

        Наиболее вероятная причина, по которой Intel не позволяет ядрам работать на разных тактовых частотах в течение длительного времени, заключается в том, что вам необходимо поддерживать напряжение, необходимое для максимальной тактовой частоты. AMD нужно наверстать упущенное, так как самое низкое C-состояние бездействующего ядра — только C1. Эта ситуация улучшится, когда появятся улучшенные Magny-Cours и Lisbon Opteron, поскольку эти процессоры будут поддерживать состояние C1E, как и их братья и сестры для ноутбуков.

        Читайте также: