Что такое синхронизация PCI Express

Обновлено: 21.11.2024

PCI Express спроектирован так, чтобы не только удовлетворить потребность в высокой пропускной способности, надежности и надежности подключения современных систем, но и решить одну из наиболее важных областей в конструкциях встроенных ASIC или SoC, которая заключается в управлении питанием и снизить энергопотребление. В этом документе обсуждаются некоторые методы, применимые к PCI Express, такие как изменение состояния питания устройства в соответствии с операционной системой, управление часами и драйверами устройств. Кроме того, в этой презентации будет представлен анализ компромисса между задержкой и тактовой частотой по отношению к энергопотреблению. В документе подробно представлено управление питанием канала PCI Express. Кроме того, разработчику системы, интегрирующему PCI Express во встроенные ASIC или SoC, будут предложены некоторые рекомендации, связанные с питанием, такие как изоляция отсека питания.

По мере увеличения скорости и количества логических элементов, поступающих в кремний, из-за меньшей геометрии процесса энергопотребление растет и может быть ограничивающим фактором для многих приложений. Следовательно, управление питанием и снижение энергопотребления было очень важным аспектом проектирования сегодняшних систем. Это еще более остро проявляется во встроенных системах, которые обычно используются в мобильных и портативных приложениях, где приветствуется любое дополнительное время автономной работы. В типичной встроенной SoC мы находим встроенный локальный процессор (например, ARM, MIPS, ARC или DSP) с несколькими тактовыми доменами и сбросами. В этих приложениях энергосбережение решается со многих точек зрения — логической, физической, функциональной и системной. На логическом фронте используются многие методы проектирования с низким энергопотреблением, а на физическом фронте многие современные инструменты помогают снизить энергопотребление на уровне списка цепей. В этом документе основное внимание будет уделено управлению питанием (PM), достигаемому через PCI Express на функциональном и системном уровнях.

Чтобы решить эту важную проблему, давайте сначала разберемся с основами энергопотребления. Затем мы обсудим, как осуществляется управление питанием как на локальном, так и на глобальном уровне, и как PCI Express решает эту проблему с помощью своих инновационных функций управления питанием на уровне канала. Существует три основных фактора, влияющих на энергопотребление или рассеяние: частота, рабочее напряжение и значение емкости переключения/узла, как указано в следующей формуле (Мощность = Kfcv2).

Как видно из приведенного выше уравнения, наибольший вклад в рассеивание мощности вносит напряжение. Он пропорционален квадрату напряжения. PCI Express работает при меньшем рабочем напряжении 1,2 В, что намного меньше, чем 5,5/3,3 В, рабочее напряжение для обычного PCI. Другой подход к снижению рассеиваемой мощности заключается в использовании отдельных силовых (напряженных) колодцев. Большинство частей микросхемы могут работать от основного источника питания, а меньшая часть может использоваться для пробуждения остальной части микросхемы и может работать от вспомогательного источника питания. Когда микросхема находится в спящем режиме без необходимости выполнять какую-либо полезную работу, питание основной логики может быть отключено, и только относительно меньшая часть микросхемы может по-прежнему питаться от вспомогательного источника питания. Это может привести к значительной средней экономии энергии. Позже мы обсудим, как этот метод применяется к PCI Express, и методы, как сделать отдельные гнезда питания в чипе.

Следующим важным фактором энергопотребления является рабочая частота. Со спросом на более высокую пропускную способность скорость/частота растут. Однако PCI Express предлагает условие, при котором базовая логика может работать на пониженной частоте без ущерба для пропускной способности. PCI Express определяет интерфейс между основной логикой и физическим PHY, называемый интерфейсом PIPE. PIPE может работать на скорости 8 бит/250 МГц (одинарная труба) или на скорости 16 бит/125 МГц (двойная труба). При использовании Dual PIPE основная логика может работать на половине тактовой частоты, обеспечивая такую ​​же пропускную способность, но меньшее энергопотребление. Конечно, у работы на более низкой частоте и более широком пути передачи данных есть свои плюсы и минусы. Минусы — относительно большая задержка для обработки пакетов с более низкой частотой. Для мобильных приложений энергосбережение важнее дополнительной задержки. В других приложениях, таких как обмен данными между чипами, задержка может быть более важной, чем экономия энергии, и эти приложения выбирают одноконвейерный режим.

Далее давайте обсудим управление питанием с точки зрения системы, опишем его основы и то, как они применимы к PCI Express. В системе управление питанием — это скоординированная работа многих компонентов, таких как операционная система (ОС), драйвер PM, драйвер устройства, часы платформы/диспетчер питания, набор микросхем и устройство. Спецификация Advanced Configuration and Power Interface (ACPI) определяет состояния системы ACPI (S0, S1, S2, S3, S4 и S5) для управления питанием на самом высоком уровне, который включает всю платформу и влияет на многие компоненты.S0 — это полностью рабочее состояние с полной мощностью, а S5 — это состояние, когда система полностью отключена. По мере перехода от S0 к S5 достигается большее энергосбережение. Следующий уровень управления питанием — это состояния устройства (D0, D1, D2, D3), определенные спецификацией PCI PM. D0 — это полностью рабочее состояние с полным включением питания, а D3 — это состояние с максимальной экономией энергии. Самый низкий уровень PM — это состояния питания канала PCI Express (L0, L0s, L1, L2 и L3). L0 — это полностью рабочее состояние питания с включенным питанием и всеми работающими часами. L3 — это состояние с наименьшим энергопотреблением, когда все питание и часы отключены. По мере того, как мы переходим от L0 к L3, достигается большая экономия энергии, но при этом увеличивается задержка выхода из этих состояний для возврата в состояние L0. Спецификация PCI Express PIPE также определяет состояния PHY P (P0, P0s, P1, P2 и P3), которые очень похожи на состояния канала. В таблице ниже описывается взаимосвязь между состояниями System, Device, Link и Phy.

В этом разделе подробно описаны состояния канала PCI Express. Состояния канала — L0, L0s, L1, L2 и L3, где L0 — это полностью функциональные состояния с полным включением питания и всеми работающими часами. L0s — это низкая задержка на выход и относительно низкое энергосберегающее состояние канала. Он предназначен для использования меньших периодов бездействия по ссылке. L1 предлагает большую экономию энергии с большей задержкой выхода и предназначен для работы в течение более длительного периода бездействия на канале. Состояние энергопотребления L2 дает наибольшую экономию энергии, но имеет наибольшую задержку выхода. Задержка на выходе для L0s составляет порядка нс (несколько сотен нс). Задержка на выходе для L1 находится в порядке от нас, а задержка на выходе для L2 — в порядке мс.

Состояние канала PCI Express L0S состоит из двух независимых состояний L0sTX и L0sRX. Канал PCI Express работает в полнодуплексном режиме, при котором передача данных происходит в обоих направлениях. Пути передачи и приема независимы друг от друга, что означает, что можно отключить либо путь передачи, либо путь приема, либо оба пути передачи и приема. L0sTX имеет дело с путем передачи, а L0sRX — с путем приема. L0sTX инициируется, когда у пользовательского приложения нет пакета для отправки. Основная логика поддерживает таймер с максимальным значением 7 мкс. Когда таймер истекает, передающая сторона отправляет EIOS (Electrical Idle Ordered State — тип пакета канального уровня) и переводит линии TX+ и TX- в синфазное напряжение. Основная логика может сделать таймер программируемым, которым может управлять драйвер устройства, вместо жесткого кодирования значения таймера во время синтеза. Это обеспечивает более точную детализацию и может варьироваться в зависимости от моделей и условий трафика. L0sRX вводится, когда канал получает EIOS от устройства на другой стороне канала. И L0sTX, и L0sRX выполняются на канальном уровне без каких-либо сведений об ОС или драйвере PM. Во время L0Stx некоторые части логики ядра PCI (уровни TX) могут быть синхронизированы, и аналогично во время L0sRX некоторые части логики ядра PCI (уровни RX) могут быть синхронизированы, как концептуально показано на схеме ниже.


Состояние канала L1 PCI Express делится на два типа состояний L1 — L1 ASPM и L1-Software. L1 ASPM является полностью автономным механизмом между двумя компонентами в конце канала и не требует взаимодействия с программным обеспечением. Когда канал входит в состояние L0 (как L0sTX, так и l0sRX) и остается там в течение определенного периода времени, состояние питания канала может быть повышено до состояния L1ASPM. Вход в L1 всегда инициируется конечной точкой PCIe (устройством, удаленным от корня в иерархии), а восходящий компонент (корневой порт или порт коммутатора) может принять или отклонить запрос на вход в L1. Когда восходящий компонент отклоняет запрос, конечная точка должна ждать не менее 10 мкс, прежде чем она сможет снова запросить. Ожидание предназначено для того, чтобы отделить новый запрос от предыдущего отклоненного запроса. После принятия обе стороны отправляют заказанные EIOS наборы и входят в состояние электрического простоя на линиях TX. Выход из L1 в L0 может быть инициирован любой стороной, когда ей нужно отправить пакет.

При наличии в микросхеме отдельных источников питания (доменов) необходимо выполнить Надлежащую изоляцию на границе между логикой в ​​этих доменах. Когда питание домена отключено, сигналы, идущие во включенный домен из отключенного домена, являются плавающими, и это может вызвать большой ток утечки. Чтобы решить проблему утечки, сигналы проходят через изолирующие ячейки, которые являются логическими вентилями И. Одна ветвь логического элемента И представляет собой сигнал powergood, который подается из включенного домена и обеспечивает значение «0». Значение «0» для сигнала powergood делает вывод детерминированным «0» вместо плавающего значения. Изоляция выполняется для сигналов, пересекающих области мощности в обоих направлениях. На следующей диаграмме показано, как это делается.

Подводя итог, можно сказать, что управление питанием является очень важной частью современных встроенных микросхем ASIC и SoC. PCI Express используется во многих встроенных приложениях, где он обеспечивает не только высокую пропускную способность, но и множество инструментов для управления питанием на разных уровнях. В документе описывается, как PCIe PM выполняется на уровне системы, устройства и канала, а также как можно применять компромисс между частотой и шириной канала для определенных приложений. Он предлагает агрессивную синхронизацию во время состояний канала. Он также предоставляет способы сделать определенный таймер бездействия программируемым пользователем, чтобы драйвер устройства мог точно настроить эти значения в зависимости от условий трафика.

Кишор Мишра — президент и главный исполнительный директор компании ASIC Architect, Inc., специализирующейся на высокоскоростных интерфейсных контроллерах. Его основное внимание уделяется PCI Express, архитектуре ПК и управлению питанием. Кишор Мишра имеет степень BSEE от NIT Rourkela, Индия, и MSEE от UT, Толедо, США. Он имеет более чем 18-летний опыт работы в электронной промышленности в области компьютерной архитектуры, разработки продуктов и управления. До того, как стать соучредителем ASIC Architect Inc., он занимал руководящие инженерные и руководящие должности в Intel, Texas Instruments и новых компаниях в Силиконовой долине. Кишор Мишра владеет несколькими патентами в области компьютерной архитектуры.

С. К. Хунг является старшим менеджером линейки основных продуктов PCI Express IP в компании Mentor Graphics. В дополнение к более чем 15-летнему опыту CC со встроенным аппаратным и программным обеспечением в области бытовой электроники, беспроводной связи, телекоммуникаций и передачи данных, он занимал различные руководящие должности в области управления продуктами и разработки приложений в Freescale, Inc. и имеет многочисленные патенты и награды. К. С. имеет степень магистра электротехники и вычислительной техники Техасского университета в Остине, степень магистра машиностроения Пенсильванского государственного университета и степень бакалавра наук Центрального национального университета Тайваня.

Есть несколько вопросов об определенных параметрах BIOS. Используйте эту плату с BIOS 0805. Запустите i9 9900k с частотой 5 ГГц, все ядра, стабильно при 1,225 В, и Prime95 29.6 build 2, все работает без AVX, AVX2. Технически температура у меня лежит в размере 4K FFT при 16 потоках при хорошем максимуме 94 ° C.

  • В разделе «Управление синхронизацией DRAM» -> «Центрирование трассировки» выбрано значение «Включено/Отключено», что именно оно делает?
  • В разделе «Управление синхронизацией DRAM» -> выбор «Maximus Tweak» = режим 1/2, что это делает?
  • В разделе Extreme Tweaker -> Внутреннее управление питанием ЦП -> «Линия нагрузки переменного тока IA», как вы устанавливаете это в идеале для разгона?
  • В разделе Extreme Tweaker -> Внутреннее управление питанием ЦП -> «Линия нагрузки постоянного тока IA», как лучше всего настроить это для разгона?
  • В Extreme Tweaker -> Внутреннее управление питанием ЦП -> Выбор «Оптимизация напряжения TVB» = Включено / Отключено, нужно ли мне это для разгона?
  • Что он делает в Extreme Tweaker -> "Ring Down Bin" = Enabled / Disabled?
  • В разделе «Дополнительно» -> «Прочие конфигурации платформы» -> «Выбор PCI Express Clock Gating» = вкл/выкл, что именно он делает?
  • Что именно он делает в разделе Extreme Tweaker -> «Xtreme Tweaking» = Enabled / Disabled?

Спасибо за ответы.
С уважением

Я тоже хотел бы знать

Кто-нибудь знает, можно ли более подробно объяснить настройки BIOS Asus (z390)?

Нагрузочная линия IA AC/IA DC полезна при использовании адаптивной регулировки напряжения ядра. Предотвращает высокие и низкие напряжения в блокировке с помощью управления Intel VID. Не влияет на ручную регулировку напряжения. Maximus Tweak предназначен для таймингов памяти, в основном оставленных в автоматическом режиме, если вы не хотите глубоко погрузиться в OC памяти. TVB предназначен для пониженного напряжения, когда чип охлаждается, что бессмысленно для OC, поскольку он имеет тенденцию нагреваться, что может быть полезно для стандартного или прямого охлаждения кристалла. Насколько я помню, Ring Bin Down вызывает нестабильность на более высоких скоростях. PCI Clock Gating предназначен для синхронизации шлюзов внутри вашего графического процессора, но я никогда не пробовал, но я должен. Xtreme Tweaking предназначен для бенчмаркинга, так как он выжал немного больше МГц из вашего ПК, если вы отключили его вручную.

Для загрузки щелкните правой кнопкой мыши ссылку в Chrome и выберите "Сохранить ссылку как".
или, если вы щелкнете по ссылке, и она откроется в вашем браузере, вы можете выбрать в меню сохранение в формате PDF.

PCI Express долгое время был доминирующим межсоединением ввода-вывода в традиционных ПК и серверах. Он даже появился в ноутбуках и ноутбуках, но только недавно PCI Express был обнаружен в небольших мобильных устройствах, таких как смартфоны и планшеты. В течение многих лет в отрасли считалось, что PCI Express слишком «прожорлив», чтобы когда-либо преуспеть в таких небольших устройствах с батарейным питанием, так что же изменилось?В этой статье рассматриваются два технологических достижения, которые значительно снизили энергопотребление интерфейса PCI Express: одно — усовершенствование протокола, а другое — новая технология кремния.

Новый протокол, пониженная мощность

Чтобы понять новый протокол энергосбережения PCI Express, нам нужно оглянуться на историю. Во время эволюции исходной параллельной шины PCI примерно в 1997 году были введены энергосберегающие «состояния устройства» или «D-состояния», где «D0» отражало нормальную работу устройства на полной мощности, а «D3» указывало либо на устройство. питание отключено или готово к работе, а также дополнительные состояния «D1» и «D2» для промежуточного энергосбережения. Все эти состояния энергосбережения были для устройства, которое не использовалось. Вход и выход из состояния энергосбережения (не «D0») требует вмешательства программного обеспечения и операционной системы. Эта спецификация подходила для таких операций, как перевод ноутбука в режим сна или гибернации, когда взаимодействие с пользователем не ожидалось в течение нескольких минут или часов.

К моменту разработки PCI Express в 2002 году в спецификацию были включены дополнительные «состояния канала» или «L-состояния». Они следуют шаблону существующих «D-состояний». «L0» означает, что канал PCI Express работает в полную силу. «L1» — это канал, по которому не передаются данные, но который может относительно быстро возобновить нормальную работу. «L2» и «L3» отражают соединение с отключенным основным питанием («L2» указывает, что вспомогательный источник питания активен для обеспечения «поддерживающего» питания устройств). Также было определено состояние «L0s», в котором каждое направление канала PCI Express могло быть отключено независимо с быстрым возобновлением нормальной работы. Полностью активные устройства в «D0» могут переключаться между «L0», «L0s» и «L1» без вмешательства программного обеспечения и, таким образом, экономить энергию по собственной инициативе без какого-либо взаимодействия с операционной системой.

Хотя это казалось решением проблемы энергосбережения активных устройств, ахиллесовой пятой «L-состояний» оказалась скорость включения и выключения питания. Спецификация PCI Express требовала, чтобы устройства выходили из «L0» менее чем за одну микросекунду, а из «L1» где-то порядка 2-4 микросекунд. Хотя разработчики PHY могли бездействовать логику приемника и передатчика в L1, чтобы соответствовать этим временам возобновления, они были вынуждены держать свои энергоемкие стабилизаторы синфазного напряжения и контуры фазовой автоподстройки частоты (PLL) включенными и работающими. Это означало, что каждая полоса PCIe PHY в «L1» по-прежнему могла потреблять 20–30 милливатт энергии, что явно было бы слишком много для устройства с батарейным питанием.

К 2012 году стало ясно, что комбинации специализированного аппаратного и программного обеспечения в таких мобильных устройствах могут обеспечивать перевод компонентов PCI Express между нормальным состоянием и состоянием с низким энергопотреблением, если только у них есть механизм для этого. «Подсостояния L1 PM с CLKREQ» ECN для PCI Express (часто называемые просто «подсостояниями L1») были введены, чтобы позволить устройствам PCI Express входить в еще более глубокие состояния энергосбережения («L1.1» и «L1 .2"), хотя для устаревшего программного обеспечения все еще отображается в состоянии "L1".

Меньшая геометрия процесса + стробирование тактовой частоты для снижения энергопотребления

Многое было сделано из-за резкого уменьшения геометрии процесса с традиционными КМОП-технологиями затвора до 30 нм, а процессы FinFET быстро переместились ниже 10 нм. Разработчики SoC выиграли от значительного увеличения количества логических элементов, что позволяет упаковывать все более и более сложную логику в передовые разработки. Необработанная скорость в виде уменьшения задержки затвора и соответствующего увеличения тактовой частоты последовала за уменьшением геометрии, хотя и с меньшей скоростью. При обсуждении энергопотребления основное внимание традиционно уделялось динамическому току — мощности, потребляемой каждый раз, когда КМОП-устройство меняет состояние — как это происходит в каждом тактовом цикле. Более высокие тактовые частоты, естественно, приводят к большему потреблению энергии в единицу времени, поэтому разработчики могут настраивать энергопотребление прямо пропорционально рабочим частотам своего устройства.

Поскольку энергопотребление PCI Express PHY в режиме ожидания было снижено до уровня, приемлемого для небольших устройств, внимание отрасли было обращено на цифровую логику. В знак снижения энергопотребления некоторые разработчики SoC вручную реализовали методы стробирования тактовых импульсов, чтобы не тратить энергию в неиспользуемых частях SoC. Возьмем, к примеру, двухпортовое устройство с одним неподключенным портом — значительную мощность можно сэкономить, остановив синхронизацию логики этого неиспользуемого порта и уменьшив динамическую мощность до нуля. К сожалению, даже когда КМОП-устройство находится в статическом состоянии, оно потребляет некоторую мощность, известную как ток утечки. Для контроллера конечной точки PCI Express, который реализует 4 линии PCIe 3.1 со скоростью 8 ГТ/с («Gen3») и который обычно можно найти в твердотельных накопителях PCI Express, эта утечка может привести к 1-2 мВт мощности в цифровом контроллере. логика.

Меньшие размеры кремния улучшают динамическую мощность благодаря их все меньшим и меньшим размерам транзисторов, но мощность утечки не улучшается с такой же скоростью. Это означает, что при рассмотрении в пропорции к динамической мощности влияние мощности утечки становится весьма значительным. Чтобы помочь в этом, разработчики процессов начали предлагать ряд ячеек в каждой библиотеке, предлагая компромисс между скоростью и мощностью утечки. Как показано на рис. 1, ячейки с низким VT работают быстро, но имеют высокий ток утечки, и хотя ячейки с высоким VT имеют низкий ток утечки, они также намного медленнее. Популярные сегодня процессы FinFET действительно обеспечивают меньшую утечку, чем прошлые традиционные процессы кремния с затвором, но даже в процессах FinFET ячейки со сверхнизким VT, необходимые для работы в гигагерцовом диапазоне, могут по-прежнему превышать требуемые целевые показатели мощности для мобильных устройств.

Чтобы подготовить графический процессор для настольных ПК к использованию в мобильной среде, одна из основ проектирования микросхемы нарушается путем введения так называемого синхронизирующего стробирования. Все графические процессоры состоят из десятков миллионов логических элементов, которые составляют все, от функциональных блоков до хранилища памяти на самом графическом процессоре. Каждый вентиль получает входные данные от тактового генератора всего графического процессора, чтобы гарантировать, что все части графического процессора работают на одной частоте. Но по мере того, как графические процессоры становятся все больше и больше, становится все труднее обеспечить одновременный прием всеми частями чипа одного и того же тактового сигнала. Чтобы компенсировать это, создаются сложные деревья тактовых импульсов, несущие сеть одного и того же тактового сигнала ко всем частям микросхемы, так что, когда часы переходят на высокий уровень (инструктируя всю логику в микросхеме выполнять свои индивидуальные задачи, вроде как зеленый свет для начала работы) все ворота получают сигнал одновременно.

Единственный принцип, которому всегда учат при проектировании микросхем, заключается в том, чтобы никогда не позволять тактовому сигналу проходить через какие-либо логические вентили, он всегда должен идти от источника сигнала к цели, не проходя через что-либо. еще. Причина в том, что если вы начнете вставлять логику между источником тактового сигнала и его целью, вы сделаете дерево тактовых импульсов чрезвычайно сложным - с этого момента вам нужно не только беспокоиться о том, чтобы получить один и тот же тактовый сигнал для всех частей графического процессора на то же время, но вы также должны беспокоиться о задержках, вызванных питанием часов через логику. Однако у стробирования тактовой частоты есть свои преимущества, и в первую очередь они связаны с энергосбережением.

Оказывается, самый простой способ отключить конкретную часть чипа — перестать подавать на него тактовый сигнал; если часы никогда не переходят на высокий уровень, то эта часть микросхемы никогда не узнает, что нужно начать работать, поэтому она остается в своем исходном состоянии, т. е. в нерабочем состоянии. Но вы, очевидно, не хотите, чтобы часы были отключены все время, поэтому вам нужно реализовать логику, которая определяет, следует ли подавать часы на определенную часть микросхемы.

Когда вы печатаете в Word, все, что делает ваш GPU, состоит из двухмерных операций и операций с памятью. Блоки с плавающей запятой графического процессора не нужны, равно как и ничего, связанного с 3D-конвейером. Допустим, у нас есть часть чипа, которая определяет, печатаете ли вы в Word вместо того, чтобы играть в игру, и эта часть чипа посылает сигнал 2D_Power_Save. Когда вы просто работаете в Word и не нуждаетесь в каком-либо 3D-ускорении, 2D_Power_Save становится высоким (сигнал имеет значение «1» или электрически, независимо от высокого напряжения на ядре), в противном случае сигнал остается низким ( «0» или 0 В).

Используя этот сигнал 2D_Power_Save, мы могли бы построить некоторую логику, используя часы, которые подаются на все части 3D-движка на графическом процессоре. Логика может выглядеть примерно так:

Очень простая логика, показанная выше, представляет собой логический элемент И с двумя входными сигналами и одним выходным. Сигнал 2D_Power_Save инвертирован, поэтому, когда он высокий, значение, подаваемое на логический элемент И, низкое, и наоборот. Если сигнал 2D_Power_Save имеет высокий уровень, он инвертируется и передается на логический элемент И как низкий сигнал, что означает, что сигнал Clock_Out никогда не будет высоким, и, следовательно, все, что связано с ним, всегда будет низким. Если 2D_Power_Save низкий, то часы передаются на остальную часть графического процессора. Вот как работает синхронизация часов.

Мы упоминали ранее, что современные графические процессоры состоят из десятков миллионов вентилей (каждый вентиль состоит из нескольких транзисторов), и хотя было бы неплохо, практически невозможно внедрить такую ​​логику для каждого одни из тех ворот. Во-первых, у вас будет невероятно огромный чип благодаря тому, что вы потратите еще больше транзисторов на логику стробирования тактовых импульсов, и это также сделает построение вашего дерева тактовых импульсов невероятно трудным. Итак, происходит то, что часы, подаваемые на большие группы вентилей, известные как блоки, стробируются, вместо того, чтобы стробировать часы на отдельные вентили.Хитрость здесь заключается в том, что чем меньше блоки, которые вы блокируете (или чем точнее вы выполняете синхронизацию), тем эффективнее будет ваше энергосбережение.

Допустим, мы взяли наши маленькие закрытые часы сверху и скормили их всему конвейеру 3D-рендеринга. Поэтому, когда 3D-ускорение не требуется (например, мы просто печатаем в MS Word), весь 3D-конвейер и все связанные с ним функциональные блоки отключаются, что экономит нам много энергии. Но теперь, когда мы запускаем игру Doom 3, все наши энергосбережения теряются, так как снова включается весь 3D-движок.

Что, если бы мы могли отключать части графического процессора не только в зависимости от того, какой тип приложения мы запускаем (2D или 3D), но и в зависимости от конкретных требований этого приложения. Например, шейдеры Doom 3 выполняют определенные операции, которые нагружают некоторые части графического процессора, в то время как такие игры, как Grand Theft Auto, нагружают другие части графического процессора. Более детальная реализация синхронизации тактовой частоты позволила бы графическому процессору различать требования двух приложений и, таким образом, обеспечить большую экономию энергии.

Хотя мы не совсем на уровне последнего примера, единственно верно то, что современные мобильные графические процессоры обеспечивают более точную синхронизацию, чем предыдущее поколение. Это останется верным для будущих мобильных графических процессоров, поскольку более мелкие производственные процессы и улучшения в архитектуре графического процессора позволят все более и более точно регулировать тактовую частоту.

Итак, что мы имеем сегодня с GeForce 6800 Go?

При использовании графических процессоров серии NV3x, как только запрос попадал в 3D-конвейер, включался весь 3D-конвейер, и он не отключался до тех пор, пока последние биты данных не покидали конвейер. В GeForce 6800 Go различные этапы 3D-конвейера включаются только в том случае, если они используются, в противном случае они остаются отключенными благодаря тактовой синхронизации. Это означает, что энергопотребление в 3D-приложениях и играх сейчас оптимизировано гораздо лучше, чем когда-либо прежде, и оно будет улучшаться с будущими мобильными графическими процессорами.

Поскольку M28 от ATI официально еще не выпущен, у нас нет информации о его энергопотреблении, однако, учитывая, что X800 потребляет меньше энергии, чем 6800 для настольных ПК, мы не будем слишком удивлены, увидев аналогичный показатель. ситуация возникает и на мобильной стороне вещей.

Читайте также: