Сколько линий PCI Express использует видеокарта

Обновлено: 02.07.2024

PCI Express, PCIe или Peripheral Component Interconnect Express могут быть довольно сложной спецификацией компьютера. Когда ваш компьютер загружается впервые, именно PCIe определяет устройства, которые подключены или подключены к материнской плате. Он определяет связи между каждым устройством, создает карту трафика и согласовывает ширину каждой ссылки. Эта идентификация устройств и подключений использует тот же протокол, что и PCI, поэтому при переходе с PCI на PCIe не требуется никаких изменений ни в программном обеспечении, ни в операционных системах.

Соединение PCIe состоит из одной или нескольких (на данный момент до шестнадцати) линий передачи данных, соединенных последовательно. Каждая полоса состоит из двух пар проводов, одна для передачи и одна для приема. В одном слоте PCIe имеется 1, 4, 8 или 16 линий, обозначаемых как x1, x4, x8 или x16. В этом разница между параллельными соединениями PCI (32-битная или 64-битная двунаправленная параллельная шина) и PCIe, который в основном представляет собой последовательную версию PCI.

Если вам нужен портативный компьютер со слотами расширения, см. «портативные компьютеры со слотами расширения».

PCIe Lanes на материнской плате

`

PCIe Lanes

Как работают линии PCIe?

PCIe — это многоуровневый протокол, в котором уровни представляют собой уровень транзакций, уровень канала передачи данных и физический уровень. Уровень канала передачи данных подразделяется на уровень управления доступом к среде (MAC). Каждая полоса состоит из двух однонаправленных дифференциальных пар, работающих на скоростях 2,5, 5, 8 или 16 Гбит/с, в зависимости от согласованных возможностей. С другой стороны, передача и прием представляют собой отдельные дифференциальные пары, что в сумме дает четыре провода данных на дорожку.

Каждая линия представляет собой независимое соединение между контроллером PCI набора микросхем процессора (южным мостом) или самим процессором (почти всегда это слот видеокарты) и платой расширения. Пропускная способность масштабируется линейно, поэтому четырехполосное соединение будет иметь вдвое большую пропускную способность, чем двухполосное соединение. В зависимости от требований к пропускной способности платы расширения может потребоваться соответствующий размер слота.

Доступная шина и теоретическая пропускная способность

Почему важны линии PCIe?

Функции управления линиями PCIe вашего ЦП:

  • Встроенное видео
  • Слот PCIe 3.0 x16 (обычно для видеокарты)
  • 2/U.2 (на некоторых форумах для энтузиастов)
  • LAN (на некоторых форумах для энтузиастов)

Другие функции используют линии шины PCIe вашего ЧИПСЕТА. Функции, которыми может управлять элемент управления PCIe Lanes набора микросхем CHIPSET:

  • Жесткие диски SATA
  • Встроенный звук
  • Встроенный RAID
  • Встроенный сетевой контроллер/локальная сеть
  • Все разъемы PCIe, кроме первого
  • Удар молнии
  • 2/U.2

Указанный объем пропускной способности PCIe, необходимой для отдельных компонентов:

У каких чипов больше всего линий PCIe?

Разные чипы поддерживают разное количество линий PCIe. Например: Intel Core i5 или i7-8700K или i9-8950HK имеют до 1×16, 2×8, 1×8+2×4 с максимум 16 линиями PCIe. Кроме того, i7 6850K и выше имеют 40 дорожек. Intel Xeon E5-4669 v4 имеет максимум 40 линий PCIe на PCIe 3.0, тогда как E7-8894 v4 имеет «всего» 32 линии (на процессор). AMD подняла планку со своими процессорами EPYC — у них 128 линий PCIe 3.0.

Сегодня в технологической отрасли это действительно усложняет то, что производители материнских плат должны обеспечивать поддержку своих материнских плат различных процессоров, которые могут иметь разное количество поддерживаемых линий PCIe. Таким образом, материнская плата, использующая чип i7-6850K, может иметь возможность адресации нескольких слотов на скорости x16, тогда как с «меньшим» чипом, т.е. i7-8700K может иметь меньше доступных дорожек, только один слот x16. Еще больше усложняет ситуацию то, что для NVME и других типов расширений требуются линии PCIe. Поскольку NVME является обязательной функцией для современной материнской платы, теперь для слотов расширения доступно еще меньше дорожек.

Выяснить, как получить максимальную отдачу от материнской платы с точки зрения производительности приложений, становится еще сложнее, когда вам нужно выбрать способ подключения к реальному миру. Распределение линий PCIe может повысить или снизить производительность высокоскоростных плат, таких как RAID-контроллеры, когда они работают почти с максимальной емкостью (что теперь возможно благодаря быстрому хранилищу SSD).

Несмотря на то, что производители компьютеров изучают некоторые варианты интерфейсов, отличных от PCIe, они также потребуют значительных изменений оборудования. В целом, PCIe, похоже, еще какое-то время будет оставаться важным, даже несмотря на то, что форм-фактор соединения продолжает развиваться.

Anandtech хорошо описала чипсет Z170 и компромиссы, на которые приходится идти производителям плат при выборе конфигурации PCH

Peripheral Component Interconnect Express, также известный как PCIe, представляет собой стандартный интерфейс шины, используемый в современных материнских платах. Он поставляется в различных конфигурациях, обозначаемых количеством линий, которые содержит каждый слот PCIe. Например, PCIe с одной полосой называется PCIe x1. То же самое касается слотов PCIe x4, x8, x16, x32, где имеется 4, 8, 16 и 32 полосы соответственно. PCIe x32 — редкость, так как большинство компонентов рассчитано на 16 линий. Различные размеры слотов PCIe, которые мы видим на материнских платах, зависят от количества линий, которые содержит слот.

С появлением приложений и игр, интенсивно использующих графику, одним из компонентов, который значительно выигрывает от высокой скорости передачи данных PCIe, высокой пропускной способности, низкой задержки и эффективной обработки больших блоков данных, является графический процессор. Чтобы полностью понять технологию, лежащую в основе PCIe, нужно охватить множество причин, но в своей основе она состоит из линий PCIe, которые связывают один компонент с другим. Давайте обсудим динамику линий PCIe и то, как они связаны с производительностью графического процессора.

Дорожки PCIe

Полосы PCIe служат для передачи данных между высокоскоростными компонентами, такими как графические и твердотельные накопители, а также процессором или набором микросхем. Каждая полоса состоит из двух пар медных проводов; одна пара предназначена для отправки данных, а другая — для приема данных. Чем больше полос, тем выше совокупная пропускная способность, которая может быть предоставлена. PCIe 5.0, последнее поколение интерфейса PCIe, имеет общую пропускную способность 128 Гбит/с при реализации x16, что вдвое больше, чем у его предшественника, PCIe 4.0.

Когда вы слышите о линиях PCIe, на ум сразу же приходят линии в слотах PCIe, но линии PCIe — это больше, чем просто слоты. Линии PCIe также работают с портами USB, портами SATA, портами M.2 и некоторыми портами ввода-вывода. Линии PCIe связывают эти компоненты с основными компонентами материнской платы, такими как ЦП и ОЗУ. Знаете ли вы, что у ЦП и чипсета материнской платы есть собственный набор линий PCIe?

Дорожки чипсета

Общее количество линий PCIe, доступных на наборе микросхем, зависит от архитектуры материнской платы, но обычно оно составляет от 4 до 24. Вы можете проверить общее количество доступных линий PCIe на материнской плате, ознакомившись со спецификациями производителя. Полосы набора микросхем в основном выделены для портов USB, портов SATA, слотов M.2, встроенного Ethernet и некоторых слотов расширения PCIe. Полосы набора микросхем могут совместно использоваться компонентами, если общее количество дорожек ограничено. Например, порты SATA могут совместно использовать дорожки со слотами M.2, но оба не могут использовать дорожки одновременно. Один компонент будет неработоспособен, а другой компонент будет использовать линии PCIe.

Из-за этого ограничения линии чипсета не полностью справляются с высокой пропускной способностью графического процессора. Чтобы разгрузить набор микросхем и, таким образом, избежать узких мест, процессоры имеют собственные линии PCIe, подключенные непосредственно к слотам расширения PCIe.

Полосы ЦП

Линии PCIe на процессоре в основном привязаны к основному и дополнительному слотам расширения. Эти слоты обычно находятся ближе всего к процессору. Основной слот обычно представляет собой слот расширения PCIe x16, а дополнительный слот — слот x8, но он может варьироваться в зависимости от конструкции производителя. Из-за высокой потребности в пропускной способности графические процессоры обычно занимают эти два слота. В зависимости от производителя ЦП также предоставляет дорожки, связанные с другими компонентами. Например, процессоры Intel имеют линии PCIe, подключенные непосредственно к слоту расширения PCIe x16, в то время как процессоры AMD имеют линии PCIe, зарезервированные для других компонентов, таких как порты SATA и порты M.2, помимо слота расширения. Полосы ЦП не распределяются между устройствами, поэтому мы можем ожидать оптимальной производительности от устройства, подключенного к слоту PCIe, напрямую подключенному к ЦП.

Линии PCIe и графические процессоры

Определение количества линий, поддерживаемых вашим набором микросхем и процессором, очень важно, особенно если вы занимаетесь сборкой ПК. Таким образом, вы не только будете знать, будет ли загружен интерфейс PCIe, но и подготовите свою систему к будущему, зная, какие устройства будут работать с ней лучше всего сейчас и в будущем.

Графическим процессорам обычно требуется самая высокая пропускная способность и скорость передачи среди карт расширения, учитывая, что они обрабатывают большие объемы графических данных. Игры, кинематографические приложения, машинное обучение и искусственный интеллект — это лишь некоторые из приложений, которые полагаются на графику. По этой причине верхний слот PCIe x16, который имеет наибольшее количество линий и, следовательно, может обеспечить самую высокую пропускную способность, обычно резервируется для графических процессоров. В зависимости от вашей рабочей нагрузки слот PCIe x8 также может обеспечить пропускную способность, необходимую для графических процессоров. Вы по-прежнему можете использовать слот PCIe x4, но вы можете ожидать снижения производительности из-за меньшего количества линий.

Однако линии PCIe — не единственный драйвер пропускной способности; версия PCIe также играет важную роль.Более новые версии PCIe имеют вдвое большую скорость и пропускную способность, чем их предшественники. Например, PCIe 5.0 имеет вдвое большую пропускную способность, чем PCIe 4.0 в слоте x16 и в любом другом слоте, если уж на то пошло. Таким образом, графический процессор PCIe 5.0 может иметь одинаковую пропускную способность в слоте PCIe 5.0 x8 и в слоте PCIe 4.0 x16.

Конфигурация с несколькими графическими процессорами

Большинство компьютерных систем могут работать с несколькими графическими процессорами для работы с несколькими дисплеями. Точно так же такие стандарты, как SLI и Crossfire, объединяют несколько графических процессоров и заставляют их работать как единое целое. В любом случае, если два графических процессора занимают слоты x16 и x8, количество линий верхнего слота будет уменьшено в соответствии с линиями PCIe, доступными для ЦП. Например, если ЦП обеспечивает 16 линий PCIe для слотов расширения, а два графических процессора используют как слоты x16, так и слоты x8, первый слот будет сокращен до восьми линий, поскольку ЦП имеет максимальное количество 16 линий, связанных со слотами расширения. . В большинстве случаев, если процессор находится на PCIe 4.0, не будет существенной разницы в производительности вашего графического процессора и имеет ту же версию PCIe, что и процессор. Если у процессора или графического процессора более низкая версия PCIe, чем у другого, это может повлиять на производительность, поскольку возможности будут снижены до более низкой версии.

Заключение

Подводя итог, можно сказать, что количество линий, которые будет использовать графический процессор, зависит от рабочей нагрузки, количества линий PCIe от ЦП и используемой версии PCIe. Шестнадцать линий идеально подходят для одного графического процессора, но, как правило, слота x8 уже достаточно для обычных потребительских нагрузок и даже для игр и приложений с интенсивным использованием графики. Для конфигурации с несколькими графическими процессорами рекомендуется использовать ЦП с большим количеством линий, чтобы избежать перегрузки линий PCIe. PCIe 4.0 рекомендуется для современных игр и приложений с интенсивным использованием графики, но даже PCIe 3.0 может нормально обрабатывать трафик данных. Более низкие версии могут больше не справляться с сегодняшним спросом на графический рендеринг. Для отличной производительности используйте слот PCIe x16 или PCIe x8 для графического процессора, учитывая используемую версию PCIe. Также рекомендуется ознакомиться со спецификациями PCIe материнской платы, чтобы узнать максимальное количество линий, которые может использовать графический процессор для конфигурации с одним или несколькими графическими процессорами.

Об авторе

Глинис Наваррете

Блогер-фрилансер, который любит писать обо всем, что связано с технологиями. Родился и вырос на Филиппинах, восемь лет работал в Сингапуре в качестве технической поддержки широкого спектра ИТ-оборудования. Погрузился в мир фриланса и теперь наслаждаюсь тем, что мне нравится, не теряя связи с технологиями.

С появлением новой линейки материнских плат X570 стандарт PCIe 4.0 наконец-то стал доступен для среднего потребителя. Имея это в виду, казалось хорошей идеей поговорить о линиях PCIe. Что это такое и сколько дорожек вам действительно нужно?

Во-первых, напомню: PCIe 3.0 — это текущий стандарт шины расширения, используемый на большинстве современных материнских плат. Это аппаратный интерфейс между устройствами (например, видеокартами, звуковыми картами, дисками M.2, сетевыми картами) и материнской платой. Слоты бывают разных размеров (x1, x2, x4, x8 и x16) 1 , а скорость конкретного слота определяется количеством доступных линий PCIe.

Общее количество дорожек для слота разбивается на те же числа, что и выше (1, 2, 4, 8, 16). Однако, чтобы немного
запутаться, количество дорожек в слоте не всегда соответствует физической длине слота. Это означает, что вы можете (и часто встречаете) слот x16 только с 8 дорожками. Совет: вы можете увидеть это, посмотрев на маленькие блестящие контакты в самом слоте. Если контакты поднимаются только наполовину, в слоте x16 всего 8 дорожек.

Но 8 дорожек часто бывает достаточно. Несмотря на то, что теоретические пределы передачи данных для 8- и 16-канальных слотов сильно различаются 2 , в настоящее время на рынке нет потребительской карты, способной заполнить пропускную способность слота PCIe 3.0 x16. Хотя объем данных, «обрабатываемых» высокопроизводительной видеокартой, часто превышает этот предел, большинство вычислений, связанных с устройством, на самом деле обрабатывается внутренним процессором карты, и поэтому им не нужно проходить через шину. Различия в производительности в основном зависят от самой карты, а не от теоретических ограничений слота.

Материнские платы разработаны с разным количеством линий PCIe, а разные процессоры разработаны с поддержкой определенного количества линий. Серверные платы и платы для энтузиастов обычно разрабатываются с большим количеством дорожек, чтобы обеспечить большую расширяемость, и производители процессоров сегментируют свои продукты аналогичным образом. Например, Intel Core i7-9700K поддерживает до 16 линий, а Core i9-9980XE — до 44. Но больше — не всегда лучше — процессоры просто предназначены для разных сред.

Однако, чтобы еще больше усложнить ситуацию, существует такая вещь, как коммутатор PCI Express, который представляет собой микросхему на некоторых материнских платах, о которой часто говорят, что она удваивает количество линий, но это не совсем точно. Хотя он не создает больше волшебным образом, он изменяет то, как ЦП управляет сигналами в слоты посредством мультиплексирования сигналов. Короче говоря, он изменяет способ отправки и получения данных от ЦП к слотам PCIe, чтобы более динамично использовать одно и то же количество линий на разных устройствах для повышения производительности.

Возвращаясь к обсуждаемой теме: необходимое количество линий зависит от того, сколько устройств PCIe вы хотите использовать в своей системе, и от того, насколько быстро вы хотите, чтобы все эти устройства работали, хотя заметное влияние на производительность обычно наблюдается только в нишевые конфигурации. Один графический процессор лучше всего работает с 16 дорожками. При установке дополнительного графического процессора обязательно используйте слот x16 с 16 дорожками, если это возможно. И наоборот, если вы добавляете карту x4 и у вас есть только слот x8, это тоже сработает. Все слоты PCIe 3.0 совместимы с устройствами меньшего форм-фактора, если они физически помещаются в слот.

Каждый раз, когда вы погружаетесь в тему технологий, легко потеряться. К счастью, компания BOXX провела за вас все исследования и разработала рабочие станции, подходящие для любого рабочего процесса. APEXX S3, наша флагманская рабочая станция, предназначена для однопоточных приложений, которые работают с максимальной эффективностью на одном высокопроизводительном графическом процессоре. Однако, если вам нужен такой же непревзойденный разогнанный процессор (8 ядер на частоте 5,1 ГГц), но требуется больше линий PCIe, APEXX Enigma S3 — идеальный вариант. Или, если вам нужно еще больше места, APEXX S4 имеет достаточно дорожек для запуска четырех графических процессоров двойной ширины.

Это всего лишь несколько примеров. Независимо от ваших конкретных потребностей, у BOXX есть рабочая станция с учетом вашего рабочего процесса. Поговорите со специалистом по производительности BOXX сегодня, чтобы узнать больше.

Все, и я имею в виду все, должны быть внимательны при интенсивном обучении машинному обучению/глубокому обучению.

Как я объяснял в предыдущем сообщении в блоге, графические процессоры значительно ускорили эволюцию искусственного интеллекта.

< бр />

Однако создать сервер GPU не так просто. И отсутствие соответствующей инфраструктуры может сказаться на времени обучения.

Если вы используете графические процессоры, вы должны знать, что существует 2 способа их подключения к материнской плате, чтобы обеспечить подключение к другим компонентам (сети, процессору, устройству хранения). Решение 1 — через PCI Express, а решение 2 — через SXM2. Мы поговорим о SXM2 в будущем. Сегодня мы сосредоточимся на PCI Express. Это связано с тем, что он сильно зависит от выбора смежного оборудования, такого как шина PCI или ЦП.

Это основной элемент, который следует учитывать, говоря о глубоком обучении, поскольку фаза загрузки данных является пустой тратой вычислительного времени, поэтому пропускная способность между компонентами и графическими процессорами является ключевым узким местом в большинстве контекстов обучения глубокому обучению.

Как работает PCI-Express и почему важно учитывать количество линий PCIe?

Что такое дорожки PCI-Express и существуют ли связанные с ними ограничения ЦП?

Каждый GPU V100 использует 16 линий PCI-e. Что это означает?

Выдержка из спецификации продукта NVidia V100 лист

Выдержка из спецификации продукта NVidia V100

"x16" означает, что PCIe имеет 16 выделенных линий. Итак… следующий вопрос: что такое линия PCI Express?

Что такое линия PCI Express?

 2 устройства PCI Express с их соединением

2 устройства PCI Express с их взаимосвязью: рисунок, вдохновленный замечательной статьей — что такое чипсет и почему меня это должно волновать

Полосы PCIe используются для связи между устройствами PCIe или между PCIe и ЦП. Полоса состоит из двух проводов: одного для входящей связи и одной с удвоенной пропускной способностью для исходящего трафика.

Линейная связь похожа на сетевую связь уровня 1 — все дело в максимально быстрой передаче битов по электрическим проводам! Однако метод, используемый для PCIe Link, немного отличается, поскольку устройство PCIe состоит из xN дорожек. В нашем предыдущем примере N=16, но это может быть любая степень числа 2 от 1 до 16 (1/2/4/8/16).

Итак… если PCIe похож на сетевую архитектуру, это означает, что уровни PCIe существуют, не так ли?

Да! вы правы PCIe имеет 4 слоя:


Физический уровень (он же большой уровень переговоров)

Физический уровень (PL) отвечает за согласование условий получения необработанных пакетов (PLP для пакетов физического уровня), т. е. ширины полосы и частоты с другим устройством.

Вы должны знать, что будет использоваться только наименьшее количество дорожек из двух устройств. Вот почему выбор подходящего процессора так важен. ЦП имеют ограниченное количество линий, которыми они могут управлять, поэтому иметь хороший графический процессор с 16 линиями PCIe и ЦП с 8 линиями шины PCIe будет так же эффективно, как выбросить половину своих денег, потому что он не помещается в вашем кошельке.< /p>

Пакеты, полученные на физическом уровне (также известном как PHY), поступают от других устройств PCIe или из системы (например, через память прямого доступа — DAM или от ЦП) и заключены во фрейм.

Назначение Start-of-Frame — сказать: «Я отправляю вам данные, это начало», и для этого требуется всего 1 байт!

Слово End-of-Frame также занимает 1 байт, чтобы сказать "до свидания, я закончил".

На этом уровне реализуется декодирование 8b/10b или 128b/130b, которое мы объясним позже, и которое в основном используется для восстановления тактовой частоты.

Пакет канального уровня (также известный как Давайте разберем этот беспорядок в правильном порядке)

Пакет канального уровня (DLLP) начинается с Порядкового номера пакета. Это очень важно, так как в какой-то момент пакет может быть поврежден, поэтому может потребоваться быть однозначно идентифицированным для повторных попыток. Порядковый номер кодируется двумя байтами.

За пакетом уровня канала передачи данных следует пакет уровня транзакции, после чего закрывается с помощью LCRC (проверка локального циклического избыточного кода) и используется для проверки целостности пакета уровня транзакции (имеется в виду фактическая полезная нагрузка).

Если LCRC подтвержден, уровень канала передачи данных отправляет сигнал ACK (ACKnowledge) на эмитент. em> через физический уровень. В противном случае отправителю отправляется сигнал NAK (Not AcKnowledge), который повторно отправляет кадр, связанный с порядковым номером, для повторной попытки; эта часть обрабатывает буфер воспроизведения на стороне получателя.

Уровень транзакций

Уровень транзакций отвечает за управление фактической полезной нагрузкой (заголовок + данные), а также (необязательно) дайджестом сообщения ECRC (сквозная циклическая проверка избыточности) . Этот пакет уровня транзакции поступает из уровня канала передачи данных, где он был декапсулирован.

При необходимости/запросе выполняется проверка целостности. На этом шаге проверяется целостность бизнес-логики и исключается повреждение пакетов при передаче данных с канального уровня на уровень транзакций.

Заголовок описывает тип транзакции, например:

  • Транзакция памяти
  • Транзакция ввода/вывода
  • Транзакция конфигурации
  • или транзакция сообщения

Слои PCIe

Прикладной уровень

Роль прикладного уровня заключается в обработке логики пользователя. Этот уровень отправляет Заголовок и полезные данные на уровень транзакции. Волшебство происходит на этом уровне, где данные привязаны к разным аппаратным компонентам.

Как PCIe взаимодействует с остальным миром?

PCIe Link использует концепцию коммутации пакетов, используемую в сети в полнодуплексном режиме.

У устройств PCIe есть внутренние часы для организации циклов передачи данных PCIe. Этот цикл передачи данных также управляется благодаря эталонным часам. Последний отправляет сигнал через выделенный канал (который не является частью упомянутого выше x1/2/4/8/16/32). Эти часы помогут принимающим и передающим устройствам синхронизироваться для передачи пакетов.

Каждая линия PCIe используется для отправки байтов параллельно с другими линиями. Упомянутая выше Синхронизация часов поможет получателю вернуть эти байты в правильном порядке


x16 означает 16 линий параллельного обмена данными по протоколу PCIe третьего поколения

У вас могут быть байты в порядке, но есть ли у вас целостность данных на физическом уровне?

Для обеспечения целостности устройство PCIe использует кодировку 8b/10b для PCIe поколений 1 и 2 или схему кодирования 128b/130b для поколений 3 и 4.

Эти кодировки используются для предотвращения потери временных ориентиров, особенно при передаче последовательных одинаковых битов.Этот процесс называется «Восстановление часов»

.

Эти 128 бит данных полезной нагрузки отправляются, и к ним добавляются 2 байта управления.

Быстрые примеры

Давайте упростим это на примере 8b/10b: согласно пункту 36 IEEE 802.3, таблица 36–1a на основе спецификаций Ethernet представляет собой кодировку таблицы 8b/10b:

IEEE 802.3 пункт 36, таблица 36–1a - Таблица кодирования 8b/10b

IEEE 802.3 пункт 36, таблица 36–1a — таблица кодирования 8b/10b

Итак, как получатель может отличить все повторяющиеся 0 (название кодовой группы D0.0)?

Повторяющиеся биты везде

Кодировка 8b/10b состоит из кодировок 5b/6b + 3b/4b.

Поэтому 00000 000 будет закодировано в 100111 0100, 5 первых битов исходных данных 00000 закодированы в 100111 с использованием кодирования 5b/6b (rd+); то же самое касается второй группы 3-битных исходных данных 000, закодированных в 0100 с использованием кодирования 3b/4b (rd-).

Это могло быть также кодирование 5b/6b rd+ и кодирование 3b/4b rd-, превращающее 00000 000 в 011000 1011

Поэтому исходные данные, которые были 8-битными, теперь являются 10-битными из-за управления битами (1 управляющий бит для 5b/6b и 1 для 3b/4b).

Но не волнуйтесь, позже я напишу статью в блоге, посвященную кодированию.

Поколения PCIe 1 и 2 были разработаны с кодировкой 8b/10b, что означает, что фактически передаваемые данные составляли только 80 % от общей нагрузки (поскольку 20 % — 2 бита используются для тактовой синхронизации).

PCIe Gen3 и 4 были разработаны с использованием 128/130 бит, что означает, что управляющие биты теперь представляют только 1,56 % полезной нагрузки. Неплохо, не так ли?

Давайте вместе посчитаем пропускную способность PCIe

Вот таблица спецификаций версий PCIe

< tbody>< td>16 ГБ/с
Количество дорожекPCIe 1.0 (2003 г.)PCIe 2.0 (2007 г.)PCIe 3.0 (2010 г.) )PCIe 4.0 (2017 г.)PCIe 5.0 (2019 г.)PCIe 6.0 (2021 г.)
x1250 МБ/с500 МБ/с1 ГБ/с2 ГБ/с4 ГБ/с8 ГБ/с
x2500 МБ/ с1 ГБ/с2 ГБ/с4 ГБ/с8 ГБ/с
x41 ГБ/с2 ГБ/с 4 ГБ/с8 ГБ/с16 ГБ/с32 ГБ/с
x82 ГБ/с4 ГБ/с8 ГБ/с16 ГБ/с 32 ГБ/с64 ГБ/с
x164 ГБ/с8 ГБ/с16 ГБ/с32 ГБ/с64 ГБ/с128 ГБ/с< /td>
консорциум PCI-SIG Спецификация теоретической пропускной способности/дорожки/пути PCIe
PCIe 1.0 (2003)PCIe 2.0 (2007 г.)PCIe 3.0 (2010 г.)PCIe 4.0 (2017 г.)PCIe 5.0 (2019 г.)PCIe 6,0 (2021 г.)
Частота2,5 ГТ/с5,0 ГТ/с8,0 ГТ/с16 ГТ/с32 ГТ/с64 ГТ/с
консорциум PCI-SIG Теоретическая спецификация скорости передачи данных PCIe

Чтобы получить такие цифры, давайте посмотрим на общую формулу пропускной способности:

  • BW — пропускная способность.
  • МТ/с: мегапереводы в секунду
  • Кодировка может быть 4b/5b/, 8b/10b, 128b/130b,…

Для PCIe v1.0:

* \фракция

 BW/дорожка\ (МБ/с) = \ 250\ (МБ/с)

Для PCIe v3.0 (тот, который нас интересует для NVIDIA V100):

* \frac" width="512" height="77" />

Поэтому с 16 линиями для NVIDIA V100, подключенными к PCIe v3.0, мы имеем эффективную скорость передачи данных (пропускную способность) почти 16 ГБ/с/канал (фактическая пропускная способность составляет 15,75 ГБ/с/канал)

Вы должны быть осторожны, чтобы не запутаться, так как общая пропускная способность также может интерпретироваться как двухсторонняя пропускная способность; в этом случае мы считаем, что общая пропускная способность x16 составляет около 32 ГБ/с.

Примечание. Еще один элемент, который мы не учли, заключается в том, что максимальная теоретическая пропускная способность должна быть уменьшена примерно на 1 Гбит/с для протоколов исправления ошибок (ECRC и LCRC), а также заголовки (начальный тег, тег последовательности, заголовок) и нижний колонтитул ( Тег End) накладные расходы объяснялись ранее в этом сообщении блога.

В заключение

Мы увидели, что PCI Express претерпел значительные изменения и основан на тех же принципах, что и сеть. Чтобы извлечь максимальную пользу из устройств PCIe, необходимо понимать основы базовой инфраструктуры.

Неправильный выбор базовой материнской платы, процессора или шины может привести к серьезным узким местам в производительности и низкой производительности графического процессора.

Друзья не позволяют друзьям создавать свои собственные хосты с графическими процессорами 😉

Жан-Луи Кегине, 1 июля 2020 г.

Если вам понравился этот пост, но вы хотите немного углубиться в аспекты глубокого обучения и искусственного интеллекта, не стесняйтесь проверить другие мои сообщения в блоге:

Читайте также: