Как найти топологию материнской платы

Обновлено: 21.11.2024

Топология сети — это канал, связывающий конечных пользователей с центром обработки данных и служащий связующим звеном между устройствами в центре обработки данных. Важно выбрать топологию, которая соответствует потребностям центра обработки данных и конечных пользователей. Если центр обработки данных отвечает за поддержку критически важного приложения, а время безотказной работы сети имеет первостепенное значение, то наилучшим выбором будет топология с несколькими уровнями резервирования, например полносвязная. Эта топология поможет предотвратить перебои в работе сети в случае выхода из строя кабеля или узла в сети/центре обработки данных. Если приложение, поддерживаемое центром обработки данных, менее критично и перебои в работе сети не вызовут серьезных проблем, то более подходящей будет менее дорогая топология, такая как звезда или расширенная звезда.

Почему это актуально для C2G?

Наши сетевые кабельные продукты — медные и оптоволоконные — обеспечивают связь между узлами в рамках топологии.
​​​​​​​

Обзор

Топология сети описывает, как компьютер, принтеры и другие устройства (например, узлы) подключены к сети. Следующие топологии чаще всего используются для построения большинства сетей.

Топология шины

Топология шины существует, когда все узлы в сети подключены к одному кабелю. Этот единственный кабель обычно называют магистральным. Топология шины использовалась для ранних 10Base-2, ThinNet и 10Base-5, ThickNet, сетей Ethernet с коаксиальным кабелем. В этой топологии сообщения, отправляемые узлом, рассылаются всем узлам в сети. Только предполагаемый узел-получатель принимает и обрабатывает сообщение. Этот тип топологии сети относительно прост в установке и недорог. Эта топология требует, чтобы оба конца магистрального кабеля были терминированы. Если магистраль не терминирована, то сигнал, скорее всего, будет отражаться от конца кабеля, вызывая коллизии данных и шум, который может нарушить работу сети. Основными недостатками этого типа сетевой топологии являются ограничение на количество компьютеров, которые могут быть подключены к сети, и тот факт, что для соединения всех узлов используется только один магистральный кабель. Сети, использующие шинную топологию, ограничены несколькими десятками компьютеров. Если производительность сети превышает этот размер, скорее всего, возникнут проблемы. В случае отказа магистрального кабеля, соединяющего все узлы, вся сеть станет нестабильной и, возможно, перестанет функционировать. Эта топология обычно не используется в современных сетях.

Топология «кольцо» и «двойное кольцо»

Кольцевая топология существует, когда все узлы в сети соединены по кругу. Каждый узел в сети действует как повторитель, поддерживая сильный сигнал, когда он проходит через сеть. Узел будет генерировать сигнал, адресованный определенному компьютеру в сети, а затем сигнал будет отправлен по сети либо по часовой стрелке, либо против часовой стрелки. Важно отметить, что все сигналы в сети, использующей этот тип топологии, должны проходить в одном направлении. Это уменьшает коллизию данных и шум в сети. Сигнал будет проходить через каждый узел, пока не достигнет намеченного узла назначения. Как правило, в сети этого типа используется протокол Token Ring, который позволяет только одному компьютеру передавать сигнал в любой момент времени. Основной недостаток этого типа топологии заключается в том, что в случае выхода из строя любого из узлов или кабелей, соединяющих узлы, сеть станет нестабильной и, возможно, перестанет функционировать. Решением этого недостатка является топология двойного кольца. Двойное кольцо добавляет вторичный кабель для резервирования в случае сбоя.
​​​​​

Топологии «звезда» и «расширенная звезда»

Звезда и расширенная звезда — самые популярные топологии для сетей Ethernet. Этот тип сети прост в настройке, относительно недорог и обеспечивает большую избыточность, чем другие топологии, например топология шины. Топология «звезда» настраивается путем подключения всех узлов сети к центральному устройству. Центральное соединение позволяет сети продолжать работу даже в случае отказа одного узла или кабеля. Основным недостатком этой топологии является то, что в случае отказа центрального устройства сеть станет нестабильной или перестанет функционировать. Топология «звезда» больше всего подходит для небольших централизованных сетей. Топология расширенной звезды добавляет субцентральные устройства, подключенные к центральному устройству. Этот тип топологии удобен для больших сетей и предоставляет функциональные возможности для организации и разделения на подсети распределения IP-адресов внутри сети. Расширенная топология «звезда» наиболее подходит для больших сетей, которые могут охватывать все здание.

Иерархическое дерево

Древовидная/иерархическая топология настраивается путем интеграции нескольких топологий типа "звезда" в топологию "шина" и использования центрального "корневого" узла.Основным недостатком этой топологии является то, что в случае отказа «корневого» узла сеть станет нестабильной или перестанет функционировать. Этот тип топологии имеет преимущество по сравнению с топологией «шина» или «звезда», поскольку он может лучше поддерживать будущее расширение сети. Однако этот тип сети обычно не используется из-за уязвимости топологии.

Топология сетки

​​​​​​​Эта топология делится на два разных типа: полная сетка и частичная сетка. Полноячеистая топология обеспечивает соединение каждого узла с каждым другим узлом в сети. Это обеспечивает полностью избыточную сеть и является самой надежной из всех сетей. Если какая-либо ссылка или узел в сети выйдет из строя, появится другой путь, который позволит продолжить сетевой трафик. Основным недостатком этого типа сети является стоимость и сложность, необходимые для настройки этой топологии. Этот тип топологии используется только в небольших сетях с несколькими узлами. Топология частичной сетки обеспечивает альтернативные маршруты от каждого узла к некоторым другим узлам в сети. Этот тип топологии обеспечивает некоторую избыточность и обычно используется в магистральных средах, сетях, где услуги жизненно необходимы, а также в глобальных сетях (WAN). Наиболее известной сетью с частичной ячеистостью является Интернет.

При покупке компьютера многие пользователи не задумываются об оперативной памяти, хотя она может серьезно повлиять на производительность — как в положительную, так и в отрицательную сторону. Это руководство, состоящее из трех частей, содержит обзор того, на что следует обратить внимание, отправляясь за покупками.

Знай свою систему

Во-первых, у каждой платформы есть свои особенности. То, что вы покупаете комплект DDR4 4600 МГц, не означает, что ваша платформа позволит вам использовать память с такой скоростью. Здесь необходимо учитывать четыре важных момента.

  • Максимальная скорость памяти ограничена, если вы покупаете ЦП с заблокированным множителем. Производитель ЦП указывает, какая скорость ОЗУ поддерживается, и, как правило, обходных путей для этого ограничения нет. Если вы хотите выжать больше производительности из своего ПК с заблокированным процессором, выбирайте модули с более короткими таймингами (ищите CL — чем меньше число, тем лучше).
  • Даже если у вас процессор с возможностью разгона, скорость оперативной памяти сильно зависит от возможностей IMC (встроенного контроллера памяти) процессора. Как и при разгоне частоты процессора, ваш пробег может варьироваться от части к части даже с одной и той же моделью процессора. Таким образом, тот факт, что кто-то достигает скорости 4400 МГц DDR4 с использованием одной модели процессора, не означает, что вы будете уверены, что ваша оперативная память будет работать с той же скоростью с той же моделью процессора.
  • Максимальная частота ОЗУ зависит от платформы. Некоторые платформы просто не работают с высокими частотами оперативной памяти. Хорошим примером является архитектура Intel Sandy Bridge. Удачи, пытаясь запустить его с DDR3, например. 2933 МГц. Кроме того, сложные платформы с большим количеством каналов памяти, такие как процессоры Intel X299 Skylake-X, не могут работать с очень высокими тактовыми частотами памяти.
  • Наконец, сама материнская плата. Компоновка материнской платы и BIOS очень важны. Материнские платы могут иметь T-образную топологию или последовательное подключение разъемов DIMM к ЦП.

Т-топология лучше работает, когда все 4 слота DIMM заняты. Daisy Chain, со своей стороны, предлагает лучший разгон при использовании 2 слотов DIMM. Обратите внимание, что здесь речь идет о наиболее распространенных материнских платах с 4 банками DIMM (основные платформы, такие как AM4/LGA1151 с 2 каналами памяти, каждый из которых имеет 2 слота DIMM).

Схемы, нарисованные Actually Hardcore Overclocking Канал YouTube.

Есть также материнские платы с одним слотом DIMM на канал. Это не делает их автоматически отличными с точки зрения разгона памяти (OC). Все дело в том, насколько хорошо проложены следы. Если эта функция выполнена правильно, такая плата может обеспечить заметно более высокую разгрузку оперативной памяти.

ASRock Z170M OC Formula — одна из лучших плат LGA1151 для экстремального разгона (даже для процессоров i9-9900K, несмотря на то, что она основана на официально неподдерживаемом чипсете Z170). Благодаря продуманному расположению оперативной памяти с 2 слотами DIMM и хорошему BIOS, он предлагает отличную производительность и фантастические возможности разгона. Gigabyte X99 SOC Champion — отличная материнская плата LGA 2011-3 для экстремального разгона. Обычно платы X99 имеют 8 слотов DIMM, но этот был разработан с расчетом исключительно на производительность.

Скорость не всегда является решением

Часы очень важны, но вы также должны следить за временем, так как они тоже влияют на производительность. Что касается тактовой частоты, чем выше число МГц, тем выше производительность, но тайминги работают наоборот: чем меньше число, тем лучше.

Тайминги также могут быть индикатором качества оперативной памяти и потенциала разгона.Например. Модули DDR4 3200 МГц CL16 довольно посредственны по своим характеристикам, и я не жду от них большого разгонного потенциала. Комплект CL14 на 3200 МГц, с другой стороны, должен предложить гораздо больше, а что-то вроде CL18 на 3200 МГц, вероятно, мусор.

Вы должны знать, что каждое приложение/игра ведет себя по-разному. Некоторые работают быстрее с более жесткими таймингами RAM, а некоторые не слишком возражают против таймингов. В некоторых сценариях 3000 МГц CL15 может оказаться быстрее, чем 3400 МГц CL17, хотя тактовые частоты обычно более важны с точки зрения производительности. Конечно, если тайминги очень свободны, это заметно снизит производительность, даже если такты высокие.

Зная особенности вашей платформы и ограничения вашего бюджета, вам, вероятно, лучше всего сбалансировать скорость памяти и тайминги.

Совет. Если вы проверяете скорость памяти в программном обеспечении CPU-Z, помните, что оно показывает реальные часы ОЗУ. Например. 1600 МГц в CPU-Z означает, что ваша оперативная память работает на частоте 3200 МГц. Причина проста: DDR означает Двойная скорость передачи данных. Таким образом, вы удваиваете время.

Эта память работает на частоте DDR 2666 МГц.

Совет 2. Пользователи настольных компьютеров привыкли подключать к материнской плате комплект памяти почти любой возможной скорости и ожидать, что он будет работать. Даже с платформой Sandy Bridge, когда вы подключаете флешку DDR ​​2933 МГц, которая не может работать с такими скоростями, ПК должен понять, что делать, загрузиться (хотя и на более медленных частотах DDR) и просто работать.< /p>

С блокнотами обычно все не так просто. Обычно, если вы подключаете даже немного более быструю оперативную память, чем установлена ​​на заводе, вас встретит не что иное, как черный экран. Чтобы избежать таких сценариев при обновлении оперативной памяти в мобильных устройствах, выберите модуль, который имеет ту же скорость, что и оригинальные. Обратите внимание, что это не касается некоторых моделей высокого класса, таких как Alienware, которые ближе к настольным ПК, чем к обычным ноутбукам, и могут работать с разгоном.

Чем больше, тем лучше?

Сегодня даже для самого простого ПК объем ОЗУ не может быть меньше 8 ГБ. Если у вас будет игровая и/или универсальная машина, я настоятельно рекомендую 16 ГБ. 32 ГБ и более можно использовать только в том случае, если у вас есть особые потребности или вы хотите настроить RAM-диск. Например, у Adobe Premiere огромный аппетит к памяти. С проектами Full HD он может легко потреблять 30 ГБ ОЗУ. Видеоредакторы 4K могут разумно потребовать даже 64 ГБ.

Конечно, сколько ОЗУ вам нужно и сколько ОЗУ может поддерживать системная плата — это две разные вещи. Всегда проверяйте эту информацию в руководстве по материнской плате.

Проблему также могут вызывать программные ограничения доступной оперативной памяти. Почти все сегодня выбирают 64-битную систему. Но если вы наткнетесь на 32-битную (X86) систему, не удивляйтесь, увидев, что ОС сообщает о 4 ГБ ОЗУ (или меньше), даже если установлено гораздо больше. И нет другого обходного пути для ограничений X86, кроме установки системы X64.

Также помните об ограничениях некоторых версий Windows 7. Home Basic не обнаружит более 8 ГБ ОЗУ, а Home Premium — 16 ГБ. Если вы хотите выйти за рамки этого (до 192 ГБ), вам понадобится одна из трех других доступных версий: Professional, Enterprise или Ultimate.

Windows 10 значительно опережает Windows 7: домашняя версия поддерживает до 128 ГБ, а версии Pro и Enterprise/Education обнаруживают колоссальные 512 ГБ ОЗУ.

Для пользователей материнских плат с одним слотом ОЗУ на каждый канал предусмотрены специальные двухуровневые модули ОЗУ большой емкости. Но они недешевы и намного выше стандартных палочек. У них также очень ограниченная совместимость. Но если вы относитесь к числу немногих пользователей таких материнских плат, этот вариант стоит рассмотреть.

Модули Zadak Double Capacity DDR4 (2 комплекта по 32 ГБ).

Вывод из первой части

  • Используйте 64-разрядные операционные системы.
  • Если вы обычный пользователь основной платформы, выберите 16 ГБ ОЗУ.
  • Для пользователей новых разблокированных процессоров комплекты с частотой 3000–3466 МГц и CL около 16 должны стать оптимальным выбором между производительностью и ценой. С заблокированными процессорами выберите самые быстрые модули, с которыми может работать ваш процессор, в соответствии со спецификациями производителей. Что касается ноутбуков, вам лучше придерживаться скорости оперативной памяти, с которой ваше устройство поставляется с завода.

Grzegorz Iwan
Оверклокер-любитель из Польши, один из двух поляков, преодолевших барьер тактовой частоты процессора 8 ГГц. Энтузиаст и коллекционер железа, представитель философии PCMasterRace; Вы можете найти фан-страницу Иванова здесь здесь.

Планируете увеличить объем памяти вашего ПК, но не знаете, есть ли свободные слоты? Вот быстрый способ узнать это в Windows 10 без дизассемблирования.

В Windows 10, когда ваш компьютер начинает работать медленно из-за требовательных к памяти приложений (таких как Google Chrome, Photoshop или Premiere Pro), понимание количества слотов ОЗУ (оперативной памяти), доступных на материнской плате, может помочь определить можете ли вы просто добавить дополнительные карты памяти или вам нужно приобрести новый комплект памяти большей емкости для обновления вашей системы.

Хотя вы всегда можете открыть корпус компьютера или проверить документацию (или переместить вещи в гладкий корпус со стеклянными панелями), вы также можете проверить общее количество слотов, поддерживаемых вашей материнской платой, и сколько из них используется с помощью Диспетчер задач.

В этом руководстве по Windows 10 мы расскажем вам, как быстро узнать, есть ли на вашем компьютере свободные слоты памяти, которые вы можете использовать для увеличения объема оперативной памяти в вашей системе.

Как проверить доступные слоты оперативной памяти в Windows 10

Чтобы проверить количество слотов памяти, доступных на вашем компьютере или ноутбуке, выполните следующие действия в Windows 10:

Выполните поиск диспетчера задач и нажмите на верхний результат, чтобы открыть его.

Совет. Открыть Диспетчер задач можно не одним способом, доступ к нему можно получить разными способами. Например, с помощью сочетания клавиш Ctrl + Alt + Del, меню опытного пользователя (клавиша Windows + сочетание клавиш X ) и сочетания клавиш Ctrl + Shift + ESC.

См. раздел Используемые слоты внизу страницы, чтобы узнать количество слотов, доступных на вашей материнской плате.

После того, как вы выполните эти шаги, вы сможете определить, можете ли вы добавить больше памяти на свой компьютер или вам нужно заменить комплект памяти на другой с большей емкостью на модуль, чтобы увеличить доступную память.

Дополнительные ресурсы по Windows 10

Для получения дополнительных полезных статей, обзоров и ответов на распространенные вопросы о Windows 10 посетите следующие ресурсы:

Мауро рекомендует все эти недорогие аксессуары

Здравствуйте, меня зовут Мауро Хукулак, гуру справки и практических советов Windows Central. Я написал пост, который вы сейчас читаете, и я знаю ОС Windows от и до. Но я также немного фанат аппаратного обеспечения. Вот некоторые из доступных гаджетов на моем рабочем столе сегодня.

Беспроводная мышь Logitech MX Master (72 доллара на Amazon)

Я знаю мышей и пользуюсь ими каждый день. MX Master — это беспроводная высокоточная мышь, очень удобная в использовании и обладающая множеством замечательных функций, в том числе возможностью подключения к нескольким устройствам, бесконечным колесом прокрутки, кнопками «назад» и «вперед», которые можно настраивать.

Коврик для игровой мыши Ktrio Extended (12 долларов США на Amazon)

Если вы тратите много времени на набор текста, ваши ладони и мышь оставят следы на вашем столе. Мое решение состояло в том, чтобы начать использовать игровые коврики для мыши, которые достаточно велики, чтобы вам было удобно использовать клавиатуру и мышь. Это тот, который я использую и рекомендую.

Светодиодная лента Supernight (20 долларов США на Amazon)

Вы можете просто использовать обычную лампочку в своем офисе, но если вы хотите добавить окружающее освещение с разными цветами, вам подойдет светодиодная лента RGB. Этот одобрен Мауро.

Мы можем получать комиссию за покупки по нашим ссылкам. Узнать больше.

Лучшие дешевые ноутбуки с Windows в марте 2022 г.

Вам не нужно опустошать свой бумажник, чтобы получить отличный компьютер, способный работать под управлением Windows и помогающий вам делать повседневные дела. Вам даже не нужно платить столько за отличные функции, такие как сенсорные экраны, Bluetooth и дискретная графика.

Вот что критики и фанаты думают о дебюте телесериала Halo

Первая серия телесериала Halo вышла в эфир на этой неделе на Paramount+.Первые отзывы о сериале не очень восторженные, но до конца сезона это может изменить ситуацию.

Присоединяйтесь к нам в прямом эфире для Windows Central Video Podcast сегодня в 13:30 по восточному времени

Сегодня в 13:30 по восточному времени мы в прямом эфире с подкастом Windows Central Video, обязательно будьте там!

Ознакомьтесь с этими обязательными приложениями Windows для Суперкубка LVI

Суперкубок LVI наконец-то здесь. Чтобы получить наилучшие впечатления от большой игры, обязательно скачайте эти приложения для Windows 11 и Windows 10.

Термин ЦП, который означает центральный процессор, является неправильным для большинства систем, поскольку центральный подразумевает одиночный , тогда как большинство современных системы имеют более одного процессорного блока или ядра. Физически процессоры находятся в упаковке, прикрепленной к материнской плате в сокете . Каждый сокет на материнской плате имеет различные соединения: с другими сокетами ЦП, контроллерами памяти, контроллерами прерываний и другими периферийными устройствами. Сокет операционной системы представляет собой логическую группу процессоров и связанных с ними ресурсов. Эта концепция занимает центральное место в большинстве наших дискуссий о настройке ЦП.

Red Hat Enterprise Linux хранит множество статистических данных о событиях системного процессора; эти статистические данные полезны при планировании стратегии настройки для повышения производительности процессора. В разделе 4.1.2 «Настройка производительности ЦП» обсуждаются некоторые наиболее полезные статистические данные, где их найти и как анализировать для настройки производительности.

Топология

На старых компьютерах было относительно мало ЦП на систему, что позволяло использовать архитектуру, известную как симметричная многопроцессорная обработка (SMP). Это означало, что каждый ЦП в системе имел одинаковый (или симметричный) доступ к доступной памяти. В последние годы количество ЦП на сокет выросло до такой степени, что попытки предоставить симметричный доступ ко всей оперативной памяти в системе стали очень дорогими. Большинство современных систем с большим количеством ЦП имеют архитектуру, известную как Non-Uniform Memory Access (NUMA), а не SMP.

Процессоры AMD уже некоторое время используют архитектуру такого типа со своими межсоединениями Hyper Transport (HT), а Intel начала внедрять NUMA в свои Quick Path Interconnect (QPI ) конструкции. NUMA и SMP настраиваются по-разному, поскольку при выделении ресурсов для приложения необходимо учитывать топологию системы.

Обсуждения

В операционной системе Linux исполнительная единица известна как поток. Потоки имеют контекст регистра, стек и сегмент исполняемого кода, который они выполняют на ЦП. Задачей операционной системы (ОС) является планирование этих потоков на доступных процессорах.

Операционная система максимизирует загрузку ЦП, распределяя нагрузку потоков между доступными ядрами. Поскольку ОС в первую очередь заботится о загрузке ЦП, она не принимает оптимальных решений в отношении производительности приложений. Перемещение потока приложения на ЦП в другом сокете может ухудшить производительность больше, чем простое ожидание освобождения текущего ЦП, поскольку операции доступа к памяти могут резко замедляться между сокетами. Для высокопроизводительных приложений разработчику обычно лучше определить, где размещаются потоки. Раздел 4.2, «Планирование ЦП», обсуждает, как лучше всего распределять ЦП и память для лучшего выполнения потоков приложений.

Прерывания

Одним из менее очевидных (но тем не менее важных) системных событий, которые могут повлиять на производительность приложения, является прерывание (также известное как IRQ в Linux). Эти события обрабатываются операционной системой и используются периферийными устройствами для сигнализации о поступлении данных или завершении операции, такой как сетевая запись или событие таймера.

Способ, которым ОС или ЦП, выполняющий код приложения, обрабатывает прерывание, не влияет на функциональность приложения. Однако это может повлиять на производительность приложения. В этой главе также обсуждаются советы по предотвращению негативного влияния прерываний на производительность приложения.

4.1. Топология ЦП

4.1.1. Топология ЦП и NUMA

Первые компьютерные процессоры были однопроцессорными , что означает, что в системе был один ЦП. Иллюзию параллельного выполнения процессов создавала операционная система, быстро переключающая один ЦП с одного потока выполнения (процесса) на другой. В стремлении повысить производительность системы разработчики отметили, что увеличение тактовой частоты для более быстрого выполнения инструкций работает только до определенного момента (обычно это ограничения на создание стабильной формы тактового сигнала с помощью текущей технологии).Стремясь повысить общую производительность системы, разработчики добавили в систему еще один ЦП, что позволило реализовать два параллельных потока выполнения. Эта тенденция добавления процессоров сохраняется с течением времени.

Большинство ранних многопроцессорных систем были спроектированы таким образом, что у каждого ЦП был один и тот же логический путь к каждой ячейке памяти (обычно это параллельная шина). Это позволяло каждому ЦП обращаться к любой ячейке памяти за то же время, что и любому другому ЦП в системе. Этот тип архитектуры известен как симметричная многопроцессорная система (SMP). SMP подходит для небольшого количества ЦП, но как только количество ЦП превышает определенную точку (8 или 16), количество параллельных трасс, необходимых для обеспечения равного доступа к памяти, использует слишком много доступного пространства на плате, оставляя меньше место для периферийных устройств.

Последовательная шина — это однопроводной канал связи с очень высокой тактовой частотой, по которому данные передаются в виде пакетных пакетов. Разработчики оборудования начали использовать последовательные шины в качестве высокоскоростных межсоединений между ЦП, а также между ЦП и контроллерами памяти и другими периферийными устройствами. Это означает, что вместо того, чтобы на плате требовалось от 32 до 64 дорожек от каждого ЦП до подсистемы памяти, теперь была одна трасса, что существенно уменьшило объем памяти, требуемый для доска.

В то же время разработчики аппаратного обеспечения размещали больше транзисторов в том же пространстве за счет уменьшения размеров кристаллов. Вместо того, чтобы размещать отдельные процессоры непосредственно на материнской плате, они начали упаковывать их в пакет процессоров как многоядерные процессоры. Затем, вместо того чтобы пытаться обеспечить равный доступ к памяти для каждого пакета процессора, разработчики прибегли к стратегии неоднородного доступа к памяти (NUMA), где каждая комбинация пакета/сокета имеет одну или несколько выделенных областей памяти для высокоскоростного доступа. Каждый сокет также имеет соединение с другими сокетами для более медленного доступа к памяти других сокетов.

В качестве простого примера NUMA предположим, что у нас есть материнская плата с двумя сокетами, где каждый сокет заполнен четырехъядерным пакетом. Это означает, что общее количество процессоров в системе равно восьми; по четыре в каждую розетку. К каждому сокету также подключен банк памяти с четырьмя гигабайтами оперативной памяти, что дает общий объем системной памяти в восемь гигабайт. Для целей этого примера ЦП 0–3 находятся в сокете 0, а ЦП 4–7 — в сокете 1. Каждый сокет в этом примере также соответствует узлу NUMA.

ЦП 0 может потребоваться три такта для доступа к памяти из банка 0: цикл для предоставления адреса контроллеру памяти, цикл для настройки доступа к ячейке памяти и цикл для чтения или записи в место нахождения. Однако ЦП 4 может потребоваться шесть тактовых циклов для доступа к памяти из того же места; поскольку он находится в отдельном сокете, он должен проходить через два контроллера памяти: локальный контроллер памяти в сокете 1, а затем удаленный контроллер памяти в сокете 0. Если память в этом месте оспаривается (то есть, если более одного ЦП пытается одновременно получить доступ к одному и тому же местоположению), контроллеры памяти должны разрешать и сериализовать доступ к памяти, поэтому доступ к памяти займет больше времени. Добавление согласованности кеша (гарантирующее, что локальные кеши ЦП содержат одни и те же данные для одной и той же области памяти) еще больше усложняет процесс.

В новейших высокопроизводительных процессорах Intel (Xeon) и AMD (Opteron) используется топология NUMA. Процессоры AMD используют межсоединение, известное как HyperTransport ™ или HT, в то время как Intel использует соединение QuickPath Interconnect ™ или QPI. Межсоединения отличаются тем, как они физически подключаются к другим межсоединениям, памяти или периферийным устройствам, но на самом деле они представляют собой коммутатор, обеспечивающий прозрачный доступ к одному подключенному устройству с другого подключенного устройства. В данном случае под прозрачностью понимается тот факт, что для использования интерконнекта не требуется специальный программный API, а не "бесплатный" вариант.

Поскольку системные архитектуры очень разнообразны, нецелесообразно конкретно описывать потери производительности, связанные с доступом к нелокальной памяти. Можно сказать, что каждый скачок через межсоединение налагает, по крайней мере, некоторое относительно постоянное снижение производительности для каждого прыжка, поэтому ссылка на ячейку памяти, которая находится на расстоянии двух межсоединений от текущего ЦП, налагает как минимум 2N + цикл памяти. time в единицах времени доступа, где N – штраф за переход.

Учитывая это снижение производительности, приложениям, чувствительным к производительности, следует избегать регулярного доступа к удаленной памяти в системе с топологией NUMA. Приложение должно быть настроено так, чтобы оно оставалось на определенном узле и выделяло память из этого узла.

Читайте также: