Почему процессоры не становятся больше?

Обновлено: 04.07.2024

Администрация Байдена работала на всех уровнях над устранением проблем с цепочками поставок, влияющих на цены. Многие такие проблемы связаны с пандемией, например, изменения в структуре спроса, узкие места или отключения. Но у некоторых повышений цен, затрагивающих американцев, есть еще один виновник: доминирующие корпорации на неконкурентных рынках, использующие в своих интересах свою рыночную власть для повышения цен, увеличивая при этом собственную прибыль. Цены на мясо являются хорошим примером.

В сентябре мы объясняли, что цены на мясо являются основной причиной роста стоимости продуктов, отчасти потому, что в мясопереработке доминируют лишь несколько крупных корпораций. Данные индекса потребительских цен за ноябрь, опубликованные сегодня утром, показывают, что цены на мясо по-прежнему являются крупнейшим фактором роста стоимости продуктов питания, которые люди потребляют дома. Повышение цен на говядину, свинину и птицу составляет четверть общего роста цен на еду на дому в прошлом месяце.

Как мы отмечали в сентябре, всего четыре крупных конгломерата контролируют примерно 55–85% рынка свинины, говядины и птицы, и эти посредники использовали свою рыночную власть для повышения цен и недоплаты фермерам, при этом забирая все больше и больше для себя. Новые данные, опубликованные за последние несколько недель четырьмя крупнейшими мясоперерабатывающими компаниями — Tyson, JBS, Marfrig и Seaboard, — показывают, что эта тенденция сохраняется. (Другие ведущие переработчики являются частными компаниями, которые не отчитываются публично о своей прибыли, марже или доходах.) Согласно последним квартальным отчетам о прибылях и убытках этих компаний, их совокупная валовая прибыль увеличилась более чем на 120% по сравнению с периодом до пандемии, и их чистая прибыль выросла на 500%. Они также недавно объявили о новых дивидендах и выкупе акций на сумму более миллиарда долларов в дополнение к более чем 3 миллиардам долларов, которые они выплатили акционерам с начала пандемии.


Некоторые утверждают, что переработчики мяса вынуждены повышать цены до нынешнего уровня из-за увеличения себестоимости (например, таких вещей, как стоимость рабочей силы или транспорта), но их собственные данные о доходах и утверждения противоречат этому утверждению. Их маржа прибыли — сумма денег, которую они зарабатывают сверх своих затрат, — резко возросла после пандемии. Валовая прибыль выросла на 50%, а чистая прибыль выросла более чем на 300%. Если бы рост затрат на производство приводил к росту цен на мясо, эта норма прибыли была бы примерно неизменной, потому что более высокие цены компенсировались бы более высокими затратами. Вместо этого мы видим, как доминирующие переработчики мяса используют свою рыночную власть для извлечения все большей и большей прибыли для себя. Компании, которые сталкиваются с серьезной конкуренцией, не могут этого сделать, потому что они потеряют бизнес из-за конкурента, который не увеличил свою прибыль.

Как сообщила инвесторам одна крупная мясоперерабатывающая компания во время объявления о прибылях и убытках, их ценовые действия «более чем компенсируют более высокую себестоимость [себестоимости проданных товаров]». Если сравнить четвертый квартал 2021 года с тем же кварталом 2020 года, то та же фирма настолько увеличила цены на говядину (более чем на 35 %), что получила рекордную прибыль, фактически продавая меньше говядины, чем раньше.


Вывод: рост цен на мясо, который мы наблюдаем, является не только естественным следствием спроса и предложения в условиях свободного рынка, но и результатом корпоративных решений, направленных на то, чтобы воспользоваться своей рыночной властью в условиях неконкурентного рынка. , в ущерб потребителям, фермерам и владельцам ранчо и нашей экономике. Они подчеркивают, почему поощрение конкуренции является основной частью экономической повестки дня администрации Байдена-Харриса.

Администрация уже объявила о решительных действиях по борьбе с незаконным фиксированием цен и строгому обеспечению соблюдения антимонопольного законодательства, инвестициях в сотни миллионов долларов для создания большей конкуренции в мясоперерабатывающей промышленности, более миллиарда долларов помощи малым предприятиям и сельскохозяйственные работники, пострадавшие от COVID, и многие другие шаги, направленные на то, чтобы американские семьи, фермеры и владельцы ранчо получили более справедливые встряски. Это лишь некоторые из действий, которые мы предпринимаем в соответствии с нашими существующими полномочиями.

Буквально вчера Министерство сельского хозяйства объявило, что его программа кредитных гарантий для инвестиций в мелкие переработчики и дистрибьюторы мяса теперь открыта. Программа будет использовать 100 миллионов долларов США из финансирования Американского плана спасения, чтобы привлечь около 1 миллиарда долларов кредитного капитала через кредиторов сообщества и частного сектора для расширения мощностей по переработке мяса и птицы и финансирования другой инфраструктуры цепочки поставок продуктов питания.Эти важные инвестиции в новые мощности частного сектора дадут производителям больше возможностей, помогут обеспечить конкуренцию мясоперерабатывающей промышленности и закроют уязвимые места в цепочке поставок продуктов питания, выявленные и усугубленные пандемией. Это в дополнение к ранее объявленным инвестициям в размере 500 миллионов долларов США для расширения мощностей по переработке мяса и птицы.

В сентябре мы также призвали Конгресс работать вместе над обеспечением большей прозрачности на рынках крупного рогатого скота. Мы воодушевлены тем, что с тех пор сенаторы объявили о новых, дополнительных усилиях по совместной работе по продвижению двухпартийного законодательства.

Вместе эти действия окажут поддержку семьям, фермерам, владельцам ранчо и рабочим, а также решат проблему концентрации на мясоперерабатывающих предприятиях, которая облегчает доминирующим корпорациям повышение цен.

В настоящее время этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подкреплены фактами, ссылками или опытом, но этот вопрос, скорее всего, вызовет дебаты, аргументы, опросы или расширенное обсуждение. Если вы считаете, что этот вопрос можно улучшить и, возможно, снова открыть, посетите справочный центр для получения инструкций.

ЦП относительно малы, и инженеры постоянно пытаются сделать их меньше и разместить больше транзисторов на той же поверхности.

Почему процессоры не больше? Если кристалл площадью примерно 260 мм 2 может вместить 758 миллионов транзисторов (AMD Phenom II x4 955). Тогда 520 мм 2 сможет вместить вдвое больше транзисторов и технически удвоить тактовую частоту или количество ядер. Почему этого не делается?

Я не знаю всех подробностей, но чем ближе друг к другу транзисторы и т. д. на чипе, тем он эффективнее. Таким образом, увеличение площади в четыре раза замедлит работу чипа.

Кроме того, учитывая текущее состояние приложений, современные ЦП тратят очень много времени на бездействие. Они вертят пальцами, пока мы, пользователи, выясняем, что мы хотим сделать.

@ChrisF Вы путаете влияние сжатия кристалла (увеличение скорости в результате уменьшения емкости) с уменьшением количества транзисторов. Спросите себя: будет ли отдельное ядро ​​на двухъядерном процессоре работать быстрее, чем на четырехъядерном?

Я не согласен с закрытым голосованием. Есть четкие причины, по которым делать более крупные фишки не имеет смысла, как показывают лучшие ответы. Так что это не самоуверенный вопрос (например, «Android лучше, чем ios»). Меня тоже интересовал этот вопрос!

9 ответов 9

В целом вы правы: в краткосрочной перспективе усиление параллелизма не только жизнеспособно, но и является единственным возможным путем. По сути, многоядерность, а также кэши, конвейеризация и гиперпоточность — это как раз то, что вы предлагаете: прирост скорости за счет увеличения использования площади чипа. Конечно, уменьшение геометрии не противоречит увеличению площади матрицы. Однако выход штампа является серьезным ограничивающим фактором.

Ресурс кристалла увеличивается обратно пропорционально размеру кристалла: большие штампы просто с большей вероятностью «уловят» ошибки пластины. Если ошибка вафли попадает в кристалл, вы можете выбросить ее. Выход штампа, очевидно, влияет на стоимость штампа. Таким образом, существует оптимальный размер кубика с точки зрения затрат и прибыли на кубик.

Единственный способ производить штампы значительно большего размера — это интегрировать отказоустойчивые и дублирующие структуры. Это то, что Intel пытается сделать в своем проекте Terra-Scale (ОБНОВЛЕНИЕ: и то, что уже практикуется в повседневных продуктах, как указывает Дэн).

В современных сложных процессорах/графических процессорах дефекты памяти часто просто передаются в биннинг. Графические процессоры среднего/высшего уровня обычно имеют полноценную часть кристалла и одну или две части, в которых несколько подкомпонентов отключены, чтобы получить больше очков соотношения цена/возможности при меньшем количестве конструкций чипов. То же самое делается с процессорами. Трехъядерные чипы AMD представляют собой четырехъядерные процессоры с отключенным кристаллом, а чипы Intel LGA2011 состоят из восьми ядер. Полные кристаллы используются только как Xeon. 4/6-ядерные процессоры i7-2011 представляют собой 8-ядерные кристаллы с отключенными частями. Если ошибки штампа попадают в нужные места, они выбрасываются как более дешевые детали. Для более модульных графических процессоров установите низкий уровень ошибок.

Существует много технических проблем (длина пути становится слишком большой, и вы теряете эффективность, электрические помехи вызывают шум), но основная причина заключается просто в том, что многие транзисторы будут слишком горячими, чтобы адекватно охлаждаться. Именно по этой причине они так стремятся уменьшить размер кристалла — это позволяет повысить производительность при том же уровне нагрева.

Длина пути не обязательно увеличивается, это локальная вещь: размещение двух ядер на чипе не увеличит длину пути внутри ядра, не так ли? Рассеивание тепла также будет распространяться на большую площадь, так что это тоже не такая уж большая проблема.

Правильно, есть много нюансов, но я не считаю нужным вдаваться в них. (Я также не обязательно имею в виду БОЛЬШЕ ядер, поскольку вопрос об этом не был столь явным.)

Суть в том, что многоядерные процессоры — это именно то, что предлагал OP — увеличение скорости за счет увеличения площади чипа.

Как вы понимаете, что гиперпоточность — это «большие и более быстрые ядра»? Гиперпоточность полностью основана на логике и не имеет ничего общего с размером. Это означает, что если на текущем ядре есть избыток, он использует его. IE: если ваш модуль MMX и FPU используются на данном ядре, вы все равно можете выполнять вычисления на основе целых чисел.

Некоторые ответы, данные здесь, являются хорошими ответами. Существуют технические проблемы с увеличением размера ЦП, и это приведет к гораздо большему теплу. Однако все они преодолимы при наличии достаточно сильных стимулов.

Я хотел бы добавить то, что, по моему мнению, является центральным вопросом: экономика. ЦП изготавливаются в таких пластинах, с большим количеством ЦП на пластину. Реальная стоимость производства указана из расчета на пластину, поэтому, если вы удвоите площадь ЦП, вы сможете разместить на пластине вдвое меньше, поэтому цена ЦП удваивается. Также не все вафли всегда выходят идеальными, могут быть погрешности. Таким образом, удвоение площади удваивает вероятность дефекта в любом конкретном процессоре.

Поэтому с экономической точки зрения причина, по которой они всегда делают вещи меньше, заключается в повышении производительности на мм^2, что является определяющим фактором в соотношении цена/производительность.

TL;DR: В дополнение к другим упомянутым причинам удвоение площади ЦП более чем удваивает стоимость.


Это основная причина. В главе 1 учебника Hennessy and Pattersons по компьютерной архитектуре описывается процесс изготовления и соображения, которые необходимо учитывать при создании процессорных кристаллов как можно меньшего размера.

Добавление дополнительных транзисторов к процессору не делает его быстрее автоматически.

Увеличенная длина пути == более низкая тактовая частота.
Добавление дополнительных транзисторов увеличит длину пути. Любое увеличение должно быть использовано с пользой, иначе оно приведет к увеличению затрат, тепла, энергии, но снижению производительности.

Конечно, вы всегда можете добавить больше ядер. Почему они этого не делают? Ну да.

Ваше общее предположение неверно. ЦП с кристаллом двойного размера не означает, что он может работать с удвоенной скоростью. Это только добавит больше места для добавления большего количества ядер (см. Некоторые многоядерные чипы Intel с 32 или 64 ядрами) или больших кэшей. Но большая часть современного программного обеспечения не может использовать более двух ядер.

Поэтому увеличенный размер кристалла значительно увеличивает цену без прироста той же высоты. Это одна из (упрощенных) причин, по которой процессоры такие, какие они есть.

Это не совсем так: чем больше транзисторов, тем меньше глубина распространения, поэтому инструкции выполняются за меньшее количество тактов. Вы правы, что это не имеет никакого отношения к тактовой частоте.

В электронике МЕНЬШЕ = БЫСТРЕЕ Частота 3 ГГц должна быть намного меньше, чем частота 20 МГц. Чем больше межсоединений, тем выше ESR и ниже скорость.

Удвоение количества транзисторов не удваивает тактовую частоту.


Увеличение тактовой частоты — это только один из способов увеличения скорости. Удвоение транзисторов — еще одно. Кроме того, уменьшение межсоединений не противоречит увеличению площади кристалла.

@artistoex, но простое удвоение транзисторов тоже не делает его быстрее. Он должен быть спроектирован таким образом, чтобы использовать преимущества этих транзисторов. Большее количество транзисторов (с тем же мм) обычно означает более низкую тактовую частоту.

Важным фактором является стоимость производства сырых вафель. Монокристаллический кремний не является бесплатным, и процесс рафинирования несколько дорог. Таким образом, использование большего количества сырья увеличивает затраты.

Большие живые существа, искусственные или искусственные, например динозавры, слабее. Соотношение площадь/объем не соответствует их выживанию: слишком много ограничений в отношении энергии — каждой формы — входной и выходной.

Подумайте о ЦП как о сети связанных узлов (транзисторов). Чтобы обеспечить больше возможностей, количество узлов и путей между ними в определенной степени увеличивается, но это увеличение является линейным. Таким образом, в одном поколении ЦП может быть миллион узлов, в следующем — 1,5 миллиона. При миниатюризации схемы количество узлов и путей сокращается до меньшего размера. Нынешние производственные процессы не превышают 30 нанометров.

Допустим, вам нужно пять единиц на узел и пять единиц расстояния между двумя узлами. Конец в конец, по прямой линии вы можете создать шину из 22222 узлов на 1 см пространства. Вы можете составить матрицу из 493 миллионов узлов в квадрате CM. Дизайн схемы - это то, что содержит логику ЦП. Удвоение пробела не увеличивает скорость, оно просто позволяет схеме иметь больше логических операторов. Или, в случае многоядерных процессоров, позволить схеме выполнять больше работы параллельно. Увеличение площади фактически снизит тактовую частоту, поскольку электронам придется преодолевать большие расстояния по цепи.

Не тот ответ, который вы ищете?Просмотрите другие вопросы с метками тактовая частота процессора или задайте свой вопрос.

Связанные

Горячие вопросы о сети

дизайн сайта / логотип © 2022 Stack Exchange Inc; вклады пользователей под лицензией cc by-sa. версия 2022.3.22.41737

ОЗУ – это оперативная память, которая используется в качестве кратковременного хранилища памяти.

Процессор, также известный как ЦП, предоставляет инструкции и вычислительную мощность, необходимые компьютеру для выполнения своей работы.

Оперативная память и ЦП работают синхронно и дополняют друг друга, чтобы мощность и производительность соответствовали потребностям вашего малого бизнеса.

Ключом к выбору ПК для малого бизнеса является поиск устройства бизнес-класса с Intel vPro® Essentials, оснащенного новейшим процессором Intel® Core™.

Выбирая лучшие ПК для малого бизнеса, ищите хороший баланс между скоростью процессора и объемом оперативной памяти. Устройства бизнес-класса на платформе Intel vPro® Essentials могут обеспечить большую уверенность по сравнению с потребительскими устройствами, поскольку они имеют встроенную аппаратную защиту, которая защитит ваши данные и ваши идеи лучше, чем только программное обеспечение. Эти варианты в сочетании с объемом оперативной памяти помогут вам решить сегодняшние задачи и использовать возможности завтрашнего дня.

Выбирая лучшие ПК для малого бизнеса, ищите хороший баланс между скоростью процессора и объемом оперативной памяти. Устройства бизнес-класса на платформе Intel vPro® Essentials могут обеспечить большую уверенность по сравнению с потребительскими устройствами, поскольку они имеют встроенную аппаратную защиту, которая защитит ваши данные и ваши идеи лучше, чем только программное обеспечение. Эти варианты в сочетании с объемом оперативной памяти помогут вам решить сегодняшние задачи и использовать возможности завтрашнего дня.

Десятилетия покупок компьютеров заставили многих людей поверить в то, что увеличение объема оперативной памяти — это лучшее решение для повышения производительности ПК. Хотя это, несомненно, важно, это не единственное решение для повышения производительности или даже обязательно правильное, в зависимости от ваших потребностей. 1 2

Старому компьютеру (которому более пяти лет) требуется дополнительное время для загрузки, загрузки веб-страниц и запуска программ, что может неожиданно сказаться на вашей прибыли в плане снижения производительности труда сотрудников. В одном исследовании Intel исследователи обнаружили, что более медленные компьютеры снижают производительность труда сотрудников на целых 29%, что может стоить работодателю до 17 000 долларов потери производительности за каждый старый компьютер на рабочем месте. 3 Это же исследование также показало, что ожидание запуска старого ПК каждое утро может занимать до 11 часов в год. 4

Помимо потери производительности, более медленный компьютер приводит к разочарованию сотрудников, что делает ваши инвестиции в оборудование не столько проблемой удержания сотрудников, сколько проблемой технологии. Поэтому зачастую разумным вложением средств являются мощные компоненты, чтобы компьютеры малого бизнеса могли обрабатывать больше данных, запускать программы с большим объемом данных и держать открытыми больше вкладок браузера.

Что ОЗУ делает… и не делает…

Оперативная память (оперативное запоминающее устройство) используется компьютерами в качестве кратковременной памяти для размещения данных для быстрого доступа. Чем больше оперативной памяти у компьютера, тем больше данных он обычно может обрабатывать в любой момент. Думайте об оперативной памяти как о рабочем пространстве: очевидно, что на гигантском верстаке работать легче, чем на крошечном чайном подносе.

Хотя увеличение объема ОЗУ может быть полезным, преимущества увеличения объема ОЗУ ограничены. Одним из таких ограничений является физический аспект: ваша материнская плата может содержать только определенный объем оперативной памяти, поэтому, если вы обновляете более старую машину, объем оперативной памяти которой уже приближается к максимальному, у вас может не быть много места для роста. Еще одним таким ограничением является вычислительная мощность. Вся краткосрочная память в мире не облегчит работу ваших сотрудников, если у вас нет вычислительной мощности, чтобы воспользоваться ею.

Мощность процессора

Процессор, также известный как ЦП, предоставляет инструкции и вычислительную мощность, необходимые компьютеру для выполнения своей работы. Чем мощнее и обновлен ваш процессор, тем быстрее ваш компьютер может выполнять свои задачи.

Получив более мощный процессор, вы поможете своему компьютеру думать и работать быстрее. Одного этого может быть достаточно, чтобы оптимизировать мощность уже имеющейся у вас оперативной памяти и помочь вам максимизировать ваши инвестиции в любую новую оперативную память, которую вы добавляете. Если больше оперативной памяти похоже на большее рабочее место, то более быстрый процессор похож на приглашение друга помочь вам с вашей работой.

Защитите свои данные с помощью аппаратной безопасности

Когда вы выбираете устройство бизнес-класса с процессором Intel® Core™ на платформе Intel vPro® Essentials, оно содержит готовые функции безопасности ниже операционной системы, которые позволяют вашему малому бизнесу добиться большей защиты от угрозы безопасности, чем только программное обеспечение.

Предвидеть будущие потребности

Оперативная память и ЦП — каждый работает дополняя друг друга, а также производительность вашей материнской платы, жесткого диска и других компонентов компьютера.

Возможно, вы захотите выбрать новейший процессор Intel® Core™, который вы знаете и которому доверяете сегодня, и добавить больше оперативной памяти по мере увеличения рабочей нагрузки сотрудников. 5

Связанные темы

Выбор подходящих ПК и ноутбуков

Выбирая устройства, которые лучше всего подходят для вашего малого бизнеса, вот три вопроса, которые вы должны задать себе и своей команде, чтобы убедиться, что компьютеры, которые вы покупаете, подходят правильно.

Нужна ли вам техническая переподготовка?

Сотрудники, ожидающие по несколько минут, пока их компьютеры загрузятся каждое утро, компьютерные сбои, утечки данных и технологии, которые просто не справляются, могут повлиять на производительность и прибыль.

Вредит ли аппаратное обеспечение вашего ПК вашей прибыли?

Однако когда дело доходит до прибыли вашего бизнеса, попытка выжать из оборудования все, что можно, не всегда является разумным шагом. Хотя использование старых компьютеров до тех пор, пока они не изнашиваются, может показаться разумным способом сэкономить, в долгосрочной перспективе это может стоить вам денег, производительности и клиентов.

Информация о продукте и эффективности

©Корпорация Intel. Intel, логотип Intel и другие товарные знаки Intel являются товарными знаками корпорации Intel или ее дочерних компаний. Другие имена и бренды могут быть заявлены как собственность других лиц.

Поскольку крупнейшие компьютерные сети продолжают расти, некоторые инженеры опасаются, что их самые маленькие компоненты могут оказаться ахиллесовой пятой.

Кредит. Том Ширлиц/Trunk Archive

Отправить историю любому другу

Как подписчик, у вас есть 10 подарочных статей каждый месяц. Любой может прочитать то, чем вы делитесь.

Отдать эту статью

Джон Маркофф

Джон Маркофф пишет о Кремниевой долине более 40 лет и является автором пяти книг об индустрии высоких технологий.

Представьте на мгновение, что миллионы компьютерных микросхем внутри серверов, которые питают крупнейшие центры обработки данных в мире, имеют редкие, почти незаметные дефекты. И единственный способ найти недостатки — использовать эти чипы для решения гигантских вычислительных задач, которые были бы немыслимы всего десять лет назад.

Поскольку крошечные переключатели в компьютерных чипах уменьшились до размера нескольких атомов, надежность чипов стала еще одной проблемой для людей, управляющих крупнейшими сетями в мире. Такие компании, как Amazon, Facebook, Twitter и многие другие сайты, за последний год столкнулись с неожиданными перебоями в работе.

У сбоев было несколько причин, таких как ошибки программирования и перегрузка в сетях. Но растет беспокойство по поводу того, что по мере того, как сети облачных вычислений становятся больше и сложнее, они по-прежнему зависят на самом базовом уровне от компьютерных чипов, которые сейчас менее надежны, а в некоторых случаях менее предсказуемы.

В прошлом году исследователи из Facebook и Google опубликовали исследования, в которых описывались сбои компьютерного оборудования, причины которых было непросто определить. Они утверждали, что проблема была не в программном обеспечении, а где-то в компьютерном оборудовании разных компаний. Google отказался комментировать свое исследование, а Facebook, теперь известный как Meta, не ответил на запросы о комментариях к своему исследованию.

"Они видят эти тихие ошибки, в основном исходящие из основного оборудования", – – говорит Субхасиш Митра, инженер-электрик из Стэнфордского университета, специализирующийся на тестировании компьютерного оборудования. По словам доктора Митра, люди все чаще полагают, что производственные дефекты связаны с так называемыми скрытыми ошибками, которые нелегко обнаружить.

Центр обработки данных Facebook в Прайнвилле, штат Орегон. В крупных центрах обработки данных произошли перебои в работе, которые частично могут быть вызваны ошибками микросхем.

Центр обработки данных Facebook в Прайнвилле, штат Орегон. В крупных центрах обработки данных случались сбои, которые частично могли быть вызваны ошибками микросхем. Кредит. Лия Нэш для The New York Times

Исследователи обеспокоены тем, что обнаруживают редкие дефекты, потому что пытаются решать все более и более серьезные вычислительные проблемы, что приводит к неожиданной нагрузке на их системы.

Компании, управляющие крупными центрами обработки данных, начали сообщать о систематических проблемах более десяти лет назад. В 2015 году в инженерном издании IEEE Spectrum группа ученых-компьютерщиков, изучающих надежность оборудования в Университете Торонто, сообщила, что каждый год до 4 % из миллионов компьютеров Google сталкивались с ошибками, которые не могли не были обнаружены, и это привело к их неожиданному закрытию.

В микропроцессоре с миллиардами транзисторов или плате памяти компьютера, состоящей из триллионов крошечных переключателей, каждый из которых может хранить 1 или 0, даже малейшая ошибка может нарушить работу систем, которые сейчас регулярно выполняют миллиарды вычислений в секунду.

В начале эры полупроводников инженеры беспокоились о том, что космические лучи могут время от времени переключать один транзистор и изменять результат вычислений. Теперь они обеспокоены тем, что сами коммутаторы становятся все менее надежными. Исследователи Facebook даже утверждают, что переключатели становятся все более подверженными износу и что срок службы компьютерной памяти или процессоров может быть короче, чем считалось ранее.

Появляется все больше свидетельств того, что проблема усугубляется с каждым новым поколением чипов. В отчете, опубликованном в 2020 году производителем микросхем Advanced Micro Devices, говорится, что самые совершенные микросхемы компьютерной памяти в то время были примерно в 5,5 раз менее надежными, чем предыдущее поколение. AMD не ответила на запросы о комментариях к отчету.

Отслеживание этих ошибок представляет собой сложную задачу, — говорит Дэвид Дитцель, опытный инженер по аппаратному обеспечению, председатель и основатель компании Esperanto Technologies, производителя процессоров нового типа, предназначенных для приложений искусственного интеллекта, в Маунтин-Вью, Калифорния. новый чип компании, который только выходит на рынок, состоит из 1000 процессоров, состоящих из 28 миллиардов транзисторов.

Он сравнивает чип с многоквартирным домом, который охватывает всю территорию Соединенных Штатов. Используя метафору г-на Дитцеля, д-р Митра сказал, что обнаружение новых ошибок немного похоже на поиск единственного работающего крана в одной из квартир в этом доме, который неисправен только тогда, когда горит свет в спальне и открыта дверь квартиры.

Центр обработки данных Google в Каунсил-Блаффс, штат Айова. Исследователи из Google обнаружили, что процессорные ядра, похоже, выдают ошибки только при определенных условиях. Кредит. Брайан Снайдер/Reuters

До сих пор разработчики компьютеров пытались бороться с аппаратными недостатками, добавляя в микросхемы специальные схемы, которые исправляют ошибки. Схемы автоматически обнаруживают и исправляют неверные данные. Когда-то это считалось чрезвычайно редкой проблемой. Но несколько лет назад производственные группы Google начали сообщать об ошибках, которые было безумно сложно диагностировать. Согласно их отчету, ошибки в расчетах возникали время от времени, и их было трудно воспроизвести.

Группа исследователей попыталась отследить проблему и в прошлом году опубликовала свои выводы. Они пришли к выводу, что огромные центры обработки данных компании, состоящие из компьютерных систем, основанных на миллионах процессорных «ядер», столкнулись с новыми ошибками, которые, вероятно, были вызваны комбинацией нескольких факторов: транзисторы меньшего размера, которые приближались к физическим пределам, и неадекватное тестирование.

В своей статье «Ядра, которые не учитываются» исследователи Google отметили, что проблема была достаточно сложной, и они уже посвятили ее решению несколько десятилетий инженерного времени.

Современные процессорные чипы состоят из десятков процессорных ядер, вычислительных механизмов, которые позволяют разбивать задачи и решать их параллельно. Исследователи обнаружили, что крошечное подмножество ядер давало неточные результаты нечасто и только при определенных условиях. Они описали поведение как спорадическое. В некоторых случаях ядра выдавали ошибки только при изменении скорости вычислений или температуры.

По данным Google, усложнение конструкции процессора было одной из важных причин сбоев. Но инженеры также сказали, что меньшие по размеру транзисторы, трехмерные чипы и новые конструкции, которые создают ошибки только в определенных случаях, — все это усугубило проблему.

В аналогичной статье, опубликованной в прошлом году, группа исследователей Facebook отметила, что некоторые процессоры выдерживают испытания производителей, но затем начинают показывать сбои в полевых условиях.

Эксперты говорят, что процессоры могут иметь более короткий срок службы, чем считалось ранее, что может быть одним из факторов, способствующих ошибкам в расчетах. Кредит. Йошиказу Цуно/Agence France-Presse — Getty Images

Руководители Intel заявили, что знакомы с исследовательскими документами Google и Facebook и работают с обеими компаниями над разработкой новых методов обнаружения и исправления аппаратных ошибок.

Брайан Йоргенсен, вице-президент группы платформ данных Intel, сказал, что утверждения, сделанные исследователями, были правильными и что «задача, которую они бросают отрасли, является правильным решением».

Он сказал, что Intel недавно начала проект по созданию стандартного программного обеспечения с открытым исходным кодом для операторов центров обработки данных. Программное обеспечение позволит им находить и исправлять аппаратные ошибки, которые не обнаруживаются встроенными в микросхемы схемами.

В прошлом году проблема обострилась, когда несколько клиентов Intel незаметно выпустили предупреждения о необнаруженных ошибках, созданных их системами. Lenovo, крупнейший в мире производитель персональных компьютеров, проинформировала своих клиентов о том, что конструктивные изменения в нескольких поколениях процессоров Intel Xeon означают, что эти чипы могут генерировать большее количество ошибок, которые невозможно исправить, чем более ранние микропроцессоры Intel.

Компания Intel публично не говорила об этой проблеме, но г-н Йоргенсен признал наличие проблемы и сказал, что она устранена. С тех пор компания изменила свой дизайн.

Компьютерные инженеры расходятся во мнениях относительно того, как реагировать на вызов. Одним из широко распространенных ответов является спрос на новые виды программного обеспечения, которые активно отслеживают аппаратные ошибки и позволяют системным операторам удалять оборудование, когда оно начинает деградировать. Это создало возможности для новых стартапов, предлагающих программное обеспечение, которое отслеживает работоспособность базовых микросхем в центрах обработки данных.

Одним из таких предприятий является TidalScale, компания из Лос-Гатоса, Калифорния, которая производит специализированное программное обеспечение для компаний, стремящихся свести к минимуму простои оборудования. Его исполнительный директор Гэри Смердон предположил, что TidalScale и другие компании столкнулись с серьезной проблемой.

"Это будет немного похоже на замену двигателя, пока самолет еще летит", – сказал он.

Читайте также: