Какие устройства классифицируются как оперативная память

Обновлено: 21.11.2024

Самыми ранними формами основной памяти компьютера были ртутные линии задержки, представляющие собой ртутные трубки, в которых данные хранились в виде ультразвуковых волн, и электронно-лучевые трубки, в которых данные сохранялись в виде зарядов на экранах трубок. Магнитный барабан, изобретенный примерно в 1948 году, использовал покрытие из оксида железа на вращающемся барабане для хранения данных и программ в виде магнитных шаблонов.

В двоичном компьютере любое бистабильное устройство (что-то, что может быть помещено в одно из двух состояний) может представлять два возможных значения битов 0 и 1 и, таким образом, может служить компьютерной памятью. Память на магнитных сердечниках, первое относительно дешевое RAM-устройство, появилось в 1952 году. Оно состояло из крошечных ферритовых магнитов в форме пончиков, нанизанных на точки пересечения двумерной проволочной сетки. По этим проводам протекали токи, изменяющие направление намагниченности каждого сердечника, а третий провод, продетый через пончик, определял его магнитную ориентацию.

Вы используете его прямо сейчас. Но вы должны пройти этот тест, чтобы узнать, что вы на самом деле знаете об Интернете.

Первая микросхема памяти на интегральной схеме (ИС) появилась в 1971 году. В памяти ИС хранится бит в комбинации транзистор-конденсатор. Конденсатор удерживает заряд для представления 1 и не имеет заряда для 0; транзистор переключает его между этими двумя состояниями. Поскольку заряд конденсатора постепенно уменьшается, память микросхемы представляет собой динамическую оперативную память (DRAM), которая должна периодически обновлять сохраненные значения (каждые 20 миллисекунд или около того). Существует также статическая оперативная память (SRAM), которую не нужно обновлять. Хотя SRAM быстрее, чем DRAM, в ней используется больше транзисторов, и поэтому она более дорогая; он используется в основном для внутренних регистров ЦП и кэш-памяти.

В дополнение к основной памяти компьютеры обычно имеют специальную видеопамять (VRAM) для хранения графических изображений, называемых растровыми изображениями, для отображения на компьютере. Эта память часто является двухпортовой — новое изображение может храниться в ней одновременно с чтением и отображением текущих данных.

Чтобы указать адрес в микросхеме памяти, требуется время, и, поскольку память работает медленнее, чем ЦП, есть преимущество в том, что память может быстро передавать последовательность слов после указания первого адреса. Одна из таких конструкций известна как синхронная DRAM (SDRAM), которая стала широко использоваться к 2001 году.

Тем не менее, передача данных по «шине» — набору проводов, соединяющих ЦП с памятью и периферийными устройствами, — является узким местом. По этой причине чипы ЦП теперь содержат кэш-память — небольшой объем быстрой SRAM. Кэш хранит копии данных из блоков основной памяти. Хорошо спроектированный кеш позволяет выполнять из него до 85–90 процентов обращений к памяти в типичных программах, что дает в несколько раз ускорение доступа к данным.

Время между двумя операциями чтения или записи памяти (время цикла) составляло около 17 микросекунд (миллионных долей секунды) для ранней оперативной памяти и около 1 микросекунды для основной памяти в начале 1970-х годов. Первая DRAM имела время цикла около половины микросекунды или 500 наносекунд (миллиардных долей секунды), а сегодня оно составляет 20 наносекунд или меньше. Не менее важным показателем является стоимость бита памяти. Первая DRAM хранила 128 байт (1 байт = 8 бит) и стоила около 10 долларов или 80 000 долларов за мегабайт (миллионы байтов). В 2001 году DRAM можно было купить менее чем за 0,25 доллара за мегабайт. Это резкое снижение стоимости сделало возможными графические пользовательские интерфейсы (GUI), экранные шрифты, используемые текстовыми процессорами, а также обработку и визуализацию больших массивов данных с помощью научных компьютеров.

Вторичная память

Вторичная память на компьютере — это хранилище данных и программ, которые в данный момент не используются. В дополнение к перфокартам и бумажной ленте ранние компьютеры также использовали магнитную ленту для вторичного хранения. Лента дешева, будь то большие катушки или маленькие кассеты, но ее недостаток заключается в том, что ее необходимо читать или записывать последовательно от одного конца к другому.

IBM представила первый магнитный диск RAMAC в 1955 году. он занимал 5 мегабайт и сдавался в аренду за 3200 долларов в месяц. Магнитные диски — это пластины, покрытые оксидом железа, как ленты и барабаны. Рукав с крошечной проволочной катушкой, головка чтения/записи (R/W), перемещается радиально по диску, который разделен на концентрические дорожки, состоящие из небольших дуг или секторов данных. Намагниченные области диска генерируют небольшие токи в катушке по мере ее прохождения, что позволяет ей «читать» сектор; точно так же небольшой ток в катушке вызовет локальное магнитное изменение на диске, тем самым «записав» в сектор. Диск вращается быстро (до 15 000 оборотов в минуту), поэтому головка чтения/записи может быстро добраться до любого сектора на диске.

Ранние диски имели большие съемные пластины. В 1970-х годах IBM представила запечатанные диски с фиксированными пластинами, известные как винчестерские диски, возможно, потому, что первые из них имели две 30-мегабайтные пластины, предполагая винтовку Winchester 30-30.Мало того, что герметичный диск был защищен от грязи, так еще и головка чтения/записи могла «летать» на тонкой воздушной пленке, очень близко к диску. Если поместить головку ближе к пластине, область оксидной пленки, представляющая один бит, может быть намного меньше, что увеличит емкость памяти. Эта базовая технология используется до сих пор.

Усовершенствования включали размещение нескольких пластин — 10 и более — в одном диске с парой головок чтения/записи для двух поверхностей каждой пластины, чтобы увеличить скорость хранения и передачи данных. Еще больший выигрыш был достигнут за счет улучшения управления радиальным перемещением рычага диска от дорожки к дорожке, что привело к более плотному распределению данных на диске. К 2002 году такая плотность достигла более 8000 дорожек на сантиметр (20 000 дорожек на дюйм), а диск диаметром с монету мог вместить более гигабайта данных. В 2002 году 80-гигабайтный диск стоил около 200 долларов США, что составляло лишь одну десятимиллионную от стоимости 1955 года и ежегодно снижалось почти на 30 %, подобно снижению цен на оперативную память.

Оптические запоминающие устройства — CD-ROM (компакт-диск, постоянное запоминающее устройство) и DVD-ROM (цифровой видеодиск или универсальный диск) — появились в середине 1980-х и 90-х годов. Оба они представляют собой биты в виде крошечных углублений в пластике, организованных в виде длинной спирали, как грампластинка, записываемых и читаемых с помощью лазеров. CD-ROM может содержать 2 гигабайта данных, но включение кодов исправления ошибок (для исправления пыли, мелких дефектов и царапин) уменьшает используемый объем данных до 650 мегабайт. DVD-диски плотнее, имеют меньшие ямки и могут вмещать 17 ГБ с исправлением ошибок.

В проигрывателе DVD используется лазер большей мощности и соответственно более точная точка фокусировки, чем в проигрывателе компакт-дисков. Это позволяет ему разрешать более короткие питы и более узкие разделительные дорожки и, таким образом, объясняет большую емкость DVD.

Оптические запоминающие устройства работают медленнее, чем магнитные диски, но они хорошо подходят для создания мастер-копий программного обеспечения или мультимедийных (аудио- и видеофайлов), которые считываются последовательно. Существуют также записываемые и перезаписываемые диски CD-ROM (CD-R и CD-RW) и DVD-ROM (DVD-R и DVD-RW), которые можно использовать как магнитные ленты для недорогого архивирования и обмена данными.

Снижающаяся стоимость памяти по-прежнему открывает новые возможности ее использования. На одном компакт-диске можно хранить 100 миллионов слов, что более чем в два раза превышает количество слов, содержащихся в печатной Британской энциклопедии. DVD может содержать полнометражный фильм. Тем не менее, разрабатываются еще более крупные и быстрые системы хранения, такие как трехмерные оптические носители, для обработки данных для компьютерного моделирования ядерных реакций, астрономических данных и медицинских данных, включая рентгеновские изображения. Для таких приложений обычно требуется много терабайт (1 терабайт = 1000 гигабайт) дискового пространства, что может привести к дополнительным сложностям при индексировании и извлечении данных.

Периферийные устройства

Компьютерная периферия — это устройства, используемые для ввода информации и инструкций в компьютер для хранения или обработки, а также для вывода обработанных данных. Кроме того, устройства, обеспечивающие передачу и прием данных между компьютерами, часто классифицируются как периферийные устройства.

Устройства ввода

К категории периферийных устройств ввода относится множество устройств. Типичными примерами являются клавиатуры, мыши, трекболы, указатели, джойстики, цифровые планшеты, сенсорные панели и сканеры.

Клавиатуры содержат механические или электромеханические переключатели, которые изменяют ток через клавиатуру при нажатии. Микропроцессор, встроенный в клавиатуру, интерпретирует эти изменения и посылает сигнал компьютеру. В дополнение к буквенным и цифровым клавишам на большинстве клавиатур также есть «функциональные» и «управляющие» клавиши, которые изменяют ввод или отправляют специальные команды на компьютер.

Механические мыши и трекболы работают одинаково, используя резиновый шарик или шарик с резиновым покрытием, который вращает два вала, соединенных с парой энкодеров, которые измеряют горизонтальные и вертикальные компоненты движения пользователя, которые затем преобразуются в движение курсора на компьютере. монитор. В оптических мышах используется световой луч и объектив камеры, чтобы преобразовывать движение мыши в движение курсора.

В манипуляторах, популярных на многих ноутбуках, используется метод, в котором используется чувствительный к давлению резистор.Когда пользователь нажимает на палочку, резистор увеличивает поток электричества, тем самым сигнализируя о том, что произошло движение. Большинство джойстиков работают аналогичным образом.

Цифровые планшеты и сенсорные панели схожи по назначению и функциональности. В обоих случаях ввод осуществляется с плоской панели, содержащей электрические датчики, определяющие наличие либо специального пера планшета, либо пальца пользователя соответственно.

Сканер чем-то похож на копировальный аппарат. Источник света освещает сканируемый объект, а различное количество отраженного света улавливается и измеряется аналого-цифровым преобразователем, подключенным к светочувствительным диодам. Диоды генерируют набор двоичных цифр, которые сохраняются в компьютере в виде графического изображения.

3D-функции Photoshop будут удалены в будущих обновлениях. Пользователям, работающим с 3D, рекомендуется изучить новую коллекцию Adobe Substance 3D, которая представляет новое поколение 3D-инструментов от Adobe.

Установка каждого пользователя уникальна, и для достижения максимальной производительности Photoshop может потребоваться различное сочетание методов. Из предложений, задокументированных в этой статье, подумайте, какие из них следует реализовать в контексте настройки вашего компьютера, типов файлов, которые вы используете, и вашего конкретного рабочего процесса. Существует четыре основных способа повлиять на производительность Photoshop:

Самый простой способ повысить производительность, не тратя денег, — настроить параметры Photoshop и настроить его функции в соответствии со своим стилем работы и типом файлов, с которыми вы обычно работаете.

Самый радикальный способ повысить производительность – это приобрести более быстрое и мощное оборудование. Ваш компьютер должен соответствовать определенным минимальным системным требованиям для оптимальной работы Photoshop. Запуск Photoshop на маломощном или неподдерживаемом оборудовании, например на компьютере с несовместимым графическим процессором (GPU), может привести к проблемам с производительностью.

Посмотрите это короткое видео, чтобы узнать, как быстро оптимизировать параметры производительности в Photoshop.

Photoshop предоставляет набор настроек ( Настройки > Производительность ), которые помогут вам оптимально использовать ресурсы вашего компьютера, такие как память, кэш, графический процессор, дисплеи и т. д. В зависимости от вашего основного варианта использования Photoshop и типов документов, с которыми вы обычно работаете, вам могут подойти различные комбинации этих настроек.

Дополнительные настройки, такие как рабочие диски , доступные на других вкладках диалогового окна «Настройки», также могут напрямую влиять на скорость и стабильность работы вашего компьютера.

Настройки производительности в Photoshop

Настройте память, выделенную для Photoshop

Вы можете повысить производительность, увеличив объем памяти/ОЗУ, выделенный для Photoshop. В области «Использование памяти» диалогового окна настроек «Производительность» («Настройки» > «Производительность») указано, сколько оперативной памяти доступно для Photoshop. Он также показывает идеальный диапазон выделения памяти Photoshop для вашей системы.

По умолчанию Photoshop использует 70 % доступной оперативной памяти.

  1. Увеличьте объем ОЗУ, выделенный для Photoshop, изменив значение в поле «Разрешить использование Photoshop». Или отрегулируйте ползунок «Использование памяти».
  2. Перезапустите Photoshop, чтобы изменения вступили в силу.

Чтобы найти идеальное распределение ОЗУ для вашей системы, меняйте его с шагом 5 % и следите за производительностью с помощью индикатора эффективности.

Мы не рекомендуем выделять более 85 % памяти вашего компьютера для Photoshop. Это может повлиять на производительность, так как не останется памяти для других важных системных приложений.

Если в Photoshop возникают ошибки нехватки оперативной памяти или памяти, попробуйте увеличить объем оперативной памяти, выделенной для Photoshop. Однако установка слишком большого объема ОЗУ для Photoshop (>85%) может повлиять на производительность других запущенных приложений, что сделает вашу систему нестабильной.

Лучшее решение этой проблемы — увеличить объем оперативной памяти на вашем компьютере. Уточните у производителя вашего компьютера характеристики ОЗУ и совместимость.

Настроить уровни кеша

Основные сведения о кэшировании

Photoshop использует кэширование изображений, чтобы ускорить перерисовку документов с высоким разрешением во время работы с ними. Вы можете указать до восьми уровней кэшированных данных изображений и выбрать один из четырех доступных размеров фрагментов кэша.

Увеличение уровня кэша повышает скорость отклика Photoshop во время работы, хотя загрузка изображений может занять больше времени. Размер фрагмента кэша определяет объем данных, с которыми одновременно работает Photoshop. Большие размеры плиток ускоряют выполнение сложных операций, таких как фильтры повышения резкости.Небольшие изменения, такие как мазки кистью, более чувствительны к меньшим размерам плитки.

Кэшировать пресеты

В настройках производительности доступны три предустановки кэша. Выберите тот, который соответствует вашему основному варианту использования/цели использования Photoshop:

  • Веб-дизайн/дизайн пользовательского интерфейса: выберите этот вариант, если вы используете Photoshop в основном для веб-дизайна, дизайна приложений или экрана. Этот вариант подходит для документов, содержащих множество слоев ресурсов с низким и средним размером пикселей.
  • По умолчанию/Фото: выберите этот вариант, если вы используете Photoshop в основном для ретуши или редактирования изображений среднего размера. Например, используйте этот параметр, если вы обычно редактируете в Photoshop фотографии, полученные с мобильного или цифрового фотоаппарата.
  • Огромные размеры в пикселях: выберите этот вариант, если вы много работаете с тяжелыми документами в Photoshop; например, панорамы, матовые картины и т. д.

Уровни кэша

Для более точного управления укажите уровни кэша вручную; значение по умолчанию — 4.

  • Если вы используете относительно небольшие файлы (примерно 1 мегапиксель или 1 280 x 1 024 пикселя) и много слоев (50 и более), установите для Уровней кэша значение 1 или 2. Установка для Уровней кэша значения 1 отключает кэширование изображений; кэшируется только текущее изображение экрана.
  • Если вы используете файлы с большими размерами в пикселях, например, 50 мегапикселей или больше, установите уровень кэша выше 4. Более высокие уровни кэша ускоряют перерисовку.

Вы можете не получить высококачественные результаты при использовании некоторых функций Photoshop, если установите для уровня кэша значение 1.

Ограничение состояний истории

Вы можете сэкономить место на рабочем диске и повысить производительность, ограничив или уменьшив количество состояний истории, которые Photoshop сохраняет на панели «История». Объем сэкономленного пространства зависит от того, сколько пикселей изменяется при выполнении операции. Например, состояние истории, основанное на маленьком мазке кистью или неразрушающей операции, такой как создание или изменение корректирующего слоя, занимает мало места. С другой стороны, применение фильтра ко всему изображению занимает гораздо больше места.

Photoshop может сохранять до 1000 состояний истории; номер по умолчанию – 50.

Чтобы уменьшить это число, перейдите в диалоговое окно настроек производительности. В разделе "История и кэш"
уменьшите количество состояний истории.

Задайте настройки графического процессора (GPU)

Лучший способ оптимизировать ускорение графического процессора, что ускоряет перерисовку экрана, — это обновлять драйвер видеоадаптера. Инструкции по обновлению драйверов видеоадаптера

Подробнее о том, как Photoshop использует графический процессор, протестированные карты и минимальные требования к графическому процессору и дисплею.

Настройки графического процессора

Photoshop предоставляет специальные настройки графического процессора в разделах «Производительность» и «3D» диалогового окна «Настройки».

Настройки в разделе "Настройки" > "Производительность"

Если в вашей системе обнаружена видеокарта, ее имя и модель появятся в разделе Обнаруженный графический процессор в области Параметры графического процессора раздела Производительность.

Ражив Баруа

Университет Мэриленда

Университет Мэриленда

Добавлено новое оповещение о цитировании!

Это оповещение успешно добавлено и будет отправлено по адресу:

Вы будете уведомлены всякий раз, когда будет цитироваться выбранная вами запись.

Чтобы изменить настройки предупреждений, нажмите кнопку ниже.

Новое предупреждение о цитировании!

Сохранить в подшивку
CASES '07: Материалы международной конференции 2007 года по компиляторам, архитектуре и синтезу встроенных систем

РЕЗЮМЕ

В этом документе представлена ​​первая схема выделения оперативной памяти, которая не требует поддержки компилятором для приложений на основе интерпретируемых языков. Блокнотная память (SPM) — это быстрая SRAM, управляемая компилятором, которая заменяет кэш, управляемый аппаратным обеспечением. Его использование мотивировано его лучшими гарантиями в реальном времени по сравнению с кешем и его значительно более низкими накладными расходами в потреблении энергии, площади и времени доступа. Интерпретируемые языки – это такие языки, как Java, которые интерпретируются средой выполнения, а не выполняются непосредственно на оборудовании.

Все существующие схемы выделения памяти для SPM требуют анализа компилятором для разработки стратегии выделения. В частности, существующие схемы распределения для приложений на основе Java определяют выделение во время компиляции. Затем они аннотируют байт-коды Java этими решениями о распределении для виртуальной машины Java (JVM) для реализации фактического распределения во время выполнения. Эти существующие схемы распределения привязывают результирующий байт-код к определенным размерам SPM, тем самым предотвращая перенос приложений на другие размеры SPM. Кроме того, существующие методы не работают для немодифицированных сторонних байт-кодов, созданных компиляторами, отличными от их специализированных компиляторов.

В этой статье мы предлагаем первую в истории схему распределения SPM, которая полностью реализована внутри JVM. Наш метод не требует поддержки компилятора и работает для немодифицированных байт-кодов из любого источника. Более того, в отличие от существующих методов, он сохраняет переносимость байт-кода на SPM любого размера. Мы исследуем наш метод на виртуальной машине Sun Hotspot JVM, на которой мы добились улучшения времени выполнения на 27,8 % и экономии энергии на 21,8 % по сравнению с отсутствием SPM — единственной существующей альтернативой для немодифицированных байт-кодов.

В этой статье мы рассматриваем проблему выбора встроенной памяти для ресурсоемких приложений, предлагая оперативную память в качестве альтернативы кэш-памяти. Площадь и энергия для различных размеров оперативной памяти и кэш-памяти рассчитываются с помощью инструмента CACTI, а производительность оценивается с использованием результатов трассировки симулятора. Целевой процесс.

Контексты в исходной публикации

<р>. ячейка массива блокнотной памяти показана на рис. 1(а), а ячейка памяти на рис. 1(б). Ячейка статического ОЗУ с 6 транзисторами показана на рис. 1(с). Ячейка имеет один порт R/W. Каждая ячейка имеет две битовые строки, битовую и битовую полосу и одну строку слова. Полная организация блокнота показана на рис. .

<р>. ячейка массива блокнотной памяти показана на рис. 1(а), а ячейка памяти на рис. 1(б). Ячейка статического ОЗУ с 6 транзисторами показана на рис. 1(с). Ячейка имеет один порт R/W. .

Похожие публикации

+5

Сетевые встроенные системы обычно используют набор маломощных встроенных систем (узлов) для совместного выполнения приложений, охватывающих различные домены приложений (например, видео, обработка изображений, связь и т. д.) с различными требованиями к приложениям. Отдельные сетевые узлы должны работать в условиях строгих ограничений (например, по энергии).

В этой статье мы рассматриваем проблему выбора встроенной памяти для ресурсоемких приложений, предлагая оперативную память в качестве альтернативы кэш-памяти. Площадь и энергия для различных размеров оперативной памяти и кэш-памяти рассчитываются с помощью инструмента CACTI, а производительность оценивается с использованием результатов трассировки симулятора. Целевой процесс.

Цитаты

<р>. Катхур и др. [27] предложил методологию на основе компилятора для получения оптимальных областей памяти и связанного с ними распределения данных. Анджолини и др.[28] используют метод на основе трассировки, который анализирует гистограмму доступа, чтобы определить, какие области памяти выделить для оперативной памяти [29]. Иссенин и Датт [30] инструментируют исходный код для создания аннотированных трасс памяти, включая точки входа и выхода цикла, и используют эту информацию для создания аффинных представлений поддающихся обработке циклов и оптимизации выделения памяти. .

Формальное высокоуровневое представление программ обычно требуется для статического и динамического анализа, выполняемого компиляторами. Однако исходный код целевых приложений не всегда доступен в анализируемом виде, например, для защиты интеллектуальной собственности. Чтобы рассуждать о таких приложениях, необходимо строить модели на основе наблюдений за их выполнением. В этой статье подробно описывается алгебраический подход, который, принимая в качестве входных данных трассировку адресов памяти, к которым обращается одиночная ссылка на память, синтезирует аффинный цикл с одной полностью вложенной ссылкой, которая генерирует исходную трассировку. Этот подход расширен для поддержки синтеза объединений аффинных петель, полезных для минимального моделирования следов, созданных автоматическими преобразованиями многогранных программ, таких как мозаика. В результате система способна обрабатывать сотни гигабайт данных трассировки за считанные минуты, минимально реконструируя 100 % статических контрольных частей в приложениях PolyBench/C и 99,99 % в версиях этих тестов на основе Pluto. В качестве примера применения метода моделирования трасс исследуется сжатие трасс. Аффинные представления, построенные для трасс памяти кодов PolyBench/C, обеспечивают коэффициенты сжатия порядка 106 и 103 по отношению к gzip для исходной и мозаичной версий трасс соответственно.

<р>. Традиционная блокнотная память [5, 18, 34] представляет собой управляемое программным обеспечением хранилище данных на кристалле без какого-либо массива тегов, которое обеспечивает адресное пространство, не пересекающееся с основной памятью и несовместимое с ним. Эти свойства могут уменьшить энергопотребление, площадь и задержку [5] по сравнению с кэшем, управляемым аппаратно. .

<р>. Традиционная блокнотная память [5,18,34] представляет собой управляемое программным обеспечением хранилище данных на кристалле без какого-либо массива тегов, которое обеспечивает адресное пространство, не пересекающееся с основной памятью и несовместимое с ним. Эти свойства могут уменьшить энергопотребление, площадь и задержку [5] по сравнению с кэшем, управляемым аппаратно. Хотя блокноты обеспечивают меньшую задержку доступа и предоставляют полный контроль программистам, которые управляют перемещением блоков данных в блокнот и из него, они могут потребовать значительных усилий программирования: программист или компилятор должен определить своевременность инициирования передачи данных через DMA, чтобы задержка доступа к памяти может быть скрыта [18,24] и вычисления не останавливаются. .

Вычислительные системы общего назначения используют иерархию памяти, чтобы создать видимость единой большой, быстрой и согласованной памяти. В процессорах специального назначения программисты вручную управляют отдельными несогласованными блокнотами памяти. В этой статье мы объединяем эти механизмы, добавляя виртуально адресованную, ассоциативную блокнотную память к ЦП общего назначения. Наш блокнот существует вместе с традиционным кэшем и позволяет избежать многих проблем программирования, связанных с традиционными блокнотами, без ущерба универсальности (например, виртуализации). Кроме того, наш дизайн обеспечивает повышенную безопасность и повышает производительность, особенно для рабочих нагрузок с высокой степенью локальности или взаимодействующих с энергонезависимой памятью.

<р>.возможность обработки является одним из ресурсов, а не центральным синглтоном не обязательно один и тот же процессор используется для решения всех частей задачи обеспечивается своего рода избыточность (простой метод замены неисправного процессора) за счет использования виртуальных процессоров ( в основном для увеличения среднего времени между техническими ошибками) поток команд может быть передан другому процессору [17], [18] разные процессоры могут и должны взаимодействовать при решении задачи, в том числе осуществлять непосредственный обмен данными и управлением между ядрами, общаясь друг с другом , возможность настраивать специальные сборки для более эффективной обработки гибким способом большое количество процессоров может использоваться для замены операций с памятью с использованием большего количества процессоров ядро ​​может передать полученную задачу на аутсорсинг • ошибочное представление о разделенных компьютерных компонентах переосмыслено эффективность Использование огромного количества процессоров увеличивается за счет использования многопортовой памяти (аналогично [19]), концепции «только памяти» (s (в отличие от концепции «только регистры»), вводится (в отличие от концепции «только регистры»), с использованием целевых, опционально распределенных, частично локальных банков памяти принцип локальности внедряется на аппаратном уровне, путем введения иерархических шин • неправильное представление о «только последовательном» выполнении [21] переосмыслено фон Нейманом, требующим только «правильной последовательности» для одного процессора; эта концепция распространяется на несколько процессорных блоков задачи разбиваются на разумные по размеру и логически взаимосвязанные фрагменты принцип "один процессор - один процесс" остается в силе для фрагментов задачи, но не обязательно для полных фрагментов задачи могут выполняться (хотя бы частично) одновременно, если и зависимость от данных, и доступность оборудования позволяют это (еще один вид асинхронных вычислений [22]).

Вычислительная парадигма, разработанная для обработки небольшого объема данных на одном отдельном процессоре, не может соответствовать требованиям, предъявляемым к современным вычислительным ресурсам. В статье предлагается новая вычислительная парадигма (расширяющая старую для явного использования нескольких процессоров) и обсуждаются некоторые вопросы ее возможной реализации. Представлены некоторые преимущества реализованного подхода, проиллюстрированные результатами симулятора с свободной синхронизацией.

Ражив Баруа

Университет Мэриленда, Колледж-Парк, Мэриленд

Университет Мэриленда, Колледж-Парк, Мэриленд

Добавлено новое оповещение о цитировании!

Это оповещение успешно добавлено и будет отправлено по адресу:

Вы будете уведомлены всякий раз, когда будет цитироваться выбранная вами запись.

Чтобы изменить настройки предупреждений, нажмите кнопку ниже.

Новое предупреждение о цитировании!

Сохранить в подшивку
Транзакции ACM во встроенных вычислительных системах

Аннотация

В этой статье представлена ​​первая схема распределения памяти для встраиваемых систем с оперативной памятью, размер которой неизвестен во время компиляции. Блокнотная память (SPM) — это быстрая SRAM, управляемая компилятором, которая заменяет кэш, управляемый аппаратным обеспечением. Все существующие схемы выделения памяти для SPM требуют, чтобы размер SPM был известен во время компиляции. К сожалению, из-за этого ограничения результирующий исполняемый файл привязан к этому размеру SPM и не может быть перенесен на другие реализации процессора, имеющие другой размер SPM. Переносимый по размеру код полезен, когда программы загружаются во время развертывания либо через сеть, либо с переносных носителей. Загрузка кода используется для исправления ошибок или расширения функциональности. Наличие СЗМ разных размеров в разных устройствах является обычным явлением из-за эволюции технологии СБИС на протяжении многих лет. В результате SPM нельзя использовать в таких ситуациях со скачанными кодами.

Чтобы преодолеть это ограничение, в нашей работе представлен метод компиляции, результирующий исполняемый файл которого можно переносить между SPM любого размера. Наша методика заключается в использовании специализированного программного обеспечения для установки, которое определяет распределение SPM непосредственно перед первым запуском программы, поскольку размер SPM может быть определен в это время. Затем установщик, на основе принятого распределения, соответствующим образом изменяет исполняемый файл программы. Полученный исполняемый файл помещает часто используемые объекты в SPM с учетом как кода, так и данных для размещения. Чтобы снизить накладные расходы, большая часть предварительной обработки для распределения выполняется во время компиляции. Результаты показывают, что наши тесты показывают среднее ускорение на 41% по сравнению с распределением только DRAM, в то время как оптимальная схема статического распределения, которая знает размер SPM во время компиляции и, таким образом, является недостижимой верхней границей, лишь немного быстрее (на 45% быстрее, чем полностью DRAM). Результаты также показывают, что накладные расходы нашего специализированного установщика составляют в среднем около 1,5 % из-за размера кода, 2 % из-за времени выполнения и 3 % из-за времени компиляции для наших эталонных тестов.

Читайте также: