Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


Intel - 2020 год.

Intel - 2020 год.

Процессоры Intel с многопроцессорной обработкой на уровне кристалла уже обеспечивают весьма высокую производительность при более приемлемых тактовых частотах благодаря параллельному выполнению множества операций. Архитектуры Intel CMP (Chip-level MultiProcessing) смогут обойти проблемы, вызванные повышением тактовой частоты (увеличение тока утечки, несоответствие производительности процессора и памяти, проблемы узкого места архитектуры фон Неймана). Многоядерная архитектура также позволит снизить влияние резистивно-емкостных задержек. В течение нескольких последующих лет в корпорации планируется выпустить процессоры, которые будут содержать множество ядер (в некоторых случаях даже сотни). Архитектуры Intel с поддержкой многопроцессорной обработки на уровне кристалла представляют собой будущее микропроцессоров, потому что именно такие архитектуры позволяют достичь огромных уровней производительности и в то же время обеспечить эффективное управление питанием и эффективный режим охлаждения.

Архитектуры CMP обеспечивают огромный рост производительности, и позволяют свести к минимуму потребление электроэнергии и теплоотдачу. В отличие от больших, энергоемких вычислительных ядер с высокой теплоотдачей, кристаллы Intel CMP активизируют только те ядра, которые необходимы для выполнения текущей задачи, тогда как остальные будут отключены. Такое управление вычислительными ресурсами позволяет кристаллу потреблять ровно столько электроэнергии, сколько нужно в данный момент времени для решения текущих задач.

Архитектуры CMP способны обеспечить специализированные функции и уровень адаптивности, необходимые для платформ будущего. Кроме ядер общего назначения, эти процессоры будут включать специализированные ядра для выполнения различных типов вычислений, таких, как обработка графики, алгоритмы распознавания речи и обработка коммуникационных протоколов.

Intel планирует разрабатывать процессоры, допускающие динамическую реконфигурацию ядер, межкомпонентных соединений и кэш-памяти, чтобы обеспечить соответствие многообразным и изменяющимся потребностям. Такая реконфигурация может выполняться производителем процессора (чтобы перенастроить один и тот же кристалл для использования в различных сегментах рынка), OEM-поставщиком (чтобы настроить процессор для систем разного типа) и даже автоматически в реальном времени, чтобы поддерживать соответствие изменяющимся потребностям текущей рабочей нагрузки.

Некоторые микропроцессоры Intel планируется оснастить внутрикристальными подсистемами памяти, объемы которых будут достигать нескольких гигабайт. Такая сверхоперативная память позволит заменить обычную оперативную память во многих вычислительных устройствах. Кэш-память тоже будет реконфигурируемой, ее можно будет динамически перераспределять для разных ядер. Некоторые области памяти можно будет выделять определенным ядрам или предоставлять для совместного использования группами ядер либо всеми ядрами глобально, в зависимости от потребностей приложений. Такая гибкая возможность изменения конфигурации необходима для того, чтобы ликвидировать узкое место производительности, когда множество ядер будет соперничать за доступ к памяти.

Предложенная специалистами концепция виртуализации платформ способна обеспечить эффективное развитие для мощных, автономных и надежных компьютерных систем. Для работы микропроцессоров будущего потребуется несколько уровней виртуализации. Например, виртуализация необходима для того, чтобы скрыть сложную структуру аппаратного обеспечения от соответствующего ПО. Сама операционная система (ОС), ее ядро и ПО не должны "задумываться" о сложном устройстве платформы, о множестве ядер, специализированном аппаратном обеспечении, о множестве модулей кэш-памяти, средствах реконфигурирования и т. п. Они должны "видеть" процессор как набор унифицированных виртуальных машин с глобальными интерфейсами. Такой необходимый уровень абстракции предоставит именно виртуализация. Виртуализация позволяет создавать менее сложные системы, превращая компьютеры в более удобно управляемые объекты, а такое разделение на части обеспечивает значительно больший уровень безопасности систем, сетей и приложений благодаря изоляции потенциально опасных подсистем от системных ресурсов низкого уровня и от других виртуальных платформ.

Технология виртуализации позволила многим ИТ-организациям получить новые способы для развертывания своих систем и приложений и для управления ими. Только виртуализация поможет получить преимущества от этой дополнительной мощности за счет консолидации множества приложений и ОС на единой платформе. Это повысит степень полезного применения серверов, а также упростит сопровождение и снизит расходы на электропитание и охлаждение. Благодаря этим возможностям организации скоро поймут, что они смогут сократить свои расходы, связанные с компьютерами (как капитальные, так и эксплуатационные), и в то же время существенно повысить маневренность центров обработки данных.

Технология Intel Virtualization, ранее известная как Vanderpool, предоставляет аппаратную поддержку, назначение которой - повысить эффективность сегодняшних решений для виртуализации, реализованных программно, которое обеспечит еще более эффективное использование этих новых расширений архитектуры. Виртуализация является постоянно развивающейся технологией, поэтому корпорация берет на себя обязательства включать самые передовые возможности виртуализации в архитектуру Intel. Именно многоядерная архитектура платформ Intel в сочетании с Virtualization Technology позволит создавать виртуальные независимые разделы ПО с обработкой на отдельных ядрах процессора. Таким образом, пользователи смогут создавать уникальную программно-аппаратную конфигурацию в рамках одного сервера и/или ПК для решения своих любых специализированных задач.

Виртуализация обеспечивает высокий уровень работоспособности и безопасности за счет таких ключевых возможностей, как локализация неисправностей, гибкая обработка отказов и разные уровни безопасности. Важнейшее преимущество виртуализации заключается еще и в том, что она упрощает миграцию приложений на новые платформы.

Увеличение производительности на 1% приводит к повышению потребляемой мощности на 3% (при уменьшении размера транзисторов и их плотности на кристалле наряду с тактовой частотой увеличивается и ток утечки, что ведет к нагреву и неэффективному расходованию электроэнергии). Если плотность транзисторов будет расти нынешними темпами, то вскоре без усовершенствования управления питанием микропроцессоры будут выделять десятки тысяч ватт тепла на квадратный сантиметр. Чтобы удовлетворять потребностям будущего, необходимо существенно сократить потребляемую мощность. Для этого необходимы соответствующие технологии.

       В недалеком будущем процессоры с архитектурой Intel CMP будут состоять из десятков и даже сотен небольших ядер с низкой потребляемой мощностью и интеллектуальным управлением питанием, которое сможет значительно сократить потери электроэнергии, позволяя процессору задействовать только те ресурсы, которые нужны для работы в данный момент. Кроме того, архитектура Intel CMP будет обеспечивать ультравысокую производительность без ультравысоких тактовых частот, что позволит обойти некоторые проблемы, связанные с током утечки. В дальнейшем архитектура Intel CMP будет обеспечивать разную скорость работы транзисторов. Это станет возможным благодаря производственным технологиям будущего с высокой плотностью. Медленные и быстрые транзисторы будут иметь разное напряжение питания. Задачи, критичные по времени, будут работать на быстрых ядрах с большей потребляемой мощностью, в то время как остальные - на более медленных с пониженным энергопотреблением. Основная цель этих усовершенствований - построение архитектур с интеллектуальным управлением питанием, которое сможет автоматически реконфигурировать процессор с учетом потребностей питания и рабочей нагрузки.

Для управления током утечки можно использовать различные технологии на уровне схем (смещение подложки, образование тяги и "засыпание" транзисторов).

Специализированное аппаратное обеспечение, например, устройства обработки протокола TCP/IP, также может снизить энергопотребление благодаря тому, что будет выполнять свои функции более эффективно (за счет меньшей сложности схем и меньшего количества циклов на операцию), чем универсальные процессоры. Или, например, шина QPI (Core i7). Основное достоинство этого интерфейса - сочетание высокой пропускной способности - до 15 Гбит/с  и низкого энергопотребления (не более 5,0 мВт на каждый гигабит в секунду при пропускной способности 15 Гбит/с). Если  сравнить еще достаточно прогрессивный по нынешним меркам интерфейс PCI Express 2.0, то  он при пиковой пропускной способности 5 Гбит/с имеет удельное энергопотребление 20 мВт на каждый гигабит в секунду.

 При скорости передачи данных 5 Гбит/с  новый интерфейс (QPI) Intel обладает уровнем энергопотребления не более 2,7 мВт на каждый гигабит в секунду. Эти результаты сегодня являются рекордными с точки зрения эффективности работы современных приёмников данных Теоретически, Intel может повысить пропускную способность существующих интерфейсов в три раза, довольствуясь только 25% уровня энергопотребления нынешних интерфейсов. Что касается возможности разгона шины QPI, то почти все процессоры будут ею обладать в полной мере. Множитель частоты шины QPI - от 4x до 64x (но процессоры Core i7 920 -2.66 ГГц и Core i7 940 - 2.93 ГГц не будут позволять повышать множитель, определяющий тактовую частоту ядер и, соответственно, технология Intel Dynamic Speed Technology ими тоже поддерживаться не будет). Подобной эффективности удалось добиться за счёт динамического управления частотой и напряжением принимающего и передающего чипов, а также некоторых других нововведений.

     Представители инженерных подразделений Intel постоянно работают по проблеме дальнейшего снижения энергопотребления процессоров и уровня выделяемого тепла. Например, версия процессора Itanium 2 (Montecito) - для серверов старшего класса - будет потреблять меньше энергии, чем его предшественник, несмотря на добавление второго процессорного ядра и более высокую тактовую частоту.

Работы специалистов Intel над снижением уровня энергопотребления становятся все важнее как для системных администраторов, сталкивающихся с необходимостью охлаждения крупных серверных стоек, так и для пользователей мобильных компьютеров, рассчитывающих увеличить время их работы без подзарядки.

Отказ Intel от своих прежних планов наращивания тактовой частоты процессоров для настольных систем стал доказательством того, насколько важным вопрос энергопотребления и тепловыделения становится на рынке ПК. Двуядерный процессор Montecito содержит в кристалле около 1,7 млрд. транзисторов и потреблял бы мощность до 300 Вт, если бы Intel не реализовала некоторые специальные технологии для экономии энергии (например, Foxton). Возможность управления питанием позволяет процессору менять уровень энергопотребления (в том числе за счет изменения тактовой частоты процессора, зависящей от рабочей нагрузки выполняемого приложения). Кроме того, Intel усовершенствовала датчики энергопотребления в Montecito с тем, чтобы они собирали достаточно данных для активации технологий настройки частоты и энергопотребления (nеперь Montecito потребляет всего 100 Вт при тактовой частоте как минимум 2 ГГц).

Высокоскоростные межкомпонентные соединения являются одним из важнейших условий для построения быстродействующих перспективных вычислительных систем. Архитектуры Intel CMP позволяют ликвидировать узкие места и источники неэффективности, общие для других архитектур, но они могут столкнуться с новыми проблемами повышения производительности.

Серьезной проблемой являются коммуникационные задержки при передаче данных между многочисленными ядрами, кэш-памятью и другими функциональными компонентами. Новым системам потребуются высокоскоростные межкомпонентные соединения, которые позволят значительно ускорить передачи данных и обеспечат эффективную полезную загрузку процессора. Intel не исключает использование усовершенствованных медных проводников, но в конечном счете видимо неизбежен переход на оптические межкомпонентные соединения, которые могут передавать данные со скоростью света.

По мере увеличения степени интеграции полупроводниковых элементов и тактовой частоты микропроцессоров резко возрастают и требования к суммарной пропускной способности каналов обмена данными между микропроцессором и набором микросхем или между несколькими микропроцессорами на системной плате компьютера. Благодаря быстрому развитию микроэлектронных технологий через несколько лет, например, электронные устройства сопряжения, используемые, в частности, для подключения компьютеров к сети (трансиверы) на КМОП-транзисторах смогут работать на тактовых частотах порядка 14 ГГц, что вполне достаточно для поддержания скорости передачи данных на уровне 20 Гбит/с. Однако для применяемой в настоящее время технологии межкомпонентных соединений на базе медных проводников скорости в 15-20 Гбит/с - это предел, по причине неизбежного на сверхвысоких тактовых частотах ухудшения характеристик сигнала, рассеивания мощности и усиления негативного влияния электромагнитных помех.

Технология оптоволоконных соединений в последние годы стала все активнее применяться при развертывании коммуникационных сетей на коротких расстояниях, в частности, для соединения серверов в центрах обработки данных. В настоящее время оптические проводники уже готовы покорять сверхкороткие расстояния микроэлектронного мира. Благодаря гораздо более высокой пропускной способности по сравнению с металлическими проводниками, оптоволоконные соединения более эффективны для передачи данных от платы к плате, от микросхемы к микросхеме и от элемента к элементу внутри самой микросхемы. Однако стоимость технологии оптических соединений на сверхкоротких расстояниях существенно возрастает из-за использования компонентов на основе арсенида галлия и германия - более дорогостоящих, чем кремний. Кроме того, технология оптических проводников по сравнению с традиционной методикой требует более тонкой юстировки (т. е. взаимного выравнивания интегральных компонентов оптической подсистемы), что значительно усложняет разработку и производство оптического оборудования. Текущие исследования в данной области главным образом сосредоточены на повышении экономической эффективности технологии, особенно с точки зрения производства. Таким образом, можно утверждать, что оптические межкомпонентные соединения вполне смогут заменить электрические проводники (когда будет достигнут приемлемый показатель цена/производительность, а также более высокий уровень производственных возможностей). Разработчики из Intel Components Research Lab объединили в рамках единого решения высокопроизводительные оптические компоненты (плоскостные лазеры с вертикальным резонатором VCSEL), и экономически эффективные и отвечающие промышленным стандартам технологии, основанные на КМОП-трансиверах с низким энергопотреблением и на стандартных методиках компоновки микропроцессоров.

Разработчики уже продемонстрировали полнофункциональное устройство, обеспечивающее высочайшую скорость передачи данных (12-канальная линия связи, восемь каналов для передачи данных, объединенная в едином корпусе с параллельным оптическим КМОП-трансивером). Оптическая подсистема ввода-вывода базируется на оптоэлектронной интегральной микросборке в корпусе FCPGA. В числе других базовых компонентов устройства - плоскостные лазеры с вертикальным резонатором на базе арсенида галлия; кремниевые фотодиодные матрицы с трехслойной (P-I-N) структурой; массивы волноводов из специального полимера; многоканальные волоконно-оптические соединители; КМОП-микросхема трансивера. Эти компоненты устанавливаются методом перевернутых кристаллов (flip-chip) на верхней части органической подложки FCPGA-корпуса, обеспечивая параллельную оптическую передачу сигнала по типу "точка-точка".

В течение сеанса передачи данных по оптической линии связи матрицы VCSEL-лазеров непосредственно модулируются информационными сигналами с простейшим бинарным кодированием (NRZ) и синхронизацией по источнику (source-synchronous clocking), формируемыми КМОП-генераторами. VCSEL-лазеры соединены матрицами многомодовых полимерных волноводов с подсистемой приема данных, состоящей из фотодиодных матриц на основе арсенида галлия и размещенных на том же кристалле трансимпедансных (управляемых током) усилителей напряжения. Интегрированные в КМОП-компонент схемы контроля обеспечивают тестирование оптических коммуникационных линий посредством определения частоты появления принятых при передаче сигнала ошибочных битов.

Кристалл оптоэлектронного трансивера (часть проекта разработки оптической подсистемы ввода-вывода для элементов сопряжения отдельных микросхем на уровене межкомпонентных соединений "кристалл-кристалл") выполнен на базе 0,18-мкм полупроводниковой технологии. Кристалл трансивера при размерах 3x3,25 мм занимает лишь третью часть общей площади интегральной микросборки и содержит все электрические схемы для реализации оптической линии связи. В числе основных модульных компонентов кристалла - 12 лазерных (VCSEL) генераторов оптического сигнала и 12 приемников сигнала в комбинации с трансимпедансными усилителями напряжения и ограничивающими усилителями; блок синхронизации; блок контроля с цепью сканирования. Два из 12 каналов несут управляющие сигналы для согласования оптоэлектронных микросхем с массивами волноводов. По двум другим каналам подаются синхроимпульсы. По остальным восьми передаются информационные сигналы вида PRBS NRZ (Pseudo Random Bit Sequence Non-Return-to-Zero, псевдослучайная битовая последовательность "без возврата к нулю"), предназначенные для управления матрицами VCSEL-лазеров. PRBS-данные формируются управляемым напряжением тактовым генератором, который, в свою очередь, управляет сдвиговым регистром линейной обратной связи.    Схема фотодиодной матрицы приемника сигнала содержит трансимпедансные усилители напряжения (TIA) и ограничивающие усилители (LIA). Каждый TIA, снабженный резистором обратной связи, обладает допустимым суммарным емкостным сопротивлением не более 500 фемтофарад (фемто- обозначает 10-15). с учетом узлов пайки, электростатического заряда и паразитной емкости фотодиодов. Усилители TIA/LIA - это асимметричные системы с неинвертирующим выходом, формирующие опорный входной сигнал для регулировки тока фотодиода. Входной токовый сигнал на пути от фотодиодов к TIA проходит через три электронных каскада: дифференцирующие цепи, усилитель и преобразователь. LIA формирует дискретные логические уровни из аналогового сигнала, а устройство вывода формирует цифровой сигнал, выводимый за пределы кристалла.

Проблема высокоскоростной связи заключается не только в материале межкомпонентных соединений, но и в их архитектуре. В дальнейшем потребуются новые архитектуры межкомпонентных соединений, способные поддерживать сотни ядер. Такие механизмы должны иметь способность к реконфигурированию, чтобы обслуживать изменяющиеся потребности обработки и конфигурации ядер. Специалисты Intel полагают, что архитектура процессоров и платформ должна двигаться именно в направлении виртуализованной, реконфигурируемой архитектуры CMP с большим числом ядер, богатым набором встроенных функций, большим объемом внутрикристальной памяти и интеллектуальным микроядром.

 


Лицензия