Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


Haswell, ультрабуки, ультрапортативные ноутбуки-трансформеры, планшеты.

Haswell, ультрабуки, ультрапортативные ноутбуки-трансформеры, планшеты.

«Увлекающиеся практикой без науки — словно кормчий, ступающий на корабль без руля или компаса; он никогда не уверен, куда плывет. Всегда практика должна быть воздвигнута на хорошей теории…» (Леонардо да Винчи).

                Intel не намерена продолжать активно бороться за честь традиционных и привычных многим систем, а вместо этого она хочет заниматься внесением изменений в архитектуру x86 и имеющиеся продукты с тем, чтобы приспособить их для тех классов мобильных устройств, которые находятся сейчас на пике популярности. Отчасти этой цели служат начавшиеся коренные преобразования в хозяйстве Atom: активное продвижение процессоров этого класса в смартфоны и планшеты, а также подготовка новой микроархитектуры Silvermont. Но параллельно метаморфозы будут происходить и с процессорной линейкой Core, которая по замыслу разработчиков должна стать ещё более мобильной. И Haswell — хотя уже не первая, но, наверное, самая заметная веха на этом пути.

Haswell в первую очередь нацеливается на ультрабуки и ультрапортативные ноутбуки-трансформеры, которые легким движением руки превращаются в планшеты. И это как нельзя лучше отражает ту цель, которая стояла перед разработчиками новой микроархитектуры. Если на этапе создания микроархитектур Sandy Bridge и Ivy Bridge инженеры работали над дизайном процессоров с целевым энергопотреблением 35–45 Вт, в то время как остальные варианты получались путём варьирования числа ядер, частоты и напряжения, то с Haswell требования по потреблению были ещё более ужесточены от 15 до 20 Вт. Таким образом, Haswell — ярко выраженная ультрамобильная микроархитектура, стоящая по уровню производительности на ступень выше Atom. Что же до десктопных модификаций Haswell, то это для Intel — побочный продукт.

Процессоры с микроархитектурой Sandy Bridge по сравнению со своими предшественниками поколения Westmere смогли обеспечить лишь примерно 15-процентный прирост производительности в десктопной среде именно потому, что разработчики стали смещать свои акценты на соотношение производительности и энергопотребления. Сейчас же главные сильные стороны Haswell это превосходная экономичность и принципиально новый уровень графического быстродействия.

Да, микроархитектура Haswell во многом действительно может считаться высокоэнергоэффективной, и разрабатывалась она в первую очередь с прицелом на мобильные применения. Принятая в компании бизнес-модель предполагает использование единого дизайна в обширной линейке продукции, включающей мобильные, десктопные и серверные компоненты. Это значит, что под модным фасадом низкого энергопотребления скрывается прочный фундамент, позволяющий направить Haswell в разные рыночные ниши. Новая микроархитектура не потеряла своей универсальности. Путём манипулирования числом ядер, версиями графического движка, целевым уровнем энергопотребления, размером кеш-памяти и добавлением того или иного набора внешних интерфейсов из Haswell могут получаться разные по своей сути процессоры.

Да, в ней на первом месте стоят нововведения, направленные на оптимизацию тепловых и энергетических режимов. Изменений же, способных поднять производительность, не так много. Действительно, когда Intel выпускала Nehalem или Sandy Bridge, перестройка затрагивала не только внутренние блоки вычислительных ядер, но и базовую концепцию процессорного дизайна. Но если посмотреть на обобщённую схему Haswell, то её легко перепутать с предшественником — Ivy Bridge.

Все функциональные блоки и принципы их объединения в процессоре остались теми же. Haswell наследует из прошлого все удачные технологии. Изменения есть лишь в недрах отдельных узлов. Причём инженерное вмешательство в глубинные слои микроархитектуры не слишком значительно. Исполнительный конвейер изменился не слишком сильно, его протяженность составляет те же 14–19 стадий, что и раньше. Фронтальная часть получила лишь отдельные косметические усовершенствования, а все сколько-нибудь значимые перемены касаются лишь механизма исполнения инструкций и поддержки новых наборов команд. Говоря о том, является ли Haswell более производительной микроархитектурой, нежели Ivy Bridge, Intel ссылается на улучшение быстродействия до 20–30 процентов, но эта оценка включает и выигрыш от использования новых команд AVX2, для которых длительный и непростой этап внедрения ещё впереди.

Ожидается, что системы на базе Haswell смогут работать от батареи примерно на 50 процентов дольше, чем аналогичные конфигурации на базе Ivy Bridge. В простое выигрыш Haswell по сравнению с процессорами предыдущего поколения составляет порядка 2–3 раза! А в состоянии готовности к работе при сохранении сетевых соединений (connected standby) общее потребление платформы по сравнению с системами на базе Sandy Bridge снизилось примерно в 20 раз.

Столь впечатляющий прогресс своими корнями уходит не в простое совершенствование технологического процесса, который на самом деле имеет лишь эволюционные отличия от 22-нм техпроцесса с трёхмерными транзисторами, используемого для производства Ivy Bridge. В процессорный кристалл перекочевала значительная часть схемы преобразователя питания, а для ультрамобильных применений был спроектирован специализированный SoC-вариант процессора, содержащий на той же подложке второй кристалл — набор системной логики.

Во-вторых, Intel провела значительную работу с основными производителями контроллеров, указав им на необходимость качественной поддержки состояний сна и глубокого сна. Попутно разработчики рассчитывают, наконец, добиться от производителей дисплейных матриц поддержки функции Panel Self Refresh, позволяющей сохранять изображение на экране без его постоянного обновления со стороны графического ядра.

В-третьих, на руку сыграла и операционная система Windows 8, ядро которой гораздо рачительнее относится к обработке прерываний, по возможности стараясь избегать разрозненных транзакций, пробуждающих процессор или устройства.

И наконец, в-четвёртых, в Haswell появился новый набор ACPI-состояний сна S0ix, похожих по уровню энергопотребления на S3/S4 (когда в пассив отправляются все составляющие платформы за исключением системной памяти), но со временем перевода системы в полностью рабочее состояние на уровне нескольких миллисекунд. Кроме того, добавились также и новые состояния простоя процессора C7 и далее, достигаемые при видимой работоспособности системы, но при которых с основной части CPU может быть полностью снято питающее напряжение.

Однако всё перечисленное в первую очередь касается мобильных платформ и длительности их работы от батареи. В настольных системах большинство из этих нововведений также имеет место, но для конечных пользователей они практически безразличны. Что же их затрагивает самым непосредственным образом, так это появление в процессоре Haswell новых зон, работающих на различных частотах. В Haswell Uncore-часть, объединяющая системный агент и кеш третьего уровня, получила свою собственную независимую частоту.

Асинхронная работа Uncore и вычислительных ядер приводит к тому, что кеш третьего уровня в Haswell имеет большую латентность, нежели у процессоров предыдущего поколения. Иными словами, ради улучшения экономичности Intel готова даже откатывать сделанные ранее для увеличения производительности шаги.

Но зато все меры, предпринятые Intel для снижения энергопотребления, позволяют компании значительно расширить спектр предлагаемых энергоэффективных процессоров Core. В мобильном сегменте ожидается появление обширной и включающей порядка двух десятков наименований U-серии, с характерным расчётным тепловыделением порядка 15 Вт. Кроме того, нас ожидает и Y-серия с тепловыделением на уровне 6–7 Вт. Эти цифры кажутся особенно впечатляющими, если принять во внимание, что речь идёт о тепловыделении сборки, включающей помимо процессорного ядра и кристалл набора логики.

Хотя вычислительные ядра Haswell очень похожи на ядра Ivy Bridge, в них всё-таки можно обнаружить некоторое количество улучшений. Правда, сделаны эти улучшения совсем не из стремления поднять чистую производительность — количество обрабатываемых за такт инструкций. Причина их появления — внедрение в обиход новых инструкций AVX2 и желание увеличить эффективность работы технологии Hyper-Threading, которая должна будет компенсировать невозможность использования четырёх полноценных ядер в низковаттных процессорах. У сделанных нововведений есть и положительные побочные эффекты. Новая микроархитектура, заточена под обработку четырёх инструкций за такт.

В набор новых команд AVX2  входят 256-битные SIMD-команды для обработки целых чисел, разреженные операции с памятью и различные перестановки и сдвиги компонентов векторов. Но львиная и самая важная доля нового набора команд — принципиально новые вещественночисленные FMA-инструкции (Fused Multiply-Add), которые фактически одновременно включают в себя пару операций — умножение и сложение. Естественно, их выполнение старыми средствами вызвало бы значительные простои процессора, поэтому для них теперь сделано два отдельных порта и выделенные исполнительные устройства. В результате Haswell может выполнять по две сдвоенные FMA-инструкции за такт.

Таким образом, теоретически Haswell на AVX2-коде может показывать вдвое более высокую пиковую вещественночисленную производительность, нежели процессоры прошлых поколений. Хотя, на самом деле, если сопоставить скорость выполнения одной FMA-инструкции и раздельных инструкций умножения и сложения, то реальная величина ускорения окажется на уровне 60 процентов.

Набор AVX2 и имеющиеся аппаратные средства для его обработки делают Haswell отличной числодробилкой, а сами эти инструкции прекрасно вписываются в популярные вычислительные алгоритмы, используемые как в научных областях, так и при обработке различного мультимедийного контента. Следовательно, процессоры Haswell всё-таки могут быть существенно производительнее своих предшественников.

Принципиально новое графическое ядро Haswell обеспечивает двукратный прирост производительности по сравнению с Ivy Bridge. Успехи на графическом фронте так впечатляющи, что впервые за свою историю Intel присвоил новому GPU имя собственное – Iris. Топовой моделью GPU, Iris Pro с собственной кэш-памятью, будут оснащаться мощные ультрабуки с прицелом на игры. Для менее требовательных систем есть решения и побюджетнее.

30 процентов площади кристалла Haswell, над которой инженеры Intel поработали очень усердно - это интегрированное графическое ядро. Учитывая первостепенность мобильных применений своих процессоров, Intel в последние несколько лет проводит последовательные улучшения встраиваемой в них графики и стремится к тому, чтобы её собственный ускоритель смотрелся не хуже решений других разработчиков, включая и тех, которые графическими решениями занимаются целенаправленно. В Ivy Bridge мы уже видели почти двукратный рост графической производительности по сравнению с процессорами предыдущего поколения, произошедший одновременно с внедрением поддержки всех современных версий программных интерфейсов. Микроархитектура Haswell обещает поднять скорость работы графического ядра ещё примерно вдвое.

Структура графического ядра осталось старой, а рост производительности обеспечивается в чистом виде экстенсивными методами. Новую же архитектуру видеоускорителя Intel обещает лишь в следующем поколении процессоров с кодовым именем Broadwell. В новом поколении Intel HD Graphics место нашли весьма занимательные инженерные решения.

Если не считать отдельных оптимизаций графического конвейера, направленных на перенесение части нагрузки с драйвера на аппаратные блоки и на увеличение производительности большинства специализированных функциональных блоков, выполняющих в конвейере 3D-рендеринга подготовительные операции, новое графическое ядро сильно похоже на ядро из процессоров предыдущего поколения с добавленной поддержкой DirectX 11.1. Главное же преимущество нового дизайна — наличие существенно большего количества универсальных исполнительных устройств. Если максимальная версия графики Ivy Bridge располагала 16 исполнительными устройствами (включающими по 4 ALU каждое), то количество исполнительных устройств в графическом ядре Haswell может доходить до 40 штук.

Однако при этом Intel решила провести более явную сегментацию и на основе единого дизайна сделать несколько вариантов графики: GT1, GT2, GT3 и GT3e. Базовая версия — это GT2 с 20 исполнительными устройствами. Она предназначается для большинства десктопных моделей процессоров и предлагает на 4 устройства больше, чем старшая графика процессоров поколения Ivy Bridge. Однако её урезанная версия, GT1, имеет лишь 6 исполнительных устройств и мало отличается от графики, уже присутствующей в существующих процессорах Pentium и Celeron. Максимальный же вариант, GT3, который располагает 40 исполнительными устройствами, представляет собой GT2 с удвоенным исполнительным кластером. Такая прокачанная версия видеоускорителя нацеливается на большинство мобильных вариантов Haswell, включая в первую очередь процессоры для ультрабуков. Двух с половиной кратное увеличение количества исполнительных устройств и должно, по замыслу разработчиков, обеспечить двукратный рост производительности графики. Однако такая производительная версия видеодвижка, GT3, в настольные компьютеры не попадёт. А это значит, что у десктопной интегрированной графики Intel прирост производительности будет не кратный, а лишь примерно 30-процентный.

Увеличение мощности исполнительного кластера графического ядра заставило разработчиков дизайна задуматься и о том, чтобы узким местом не стал этап наложения текстур. Поэтому скорость работы текстурного блока в Haswell была симметрично увеличена. Intel обещает четырёхкратный рост скорости текстурирования по сравнению с графикой Ivy Bridge.

Для производительных игровых мобильных систем Intel создала специализированную заряженную модификацию GT3e. В процессорах с таким ядром, которые будут образовывать отдельную мобильную H-серию, встроенное графическое ядро GT3 будет дополняться быстрой eDRAM-памятью объёмом 128 Мбайт и 512-битной шиной. Идея состоит в том, что существенные ограничения на скорость встраиваемых видеоядер накладывает недостаточная пропускная способность системной памяти, которая в таких случаях играет также и роль видеопамяти. eDRAM же будет устанавливаться на одну подложку с процессорным ядром и выполнять роль L4-кеша, обеспечивая пропускную способность порядка 64 Гбайт/с. Однако никакого специализированного интерфейса между графическим ядром и eDRAM не предусматривается, так что такой L4-кеш будет буферизировать все обращения в память, а не только инициированные графическим ядром. Тем не менее Intel ожидает, что именно эта добавка сможет вывести Haswell по графической производительности на один уровень с NVIDIA GeForce GT 650M.

CPU с GT3e предполагается использовать исключительно в высокопроизводительных геймерских ноутбуках, где речь об экономичности, компактности и бюджетности не идёт. А значит, компания AMD со своими APU поколения Richland пока что не будет ощущать особого давления со стороны конкурента. И особенно это касается десктопной среды: предлагать широкий ассортимент процессоров с производительными графическими ядрами для этого рыночного сегмента Intel не считает необходимым.

В Haswell поддерживается работа до трёх независимых дисплеев, причем все три подключения могут быть цифровыми. Благодаря же внедрению совместимости с последними версиями интерфейсов HDMI и DisplayPort, максимальные поддерживаемые разрешения достигли величин 4Kx2K.

Без улучшений не осталось и одно из любимых детищ Intel — встроенный в графическое ядро аппаратный видеокодер Quick Sync. Так, Haswell в дополнение к уже освоенным форматам будет способен на аппаратном уровне работать с SVC (Scalable Video Coding — производная AVC H.264), декодировать MJPEG (motion JPEG) и кодировать видео в формате MPEG2. При этом будет обеспечена полноценная совместимость при кодировании и декодировании с видео в разрешении 4K (4096x2304, 4096x2160 и 3840x2160), которое в настоящее время приобретает всё большую популярность.

Возросла и чистая производительность кодера Quick Sync. Причём теперь ему присуща не только высокая пропускная способность, но и низкая латентность, открывающая аппаратному кодированию путь в телеконференции. Скорость же кодирования в Haswell заметно выше, чем у Ivy Bridge, однако в разных версиях графического ядра она различается, причём в разы. Зато качество получаемого при аппаратном кодировании видео улучшилось в любых модификациях графики. Обновлённая технология Quick Sync должна давать лучшее качество кодированного изображения, чем Ivy Bridge, даже при одинаковом битрейте.

Дизайн Haswell получился настолько энергоэффективным и сбалансированным, что эти процессоры, вне всяких сомнений, смогут занять достойное место в лакомом для производителя подвиде мобильных устройств — производительных планшетах и ноутбуках-трансформерах.

 


Лицензия