Воскресенье, 19.05.2024, 12:03
Приветствую Вас Гость | RSS

Сайт Цыгановых

Блог

Главная » 2011 » Март » 25 » 6. Многоядерные процессоры 6.3. Многоядерные процессоры корпорации Intel
20:32
6. Многоядерные процессоры 6.3. Многоядерные процессоры корпорации Intel

Организация ЭВМ и систем

 6Многоядерные процессоры

 

        6.3. Многоядерные процессоры корпорации Intel

        Корпорация Intel  давно работает над концепцией параллелизма и аппаратными средствами реализации многопоточности. Уже к 1994 г. в процессоре Intel Pentium  был реализован параллелизм на уровне команд - архитектурная особенность, при которой команды одного потока кода извлекаются, выполняются параллельно, а затем объединяются в прежнем порядке. В 1994 г. корпорация реализовала также двухпроцессорную обработку (два полноценных процессора, вставлялись в два разъема системной платы), создав аппаратную многопоточную среду для серверов и рабочих станций. В 1995 г. был представлен процессор Pentium Pro, поддерживавший эффективное объединение уже четырех процессоров на одной системной плате, что обеспечило более высокую скорость обработки данных в многопоточных приложениях, ориентированных на серверные платформы и рабочие станции.
   
 Эти усилия стимулировали разработку однопроцессорных технологий, обеспечивающих более высокую степень параллелизма на уровне потоков, для массовых платформ. Корпорация реализовала технологию HT (Hyper-Threading) для процессоров Pentium 4 и Xeon,  как инновационный способ достижения более высокой степени параллелизма на уровне потоков в процессорах для массовых систем. В корпорации поняли, что технология HT естественным образом ведет к разработке многоядерных процессоров, отличающихся более высокими степенями параллелизма.
   
 Для перевода своей полупроводниковой индустрии на выпуск многоядерных процессоров с 2000 г. Intel вложила большие средства в исследования и разработки по этой тематике. 

В Intel не считают целесообразным конструировать многоядерные процессоры, состоящие из одного ядра общего назначения и специализированных ядер. Применении универсальных ядер, способных решать самые различные задачи считается более перспективным.
 В ПК и серверах будущего будут применяться  многоядерные процессоры, поддерживающие такие инновационные технологии, как ускоренный ввод-вывод, виртуализация (обеспечение виртуальной независимости работы каждого ядра), безопасность и усовершенствованная технология памяти.
 

Технология ускорения ввода-вывода

Технология ускорения ввода-вывода I/OAT (Intel I/O Acceleration Technology) появилась в то время, когда потребности приложений (таких, как электронная коммерция, обмен сообщениями, приложения для кластеров устройств хранения данных и серверов) начали обгонять способность серверов к реагированию и их возможности быстрого и надежного обмена сетевыми данными с приложениями. В то время как производительность серверных процессоров и пропускная способность сетей значительно выросли, основной метод обмена данными остался прежним. Процессор сервера ведет обработку данных, осуществляет доступ к памяти и реализует протоколы обмена для каждого пакета данных. В результате работа серверных приложений замедляется.
   
 Для решения этой проблемы в технологии ускорения ввода-вывода корпорацией Intel применяется общеплатформенный подход. Задача управления данными распределяется между всеми компонентами платформы - процессором, набором микросхем, сетевым контроллером и программным обеспечением. Общеплатформенный подход позволяет снизить нагрузку на процессор и ускорить обмен данными. Загруженность процессора снижается благодаря тому, что набор микросхем и сетевой контроллер получают возможность считывать данные из памяти и записывать их в память.
   
 Intel также оптимизировала протокол TCP/IP - открытый "свод правил", который позволяет компьютерам всех типов обмениваться данными, общаясь на одном языке. В результате загруженность процессоров в серверах архитектуры Intel снизилась наполовину, а вычислительные ресурсы высвободились для решения других задач. В среднем такой подход позволяет ускорить обмен данными между платформой и приложениями на 30% и освобождает процессор для выполнения другой вычислительной работы.
   
 Кроме того, подход, применяемый в технологии I/OAT, позволяет отказаться от искусственных надстроек, применяемых в существующих технологиях, - таких, как механизмы разгрузки TCP (TCP offload engine, TOE).  TOE - это специализированные дорогостоящие микросхемы, предназначенные для разгрузки процессора при обработке протокола TCP/IP, но они не решают двух основных проблем, связанных с процессором: снижения системных издержек и организации доступа к памяти. В результате TOE эффективны только для таких приложений, где велика информационная составляющая пакетов данных - например, для высокопроизводительных систем управления базами данных или для хранилищ данных.
   
 Корпорация Microsoft обещает обеспечить встроенную поддержку технологии I/OAT в будущих версиях ОС Windows Server. В этих версиях также будет использоваться технология, которая позволяет сбалансировать трафик TCP/IP при использовании многоядерных процессоров. 

Рассмотрим архитектурные особенности процессора Pentium D.

    С 2005 года был начат выпуск двуядерных процессоров Pentium D. Двуядерные процессоры Pentium D содержат два независимых ядра на одной кремниевой пластине (рис.1). Каждое ядро имеет собственный кэш второго уровня L2 объемом 1 Мб. Ядра процессоров базируются на архитектуре NetBurst процессоров Pentium 4. Ядра объединены общей процессорной шиной, работающей на частоте 800 МГц. 
    Ядра процессоров Pentium D не поддерживают технологию Hyper-Threading. Для двуядерных процессоров она присутствует только в Pentium Extreme Edition, который благодаря этому виден в системе как четырехядерный (рис.2).
Процессоры Pentium D поддерживают 64-битные расширения команд EM64T и технологию XD — защита от атак типа "переполнение буфера".  Некоторые модели  дополнительно поддерживают технологию SpeedStep, при которой возможно динамическое регулирование частоты и напряжения питания ядер процессора.
     Выпуск процессоров Pentium D был налажен по 90-нанометровому техпроцессу, при этом на кристалле площадью 206 кв. мм.  размещалось 230 млн. транзисторов.

 Кроме двух независимых ядер микропроцессор включает арбитр, позволяющий двум процессорам разделять между собой процессорную шину. То есть, фактически, всё взаимодействие между ядрами  происходит только на уровне системной шины.

 

Рис.1.  Двуядерный процессор Pentium D      

    Суммарный размер  кэш памяти  второго уровня составляет 2 МбайтаКэш память  разделяется пополам между двумя ядрами таким образом, что каждое из них оперирует с собственной кэш памятью второго уровня (L2) емкостью 1 мегабайт. 
    Но эксплуатация двуядерных процессоров на тех же частотах, что и одиночных ядер, невозможна. Вызвано это в первую очередь ограничениями по тепловыделению и энергопотреблению процессоров, поскольку объединение двух ядер на одном кристалле приводит к значительному росту этих характеристик. Поэтому, двуядерные процессоры имеют гораздо более низкую тактовую частоту, чем их одноядерные "прародители".  

Двуядерный процессор Pentium Extreme Edition (рис.2) был выпущен с тактовой частотой 3,2 ГГц, частотой системной шины 800 МГц и 2 Мб кэш-памяти второго уровня (по 1 Мб на каждое ядро).

   

 Рис.2. Intel Pentium Extreme Edition 955 с 376 миллионами транзисторов со
 сдвоенным 65-нм ядром Presler

Каждое ядро поддерживает Hyper-Threading, поэтому в системе видны четыре процессора (рис.3).

       
Рис.3. 
Технология Hyper-Threading в микропроцессоре Pentium Extreme Edition.

     Для поддержки процессора был выпущен специальный чипсет 975X. Архитектура компьютера на платформе  975X показана на рис.4.

Рис. 4. Архитектура компьютера на платформе  975X

На рисунке 5 представлена материнская плата ПК на платформе  975X.


Рис. 5. Материнская плата ПК на платформе  975X

Судьба системной шины

Чтобы в полной мере реализовать потенциал роста производительности, обеспечиваемый несколькими ядрами, необходим способ предоставить процессору достаточное количество данных. По мнению экспертов, существующая архитектура системной шины Intel способна удовлетворить требования максимум четырех ядер. В этой архитектуре системная шина связывает центральный процессор с основной памятью (рис.1). Контроллер памяти, входящий в состав соответствующих наборов микросхем, управляет передачей данных из памяти в центральный процессор и обратно. Многие компании (AMD, Sun Microsystems, IBM) интегрировали контроллеры памяти в кристаллы центральных процессоров.  Интегрированный контроллер памяти сокращает уровень задержки (время, требуемое для передачи порции данных от одного компонента системы другому).
     Интегрированный контроллер  позволил бы Intel увеличить производительность серверных приложений, интенсивно использующих память, и обеспечить доставку данных к нескольким ядрам. Фактически процессор Itanium образца 2007 г. может иметь до восьми ядер. Существует и другой путь, сохранить системную шину за счет добавления к процессорам модулей арбитража шины, которые обеспечат совместное использование процессорами ресурсов, в том числе средств доступа к памяти и систем ввода-вывода. Ряд производителей  устанавливает подобные модули в свои многопроцессорные серверы. Во многих серверах с восемью или более процессорами они фактически сгруппированы по четыре. Для Intel не составит большого труда организовать тот же тип архитектуры в процессоре с четырьмя и более ядрами.
   
 20 октября 2006 года Intel продемонстрировала свой первый  четырехядерный процессор для многопроцессорных серверных систем под кодовым названием Tigerton (на пресс-брифинге в Сан-Франциско был показан в работе четырехпроцессорный сервер, созданный на его основе). 
  Четырехядерный серверный процессор с кодовым названием  Tigerton, созданный на базе микроархитектуры Intel Core,  поддерживает новое высокоскоростное межкомпонентное соединение. 
Другие характеристики процессора Tigerton:

  • Специализированное высокоскоростное межкомпонентное соединение, соединяющее каждый процессор непосредственно с набором микросхем, обеспечивает более чем двукратный рост производительности и пропускной способности системы.
  •  Чипсет  поддерживает модули памяти FB-DIMM (модули DIMM, оснащенные высокоскоростной шиной)  и  может быть оснащен четырьмя каналами для подключения к модулям памяти, что расширяет полосу пропускания и увеличивает поддерживаемый объем памяти. 
  • Поддержка технологии I/O Acceleration Technology (IOAT), впервые реализована на многопроцессорных платформах.

        Четырехядерные процессоры Intel Xeon  созданы на базе микроархитектуры Intel Core. Их производительность  почти на 50% выше, чем у современного поколения двухядерных процессоров, при сохранении того же уровня энергопотребления.  
        Двуядерные процессоры Intel Xeon серии 7000 были изготовлены по 65-нанометровой производственной технологии
     и были предназначены для установки в серверы с четырьмя или большим числом процессоров. Процессоры этой серии поддерживают технологию Hyper-Threading, благодаря чему способны выполнять 4 вычислительных потока одновременно. Кроме того, они оснащены кэш-памятью третьего уровня объемом 16 МБ, используемой обоими ядрами. Процессоры поддерживают технологии Intel Virtualization Technology и Intel Cache Safe Technology, что позволяет свести к минимуму простои при работе в критических случаях. 
    Двухъядерные процессоры Intel Xeon серии 7100 предназначены для установки в серверы с четырьмя или более процессорами. В состав данного семейства входят процессоры с пониженным энергопотреблением (95 Вт). Процессоры серии 7100 по производительности превосходят процессоры предыдущего поколения почти в два раза, а по показателю «производительность на ватт» – почти в три раза.

Производительность

Производительность многоядерных процессоров стала зависеть от качества работы программистов. Успех массового программного обеспечения (ПО) зависит от его способности "распараллеливать" задачи. Корпорация Intel взялась за разработку инструментария для написания таких программ и оптимизации существующих.

Многоядерное будущее

В сентябре 2006 года состоялась демонстрация прототипа процессора Intel, обладающего производительностью в 1 терафлоп (1012 операций с плавающей точкой в секунду). Для того, чтобы  представить, насколько это много, приведем пример. Первый суперкомпьютер, достигший производительности в 1 терафлоп, ASCI Red, был создан в 1996 году. В его состав входило 4,5 тысячи процессоров Pentium Pro, работавших на частоте 200 МГц.

Рис.5. 80-ти ядерный прототип процессора Intel 

Процессор имеет 80 ядер (рис.6) и интегрированную статическую память (SRAM) общим объёмом в 20 Мб (по 256 Кб на ядро). Обмен данными между ядрами процессора осуществляется со скоростью более терабайта в секунду.   Нынешние образцы 80-ядерных процессоров работают на частоте 3,1 ГГц. Ожидается, что коммерческая доступность таких процессоров наступит в течение пяти лет. В настоящий момент нельзя говорить о том, что перед нами полнофункциональная версия процессоров будущего, скорее - одно из первых воплощений концепта, разработанного в рамках инициативы Intel Tera-Scale, целью которой является доступность для массового покупателя  процессоров с производительностью терафлоп уже к 2010-му году.

Просмотров: 2504 | Добавил: МИХАлыч | Теги: 6. Многоядерные процессоры 6.3. Мно | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *:
Форма входа
Календарь
«  Март 2011  »
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031
Архив записей
Наш опрос
Оцените мой сайт
Всего ответов: 32