Воскресенье, 19.05.2024, 14:45
Приветствую Вас Гость | RSS

Сайт Цыгановых

Блог

Главная » 2011 » Март » 25 » 6. Многоядерные процессоры 6.4. Многоядерные решения AMD
20:33
6. Многоядерные процессоры 6.4. Многоядерные решения AMD

Организация ЭВМ и систем

 6Многоядерные процессоры

   
      6.4. Многоядерные решения AMD

      Корпорация AMD разработала технологию виртуализации Pacifica и технологию безопасности Presidio для серийных многоядерных процессоров. Технология виртуализации Pacifica позволяет запускать на одном компьютере несколько независимых операционных систем и приложений,  а технология безопасности Presidio повышает безопасность работы с данными при помощи специальной защищённой области в процессоре.
   
 Многоядерные чипы, спроектированные инженерами AMD, отличаются более низким энергопотреблением, поскольку выполнены на единой подложке, в отличие от кристаллов Intel, где механически соединяются несколько отдельных ядер. Система Cool'n'Quiet автоматически регулирует тактовую частоту и напряжение питания процессора в зависимости от реальной нагрузки, а также скорость вращения процессорного кулера в зависимости от температуры процессора. Конструкция AMD обеспечивает наиболее тесные связи между всеми ядрами, что позволяет не только повысить производительность, но и оптимизировать потребление электроэнергии. 
     Направление  на выпуск многоядерных процессоров заставляет отказаться от схем, оптимальных лишь для одноядерных микросхем. Возможно создание узкоспециализированных моделей процессоров, чётко ориентированных на решение тех или иных задач. К примеру, для серверов производительность процессора в векторных операциях не нужна, поэтому за счёт оптимизации конструкции можно добиться  повышенной мощности в поисковых вычислениях и снижения энергопотребления. При этом важно сохранить взаимную совместимость набора инструкций разных модификаций - это не только удешевит производство, но и снимет возможные проблемы при написании программного обеспечения.
    Для объединения вычислительных ядер AMD использует архитектуру Direct Connect (прямого соединения), а для связи с набором системной логики используется шина HyperTransport.  Третьяй версия этой шины в три раза превышает пропускную способность HyperTransport 2.0. Совокупная максимальная пропускная способность HyperTransport 2.0. составляет 22,4 Гб/c. В новой версии шины сохраняется её традиционное преимущество - прямая связь между процессором и системами ввода/вывода, только теперь эти прямые линии связи будут устанавливаться с несколькими ядрами.
   
 Компания Advanced Micro Devices (http://www.amd.com/)  летом 2004 г. продемонстрировала оснащенный двумя ядрами 64-разрядный процессор AMD Opteron (с поддержкой системы команд x86). На демонстрации был представлен сервер HP ProLiant DL585 с четырьмя двухъядерными процессорами Opteron, изготовленными по технологии "кремний на изоляторе" (SOI) с соблюдением проектных норм 90 нм. 
   
 Таким образом компания AMD заложила фундамент для создания процессоров с двумя ядрами, снабдив свои одноядерные процессоры AMD 64 встроенной инфраструктурой для поддержки второго ядра на той же микросхеме. 
   
 Двухъядерные процессоры представляют собой естественное расширение технологии AMD 64 с архитектурой прямых соединений. 
     Компания AMD  устранила узкие места в работе внешней шины, характерные для архитектуры x86, она  объединила два ядра на одном кристалле вместе с контроллером памяти и подсистемой ввода-вывода(рис. 1). Это позволило улучшить общесистемную производительность и повысить эффективность обработки данных.

Fig.4

Рис.1. Блок-схема двухъядерного процессора Opteron.

    Архитектура прямых соединений - Direct Connect позволяет подключить несколько процессоров, контроллер памяти и модули ввода-вывода напрямую. Она нейтрализует недостатки современных системных архитектур и устраняет узкие места при обмене данными. Считается, что данная архитектура сокращает задержки при обращении к памяти, а поскольку средства ввода-вывода непосредственно подключаются к центральному процессору, улучшается баланс между производительностью процессора и пропускной способностью подсистемы ввода-вывода. В свою очередь, все процессоры соединяются непосредственно друг с другом, что обеспечивает практически линейное повышение производительности для многопроцессорных систем. С ростом числа процессоров пропускная способность памяти растет линейно.
   
 Двухъядерные процессоры AMD 64 поддерживают совместимость с приложениями AMD 64 для платформы x86, что упрощает их массовое распространение.
    Следует отметить, что реализация двухъядерности в процессорах AMD несколько отличается от реализации Intel.  AMD предлагает несколько иной способ взаимодействия ядер между собой.  
    Подход Intel заключается в простом помещении на один кристалл двух ядер. При такой организации двухъядерности процессор не имеет никаких специальных механизмов для осуществления взаимодействия между ядрами. Как и в обычных двухпроцессорных системах, ядра общаются посредством системной шины. Соответственно, системная шина разделяется между ядрами процессора и при работе с памятью, что приводит к увеличению задержек при обращении к памяти двух ядер одновременно.  
    В процессорах AMD  дублированы некоторые ресурсы. Хотя каждое из ядер Athlon 64 X2 обладает собственным набором исполнительных устройств и выделенной кэш-памятью второго уровня, контроллер памяти и контроллер шины Hyper-Transport на оба ядра общий. Взаимодействие каждого из ядер с разделяемыми ресурсами осуществляется посредством специального Crossbar-переключателя и очереди системных запросов (System Request Queue). На этом же уровне организовано и взаимодействие ядер между собой, благодаря чему вопросы когерентности кэш памяти решаются без дополнительной нагрузки на системную шину и шину памяти (рис.2)  
        

 

  Рис.2. Блок-схема двухъядерного процессора Athlon 64 X2.

    Таким образом, единственное узкое место, имеющееся в архитектуре Athlon 64X2 – это пропускная способность подсистемы памяти (6.4 Гбайт в секунду), которая делится между процессорными ядрами.  
  AMD  стремилась сохранить совместимость Athlon 64 X2 с существующими платформами. В результате, эти процессоры стало возможно использовать на тех же самых материнских платах, что и одноядерные Athlon 64. Поэтому, Athlon 64 X2 имеют такой же корпус, двухканальный контроллер памяти с поддержкой DDR400 SDRAM и работают с шиной HyperTransport с частотой до 1 ГГц. Благодаря этому единственное, что потребовалось для поддержки двухядерных CPU от AMD  материнскими платами, – это обновление BIOS. Инженерам AMD удалось вписать в ранее установленные рамки и энергопотребление процессора Athlon 64 X2. 
     Athlon 64 X2 поддерживают набор инструкций SSE3, а также имеют усовершенствованный контроллер памяти. Среди особенностей контроллера памяти Athlon 64 X2 следует упомянуть возможность использования разномастных модулей DIMM в различных каналах (вплоть до установки в оба канала памяти модулей разного объёма) и возможность работы с четырьмя двухсторонними модулями DIMM в режиме DDR400.
Процессоры Athlon 64 X2 (Toledo), содержащие два ядра с кэш-памятью второго уровня по 1 Мбайту на каждое ядро, состоят из примерно 233.2 млн. транзисторов и имеют площадь около 199 кв. мм. Кристалл и сложность двухъядерного процессора оказывается примерно вдвое больше кристалла соответствующего одноядерного.
   
 Наличие посредника между процессором и памятью в лице северного моста для многоядерных процессоров Intel увеличивает задержки. При этом пропускная способность памяти не растет с числом процессоров, а наоборот, процессоры разделяют пропускную способность системы процессор - память (до 6,4 Гбайт/с) между собой. 
    Для компенсации проблемы пропускной способности оперативной памяти в Intel предлагают увеличить емкость кэш памяти. 
    Использование высокоскоростного интерфейса HyperTransport в Opteron/Athlon64 предполагает как соединение процессоров через HyperTransport с поддержанием когерентности кэша в многопроцессорных серверах, так и прямое — без северного и южного мостов — подсоединение через HyperTransport мосты для шин PCI-X/PCI-Express, что также повышает производительность. Суммарная пропускная способность ввода/вывода для 8-процессорных систем на базе Opteron 8xx достигает 30,4 Гбайт/с. 
    Построение серверов  на базе Opteron отвечает архитектуре кэш когерентной неоднородной памяти ( ccNUMA), пока с небольшим количеством ( до 8) процессоров.
 Можно упомянуть и другие преимущества, например, низкие величины задержек при работе с иерархией памяти. Так, задержка Opteron при выборке из кэш памяти данных первого уровня равна трем тактам. Два порта чтения позволяют выполнять одновременно две таких операции. 
    Пропускная способность памяти лимитирует производительность многих приложений. Пропускная способность важна, например, при решении задач гидро- и аэродинамики, где используются сеточные методы решения уравнений в частных производных. Классический пример — краткосрочный прогноз погоды. Другой иллюстрацией важности проблемы пропускной способности памяти могут служить коды программ моделирования океана или коды вычислительной химии. 

Просмотров: 696 | Добавил: МИХАлыч | Теги: 6. Многоядерные процессоры 6.4. Мно | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *:
Форма входа
Календарь
«  Март 2011  »
ПнВтСрЧтПтСбВс
 123456
78910111213
14151617181920
21222324252627
28293031
Архив записей
Наш опрос
Оцените мой сайт
Всего ответов: 32